Zum Glossar
Sicherheit

Content Moderation

Content Moderation bezeichnet das Prüfen und Filtern von Inhalten, um schädliches Material wie Gewalt, Hassrede oder Betrug herauszuhalten. Bei KI-Systemen prüft sie sowohl die Eingaben der Nutzer als auch die erzeugten Ausgaben. Die Prüfung übernehmen oft automatische Filter, häufig ergänzt durch Menschen, da reine Automatik Grenzfälle leicht falsch einordnet.