KI verständlich — Begriff für Begriff.

Agentic AI bezeichnet KI-Systeme, die nicht nur auf eine einzelne Frage antworten, sondern ein Ziel selbstständig in mehreren Schritten verfolgen. Solche Systeme planen Teilschritte, rufen Werkzeuge oder Programme auf und reagieren auf Zwischenergebnisse, bis die Aufgabe erledigt ist. Sie sind weniger zuverlässig je komplexer das Ziel wird, weil sich Fehler über viele Schritte aufsummieren können.

Aktivierungsfunktion

Eine Aktivierungsfunktion entscheidet in einem neuronalen Netz, wie stark ein einzelnes Neuron auf seine Eingaben reagiert und sein Signal weitergibt. Sie sorgt dafür, dass das Netz auch verwickelte, nicht-lineare Zusammenhänge abbilden kann statt nur einfacher gerader Linien. Ohne Aktivierungsfunktionen könnte ein noch so großes Netz keine komplexen Muster lernen.

Alignment

Alignment (Ausrichtung) bezeichnet die Aufgabe, ein KI-System so zu gestalten, dass sein Verhalten den Absichten und Werten der Menschen entspricht, die es nutzen. Dazu gehört, dass das System hilfreiche Antworten gibt und schädliche oder unerwünschte Ausgaben vermeidet. Alignment ist schwierig, weil sich menschliche Ziele oft nicht vollständig in klare Regeln fassen lassen.

Annotation (Labeling)

Annotation, auch Labeling genannt, ist das Versehen von Rohdaten mit erklärenden Markierungen, damit ein Modell daraus lernen kann. Menschen kennzeichnen zum Beispiel, was auf einem Bild zu sehen ist oder ob ein Kommentar positiv oder negativ gemeint ist. Die Qualität dieser Markierungen bestimmt stark, wie gut das spätere Modell wird.

Anomalieerkennung

Anomalieerkennung ist ein Verfahren, das in Daten ungewöhnliche Muster aufspürt, die vom Normalfall abweichen. Eingesetzt wird sie zum Beispiel, um verdächtige Kontobewegungen, technische Störungen oder Netzwerkangriffe zu finden. Das System lernt zunächst, wie normale Daten aussehen, und meldet dann alles, was deutlich davon abweicht.

API

Eine API (Programmierschnittstelle) ist eine festgelegte Schnittstelle, über die ein Programm einen Dienst eines anderen Programms aufrufen kann, ohne dessen Innenleben zu kennen. Bei KI nutzt man eine API, um zum Beispiel ein Sprachmodell aus der eigenen Anwendung heraus mit einer Anfrage zu versorgen und die Antwort zurückzubekommen. So lassen sich KI-Funktionen in eigene Software einbauen, ohne das Modell selbst zu betreiben.

Artificial General Intelligence (AGI)

Artificial General Intelligence (allgemeine künstliche Intelligenz) meint eine hypothetische KI, die beliebige geistige Aufgaben mindestens so gut wie ein Mensch lösen könnte, statt nur auf einzelne Bereiche spezialisiert zu sein. Heutige Systeme sind davon weit entfernt; sie sind schwache KI, also auf bestimmte Aufgaben begrenzt. Ob und wann AGI erreichbar ist, ist offen und unter Fachleuten umstritten.

Attention

Attention (Aufmerksamkeit) ist ein Mechanismus in Sprachmodellen, mit dem das Modell beim Verarbeiten eines Wortes gewichtet, welche anderen Wörter im Text dafür gerade wichtig sind. So kann es Bezüge über lange Strecken hinweg herstellen, etwa wenn ein Pronomen sich auf ein weit vorher genanntes Wort bezieht. Attention ist der Kern moderner Sprachmodelle und der Grund, warum sie Zusammenhänge im Text gut erfassen.

B

Backpropagation

Backpropagation (Fehlerrückführung) ist das Standardverfahren, mit dem ein neuronales Netz aus seinen Fehlern lernt. Nach jeder Vorhersage wird berechnet, wie weit das Ergebnis daneben lag, und dieser Fehler wird rückwärts durch das Netz geleitet, um jeden Stellwert ein wenig zu korrigieren. Über viele Wiederholungen werden die Vorhersagen so schrittweise genauer.

Batch

Ein Batch (Stapel) ist eine Gruppe von Datenbeispielen, die ein Modell während des Trainings auf einmal verarbeitet, bevor es seine internen Werte anpasst. Statt jedes Beispiel einzeln zu betrachten, rechnet das Modell so effizienter und lernt stabiler. Die Batch-Größe ist eine wichtige Einstellung, die Tempo und Qualität des Trainings beeinflusst.

Benchmark

Ein Benchmark ist ein standardisierter Test, mit dem die Leistung von KI-Modellen unter gleichen Bedingungen verglichen wird. Dazu lässt man verschiedene Modelle dieselben Aufgaben lösen und misst, wie gut sie abschneiden. Benchmark-Werte geben einen groben Anhaltspunkt, sagen aber nicht zwingend, wie gut ein Modell in deinem konkreten Einsatz funktioniert.

BERT

BERT ist ein 2018 von Google vorgestelltes Sprachmodell, das Texte besonders gut auf ihre Bedeutung hin versteht, indem es jedes Wort im Zusammenhang der ganzen Umgebung betrachtet. Es ist vor allem fürs Verstehen und Einordnen von Text gedacht, etwa für Suche oder Textklassifikation, und weniger fürs freie Schreiben. BERT war ein wichtiger Vorläufer vieler heutiger Modelle.

Bias (Verzerrung)

Bias bezeichnet eine systematische Verzerrung in den Ausgaben eines KI-Systems, durch die bestimmte Gruppen oder Sichtweisen unfair benachteiligt oder bevorzugt werden. Solche Verzerrungen entstehen meist, weil sie schon in den Trainingsdaten stecken und das Modell sie übernimmt. Bias zu erkennen und zu verringern ist wichtig, damit Entscheidungen mit KI fair bleiben.

Black Box

Als Black Box bezeichnet man ein System, bei dem man zwar Eingabe und Ausgabe sieht, aber nicht nachvollziehen kann, wie es im Inneren zu seinem Ergebnis kommt. Viele große KI-Modelle gelten als Black Box, weil ihre Entscheidungen aus Millionen oder Milliarden Stellwerten entstehen, die sich nicht einfach in verständliche Regeln übersetzen lassen. Das erschwert es, Fehler zu erklären oder Vertrauen aufzubauen.

C

Chain-of-Thought

Chain-of-Thought (Gedankenkette) ist eine Methode, bei der ein Sprachmodell eine Aufgabe Schritt für Schritt durchdenkt, statt sofort eine Antwort zu nennen. Indem es Zwischenüberlegungen ausformuliert, löst es besonders Rechen- und Logikaufgaben oft zuverlässiger. Die ausgegebenen Schritte sind allerdings eine plausible Darstellung und nicht zwingend der tatsächliche innere Rechenweg.

Chatbot

Ein Chatbot ist ein Programm, das sich mit Menschen in geschriebener oder gesprochener Sprache unterhält und auf Fragen oder Anliegen reagiert. Frühere Chatbots folgten festen Regeln, während heutige meist auf Sprachmodellen beruhen und dadurch freier formulieren können. Trotzdem können sie falsche Angaben machen, weshalb wichtige Auskünfte überprüft werden sollten.

Chunking

Chunking ist das Zerlegen längerer Texte in kleinere, handhabbare Abschnitte, bevor ein KI-System sie weiterverarbeitet. Das ist nötig, weil Modelle nur eine begrenzte Textmenge auf einmal betrachten können und kürzere Abschnitte sich gezielter durchsuchen lassen. Wie man die Abschnitte schneidet, beeinflusst stark, wie gut eine spätere Suche passende Stellen findet.

Clustering

Clustering ist ein Verfahren, das Datenpunkte automatisch in Gruppen einteilt, sodass ähnliche Punkte zusammenkommen und unähnliche getrennt bleiben. Anders als bei der Klassifikation gibt man dem System dafür keine vorgegebenen Kategorien; es findet die Gruppen selbst. Genutzt wird das etwa, um Kunden mit ähnlichem Verhalten oder verwandte Dokumente zu erkennen.

Computer Vision

Computer Vision (maschinelles Sehen) ist das Teilgebiet der KI, das Computern beibringt, Bilder und Videos auszuwerten und ihren Inhalt zu erkennen. Dazu gehört etwa, Objekte zu finden, Gesichter zu erkennen oder Text aus Fotos zu lesen. Eingesetzt wird es zum Beispiel in der Qualitätskontrolle, bei medizinischen Aufnahmen oder in Fahrassistenzsystemen.

Content Moderation

Content Moderation bezeichnet das Prüfen und Filtern von Inhalten, um schädliches Material wie Gewalt, Hassrede oder Betrug herauszuhalten. Bei KI-Systemen prüft sie sowohl die Eingaben der Nutzer als auch die erzeugten Ausgaben. Die Prüfung übernehmen oft automatische Filter, häufig ergänzt durch Menschen, da reine Automatik Grenzfälle leicht falsch einordnet.

Convolutional Neural Network (CNN)

Ein Convolutional Neural Network (faltendes neuronales Netz) ist ein Netztyp, der besonders gut mit Bildern umgeht. Es tastet ein Bild in kleinen Ausschnitten ab und erkennt darin zunächst einfache Muster wie Kanten, die es in tieferen Schichten zu Formen und ganzen Objekten zusammensetzt. CNNs sind eine Grundlage vieler Anwendungen der Bilderkennung.

D

Deep Learning

Deep Learning (tiefes Lernen) ist ein Teilbereich des maschinellen Lernens, der neuronale Netze mit vielen hintereinanderliegenden Schichten verwendet. Durch diese Tiefe können die Netze aus großen Datenmengen selbstständig immer abstraktere Merkmale herausarbeiten, ohne dass Menschen sie vorgeben. Deep Learning steckt hinter den meisten heutigen Fortschritten bei Sprache, Bild und Ton.

Deepfake

Ein Deepfake ist ein mit KI erzeugtes oder verändertes Bild, Video oder Tondokument, das echt wirkt, aber Personen Dinge sagen oder tun lässt, die so nie passiert sind. Solche Fälschungen lassen sich für Betrug, Rufschädigung oder Desinformation missbrauchen. Weil sie immer überzeugender werden, ist es zunehmend wichtig, Quellen zu prüfen und Echtheitsnachweise zu nutzen.

Diffusionsmodell

Ein Diffusionsmodell ist ein KI-Verfahren, das vor allem Bilder erzeugt, indem es von zufälligem Rauschen ausgeht und dieses Schritt für Schritt zu einem klaren Bild entrauscht. Im Training lernt es, wie sich aus Unordnung sinnvolle Strukturen zurückgewinnen lassen. Viele bekannte Bildgeneratoren beruhen auf dieser Technik.

Distillation

Distillation (Wissensdestillation) ist ein Verfahren, bei dem ein großes, leistungsfähiges Modell als Lehrer dient, um ein kleineres Modell zu trainieren. Das kleinere Modell lernt, die Ausgaben des großen nachzuahmen, und wird dadurch oft deutlich schneller und günstiger bei nur geringem Qualitätsverlust. So lassen sich starke Modelle auf weniger leistungsfähiger Hardware nutzbar machen.

Dropout

Dropout ist eine Technik beim Training neuronaler Netze, bei der in jedem Durchlauf zufällig ein Teil der künstlichen Neuronen vorübergehend abgeschaltet wird. So lernt das Modell, sich nicht zu stark auf einzelne Neuronen zu verlassen, und es funktioniert später auch mit neuen Daten besser. Damit beugst du Overfitting vor, also dem Auswendiglernen der Trainingsdaten.

E

Embedding

Ein Embedding ist die Darstellung von Wörtern, Sätzen oder anderen Daten als Liste von Zahlen, einem sogenannten Vektor. Ähnliche Inhalte bekommen dabei ähnliche Zahlenwerte, sodass eine Maschine inhaltliche Nähe berechnen kann. Embeddings sind die Grundlage für semantische Suche und das Speichern von Inhalten in Vektordatenbanken.

Encoder-Decoder

Encoder-Decoder ist ein Aufbau für KI-Modelle, bei dem ein Teil (der Encoder) eine Eingabe in eine interne Zahlendarstellung übersetzt und ein zweiter Teil (der Decoder) daraus eine Ausgabe erzeugt. Dieser Aufbau eignet sich für Aufgaben, bei denen aus einer Eingabe eine neue Sequenz entsteht, etwa bei Übersetzungen. Viele moderne Sprachmodelle bauen auf dieser oder einer verwandten Struktur auf.

Epoche

Eine Epoche bezeichnet beim Training einen kompletten Durchlauf durch sämtliche Trainingsdaten. Modelle werden meist über mehrere Epochen trainiert, damit sie die Muster in den Daten Schritt für Schritt besser erfassen. Zu viele Epochen können allerdings zu Overfitting führen, also dazu, dass das Modell die Daten nur auswendig lernt.

Explainable AI (XAI)

Explainable AI, auf Deutsch erklärbare KI, umfasst Methoden, die nachvollziehbar machen, wie ein KI-Modell zu einer Entscheidung kommt. Das ist wichtig, weil viele Modelle als Black Box arbeiten, deren innere Abläufe von außen nicht direkt einsehbar sind. Mit erklärbarer KI kannst du Ergebnisse besser prüfen und Fehler oder Verzerrungen leichter aufdecken.

F

F1-Score

Der F1-Score ist eine Kennzahl, die misst, wie gut ein Modell bei einer Einordnungsaufgabe abschneidet. Er fasst zwei Aspekte zusammen: wie viele der gefundenen Treffer wirklich richtig sind und wie viele der echten Treffer gefunden wurden. Ein hoher F1-Score zeigt, dass ein Modell beide Seiten gut ausbalanciert.

Feature (Merkmal)

Ein Feature ist eine einzelne messbare Eigenschaft der Daten, die ein Modell für seine Berechnungen nutzt, zum Beispiel das Alter einer Person oder die Wortlänge in einem Text. Aus mehreren solchen Merkmalen leitet ein Modell seine Vorhersagen ab. Welche Merkmale du auswählst, hat großen Einfluss darauf, wie gut ein Modell funktioniert.

Feature Engineering

Feature Engineering bezeichnet die Arbeit, aus Rohdaten sinnvolle Merkmale für ein Modell aufzubereiten oder neu zu erzeugen. Dazu gehört etwa das Umrechnen, Kombinieren oder Filtern von Werten, damit ein Modell die wichtigen Muster besser erkennt. Sorgfältiges Feature Engineering verbessert oft die Ergebnisse deutlicher als ein komplexeres Modell.

Federated Learning

Federated Learning ist ein Trainingsverfahren, bei dem ein Modell auf vielen verteilten Geräten lernt, ohne dass die Rohdaten diese Geräte verlassen. Statt der Daten werden nur die berechneten Modellanpassungen zusammengeführt. Das hilft beim Datenschutz, weil sensible Daten zum Beispiel auf dem Handy bleiben.

Few-Shot Learning

Bei Few-Shot Learning gibst du einem Sprachmodell im Prompt einige wenige Beispiele für die gewünschte Aufgabe mit, bevor es deine eigentliche Anfrage bearbeitet. Anhand dieser Beispiele erkennt das Modell das Muster und liefert passendere Antworten, ohne dass ein neues Training nötig ist. Im Unterschied dazu bekommt das Modell bei Zero-Shot gar keine Beispiele.

Fine-Tuning

Fine-Tuning bedeutet, ein bereits vortrainiertes Modell mit zusätzlichen, oft eigenen Daten weiterzutrainieren, damit es eine bestimmte Aufgabe oder einen bestimmten Stil besser beherrscht. So musst du nicht bei null anfangen, sondern baust auf vorhandenem Wissen auf. Das spart Rechenleistung und Daten gegenüber einem kompletten Training von Grund auf.

Foundation Model

Ein Foundation Model ist ein großes, breit vortrainiertes Modell, das als gemeinsame Grundlage für viele verschiedene Anwendungen dient. Statt für jede Aufgabe ein eigenes Modell zu bauen, passt du ein solches Basismodell durch Fine-Tuning oder geschickte Prompts an. Große Sprachmodelle sind ein bekanntes Beispiel für Foundation Models.

Function Calling

Function Calling beschreibt die Fähigkeit eines Sprachmodells, statt einer reinen Textantwort eine strukturierte Anweisung zu erzeugen, mit der ein externes Programm aufgerufen wird. So kann das Modell zum Beispiel eine Wetterabfrage oder eine Datenbankabfrage anstoßen und das Ergebnis weiterverarbeiten. Damit verbindest du ein Sprachmodell mit echten Werkzeugen und aktuellen Daten.

G

Generative Adversarial Network (GAN)

Ein GAN besteht aus zwei neuronalen Netzen, die gegeneinander arbeiten: Eines erzeugt neue Inhalte wie Bilder, das andere versucht, echte von erzeugten Inhalten zu unterscheiden. Durch diesen Wettbewerb werden die erzeugten Ergebnisse mit der Zeit immer überzeugender. GANs werden unter anderem für realistisch wirkende Bilder und Deepfakes genutzt.

Generative KI

Generative KI bezeichnet Systeme, die neue Inhalte erzeugen, etwa Texte, Bilder, Audio oder Code, statt nur vorhandene Daten zu sortieren oder einzuordnen. Sie lernen Muster aus großen Datenmengen und setzen daraus passende neue Ergebnisse zusammen. Sprachmodelle und Bildgeneratoren sind typische Beispiele.

GitHub

GitHub ist die größte Plattform, um Programmcode zu speichern, zu versionieren und gemeinsam daran zu arbeiten. Sie baut auf dem Versionsverwaltungssystem Git auf und hält jede Änderung nachvollziehbar fest. Für KI ist GitHub doppelt wichtig: Viele offene Modelle und Werkzeuge werden dort veröffentlicht, und KI-Coding-Agenten legen ihre Ergebnisse als Commits direkt in GitHub ab.

GPT

GPT steht für Generative Pretrained Transformer und bezeichnet eine Familie großer Sprachmodelle, die Texte erzeugen können. Sie basieren auf der Transformer-Architektur und werden zunächst mit sehr großen Textmengen vortrainiert. Aus dieser Modellfamilie stammen viele bekannte Chatbots.

GPU

Eine GPU (Grafikprozessor) ist ein Chip, der viele Rechenoperationen gleichzeitig ausführen kann. Weil das Training und der Betrieb von KI-Modellen aus sehr vielen parallelen Rechenschritten bestehen, sind GPUs dafür deutlich schneller als gewöhnliche Hauptprozessoren. Sie gehören deshalb zur zentralen Hardware für KI.

Gradientenverfahren

Das Gradientenverfahren ist die Methode, mit der ein Modell während des Trainings seine internen Werte Schritt für Schritt anpasst, um Fehler zu verringern. Dabei wird in kleinen Schritten in die Richtung bewegt, die den Fehler am stärksten senkt, gemessen an einer Verlustfunktion. So nähert sich das Modell nach und nach besseren Vorhersagen.

Grounding

Grounding bedeutet, die Antworten eines Sprachmodells an verlässliche, überprüfbare Quellen zu binden, etwa an Dokumente oder eine Datenbank. Dadurch antwortet das Modell nicht nur aus seinem allgemeinen Training, sondern stützt sich auf konkrete Belege. Das verringert das Risiko von erfundenen Aussagen, sogenannten Halluzinationen.

Guardrails

Guardrails sind Regeln und technische Schranken, die festlegen, was ein KI-System tun darf und was nicht. Sie sollen verhindern, dass ein Modell schädliche, falsche oder unerwünschte Ausgaben liefert, etwa indem riskante Anfragen blockiert oder Antworten gefiltert werden. So lässt sich der Einsatz eines Modells sicherer gestalten.

H

Halluzination

Von einer Halluzination spricht man, wenn ein Sprachmodell Aussagen erzeugt, die plausibel klingen, aber sachlich falsch oder frei erfunden sind. Das passiert, weil solche Modelle Texte aufgrund von Wahrscheinlichkeiten zusammensetzen und nicht zwischen wahr und falsch unterscheiden. Deshalb solltest du wichtige Ausgaben immer gegenprüfen.

Hyperparameter

Hyperparameter sind Einstellungen, die du vor dem Training festlegst und die steuern, wie ein Modell lernt, zum Beispiel die Schrittweite beim Lernen oder die Anzahl der Durchläufe. Anders als die eigentlichen Parameter werden sie nicht vom Modell selbst gelernt. Ihre Wahl beeinflusst stark, wie gut das fertige Modell arbeitet.

I

Inferenz

Inferenz bezeichnet die Phase, in der ein fertig trainiertes Modell tatsächlich genutzt wird, um aus einer Eingabe eine Antwort oder Vorhersage zu berechnen. Im Unterschied zum Training, bei dem das Modell lernt, wird hier nur das gelernte Wissen angewendet. Jede Anfrage an ein Sprachmodell löst eine solche Inferenz aus.

J

Jailbreak

Ein Jailbreak ist der Versuch, ein KI-Modell durch geschickt formulierte Eingaben dazu zu bringen, seine Sicherheitsregeln zu umgehen. Ziel ist meist, Antworten zu erhalten, die das Modell eigentlich verweigern sollte. Anbieter arbeiten laufend daran, solche Lücken zu schließen.

K

Klassifikation

Klassifikation ist eine Aufgabe, bei der ein Modell eine Eingabe einer von mehreren vorgegebenen Kategorien zuordnet, zum Beispiel eine E-Mail als Spam oder Nicht-Spam. Das Modell lernt dafür anhand von Beispielen, welche Merkmale zu welcher Kategorie gehören. Im Gegensatz dazu sagt Regression einen Zahlenwert statt einer Kategorie voraus.

Knowledge Base

Eine Knowledge Base ist eine strukturierte Sammlung von Wissen, etwa Dokumente, Artikel oder Datensätze, auf die ein KI-System zugreifen kann. Statt sich nur auf das Training zu verlassen, kann ein Modell so auf aktuelle und geprüfte Inhalte zurückgreifen. Sie ist oft die Grundlage für Verfahren, die Antworten mit Quellen belegen.

Kontextfenster

Das Kontextfenster ist die maximale Menge an Text, die ein Sprachmodell bei einer Anfrage gleichzeitig berücksichtigen kann, gemessen in Token (Wortbausteinen). Alles, was über diese Grenze hinausgeht, fällt aus dem Blickfeld des Modells und kann nicht mehr einbezogen werden. Ein größeres Kontextfenster erlaubt längere Dokumente oder Gespräche, erhöht aber meist auch den Rechenaufwand.

Kosinus-Ähnlichkeit

Die Kosinus-Ähnlichkeit ist ein Maß dafür, wie ähnlich zwei als Zahlenlisten dargestellte Inhalte sind, indem sie den Winkel zwischen ihnen vergleicht. Ein Wert nahe eins bedeutet sehr ähnlich, ein Wert nahe null kaum verwandt. Sie wird häufig in der semantischen Suche genutzt, um Texte mit ähnlicher Bedeutung zu finden.

Kreuzvalidierung

Kreuzvalidierung ist ein Verfahren, um zu prüfen, wie gut ein Modell mit neuen Daten zurechtkommt. Dabei werden die Daten in mehrere Teile aufgeteilt, und das Modell wird abwechselnd auf einem Teil getestet und auf den übrigen trainiert. So bekommst du ein verlässlicheres Bild der Leistung, als wenn du nur einmal testest.

Künstliche Intelligenz (KI)

Künstliche Intelligenz ist der Oberbegriff für Computersysteme, die Aufgaben übernehmen, für die man üblicherweise menschliche Denkleistung braucht, etwa Sprache verstehen, Bilder erkennen oder Entscheidungen treffen. In der Praxis beruht KI heute meist auf maschinellem Lernen, bei dem Systeme Muster aus Daten ableiten. Trotz des Namens handelt es sich nicht um Bewusstsein, sondern um statistische Mustererkennung.

L

Large Language Model (LLM)

Ein großes Sprachmodell ist ein KI-Modell, das auf riesigen Textmengen trainiert wurde und Sprache fortsetzt, indem es das jeweils wahrscheinlichste nächste Wort vorhersagt. Aus dieser einfachen Mechanik entstehen Fähigkeiten wie Zusammenfassen, Übersetzen oder Programmieren. Bekannte Beispiele sind die Modelle hinter ChatGPT oder Claude.

Latent Space

Der Latent Space ist ein gedachter, vieldimensionaler Raum, in dem ein Modell Daten als Zahlenvektoren ablegt. Ähnliche Inhalte landen darin nahe beieinander, sehr unterschiedliche weit auseinander. So kann das Modell Bedeutungen und Muster erfassen, ohne mit den Rohdaten selbst zu rechnen. Du siehst diesen Raum nie direkt, aber Embeddings und Bildgeneratoren bauen darauf auf.

Latenz

Latenz ist die Zeit, die ein KI-System braucht, um auf deine Anfrage zu antworten. Sie wird oft in Millisekunden oder Sekunden gemessen und reicht vom Absenden des Prompts bis zur ersten oder vollständigen Antwort. Bei großen Sprachmodellen hängt sie unter anderem von Modellgröße, Auslastung und Antwortlänge ab. Niedrige Latenz fühlt sich für dich flüssiger an, hohe Latenz wirkt zäh.

LLMOps

LLMOps bezeichnet die Praktiken und Werkzeuge, mit denen Teams große Sprachmodelle im laufenden Betrieb verwalten. Dazu gehören das Verwalten von Prompts, das Überwachen von Qualität und Kosten, das Testen von Versionen und das Eindämmen von Halluzinationen. Es ist eine auf Sprachmodelle zugeschnittene Variante von MLOps. Ziel ist, dass ein KI-Dienst zuverlässig und kontrolliert in Produkten läuft.

LoRA

LoRA (Low-Rank Adaptation) ist eine sparsame Methode, ein vortrainiertes Modell an eine neue Aufgabe anzupassen. Statt alle Gewichte neu zu trainieren, fügt LoRA nur wenige kleine Zusatzschichten hinzu und passt diese an. Das spart Rechenzeit und Speicher und macht das Ergebnis leicht austauschbar. Du erkennst LoRA oft bei Bildmodellen, wo ein kleiner Zusatz einen bestimmten Stil ergänzt.

LSTM

LSTM (Long Short-Term Memory) ist eine Bauart neuronaler Netze, die für Daten in Reihenfolge gedacht ist, etwa Sätze oder Zeitreihen. Sie besitzt eine Art Gedächtnis, das wichtige Informationen über viele Schritte behalten und Unwichtiges vergessen kann. Damit löste sie ein Problem älterer rückgekoppelter Netze, die sich Zusammenhänge über lange Strecken schlecht merkten. Heute übernehmen oft Transformer diese Aufgaben.

M

Machine Learning

Machine Learning (maschinelles Lernen) ist ein Teilgebiet der künstlichen Intelligenz, bei dem Programme Muster aus Daten lernen, statt feste Regeln vorgegeben zu bekommen. Aus vielen Beispielen leitet ein Modell ab, wie es neue Fälle einschätzen soll. So kann es etwa E-Mails als Spam erkennen oder Preise vorhersagen. Die Qualität hängt stark von Menge und Güte der Trainingsdaten ab.

Mixture of Experts (MoE)

Mixture of Experts (MoE) ist ein Aufbau, bei dem ein Modell aus vielen spezialisierten Teilnetzen, den Experten, besteht. Für jede Anfrage wird nur eine kleine Auswahl davon aktiviert, statt das gesamte Modell zu nutzen. Dadurch kann ein Modell sehr viele Parameter besitzen und trotzdem vergleichsweise sparsam rechnen. Welche Experten zuständig sind, entscheidet ein vorgeschalteter Verteiler.

MLOps

MLOps fasst Methoden zusammen, mit denen Machine-Learning-Modelle zuverlässig entwickelt, ausgeliefert und überwacht werden. Es überträgt Praktiken aus der Softwareentwicklung auf den Umgang mit Daten und Modellen, etwa Versionierung, automatische Tests und Überwachung im Betrieb. Damit lässt sich erkennen, wenn ein Modell mit der Zeit schlechter wird. Ziel ist ein stabiler, wartbarer Betrieb statt einmaliger Bastellösungen.

MMLU

MMLU (Massive Multitask Language Understanding) ist ein bekannter Test, mit dem das Wissen von Sprachmodellen geprüft wird. Er besteht aus Multiple-Choice-Fragen aus vielen Fachgebieten, von Mathematik über Recht bis Medizin. Ein höherer Prozentwert bedeutet, dass das Modell mehr Fragen richtig beantwortet. Der Wert ist nur ein Anhaltspunkt und sagt wenig darüber aus, wie ein Modell sich in deiner konkreten Aufgabe verhält.

Model Card

Eine Model Card (Modellkarte) ist ein kurzes Begleitdokument zu einem KI-Modell. Sie beschreibt, wofür das Modell gedacht ist, mit welchen Daten es trainiert wurde, wo seine Grenzen liegen und welche Risiken oder Verzerrungen bekannt sind. So kannst du besser einschätzen, ob ein Modell für deinen Zweck geeignet ist. Sie schafft Transparenz, ersetzt aber keine eigene Prüfung.

Model Context Protocol (MCP)

Das Model Context Protocol (MCP) ist ein offener Standard, über den KI-Anwendungen einheitlich an externe Datenquellen und Werkzeuge angebunden werden. Statt für jede Verbindung eine eigene Schnittstelle zu bauen, sprechen Modell und Werkzeug eine gemeinsame Sprache. So kann ein Assistent zum Beispiel auf Dateien, Datenbanken oder APIs zugreifen. Das erleichtert es, ein Modell mit aktuellen Informationen und Aktionen zu verbinden.

Model Drift

Model Drift (Modelldrift) beschreibt, dass die Vorhersagen eines Modells mit der Zeit schlechter werden, weil sich die echte Welt von den Daten entfernt, mit denen es trainiert wurde. Ändern sich zum Beispiel Kundenverhalten oder Marktbedingungen, passen die alten Muster nicht mehr. Deshalb müssen Modelle im Betrieb überwacht und bei Bedarf mit neuen Daten aktualisiert werden.

Multimodales Modell

Ein multimodales Modell kann mehrere Arten von Eingaben verarbeiten, etwa Text, Bilder, Audio oder Video, statt nur einer. Es lernt, Zusammenhänge zwischen diesen Formen herzustellen, und kann zum Beispiel ein Bild beschreiben oder eine Frage zu einem Foto beantworten. Manche dieser Modelle erzeugen auch verschiedene Ausgaben. Dadurch wird die Bedienung flexibler, weil du nicht auf reinen Text beschränkt bist.

N

Named Entity Recognition (NER)

Named Entity Recognition (NER) ist eine Sprachverarbeitungs-Technik, die in Texten benannte Dinge erkennt und einordnet. Dazu gehören etwa Personen, Orte, Firmen, Datumsangaben oder Geldbeträge. So lässt sich aus einem Fließtext strukturierte Information herausziehen, zum Beispiel für eine Suche oder eine Auswertung. Du findest NER unter anderem in Dokumentenanalyse und automatischer Datenerfassung.

Natural Language Processing (NLP)

Natural Language Processing (NLP), zu Deutsch Sprachverarbeitung, ist das Teilgebiet der KI, das sich mit menschlicher Sprache befasst. Es umfasst Aufgaben wie Übersetzen, Zusammenfassen, das Erkennen von Stimmungen oder das Beantworten von Fragen. Dafür müssen Texte so aufbereitet werden, dass ein Computer sie verarbeiten kann. Sprachmodelle und Chatbots beruhen auf diesen Methoden.

Neuronales Netz

Ein neuronales Netz ist ein Rechenmodell, das lose vom Aufbau des Gehirns inspiriert ist. Es besteht aus vielen verbundenen Knoten in Schichten, die Eingaben gewichten und weitergeben. Während des Trainings passen sich diese Gewichte an, sodass das Netz Muster in Daten erkennt. Es bildet die Grundlage für die meisten heutigen KI-Verfahren, vom Bilderkennen bis zu Sprachmodellen.

O

Open Weights

Open Weights bedeutet, dass die trainierten Gewichte eines Modells öffentlich verfügbar sind und du es damit selbst ausführen oder anpassen kannst. Anders als bei vollständig quelloffenen Projekten werden dabei aber nicht zwingend die Trainingsdaten oder der Trainingscode offengelegt. Du bekommst also das fertige Modell, aber nicht unbedingt den Weg dorthin. Der Begriff wird oft fälschlich mit Open Source gleichgesetzt.

Open-Source-Modell

Ein Open-Source-Modell ist ein KI-Modell, dessen Bestandteile offen zugänglich sind, oft inklusive Code und Lizenz zur freien Nutzung. Je nach Lizenz darfst du es selbst betreiben, anpassen und weitergeben. Das macht dich unabhängiger von einem einzelnen Anbieter und erlaubt mehr Einblick in die Funktionsweise. Was genau offengelegt ist, unterscheidet sich allerdings von Projekt zu Projekt.

Overfitting

Overfitting (Überanpassung) beschreibt, wenn ein Modell die Trainingsdaten zu genau auswendig lernt, statt allgemeine Muster zu erfassen. Es schneidet dann bei bekannten Beispielen sehr gut ab, versagt aber bei neuen, ungesehenen Daten. Ursachen sind oft zu wenige Daten oder ein zu komplexes Modell. Gegenmittel sind unter anderem mehr Daten, Regularisierung und sauberes Testen.

P

Parameter

Parameter sind die internen Stellgrößen eines Modells, die während des Trainings angepasst werden. Vereinfacht gesagt sind es die Gewichte, mit denen ein neuronales Netz Eingaben verrechnet. Ihre Anzahl, etwa Milliarden bei großen Modellen, gibt einen groben Hinweis auf die Kapazität. Mehr Parameter bedeuten aber nicht automatisch bessere oder verlässlichere Ergebnisse.

Perplexity

Perplexity ist ein Maß dafür, wie gut ein Sprachmodell den nächsten Textbaustein vorhersagt. Ein niedriger Wert bedeutet, dass das Modell wenig überrascht ist und Texte gut einschätzt, ein hoher Wert das Gegenteil. Forscher nutzen ihn, um Modelle während der Entwicklung zu vergleichen. Er sagt allerdings nichts darüber aus, ob die erzeugten Aussagen inhaltlich richtig oder nützlich sind.

Pre-Training

Pre-Training ist die erste, große Lernphase eines Modells, in der es aus sehr vielen ungeordneten Daten allgemeine Muster lernt. Bei Sprachmodellen geschieht das meist, indem das Modell wieder und wieder den nächsten Textbaustein vorhersagt. Daraus entsteht ein breites Grundverständnis von Sprache und Wissen. Erst danach folgen feinere Schritte wie Fine-Tuning für konkrete Aufgaben.

Precision und Recall

Precision und Recall sind zwei Kennzahlen, mit denen die Güte einer Klassifikation gemessen wird. Precision (Genauigkeit) gibt an, wie viele der als positiv markierten Fälle tatsächlich richtig waren. Recall (Trefferquote) gibt an, wie viele der wirklich positiven Fälle das Modell gefunden hat. Beide stehen oft im Spannungsverhältnis, weshalb man je nach Anwendung das eine oder andere stärker gewichtet.

Prompt

Ein Prompt ist die Eingabe, mit der du einem Sprachmodell sagst, was es tun soll. Je klarer du Rolle, Kontext, Format und Beispiele vorgibst, desto brauchbarer wird die Antwort. Der Prompt ist damit der wichtigste Hebel für gute Ergebnisse.

Prompt Engineering

Prompt Engineering ist die Kunst, Anweisungen an ein KI-Modell so zu formulieren, dass du brauchbare Antworten bekommst. Dazu gehört, das Ziel klar zu beschreiben, Beispiele oder Kontext mitzugeben und das Format vorzugeben. Kleine Änderungen am Wortlaut können das Ergebnis spürbar verändern. Es ist eher eine erlernbare Praxis als eine exakte Wissenschaft.

Prompt Injection

Prompt Injection ist ein Angriff, bei dem jemand einem KI-System über versteckte oder eingeschleuste Anweisungen ein unerwünschtes Verhalten unterschiebt. Solche Anweisungen können etwa in einer Webseite oder einem Dokument stecken, das das Modell verarbeitet. Das Modell folgt ihnen dann womöglich, statt deinen eigentlichen Auftrag zu erfüllen. Besonders riskant ist das bei Systemen, die selbstständig auf Werkzeuge oder Daten zugreifen.

Q

Quantisierung

Quantisierung verkleinert ein Modell, indem seine Zahlen mit geringerer Genauigkeit gespeichert werden, etwa als kleinere Ganzzahlen statt langer Kommazahlen. Dadurch braucht es weniger Speicher und rechnet schneller, oft sogar auf gewöhnlicher Hardware. Im Gegenzug kann die Qualität leicht sinken. In der Praxis ist der Unterschied häufig gering, sodass sich der Kompromiss lohnt.

R

Rate Limit

Ein Rate Limit ist eine Obergrenze dafür, wie viele Anfragen du in einem Zeitraum an einen KI-Dienst schicken darfst. Anbieter setzen sie ein, um die Server zu schützen und die Last fair zu verteilen. Wird die Grenze überschritten, werden weitere Anfragen vorübergehend abgewiesen oder verzögert. Bei eigener Software musst du das einplanen, etwa durch Wiederholungen mit Wartezeit.

Recurrent Neural Network (RNN)

Ein Recurrent Neural Network ist ein neuronales Netz, das Daten in einer Reihenfolge verarbeitet und sich dabei an Vorheriges erinnert, etwa Wort für Wort in einem Satz. Diese Erinnerung macht es geeignet für Text, Sprache und Zeitreihen. Bei langen Abfolgen stößt es jedoch an Grenzen, weshalb es heute oft durch Transformer ersetzt wird.

Regression

Regression ist eine Methode des maschinellen Lernens, bei der ein Modell einen kontinuierlichen Zahlenwert vorhersagt, etwa einen Preis, eine Temperatur oder eine Verkaufsmenge. Anders als bei der Klassifikation, die feste Kategorien zuordnet, geht es hier um eine fortlaufende Skala. Das Modell lernt aus Beispieldaten, wie Eingaben mit dem Zielwert zusammenhängen.

Regularisierung

Regularisierung ist eine Technik beim Training, die verhindern soll, dass ein Modell die Trainingsdaten auswendig lernt statt allgemeine Muster zu erkennen. Dazu werden zu komplexe Lösungen während des Lernens bewusst bestraft, sodass das Modell einfacher bleibt. So wird Overfitting reduziert und das Modell schneidet bei neuen Daten besser ab.

Reinforcement Learning

Reinforcement Learning, auf Deutsch bestärkendes Lernen, ist eine Methode, bei der ein System durch Ausprobieren lernt und für gute Entscheidungen Belohnungen, für schlechte Strafen erhält. Über viele Versuche entwickelt es so eine Strategie, die die Belohnung maximiert. Diese Methode steckt zum Beispiel hinter Spiele-KIs und wird auch genutzt, um Sprachmodelle an menschliche Vorlieben anzupassen.

Reranking

Reranking ordnet eine bereits gefundene Liste von Suchergebnissen ein zweites Mal nach Relevanz, um die treffendsten Einträge nach oben zu sortieren. Häufig liefert eine schnelle erste Suche viele Kandidaten, und ein genaueres Modell bewertet diese anschließend neu. In RAG-Systemen verbessert das die Qualität der Textstellen, die einem Sprachmodell als Kontext mitgegeben werden.

Retrieval-Augmented Generation (RAG)

Retrieval-Augmented Generation (RAG) verbindet ein Sprachmodell mit einer Suche in eigenen Dokumenten. Statt nur aus dem Gelernten zu antworten, holt das System passende Textstellen heran und nutzt sie als Grundlage für die Antwort. So kann es auf aktuelle oder firmeneigene Inhalte zugreifen und das Risiko von Halluzinationen senken. Die Antwortqualität hängt davon ab, wie gut die Suche die richtigen Stellen findet.

RLHF

RLHF steht für Reinforcement Learning from Human Feedback, also bestärkendes Lernen aus menschlichem Feedback. Dabei bewerten Menschen verschiedene Antworten eines Modells, und das Modell lernt, künftig die bevorzugten Antworten zu erzeugen. Diese Methode trägt dazu bei, dass Sprachmodelle hilfreicher und weniger problematisch antworten.

S

Schwache KI

Schwache KI bezeichnet Systeme, die für eine bestimmte Aufgabe entwickelt sind, etwa Bilderkennung, Übersetzung oder Schachspielen. Sie haben kein eigenes Verständnis und können nur das, wofür sie trainiert wurden. Praktisch alle heute eingesetzten KI-Systeme fallen in diese Kategorie, im Gegensatz zur bisher hypothetischen allgemeinen KI.

Semantische Suche

Die semantische Suche findet Inhalte nicht über exakt übereinstimmende Wörter, sondern über deren Bedeutung. Dazu werden Texte in Zahlenvektoren umgewandelt, sodass inhaltlich ähnliche Inhalte auch dann gefunden werden, wenn sie andere Begriffe verwenden. So liefert eine Suche nach Auto auch Treffer zu Fahrzeug oder Pkw.

Sentiment-Analyse

Die Sentiment-Analyse ermittelt automatisch, ob ein Text positiv, negativ oder neutral gestimmt ist. Sie wird zum Beispiel genutzt, um Kundenbewertungen, Kommentare oder Social-Media-Beiträge im großen Stil auszuwerten. So lässt sich die Stimmung zu einem Produkt oder Thema einschätzen, ohne jeden Beitrag einzeln zu lesen.

Sequence-to-Sequence

Sequence-to-Sequence beschreibt Modelle, die eine Eingabefolge in eine Ausgabefolge umwandeln, etwa einen Satz in seine Übersetzung. Ein Teil des Modells liest die Eingabe ein, ein anderer erzeugt daraus Schritt für Schritt die Ausgabe. Dieses Prinzip ist die Grundlage für maschinelle Übersetzung und viele weitere Text-Anwendungen.

Softmax

Softmax ist eine Funktion, die eine Liste von Zahlen in Wahrscheinlichkeiten umwandelt, die sich zu 100 Prozent addieren. Am Ende eines Sprachmodells macht sie aus den Rohwerten für viele mögliche nächste Token eine Wahrscheinlichkeitsverteilung. So entsteht die Grundlage dafür, welches Wort als Nächstes gewählt wird.

Speech-to-Text

Speech-to-Text wandelt gesprochene Sprache automatisch in geschriebenen Text um. Die Technik steckt hinter Diktierfunktionen, automatischen Untertiteln und Sprachassistenten. Moderne Systeme erkennen dabei auch unterschiedliche Sprecher, Akzente und Hintergrundgeräusche recht zuverlässig.

Synthetische Daten

Synthetische Daten sind künstlich erzeugte Daten, die echte Daten nachbilden, ohne reale Personen oder Vorfälle direkt abzubilden. Man nutzt sie, wenn echte Daten knapp, teuer oder aus Datenschutzgründen heikel sind. Allerdings können sie Verzerrungen enthalten oder die Wirklichkeit ungenau abbilden, weshalb ihr Einsatz Sorgfalt erfordert.

System-Prompt

Der System-Prompt ist eine versteckte Anweisung, die einem Sprachmodell vorgibt, wie es sich verhalten soll, etwa welchen Tonfall es nutzt oder welche Themen es meidet. Anders als die Eingabe des Nutzers ist er fester Teil der Anwendung und gilt für das gesamte Gespräch. Er legt damit den Rahmen fest, in dem das Modell antwortet.

T

Temperatur

Die Temperatur ist eine Einstellung, die steuert, wie kreativ oder vorhersehbar ein Sprachmodell antwortet. Ein niedriger Wert führt zu nüchternen, gut reproduzierbaren Antworten, ein hoher Wert zu abwechslungsreicheren, aber auch unzuverlässigeren Ergebnissen. Je nach Aufgabe wählt man den Wert, etwa niedrig für Fakten und höher für Ideensammlungen.

Text-to-Speech (TTS)

Text-to-Speech wandelt geschriebenen Text in gesprochene Sprache um. Die Technik steckt hinter Vorlesefunktionen, Sprachassistenten und Hörbuch-Stimmen. Moderne Systeme erzeugen dabei Stimmen, die natürlich klingen und Betonung sowie Sprechtempo berücksichtigen.

Token

Ein Token ist die kleinste Texteinheit, mit der ein Sprachmodell rechnet — oft ein Wortteil, nicht ein ganzes Wort. Modelle messen Eingabe, Ausgabe und Kosten in Token. Als Faustregel entsprechen 1.000 Token grob 750 deutschen Wörtern.

Tokenisierung

Tokenisierung ist der Schritt, in dem ein Text in kleine Einheiten zerlegt wird, sogenannte Tokens, die ein Modell verarbeiten kann. Ein Token ist oft ein ganzes Wort, manchmal nur eine Silbe oder ein Zeichen. Diese Zerlegung ist die Grundlage dafür, dass ein Sprachmodell Text überhaupt lesen und erzeugen kann.

Top-p (Nucleus Sampling)

Top-p, auch Nucleus Sampling genannt, ist eine Einstellung, die bei der Wortwahl eines Sprachmodells nur die wahrscheinlichsten Optionen zulässt, bis ihre Wahrscheinlichkeit zusammen einen Schwellenwert erreicht. Unwahrscheinliche Wörter werden so ausgeschlossen. Wie die Temperatur beeinflusst Top-p, wie kreativ oder kontrolliert die Antworten ausfallen.

Trainingsdaten

Trainingsdaten sind die Beispiele, aus denen ein Modell lernt, etwa Texte, Bilder oder Tabellen. Ihre Menge und Qualität bestimmen maßgeblich, wie gut das fertige Modell arbeitet. Enthalten sie Lücken oder Verzerrungen, übernimmt das Modell diese Schwächen häufig.

Transfer Learning

Transfer Learning bedeutet, ein bereits trainiertes Modell als Ausgangspunkt für eine neue, verwandte Aufgabe zu nutzen, statt von Grund auf neu zu trainieren. Das vorhandene Wissen wird übertragen und nur noch mit weniger Daten angepasst. Das spart Rechenzeit und Daten und ist Grundlage moderner Foundation-Modelle.

Transformer

Der Transformer ist die Netzwerk-Architektur, auf der nahezu alle modernen Sprachmodelle beruhen. Sein Kern ist der Attention-Mechanismus, der bewertet, welche Wörter im Text füreinander wichtig sind. Seit 2017 hat er ältere Ansätze weitgehend abgelöst.

Turing-Test

Der Turing-Test ist ein 1950 von Alan Turing vorgeschlagenes Gedankenexperiment, um zu prüfen, ob eine Maschine menschenähnlich kommunizieren kann. Eine Person chattet dabei mit einem unbekannten Gegenüber und soll erraten, ob es ein Mensch oder eine Maschine ist. Der Test misst nur die Täuschung im Gespräch, nicht echtes Verständnis oder Intelligenz.

U

Überwachtes Lernen

Beim überwachten Lernen trainiert ein Modell mit Beispielen, bei denen die richtige Antwort bereits bekannt ist, etwa Bilder mit dem Vermerk Katze oder Hund. Aus diesen beschrifteten Daten lernt es den Zusammenhang zwischen Eingabe und gewünschtem Ergebnis. Anschließend kann es bei neuen, unbeschrifteten Daten passende Vorhersagen treffen.

Unüberwachtes Lernen

Beim unüberwachten Lernen sucht ein Modell selbstständig Muster in Daten, ohne dass die richtigen Antworten vorgegeben sind. Es gruppiert zum Beispiel ähnliche Datenpunkte oder findet auffällige Ausreißer. Das ist nützlich, wenn beschriftete Daten fehlen, etwa um Kundengruppen zu erkennen.

V

Vektordatenbank

Eine Vektordatenbank speichert Daten als Zahlenvektoren, die die Bedeutung von Texten, Bildern oder Tönen abbilden. Sie ist darauf ausgelegt, schnell inhaltlich ähnliche Einträge zu finden, statt nur exakte Wörter zu vergleichen. Sie bildet die Grundlage für semantische Suche und RAG-Systeme.

Verlustfunktion

Eine Verlustfunktion misst während des Trainings, wie weit die Vorhersage eines Modells von der richtigen Antwort entfernt ist. Je größer der Fehler, desto höher der Wert. Das Training versucht, diesen Wert Schritt für Schritt zu senken und so das Modell zu verbessern. Sie ist gewissermaßen der Kompass, an dem sich das Lernen ausrichtet.

W

Watermarking

Watermarking versieht KI-erzeugte Inhalte mit einem unsichtbaren Kennzeichen, das später nachweist, dass sie von einer Maschine stammen. Dieses Wasserzeichen ist für Menschen nicht erkennbar, lässt sich aber technisch auslesen. Es soll helfen, Deepfakes und automatisch erzeugte Texte einzuordnen, ist aber nicht völlig fälschungssicher.

Whisper

Whisper ist ein von OpenAI veröffentlichtes Modell, das gesprochene Sprache in Text umwandelt und dabei viele Sprachen beherrscht. Es kann auch Aufnahmen mit Akzenten oder Hintergrundgeräuschen recht zuverlässig verschriftlichen und übersetzen. Weil es frei verfügbar ist, wird es vielfach in Transkriptions- und Untertitel-Werkzeugen eingesetzt.

Z

Zero-Shot Learning