KI-Glossar: das Wörterbuch für alle KI-Begriffe

Unser KI Wörterbuch erklärt zentrale Begriffe rund um moderne KI-Systeme in klarer Sprache. Die Terminologiedatenbank wird regelmäßig aktualisiert.

Es richtet sich an alle, die KI-Projekte evaluieren, einführen oder intern verständlich kommunizieren wollen. Viele Begriffe werden im Alltag unterschiedlich verwendet, hier finden Sie kurze, präzise Arbeitsdefinitionen als gemeinsame Grundlage.

KI Begriffe von A bis Z

Nutze die Suche, um den passenden Begriff schnell zu finden.

AI Accountability

Klare Verantwortlichkeiten dafür, wer Risiken, Entscheidungen und Kontrollen eines KI-Systems trägt und nachweisen kann.

AI Agent

Ein KI-System, das eigenständig Aufgaben in mehreren Schritten ausführt und dabei Tools, Datenquellen oder APIs nutzt.

AI Guardrails

Schutzmaßnahmen wie Regeln, Filter, Freigaben und Sicherheitsprüfungen, die ein KI-System in sicheren Grenzen halten.

AI Literacy

Wissen und Fähigkeiten, KI sinnvoll, sicher und risikobewusst einzusetzen.

AI Model

Ein trainiertes Modell, das aus Eingaben Wahrscheinlichkeiten berechnet und daraus Ausgaben erzeugt.

AI Red Teaming

Gezieltes, kritisches Testen, um Schwächen, Sicherheitslücken, Fehlverhalten oder Diskriminierung vor dem Produktivbetrieb zu finden.

AI System

Ein Gesamtsystem aus Software und ggf. Hardware, das aus Eingaben Ausgaben wie Vorhersagen, Inhalte, Empfehlungen oder Entscheidungen ableitet.

AI Wrapper

Eine Anwendung, die ein bestehendes KI-Modell in ein nutzbares Produkt mit eigener Oberfläche, Workflows und Funktionen verpackt.

Alignment

Methoden, um Modellverhalten an menschliche Ziele, Regeln und Sicherheitsanforderungen anzupassen.

Benchmark

Standardisierter Test, mit dem die Leistung verschiedener KI-Modelle vergleichbar gemessen wird.

Bias

Systematische Verzerrung in Daten oder Modellen, die zu unfairen oder fehlerhaften Ergebnissen führen kann.

Chunking

Das Zerlegen großer Inhalte in kleinere Abschnitte, damit sie besser gespeichert, gesucht und ins Kontextfenster geladen werden können.

Compute

Rechenressourcen wie GPU-Zeit und Infrastruktur, die für Training und Betrieb von KI-Modellen benötigt werden.

Computer Vision

Teilgebiet der KI, das Bilder und Videos analysiert, um Objekte, Texte oder Muster automatisch zu erkennen.

Data Drift / Concept Drift

Wenn sich Daten oder die Bedeutung der Zielgröße über die Zeit ändern und Modelle dadurch schlechter werden.

Data Poisoning

Ein Angriff, bei dem Trainings- oder Wissensdaten absichtlich manipuliert werden, damit das System falsche Ergebnisse liefert.

Dataset

Eine strukturierte Sammlung von Daten, die zum Trainieren, Testen oder Betreiben eines Modells genutzt wird.

Deepfake

KI-generierter oder manipulierter Bild-, Audio- oder Video-Content, der echt wirkt.

Deployer (Betreiber/Nutzer im Unternehmen)

Organisation oder Person, die ein KI-System unter eigener Verantwortung einsetzt.

Deployment Stage

Die Phase, in der ein Modell oder eine Anwendung in eine Live-Umgebung gebracht wird.

Differential Privacy

Ein mathematischer Ansatz, der Privatsphärenrisiken messbar reduziert, indem statistisches Rauschen hinzugefügt wird.

Embeddings

Numerische Vektoren, die Inhalte wie Text semantisch darstellen und so Suche, Clustering und ähnlichkeitsbasierte Vergleiche ermöglichen.

Fine-Tuning

Nachtraining eines Basismodells mit spezifischen Daten, um es auf eine konkrete Aufgabe oder Domäne zu spezialisieren.

Foundation Model

Großes, breit trainiertes Ausgangsmodell, das als Basis für viele spezialisierte KI-Anwendungen dient.

Fundamental Rights Impact Assessment

Folgenabschätzung vor dem Einsatz bestimmter Hochrisiko-KI, um betroffene Gruppen, Risiken und Gegenmaßnahmen zu dokumentieren.

General-Purpose AI Model (GPAI)

Ein allgemein einsetzbares KI-Modell, das sich in viele Anwendungen integrieren lässt.

Generative AI (GenAI)

KI, die neue Inhalte erzeugt statt nur zu klassifizieren oder vorherzusagen.

GPU

Grafikprozessor, der durch parallele Verarbeitung besonders effizient für KI-Training und Inference ist.

Ground Truth

Geprüfte Referenz-Wahrheit, mit der man Modell-Ausgaben vergleichen und Qualität messen kann.

Grounding

Antworten auf überprüfbare Quellen und Kontext stützen, damit Ergebnisse genauer und belastbarer werden.

Halluzination

Plausibel klingende, aber inhaltlich falsche oder erfundene Modellantwort ohne verifizierbare Grundlage.

High-Risk AI System

Ein KI-System in sensiblen Einsatzbereichen mit zusätzlichen Pflichten und Kontrollen.

Human Oversight

So gestalten, dass Menschen wirksam überwachen und eingreifen können, um Risiken zu verhindern oder zu minimieren.

Hyperparameter

Einstellungen, die man vor oder während des Trainings festlegt und die beeinflussen, wie das Modell lernt.

Inference

Die Ausführungsphase eines trainierten Modells, in der es neue Eingaben verarbeitet und Ergebnisse erzeugt.

Information Leakage

Unbeabsichtigtes oder absichtliches Abfließen von Informationen in eine Umgebung, der man nicht vertraut.

Jailbreak

Spezielle Form von Prompt Injection, die darauf abzielt, Sicherheitsregeln und Einschränkungen des Modells zu umgehen.

Kontextfenster

Maximale Menge an Tokens, die ein Modell in einer Anfrage gleichzeitig berücksichtigen kann.

Label / Data Labeling

Ein Label markiert, was ein Datenpunkt bedeutet; Data Labeling ist das systematische Vergaben dieser Labels.

Large Language Model (LLM)

Großes Sprachmodell, das auf umfangreichen Textdaten trainiert wurde und Aufgaben in natürlicher Sprache löst.

Latency

Die Zeit zwischen Anfrage und Ausgabe.

LLMOps

Praktiken und Prozesse für Betrieb, Monitoring, Updates und Qualitätssicherung von LLM-Anwendungen.

MLOps

Praktiken und Prozesse, die Entwicklung und Betrieb von ML-Systemen verbinden.

Model Card

Steckbrief und Dokumentation eines Modells: Zweck, Grenzen, Tests, bekannte Risiken und geeignete Nutzung.

Monitoring

Die dauerhafte Beobachtung eines Systems in Produktion, um Qualität, Fehler, Drift und Kosten im Blick zu behalten.

Multimodalität

Fähigkeit eines Modells, mehrere Datentypen wie Text, Bild, Audio oder Video gemeinsam zu verarbeiten.

Observability (Logs, Metrics, Traces)

Die Fähigkeit, ein System über Logs, Metriken und Traces so zu instrumentieren, dass man Verhalten und Ursachen verstehen kann.

Orchestration

Die Steuerlogik um ein Modell herum, die Tools, Datenfluss, State und Abläufe koordiniert.

Overfitting

Wenn ein Modell Trainingsdaten auswendig lernt und dadurch bei neuen, echten Fällen schlechter wird.

Overreliance / Automation Bias

Wenn Menschen oder Prozesse KI-Antworten zu stark vertrauen und dadurch Fehler oder Schäden übersehen.

Parameter

Interne Modellwerte, die während des Trainings gelernt werden und das Verhalten des Modells bestimmen.

PII / Personal Data

Informationen, die eine Person direkt oder indirekt identifizierbar machen.

Pre-Training

Erstes Grundtraining für ein allgemeines Modell, das später für konkrete Aufgaben angepasst werden kann.

Prompt

Die Eingabeanweisung an ein Modell, die Ziel, Kontext und gewünschtes Ausgabeformat vorgibt.

Prompt Engineering

Strukturiertes Entwerfen und Iterieren von Prompts, um zuverlässigere und hochwertigere Ergebnisse zu erzielen.

Prompt Injection

Angriff, bei dem unzuverlässige Eingaben so platziert werden, dass sie den Prompt übernehmen und das System zu unerwünschtem Verhalten bringen.

Provider (Anbieter)

Organisation oder Person, die ein KI-System oder GPAI-Modell entwickelt oder unter eigenem Namen in Verkehr bringt.

RAG (Retrieval-Augmented Generation)

Ansatz, bei dem ein Modell vor der Antwort relevante externe Informationen abruft und in die Generierung einbezieht.

Reinforcement Learning

Lernen durch Versuch und Feedback, bei dem ein System Handlungen ausprobiert und daraus Belohnung oder Strafe ableitet.

RLHF (Reinforcement Learning from Human Feedback)

Trainingsverfahren, bei dem menschliches Feedback genutzt wird, um Antworten hilfreicher und sicherer zu machen.

Self-Supervised Learning

Lernen, bei dem Labels automatisch aus den Daten abgeleitet werden.

Sensitive Information Disclosure

Das Risiko, dass ein LLM sensible Informationen wie interne Daten oder Kundendaten ausgibt.

Supervised Learning

Lernen mit gelabelten Beispielen, bei dem das Modell Eingabe und richtige Antwort sieht.

System Prompt / System Message

Grundregeln und Kontext für den Assistenten, etwa Rolle, Grenzen und Ton.

Token

Kleinste Verarbeitungseinheit eines Sprachmodells, meist Wortteile oder Zeichenfolgen.

Tool Calling / Function Calling

Wenn ein Modell strukturierte Aufrufe erzeugt, damit eine Anwendung APIs oder Tools ausführen kann.

Training

Lernphase, in der ein Modell anhand von Daten seine Parameter schrittweise anpasst.

Training Data

Daten, mit denen ein Modell lernt und seine Parameter so anpasst, dass es die gewünschte Aufgabe besser erfüllt.

Training, Validation, Test Set

Dreiteilung von Daten in Trainings-, Validierungs- und Testdaten für Lernen, Kontrolle und finalen Check.

Transformer

Modellarchitektur mit Attention-Mechanismus, die die Grundlage moderner Sprachmodelle bildet.

Transparency obligations for AI-generated content

Pflichten rund um Kennzeichnung und Information bei KI-generierten oder synthetischen Inhalten.

Trustworthy AI

KI, die im Einsatzkontext als vertrauenswürdig gilt: zuverlässig, sicher, transparent, erklärbar, fair und datenschutzfreundlich.

Unsupervised Learning

Lernen ohne Labels, bei dem das Modell selbst Muster oder Gruppen in Daten entdeckt.

Vector Database

Eine Datenbank für Embeddings, die ähnliche Inhalte über Vektorvergleiche findet.

Vector Search / Similarity Search

Suche nach ähnlicher Bedeutung statt nach exakt gleichen Wörtern.

Watermarking / Content Provenance

Techniken, die anzeigen sollen, ob Content KI-generiert ist und woher er stammt.

Zero-Shot Learning

Fähigkeit eines Modells, Aufgaben ohne aufgabenspezifisches Nachtraining nur auf Basis der Anweisung zu lösen.

Verantwortung lässt sich nicht auslagern.

Jeder Prompt, jedes Dokument, jedes Gespräch, alles auf Ihrem Server, alles unter eurer Kontrolle.