KI-Modelle generieren wahrscheinlichen Text, keinen verifizierten Faktenabgleich. Halluzinationen entstehen, weil das Modell keine Quelle abruft, sondern statistisch plausible Fortsetzungen erzeugt. Überprüfung kritischer Outputs ist daher Pflicht.
KI wirkt überzeugend – auch wenn sie falsch liegt. Das ist der Kern des Halluzinationsproblems: nicht die Fehler selbst, sondern ihre sprachliche Perfektion.
Der Mythos: KI als Wissensmaschine
Der verbreitetste Irrglaube über KI-Sprachmodelle ist dieser: Sie rufen Fakten aus einer riesigen Datenbank ab – ähnlich wie eine erweiterte Google-Suche. In der Praxis sieht es vollständig anders aus. Sprachmodelle wie ChatGPT, Claude oder Gemini wurden auf enormen Textmengen trainiert und lernen dabei, welche Wörter, Sätze und Aussagen statistisch wahrscheinlich aufeinander folgen. Wenn Sie das Modell nach einer Zahl, einem Urteil oder einem Personennamen fragen, antwortet es nicht mit dem, was es weiß – sondern mit dem, was in seinem Training am häufigsten in einem solchen Kontext auftauchte. Das ist ein grundlegender Unterschied. Und er ist gefährlich, weil das Ergebnis exakt so formuliert ist, als käme es aus einem Lexikon.
Das Tückische: Halluzinationen sind nicht auf schwache Modelle beschränkt. Selbst die leistungsstärksten Systeme halluzinieren – gerade dann, wenn sie zu einer Frage wenig Trainingsdaten hatten, sie aber dennoch kompetent klingen möchten. Das Modell weiß nicht, dass es etwas nicht weiß. Es generiert einfach weiter.
Der Mythos klar benannt
Was Halluzinationen technisch sind
Technisch gesehen ist eine Halluzination kein Fehler im Sinne eines Programmierfehlers. Sie ist das erwartbare Ergebnis eines Systems, das auf Wahrscheinlichkeit optimiert ist – nicht auf Richtigkeit. Das Modell erzeugt Ausgaben, die im Kontext des Gesprächs grammatikalisch korrekt, sprachlich überzeugend und thematisch passend sind – aber sachlich falsch sein können.
Besonders häufig treten Halluzinationen auf bei: spezifischen Zahlen, Daten und Statistiken (Modelle runden, interpolieren oder erfinden Werte); Personen und Biografien (Namen, Funktionen, Zitate werden kombiniert und teils frei erfunden); Rechtsurteilen und Gesetzesstellen (Aktenzeichen, Paragraphen und Urteilsinhalte werden plausibel klingend zusammengesetzt); Unternehmensdaten (Umsätze, Mitarbeiterzahlen, Gründungsjahre aus schwach repräsentierten Quellen); sowie Spezialthemen mit geringer Trainingsdatenbasis (Nischenthemen, lokale Ereignisse, Fachinhalte).
Warum wirken Halluzinationen so überzeugend? Weil das Modell gelernt hat, dass präzise, selbstsichere Antworten dem menschlichen Erwartungsmuster entsprechen. Es formuliert keine Unsicherheit, wenn es nicht explizit dazu aufgefordert wird.
Szenarien mit hohem Halluzinationsrisiko
- Rechtsfragen: Gerichtsurteile, Aktenzeichen, Paragraphen – hier werden plausibel klingende, aber falsche Referenzen generiert
- Medizin: Dosierungen, Studienreferenzen, Diagnosekriterien – lebensrelevante Fehler sind möglich
- Finanzrecht und Steuerrecht: Steuergesetze, Fristen, Prozentsätze – Modelle kennen keine aktuellen Gesetzesänderungen
- Historische Fakten: Daten, Orte, beteiligte Personen – besonders bei wenig dokumentierten Ereignissen
- Spezifische Unternehmensdaten: Interne Zahlen, Personalien, Produktdetails – ausserhalb des Trainingsdatensatzes
- Lokale Ereignisse und regionale Rechtsprechung: Kaum in Trainingsdaten vorhanden – hohes Erfindungsrisiko
- Aktuelle Entwicklungen nach dem Training-Cutoff: Das Modell kennt keine Ereignisse nach seinem Wissensstichtag
Wie man mit Halluzinationen professionell umgeht
-
Kritische Outputs immer verifizieren
Zahlen, Namen, Daten, Rechtsquellen und Studienergebnisse niemals ungeprüft übernehmen. Nutzen Sie KI als ersten Entwurf, nicht als letzte Instanz. Die Verifikationspflicht liegt beim Menschen – nicht beim Modell.
-
Quellen-Prompts einsetzen
Formulieren Sie Prompts so, dass das Modell Quellen oder Begründungen nennen muss – das reduziert zwar keine Halluzinationen, macht sie aber sichtbarer.
-
RAG-Systeme für faktenbasierte Antworten nutzen
Retrieval Augmented Generation (RAG) verknüpft das Sprachmodell mit Ihren verifizierten Dokumenten. Das Modell antwortet dann aus Ihren Daten – nicht aus dem Training. Für unternehmensspezifische Inhalte ist das die zuverlässigste Lösung.
-
KI nie als alleinige Informationsquelle
KI-Outputs sind immer ein Ausgangspunkt, nie ein Endpunkt. Für Entscheidungen mit wirtschaftlicher, rechtlicher oder medizinischer Relevanz ist Gegenprüfung durch Fachpersonen Pflicht – unabhängig davon, wie überzeugend die Antwort klingt.
-
Mitarbeiter gezielt schulen
Das grösste Risiko liegt nicht in der KI, sondern im unkritischen Umgang mit ihren Ausgaben. Schulungen sollten konkret zeigen, bei welchen Aufgabentypen Halluzinationsrisiken hoch sind – und welche Workflows die Gegenprüfung sicherstellen.
- Sprachmodelle rufen keine Fakten ab – sie generieren wahrscheinlichen Text, der falsch sein kann
- Halluzinationen wirken überzeugend, weil das Modell nicht weiß, was es nicht weiß
- Besonders hohes Risiko bei Rechtsfragen, Medizin, Zahlen, Personen und aktuellen Ereignissen
- Lösung: kritische Verifikation, Quellen-Prompts, RAG-Systeme und Mitarbeiterschulungen
Sie wollen KI in Ihrem Unternehmen einsetzen – sicher, effizient und ohne böse Überraschungen? Wir helfen Ihnen dabei, die richtigen Prozesse und Prüfmechanismen aufzubauen.
Jetzt KI-Beratung anfragenHäufige Fragen
Halluzinieren alle KI-Modelle oder nur günstige?
Kann man Halluzinationen technisch komplett verhindern?
Wie erkenne ich eine Halluzination in einer KI-Antwort?
Was ist der Unterschied zwischen Halluzination und einem einfachen Fehler?
War dieser Artikel hilfreich?