Wie verhindert man das Halluzinieren bei LLMs?

Eine Person hält ein Smartphone in der Hand, auf dem eine KI-Anwendung mit einem Warnhinweis und einem Eingabefeld für Prompts zu sehen ist. Im Hintergrund sind digitale Symbole wie ein Gehirn, ein Mikrochip und Sicherheitswarnungen dargestellt, die auf die Risiken und die Technologie von Künstlicher Intelligenz hinweisen.

Welche Vorteile bringen KI und LLMs im Input Management?

Künstliche Intelligenz (KI) und Large Language Models (LLMs) können stark bei der Automatisierung im Input Management helfen. Mit dieser Technologie können Rechnungen sowie andere Dokumente deutlich schneller und effektiver verarbeitet werden. Dadurch nimmt der Projektaufwand ab und Unternehmen sparen bares Geld.

Darüber hinaus ermöglichen der Einsatz von KI und LLMs viele neue Möglichkeiten. So lassen sich z. B. auch Rechnungen und Dokumente verarbeiten, die keine feste Struktur haben oder lediglich als normale E-Mails vorliegen. Außerdem ist es möglich, aus vielen Dokumenten automatisch Zusammenfassungen zu erstellen und diese an Kunden oder Mitarbeitende zu versenden.

Eine Lösung, die all das bietet, ist SPICE. SPICE ist unsere Software für modernes Input Management und digitale Rechnungsverarbeitung. In SPICE können Sie einfach Workflows erstellen und unterschiedliche Bereiche der Dokumentenverarbeitung automatisieren. Das integrierte KI- und LLM-Modul verarbeitet Dokumente zuverlässig, kann auf Wunsch Daten anreichern und abschließend die extrahierten Daten zum Beispiel an ein ERP-System weiterleiten.

Damit das zuverlässig funktioniert, muss man sich auf die KI/LLM verlassen können – und das LLM darf nicht halluzinieren. Doch wie erreichen wir das?

Was ist Halluzinieren bei LLMs?

Unter Halluzinieren versteht man, dass LLMs Inhalte ausgeben, die entweder nicht korrekt sind oder – im Falle einer Extraktionsaufgabe – so gar nicht im Dokument enthalten sind, sondern aus dem Training der Modelle stammen. Das passiert, weil LLMs Texte und Sprache nicht im menschlichen Sinne wirklich „verstehen“, sondern im Wesentlichen nur berechnen, welche Antwort bzw. welche Zeichenfolge für eine bestimmte Anweisung (Prompt) statistisch gesehen basierend auf dem Trainingskorpus am wahrscheinlichsten ist.


Bei dieser Wahrscheinlichkeitsberechnung können Fehler entstehen, wodurch am Ende falsche Ergebnisse ausgegeben werden. Da diese Fehler oftmals gar nicht oder erst zu spät auffallen, kann das natürlich ein großes Problem für Unternehmen werden – vor allem bei der automatisierten Verarbeitung von Dokumenten und Rechnungen. Genau hier setzt one:ic mit SPICE an.

Wie verhindert man das Halluzinieren von LLMs?

In SPICE können Sie für verschiedene Szenarien entweder vorgefertigte und standardisierte Prompts nutzen, diese anpassen und erweitern oder gänzlich individuelle Prompts erstellen. In den Prompts definieren Sie genau, welche Informationen gesucht werden, wie diese aufgebaut sind oder wo sie zu finden sind sowie wie Inhalte interpretiert werden sollen und – am wichtigsten – in welcher Art und in welchem Schema die Ergebnisse ausgegeben werden sollen. Zum Beispiel Rechnungsnummern, Preise oder andere relevante Felder.

Die wichtigste Einstellung zur Vermeidung von Halluzination von LLMs in SPICE ist der sogenannte Temperatur-Parameter. Mit diesem können Sie festlegen, wie „kreativ“ die Antworten des Modells sein sollen und somit auch wie stark sich das LLM an die im Dokument vorhandenen Informationen halten soll oder davon abweichen darf/soll.

Wird diese Einstellung auf einen niedrigen Wert zwischen 0 und 30 gesetzt, wird das Modell gezwungen, für die Extraktion nur die im Dokument enthaltenen Werte zu verwenden und keine zusätzlichen (logischen) Ergänzungen, Checks oder Korrekturen vorzunehmen. Das ist ideal für die reine Extraktion von Informationen aus Rechnungen und Dokumenten im Input Management.

Wenn Sie hingegen möchten, dass später z. B. eine Zusammenfassung der Dokumente per E-Mail versendet wird, sollte der Parameter auf einen höheren Wert gesetzt werden. Dies ermöglicht es dem Modell, die Daten breiter zu interpretieren, selbstständig gewisse Schlussfolgerungen zu ziehen sowie die Antworten in Form von individuellen und ansprechenden Nachrichten zu erzeugen.

Das bewusste Verwenden des Temperatur-Parameters sowie geschickte Anweisungen und Vorgaben in den Prompts inklusive Vorgabe des gewünschten Antwortschemas können in SPICE die Gefahr des Halluzinierens von LLMs effektiv verringern. In Kombination mit den weiteren Möglichkeiten der SPICE-Plattform kann gleichzeitig das volle Potenzial moderner KI im Input Management ausgeschöpft werden.

Wollen Sie mehr über SPICE erfahren?

Erfahren Sie mehr zu SPICE