RAG

KI schlägt vor der Antwort in einer Wissensdatenbank nach — für aktuelle, quellenbasierte Ergebnisse ohne Finetuning.

Auch bekannt als: Retrieval-Augmented Generation, RAG-System, Wissens-KI

Was ist RAG?

RAG steht für Retrieval-Augmented Generation — auf Deutsch: abrufgestützte Textgenerierung. Es ist eine Technik, bei der ein [[llm|Sprachmodell]] vor dem Formulieren einer Antwort in einer externen Wissensdatenbank nachschlägt, ähnlich wie ein Mitarbeiter, der vor der Antwort erst im Handbuch nachsieht.

Das grundlegende Problem ohne RAG: Sprachmodelle wurden auf Daten trainiert, die irgendwann in der Vergangenheit enden. Sie wissen nichts über interne Dokumente, aktuelle Preislisten, neue Gesetze oder firmeninterne Prozesse.

RAG löst dieses Problem: Das System durchsucht eine Dokumentendatenbank, findet relevante Textpassagen und gibt diese als Kontext an das Sprachmodell. Das Modell antwortet dann auf Basis dieser Dokumente — nicht aus seinem Trainingsgedächtnis.

Wie funktioniert RAG technisch?

Indexierung: Dokumente werden in kleine Textabschnitte (Chunks) zerlegt und als mathematische Einbettungen (Embeddings) in einer Vektordatenbank gespeichert.
Anfrage: Der Nutzer stellt eine Frage.
Retrieval: Das System sucht in der Vektordatenbank nach den relevantesten Chunks.
Augmentation: Die gefundenen Textpassagen werden dem [[prompt-engineering|Prompt]] als Kontext beigefügt.
Generation: Das Sprachmodell generiert eine Antwort auf Basis dieses Kontexts.

Anwendungsbeispiele für KMU

Interner Wissens-Chatbot: KI, die auf Basis eigener Handbücher, Protokolle und Verträge antwortet
Produkt-FAQ-Bot: Immer aktuelle Preisinformationen und Produktdetails aus der eigenen Datenbank
Kundenservice-Assistent: Antwortet auf Basis echten Produkt-Know-hows, nicht allgemeiner Trainingsdaten
Rechtliche Compliance: Prüfungen gegen aktuelle interne Richtlinien und externe Vorschriften

RAG vs. Fine-Tuning

Fine-Tuning bedeutet, das Modell selbst mit eigenen Daten neu zu trainieren. Das ist teuer, zeitaufwändig und muss wiederholt werden, wenn sich Daten ändern.

RAG ist günstiger, flexibler und aktualisierbar — und liefert nachvollziehbare Antworten mit Quellenangaben.

	RAG	Fine-Tuning
Kosten	Gering bis mittel	Hoch
Aktualität	Sofort aktualisierbar	Neues Training nötig
Quellenangaben	Möglich	Nicht möglich
Aufwand	Moderate Infrastruktur	Hoher ML-Aufwand

Grenzen

RAG findet relevante Passagen — kann aber keine komplexen Schlussfolgerungen über viele Dokumente gleichzeitig ziehen. Die Qualität hängt stark von der Qualität und Struktur der indexierten Dokumente ab.

RAG ist eine der praktischsten KI-Techniken für KMU: Sie macht beliebige Wissensdatenbanken für KI zugänglich — ohne dass das Modell neu trainiert werden muss.

Verwandte Begriffe

LLM

Large Language Model: KI-Sprachmodell, das auf riesigen Textmengen trainiert wurde und natürliche Sprache versteht, generiert und verarbeitet.

KI-Agent

Software, die eigenständig Aufgaben plant und ausführt — mit Zugriff auf Tools, Daten und APIs, ohne für jeden Schritt menschliche Anweisung zu benötigen.

Prompt Engineering

Die Kunst, Eingaben für KI-Sprachmodelle so zu formulieren, dass die Ausgaben zuverlässig nützlich sind — ohne das Modell selbst zu verändern.

KI-Halluzination

Phänomen, bei dem ein KI-Sprachmodell sachlich falsche Aussagen selbstsicher und gut formuliert produziert — ohne es selbst zu bemerken.

Alle Begriffe im Überblick

Zum Glossar Erstgespräch