Name des Begriffes: RAG - Retrieval Augmented Generation
Beschreibungen des Begriffes:

RAG - Retrieval Augmented Generation

RAG steht für Retrieval Augmented Generation und bezeichnet ein Verfahren, bei dem ein Sprachmodell vor der Antwort gezielt Informationen aus externen Quellen abruft. Dadurch entstehen Antworten nicht nur aus dem Trainingswissen des Modells, sondern zusätzlich auf Basis aktueller, fachlicher oder unternehmensinterner Inhalte. Im Kontext von KI-Systemen dient RAG vor allem dazu, Antworten relevanter, nachvollziehbarer und in vielen Fällen sachlich belastbarer zu machen.

Definition

Retrieval Augmented Generation ist eine Architektur für generative KI, bei der zwei Funktionen kombiniert werden: das Retrieval, also das Auffinden passender Informationen, und die Generation, also das Formulieren einer Antwort durch ein Sprachmodell. Statt ausschließlich auf statisches Trainingswissen zu vertrauen, bezieht das System vor der Textausgabe zusätzliche Inhalte aus Dokumenten, Datenbanken oder anderen Wissensquellen ein.

RAG wird vor allem mit großen Sprachmodellen, also Large Language Models, eingesetzt. Die Methode ist besonders relevant, wenn Antworten auf aktuelle Daten, interne Wissensbestände oder klar definierte Fachquellen gestützt werden sollen. Damit gehört RAG zu den wichtigen Bausteinen moderner KI-Anwendungen in Unternehmen, Wissensportalen, Suchsystemen und digitalen Assistenzsystemen.

Technischer Hintergrund

Der technische Kern von RAG besteht darin, eine Anfrage nicht direkt an das Sprachmodell zu übergeben, sondern vorher passenden Kontext zu beschaffen. Dieser Kontext wird zusammen mit der eigentlichen Frage an das Modell weitergegeben. Das Modell formuliert seine Antwort also auf Basis des Nutzerprompts und der zusätzlich bereitgestellten Inhalte.

Typischerweise läuft der Prozess in mehreren Schritten ab:

  1. Dokumente oder Datenquellen werden aufbereitet und in kleinere Abschnitte zerlegt.
  2. Diese Inhalte werden in numerische Repräsentationen umgewandelt, sogenannte Embeddings. Embeddings bilden die Bedeutung von Texten mathematisch ab.
  3. Die Embeddings werden in einem Suchindex oder einer Vektordatenbank gespeichert.
  4. Bei einer Anfrage wird auch die Frage in ein Embedding umgewandelt.
  5. Das System sucht in der Datenbasis nach inhaltlich ähnlichen Abschnitten.
  6. Die gefundenen Inhalte werden dem Sprachmodell als Zusatzkontext übergeben.
  7. Das Modell erzeugt daraus eine sprachlich formulierte Antwort.

Dieser Aufbau ist deshalb wichtig, weil große Sprachmodelle selbst keine klassische Datenbank sind. Sie speichern Wissen nicht in Form direkt abfragbarer Fakten, sondern in statistischen Mustern aus dem Training. RAG ergänzt dieses Prinzip um einen gezielten Zugriff auf externe Informationen.

Typische Datenquellen

  • interne Dokumentationen und Wissensdatenbanken
  • Produktdaten, Handbücher und Support-Inhalte
  • Richtlinien, Verträge oder Compliance-Dokumente
  • Webseiten, Archive oder redaktionelle Inhalte
  • strukturierte Daten aus APIs oder Datenbanken

Praxisbezug

Im praktischen Einsatz ist RAG vor allem dort sinnvoll, wo Informationen häufig aktualisiert werden oder wo geschlossene Wissensräume genutzt werden müssen. Beispiele sind interne KI-Assistenten, Support-Chatbots, Recherchetools, Dokumentensuche oder Anwendungen im Wissensmanagement.

Für Unternehmen ist die Methode relevant, weil sie generative KI mit vorhandenen Inhalten verbinden kann, ohne das Sprachmodell für jede Datenänderung neu zu trainieren. Neue oder geänderte Informationen werden stattdessen in der externen Wissensbasis gepflegt. Das reduziert Aufwand und erhöht die Aktualität der Antworten.

Auch im digitalen Marketing, in Content-Prozessen und in der Suche kann RAG eine Rolle spielen. Systeme können etwa auf Produktinformationen, redaktionelle Inhalte oder Help-Center-Dokumente zugreifen und daraus kontextbezogene Antworten erzeugen. Im Gegensatz zu einer reinen Volltextsuche formuliert das System die Ergebnisse sprachlich zusammen, idealerweise auf Basis der gefundenen Quellen.

RAG verbessert die Qualität von KI-Antworten oft deutlich, ersetzt aber keine redaktionelle, fachliche oder rechtliche Prüfung bei sensiblen Inhalten.

Abgrenzung und typische Missverständnisse

Ein häufiges Missverständnis besteht darin, RAG mit dem Training eines Sprachmodells gleichzusetzen. Tatsächlich ergänzt RAG ein vorhandenes Modell um externen Kontext, verändert aber nicht automatisch dessen Grundwissen. Es handelt sich also nicht um ein erneutes Training, sondern um eine Laufzeit-Erweiterung während der Anfrageverarbeitung.

Ebenso ist RAG nicht dasselbe wie eine klassische Suchmaschine. Eine Suchmaschine liefert in erster Linie Trefferlisten oder Dokumente. Ein RAG-System nutzt Suchmechanismen zwar als Teilprozess, verbindet diese aber mit generativer Textausgabe. Das Ergebnis ist eine formulierte Antwort statt nur einer Liste von Fundstellen.

Ein weiterer wichtiger Punkt: RAG verhindert Fehlantworten nicht vollständig. Wenn die abgerufenen Inhalte ungeeignet, missverständlich oder unvollständig sind, kann das Modell dennoch falsche Schlussfolgerungen ziehen. RAG reduziert Halluzinationen häufig, garantiert aber keine Wahrheit im strengen Sinn. Die Qualität hängt stark von den Quellen, der Suche und der Systemgestaltung ab.

Varianten und verwandte Formen

Je nach Anwendung kann RAG unterschiedlich umgesetzt werden. Manche Systeme nutzen nur Textdokumente, andere kombinieren strukturierte Daten, Metadaten oder Wissensgraphen. Auch die Suche kann variieren, etwa über semantische Suche mit Embeddings, über klassische Schlagwortsuche oder als Hybrid aus beidem.

  • Semantisches RAG: sucht nach inhaltlicher Ähnlichkeit statt nur nach exakten Begriffen.
  • Hybrides RAG: verbindet semantische Suche und klassische Suchverfahren.
  • Multi-Source-RAG: greift auf mehrere Datenquellen gleichzeitig zu.
  • Agentische Ansätze: nutzen zusätzliche Logik, um Quellen gezielt auszuwählen oder mehrstufig zu recherchieren.

Häufige Fragen

Ist RAG dasselbe wie ein Fine-Tuning?

Nein. Fine-Tuning verändert ein Modell durch zusätzliches Training. RAG ergänzt eine Anfrage zur Laufzeit um externe Informationen.

Warum ist RAG für Unternehmen interessant?

Weil interne oder aktuelle Inhalte genutzt werden können, ohne das Sprachmodell bei jeder Änderung neu trainieren zu müssen.

Kann RAG Halluzinationen vollständig verhindern?

Nein. Die Methode kann Fehlangaben verringern, aber nicht grundsätzlich ausschließen.

Welche Rolle spielen Vektordatenbanken?

Sie speichern Embeddings und ermöglichen es, inhaltlich ähnliche Dokumente oder Textabschnitte effizient zu finden.

Ist RAG nur für Chatbots geeignet?

Nein. Die Methode eignet sich auch für Suche, Wissensmanagement, Assistenzsysteme, Analysewerkzeuge und andere KI-Anwendungen mit externem Kontext.

Synonyme: Retrieval-augmented generation, RAG, abfragegestützte Generierung
Typ des Begriffes: definition
Sprache des Begriffes (2 Zeichen ISO Code): de
Zurück