# Agentenmodus: coreAI baut den Kontext selbst, wenn die Antwort fehlt

Wenn coreAI im bereits übergebenen Kontext keine Deckung findet, versetzt der Agentenmodus den Assistenten in die Lage, den Kontext selbst aufzubauen – statt zu raten oder aufzugeben. Er wählt unterwegs seine eigenen Werkzeuge: semantische Suche, Stichwortsuche und strukturierte Filterung gegen Ihre eigene Wissensbasis – und zusätzlich externe MCP-APIs, wenn Sie den Assistenten an relevante Quellen angebunden haben. Sie aktivieren die Funktion pro Assistent und verändern, wie er denkt – nicht nur, was er weiß.

![Skizze, wie coreAI im Agentenmodus Werkzeuge auswählt](/articles/agentic-mode.webp)

## Was ist der Agentenmodus?

Klassisches RAG (Retrieval-Augmented Generation) lädt den Kontext im Voraus: das System führt eine Suche aus, schiebt die Ergebnisse in den Prompt und lässt das Sprachmodell aus dem antworten, was es bekommen hat. Der Agentenmodus dreht das um. Statt den Kontext vorab zu laden, wird die Suche in der Wissensbasis als Werkzeug bereitgestellt, das das Sprachmodell selbst aufrufen kann – so oft es nötig ist, um die Frage abzudecken.

Das bedeutet: Der Assistent trifft unterwegs eigene Entscheidungen – welche Suchen er ausführt, wie er sie formuliert und wann er genug hat, um zu antworten. Bei zusammengesetzten Fragen ist das der Unterschied zwischen einer halben und einer ganzen Antwort.

## So denkt der Assistent in mehreren Schritten

Nach jeder Suche führt coreAI eine Deckungsprüfung durch: Er identifiziert die einzelnen Teilfragen und benannten Begriffe in der Frage des Nutzers und prüft, ob jeder davon direkte Stütze in den zurückgegebenen Quellen hat. Fehlt etwas, sucht er erneut mit einer breiteren oder gezielteren Anfrage, bevor er überhaupt zu antworten beginnt.

![Skizze, wie coreAI eine Deckungsprüfung durchführt und erneut sucht, bevor er antwortet](/articles/agentic-mode-reasoning.webp)

- bei substanziellen Fragen muss der Assistent suchen, statt zu raten
- er kann mehrere Suchen innerhalb einer Antwort ausführen, um jeden Teil einer Frage zu erfassen
- findet er weiterhin keine Deckung, weist er darauf hin, dass die Antwort nicht in der Wissensbasis steht – statt eine zu erfinden
- alle Treffer aus den Suchen werden gesammelt, sodass die Antwort genau ausweist, auf welchen Quellen sie beruht

Beispiel: „Wie ist Ihr Rückgaberecht, und wie lange dauert eine Rückerstattung?" sind eigentlich zwei Fragen. Der Agentenmodus sucht zuerst nach dem Rückgaberecht, dann nach der Erstattungsdauer und beantwortet beide. Ein einfaches Vorladen würde leicht eine Hälfte verfehlen.

## Die Werkzeuge, die der Assistent nutzen kann

Der Agentenmodus gibt dem Sprachmodell ein kleines, präzises Set an Werkzeugen – und der Assistent wählt selbst das passende:

- semantische Suche für natürlichsprachliche Fragen, breite Themen und Empfehlungen
- Stichwortsuche, um exakte Begriffe nachzuschlagen: Personennamen, Rollen, Dokumenttitel oder Produktnummern
- strukturierte Filterung für Produktassistenten, etwa nach Preis, Produktnummer oder ob ein Artikel im Angebot ist
- externe Werkzeuge über MCP (Model Context Protocol) – für Live-Daten oder Aktionen außerhalb der Wissensbasis

Hat ein Assistent sowohl eine eigene Wissensbasis als auch angebundene MCP-Server, kann er interne und externe Werkzeuge in derselben Antwort kombinieren: Fakten aus Ihren eigenen Quellen ziehen und einen Live-Status aus einem anderen System prüfen – in einem und demselben Durchgang.

## Wann der Agentenmodus den größten Unterschied macht

Der Agentenmodus lohnt sich am meisten bei zusammengesetzten Fragen, wenn die Antwort über mehrere Quellen verteilt ist oder wenn der Nutzer erwartet, dass der Assistent etwas Frisches aus einem anderen System holt. Sie bekommen vollständigere Antworten, nachprüfbare Quellenangaben und einen Assistenten, der lieber Bescheid sagt, als zu halluzinieren, wenn die Information nicht da ist.