Question 1

Warum keine autonome LLM-Web-Recherche?

Accepted Answer

Autonome Web-Recherche durch ein LLM bedeutet: das LLM entscheidet selbst, welche Quellen es konsultiert. Das ist für viele Anwendungen pragmatisch — für ein Audit aber gefährlich. Halluzinationen, schlechte Quellen-Wahl und unverifizierbare Ergebnisse machen den Output unbrauchbar. Wir trennen deshalb strikt: ein deterministischer Datenfetcher zieht definierte Quellen, das LLM bewertet nur diese strukturierten Daten.

Question 2

Welche LLMs setzt ihr in welcher Stage ein?

Accepted Answer

Stage 1 (Data Engineer) und Stage 2 (Senior Consultant) laufen beide auf aktuellen Frontier-Modellen von Anthropic (Claude) und OpenAI (ChatGPT). Beide Modell-Familien unterstützen Schema-Constrained-JSON-Outputs, was für reproduzierbare Ergebnisse essentiell ist. Die Modell-Auswahl ist konfigurierbar pro Kunde.

Question 3

Wie geht ihr mit Datenschutz um?

Accepted Answer

Daten, die in die Pipeline gehen, sind aggregierte Crawl-Daten und LLM-Citation-Outputs — keine Personenbezogenen Daten. Sollten in Pilot-/Retainer-Projekten Personenbezogene Daten relevant sein (z. B. Author-Profile), wickeln wir das über AVV nach Art. 28 DSGVO ab, mit dokumentierten TOMs und EU-Region-Compute (Cloudflare EU, OpenAI EU, Anthropic EU bei Verfügbarkeit).

Question 4

Wie reproduzierbar ist die Pipeline?

Accepted Answer

Beide LLM-Stages laufen mit Temperature=0 und festem Seed, wo verfügbar. Outputs sind JSON-Schema-validiert. Identische Inputs erzeugen identische Outputs — wichtig für Audit-Wiederholungen und Vergleichbarkeit über Zeit. Konkurrenz-Audits, die mit Temperature=0.7 fahren, können Ergebnisse nicht reproduzieren.

Two-Stage-Pipeline. Keine autonome LLM-Recherche.

Datenquellen

Stage 1: Data Engineer

Stage 2: Senior Consultant

Output

Häufige Fragen zur Pipeline.

Methode überzeugt? Sprich mit uns.