Zuletzt aktualisiert: 1. September 2025
Gute Ergebnisse hängen oft von den richtigen Engine‑Einstellungen ab. Verwende diese Checkliste beim Konfigurieren eines Famulor‑Assistenten.

1. Modus wählen

ModusWarum wählen?Hinweise
Dualplex (Beta)Schnelles Turn‑Taking + Premium/geklonte StimmenEmpfohlener Standard. Kombiniere mit Gemini Flash 2.0/2.5 oder GPT‑5 Realtime.
Speech‑to‑Speech (Multimodal)Schnellstes Turn‑Taking und natürlichster GesprächsflussEmpfohlenes Modell: GPT‑5 Realtime.
PipelineMaximale Kontrolle über Stimme und lange AntwortenEmpfohlenes Modell: GPT‑5 Mini. Wenn du Pipeline wählst, fahre unten mit dem Transcriber‑Schritt fort.
Mehr zu den Unterschieden? Siehe den Leitfaden Assistenten‑Modi.
Experimentiere mit allen drei Modi: Nimm dasselbe Szenario in jedem auf und vergleiche Reaktionszeit und Anruferzufriedenheit.

2. Transcriber wählen (nur Pipeline)

TranscriberGenauigkeitLatenzAm besten geeignet für
Azure⭐️⭐️⭐️⭐️⏱️⏱️⏱️ (langsamer)Wenn du die höchste Transkriptionsqualität benötigst
Gladia⭐️⭐️⭐️⏱️ (schneller)Guter Allrounder für die meisten Sprachen
Deepgram⭐️⭐️⭐️⏱️ (schneller)Weitere solide Wahl — teste, was für deine Sprache und dein Audio‑Setup besser funktioniert
Verschiedene Sprachen, Akzente oder Hintergrundgeräusche können jede Engine unterschiedlich beeinflussen. Führe einen kurzen A/B‑Test durch und behalte den besten Kandidaten.

3. LLM‑Modell auswählen

ModellStärkenAbwägungen
GPT-5 MiniAusgewogenes Reasoning mit niedriger LatenzKann langsamer sein als Realtime-Modelle für schnelle Turn-Taking
GPT-5 RealtimeEntwickelt für ultra-niedrige Latenz bei SprachwendungenAm besten für Speech-to-Speech und Dualplex
GPT-4oStarkes Reasoning und multimodales VerständnisHöhere Latenz
Gemini Flash 2.0 / 2.5Ultra-schnell für Sprachwendungen in Dualplex/MultimodalExzellent zur Minimierung wahrgenommener Latenz
Wenn Geschwindigkeit entscheidend ist, nutze GPT‑5 Realtime (großartig für Speech-to-Speech) oder Gemini Flash 2.0/2.5 (großartig mit Dualplex). Für reicheres Reasoning nutze GPT-4o oder GPT-5 Mini und kompensiere die Latenz durch Füll-Audios.

4. Rauschunterdrückung

Wenn Anrufer über Lautsprecher telefonieren oder es ruhig ist, lasse die Rauschunterdrückung AN. Wenn die Lautstärke niedrig ist oder Wörter „abgeschnitten“ klingen, schalte sie AUS, damit der Transcriber das volle Signal erhält.
Wenn der Assistent dich schlecht versteht, versuche die Rauschunterdrückung auszuschalten.

5. Konversations‑Timer

ParameterEmpfehlungWarum
Re‑engagement≈ 30 sGibt Anrufern genügend Zeit zum Nachdenken. Niedrigere Werte können aufdringlich wirken.
Maximale Stille‑Dauer≈ 60 sVerhindert verfrühte Auflegungen und beendet dennoch wirklich stille Anrufe.
Teste verschiedene Werte in echten Anrufen — zu niedrig unterbricht, zu hoch erzeugt peinliche Pausen.

6. Einstiegsnachricht

ModusVerwendungBest Practice
PipelineWird exakt wie geschrieben vorgelesen (per TTS)Formuliere die Begrüßung wörtlich: „Hallo, hier ist Alex von …“.
DualplexWird exakt wie geschrieben vorgelesen (über ElevenLabs TTS gerendert)Formuliere die Begrüßung wörtlich, wähle dann deine geklonte Stimme aus.
Speech‑to‑SpeechWird vom Modell als Prompt interpretiertFüge Anweisungen hinzu wie „Begrüße die Kundin/den Kunden und sage …“ oder stelle sage genau: voran, um wörtliche Ausgabe zu erzwingen.

7. Umgebungsgeräusch

Umgebungsgeräusch fügt der Stimme des Assistenten dezente Hintergrundgeräusche hinzu und ist standardmäßig aktiviert.
Wenn der Assistent dich schlecht hört, deaktiviere das Umgebungsgeräusch oder reduziere die Umgebungslautstärke.

8. Endpointing‑Regler

Steuere mit dem Endpointing‑Empfindlichkeitsregler unten in den Assistenten‑Einstellungen, wann dein Assistent zu sprechen beginnt.
EinstellungWirkungVerwenden, wenn
Niedrige EmpfindlichkeitAssistent antwortet schneller, nachdem die Anruferin/der Anrufer aufgehört hat zu sprechenDu möchtest knackige, schnelle Gesprächswechsel
Hohe EmpfindlichkeitAssistent wartet länger, bevor er antwortetAnrufer geben längere, detailliertere Antworten
Wenn dein Assistent Anruferinnen/Anrufer mitten im Satz abschneidet, erhöhe die Empfindlichkeit. Wenn Antworten träge wirken, verringere sie.

9. Debugging mit dem Anruf‑Transkript

Wenn du Probleme mit deinem Assistenten hast, kannst du das Anruf-Transkript zur Fehlerbehebung verwenden.
1

Anrufverlauf öffnen

Wechsle im Dashboard zur Seite Anrufverlauf.
2

Letzten Testanruf auswählen

Klicke auf den letzten Anruf, den du getestet hast.
3

Transkript und Funktionsaufrufe prüfen

Das Anruf-Transkript wird angezeigt, einschließlich Funktionsaufrufen und deren Parametern.
Bestätige, dass der Assistent den erwarteten Modus, das Modell und die Tools gemäß deiner Konfiguration nutzt.

10. Noch Fragen?

Wenn du Fragen hast, kontaktiere unser Support‑Team unter support@famulor.io.
Teste verschiedene Einstellungen mit echten Anrufen — die richtige Balance hängt von deinem Gesprächsablauf und den Verhaltensmustern der Anrufer ab.