fusion_hat.voice_assistant Modul
- class fusion_hat.voice_assistant.VoiceAssistant(*args, **kwargs)[Quellcode]
Basisklassen:
objectSprachassistenten-Klasse
- Parameter:
llm (
sunfounder_voice_assistant.llm.LLM) – Sprachmodellname (str, optional) – Robotername, Standard ist NAME
with_image (bool, optional) – Bilder aktivieren, ein multimodales Sprachmodell muss eingerichtet werden, Standard ist WITH_IMAGE
tts_model (str, optional) – Text-to-Speech-Modell, Standard ist TTS_MODEL
stt_language (str, optional) – Speech-to-Text-Sprache, Standard ist STT_LANGUAGE
keyboard_enable (bool, optional) – Tastatureingabe aktivieren, Standard ist KEYBOARD_ENABLE
wake_enable (bool, optional) – Aktivierungswort aktivieren, Standard ist WAKE_ENABLE
wake_word (list, optional) – Aktivierungswort, Standard ist WAKE_WORD
answer_on_wake (str, optional) – Auf Aktivierungswort antworten, Standard ist ANSWER_ON_WAKE
welcome (str, optional) – Begrüßungsnachricht, Standard ist WELCOME
instructions (str, optional) – Anweisungen festlegen, Standard ist INSTRUCTIONS
disable_think (bool, optional) – Den Denkprozess deaktivieren, Standard ist False
- before_listen() None[Quellcode]
Vor dem Zuhören
- after_listen(stt_result: str) None[Quellcode]
Nach dem Zuhören
- Parameter:
stt_result (str) – Speech-to-Text-Ergebnis
- before_think(text: str) None[Quellcode]
Vor dem Denken
- Parameter:
text (str) – Text zum Denken
- after_think(text: str) None[Quellcode]
Nach dem Denken
- Parameter:
text (str) – Text zum Denken
- on_start() None[Quellcode]
Beim Start
- on_wake() None[Quellcode]
Bei Aktivierung
- on_heard(text: str) None[Quellcode]
Bei Gehört
- Parameter:
text (str) – Gehörter Text
- parse_response(text: str) str[Quellcode]
Antwort analysieren
- Parameter:
text (str) – Zu analysierender Text
- Rückgabe:
Analysierter Text
- Rückgabetyp:
str
- add_trigger(trigger_function: Callable[[], tuple[bool, bool, str]]) None[Quellcode]
Trigger-Funktion hinzufügen
- Parameter:
trigger_function (Callable[[], tuple[bool, bool, str]]) – Trigger-Funktion
- before_say(text: str) None[Quellcode]
Vor dem Sprechen
- Parameter:
text (str) – Zu sprechender Text
- after_say(text: str) None[Quellcode]
Nach dem Sprechen
- Parameter:
text (str) – Zu sprechender Text
- on_stop() None[Quellcode]
Beim Stoppen
- on_finish_a_round() None[Quellcode]
Beim Abschluss einer Runde
- capture_image(path: str) None[Quellcode]
Bild aufnehmen
- Parameter:
path (str) – Pfad zum Speichern des Bildes
- trigger_wake_word() tuple[bool, bool, str][Quellcode]
Aktivierungswort auslösen
- Rückgabe:
Ausgelöst, Bild deaktivieren, Nachricht
- Rückgabetyp:
tuple[bool, bool, str]
- trigger_keyboard_input() tuple[bool, bool, str][Quellcode]
Tastatureingabe auslösen
- Rückgabe:
Ausgelöst, Bild deaktivieren, Nachricht
- Rückgabetyp:
tuple[bool, bool, str]
- init_camera() None[Quellcode]
Kamera initialisieren
- close_camera() None[Quellcode]
Kamera schließen
- listen() str[Quellcode]
Zuhören
- Rückgabe:
Speech-to-Text-Ergebnis
- Rückgabetyp:
str
- think(text: str, disable_image: bool = False) str[Quellcode]
Denken
- Parameter:
text (str) – Text zum Denken
disable_image (bool, optional) – Bild deaktivieren, Standard ist False
- Rückgabe:
LLM-Antwort
- Rückgabetyp:
str
- main() None[Quellcode]
Hauptschleife
- run() None[Quellcode]
Ausführen