logo elektroda
logo elektroda
X
logo elektroda
Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Projekt programu w c++: program talk-llama od G.Gerganova mówi ośmioma językami z auto wyborem

kolor 18 Paź 2025 20:30 1359 8

TL;DR

  • Powstał uruchamiacz UruchamiaczSherpaLlamaMulti.exe w C++, który łączy talk-llama z syntezą mowy i automatycznym doborem języka.
  • Rozwiązanie używa whisper.cpp do zamiany mowy na tekst, Bielik-11B-v2.6-Instruct.Q2_K.gguf do generowania odpowiedzi oraz sherpa-onnx-offline-tts-play.exe do odczytu.
  • Konfiguracja obejmuje 8 języków: polski, rosyjski, chiński, włoski, francuski, hiszpański, angielski i niemiecki, a dla CUDA zalecane jest -ngl 16.
  • Po modyfikacji regex zachowuje polskie i rosyjskie znaki; filtr bywa niedokładny, a krótkie komunikaty mogą zostać odczytane dwa razy.
📢 Słuchaj (AI):
📢 Słuchaj (AI):

Podsumowanie tematu

✨ Dyskusja dotyczy rozwoju programu w C++ do lokalnej obsługi mowy i tekstu: początkowo uruchamiacz łączył whisper.cpp z sherpa-onnx-offline-tts-play.exe i automatycznie wybierał lektora TTS na podstawie rozpoznanego języka, umożliwiając generowanie oraz odczyt odpowiedzi w wielu językach. Następnie pojawiła się wersja oparta o Piper i odtwarzanie raw, co przyspieszyło inicjalizację mowy. W kolejnych aktualizacjach program został rozbudowany o integrację z llama-server.exe, obsługę narzędzi CLI, zapis wygenerowanego tekstu do pliku i automatyczne uruchamianie syntezy mowy. Dodano też tryb pseudo-RAG do wczytywania i przeszukiwania własnych notatek, tryb ciągłej rozmowy z utrzymaniem kontekstu oraz wejście z klawiatury (--console/--stdin). Ostatnie wersje wykorzystują fasttext.cc do wykrywania języka, dynamiczne wykrywanie dostępnych głosów w katalogu voices, obsługę wybranego języka oraz możliwość pracy z dużą liczbą modeli TTS. Wątek obejmuje również praktyczne uwagi o czułości mikrofonu, zakłóceniach od efektów systemowych i ograniczeniach automatycznego wyboru języka przy krótkich tekstach.
REKLAMA