logo elektroda
logo elektroda
X
logo elektroda
REKLAMA
REKLAMA
Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Jak skonfigurować lokalny model Bielik z Whisperem od Gerganova?

kolor 22 Gru 2024 22:33 1302 1

TL;DR

  • Łączy lokalny polski model Bielik z Whisperem i talk-llama, tworząc offline’owego asystenta głosowego z odpowiedziami czytanymi przez systemowy TTS.
  • Konfiguracja opiera się na narzędziach ggerganov w C/C++, plikach .bat i PowerShellu oraz konwersji wyjścia z UTF-8 do ANSI/CP-1250 przed TTS.
  • Jako zestaw bazowy wskazuje ggml-small.bin dla Whispera i Bielik-11B-v2.3-Instruct.Q4_K_M.gguf, a większy model Whispera może nie nadążać.
  • Pokazuje też obsługę obrazów w llama.cpp/llava 1.5 i 1.6, z komendą llama-llava-cli.exe do opisu screenshot.bmp po polsku.
  • Alternatywnie proponuje sherpa-onnx jako silnik mowy, ale ostrzega o błędach dekodowania talk-llama i limicie tekstu sherpa do około 22 kb.
Podsumowanie wygenerowane przez AI na podstawie treści dyskusji.
REKLAMA
📢 Słuchaj (AI):
📢 Słuchaj (AI):
REKLAMA