Система речевой аналитики на базе Vosk
Основные фукнции
- Распознавание звонков
- Диаризация моно звонков
- Определение эмоций по фразам
- Построение отчетов по звонкам
- Поиск звонков по тексту
- Суммаризация по тексту диалога на базе LLM mistral 7b
- Автотематизация
Установка
Установить БД postgres и запустить инициализирующий скрипт initial.sql
Single node. GigaAM Проще всего установить на одном сервере. Перейти в директорию full_node
cd full_node
в файле .env прописать/заменить свой DSN к БД postgresql
DSN=postgresql://user:pass@server:port/db_names
Запустить через
docker-compose up -d
Worker node. Vosk
- Перейти в директорию worker_node
cd worker_node
- в файле docker-compose.yml изменить параметры подключения к БД в DSN, вместо
postgresql://user:pass@host:port/db
прописать ваши данные
-
в переменной VOSK_SERVER указать адрес текущей машины или вместо 127.0.0.1 прописать vosk
-
Скачать нужные файлы моделей
в директорию
cd vosk
скачать и распаковать модели vosk по ссылкам из файла loadvosk.txt
в директорию
text_processor\ruword2tags
скачиваем файл ruword2tags.db по ссылке в load.txt
- Запустить через
docker-compose up -d
Web node
Устанавливаем nginx и прописываем конфигурацию как в файле default. Если сервисы расположены на разных машинах, то необходимо прописать корректные адреса до них в секциях location -> proxy_pass.
Если web node развернута на отдельном сервере, то указать в docker-compose.yml Правильный внешний адрес машины
APIURL: "http://127.0.0.1/api/file/"
LLM node
Скачать модель с помощью скрипта
llm_node\summarization_server\load_model.sh
Запустить сервер через
docker-compose up -d
Загрузка аудио
в файле load.curl есть пример запроса для подгрузки новых аудио
Так же в интерфейсе реализована форма загрузки через web
Пример интерфейса
Основной интерфейс просмотра звонков
В проекте используются модели Vosk, DeepPavlov, I.Koziev
Присоединяйтесь к сообществу https://t.me/voiceperception