Skip to content

vordex-dd/tinkoff-text-generation

Repository files navigation

Tinkoff text generation

Проект для отбора в ML Тинькофф

Генерация последовательности

Для запуска нужно ввести

python generate.py

Необязательные аргументы

Можно задать длину генерируемой последовательности:

python generate.py -l 8
python generate.py --length 8

Можно задать первое слово генерируемой последовательности:

python generate.py -f привет
python generate.py --first привет

Можно задать второе слово генерируемой последовательности:

python generate.py -s друг
python generate.py --second друг

Пример

Следующая команда:

python generate.py -f привет -s друг -l 10

Сгенерирует последовательность, состояющую из 10 слов и начинающуюся со слов "привет друг".

Изменение словаря данных

Первый способ

Нужно передать в качестве аргумента каталог, в котором находятся файлы, на основе которых будет делаться словарь

python generate.py -d data
python generate.py --directroty data

В данном примере будут обработаны файлы из папки "дата" и словари будут построенны на этих данных. Также можно указать кодировку и обрабатывать ли английские слова:

python generate.py -d data -u  # будут обрабатываться слова на английском
python.generate.py -d data -e UTF-8  # файлы будут прочтены и обработаны в кодировке UTF-8

Обратите внимание, что без использование аргумента для --directory словарь с данными не будет обновлен.

Второй способ

Можно запустить следующую команду:

python train.py

В таком случае можно не указывать аргумент для --directory (в отличие от первого способо) и будет выбрана по умолчанию папка "data". Примеры:

python train.py -d new_data -u
python train.py -u -e UTF-8
python train.py -e UTF-8

Дополнительные библиотеки

Обратите внимание, что в программе используется numpy, поэтому перед запуском программы нужно не забыть установить данную библиотеку:

pip install numpy

About

Проект для отбора в ML Тинькофф

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages