Для работы с содержимым epub используются библиотеки:
ebooklib https://github.com/aerkalov/ebooklib
Установка в linux ubuntu/mint $ sudo pip3 install ebooklib
ebookmeta https://github.com/dnkorpushov/ebookmeta Взята за основу и дописана очистка и интерпретация данных В оригинальной библиотеке слабо сделана очистка данных.
Порядок обработки книг
- Разархивирубтся все фалы в каталоге zip. Результат -> в каталог fb2
- Конвертируются книги из каталога fb2. Результат раскладывается по соответствующим каталогам в Traum.YYMM
- Из файлов из каталога epub выделяется метаинформация и результат раскладывается по соответствующим каталогам в Traum.YYMM