Skip to content

Latest commit

 

History

History
37 lines (26 loc) · 1.96 KB

README.md

File metadata and controls

37 lines (26 loc) · 1.96 KB

MyWhisper

WindowsでオーディオファイルをWhisper文字起こしできるアプリ

Windows向けにサクッと音声ファイルをWhisper文字起こしできるアプリが無かったので作りました。 コードはChatGPTに書いてもらいました。 アプリはboothで無料版、有料版を配布してます。→ https://umiyuki.booth.pm/items/4663311

使用しているMediaToolkitと言うライブラリが内部でFFMpegを使ってて、FFMpegはGPLだかLGPLライセンスらしいので、とりあえずこのコードもGPLでオープンソースにしました。

プロジェクトはVisualStudio2019で作成しています。 C#でWindows Formアプリケーションです。

ビルド方法

VisualStudio2019で普通にビルドできるハズです。アイコンファイルはIcon8というフリーアイコンサイトからダウンロードしたものなので、リポジトリには上げてません。 こちらからダウンロードしてicoファイルに変換してください。→ Create icon by Icons8

別途whisper-ctranslate2をPyInstallerでexeファイル作成してフォルダに入れる必要があります。 https://github.com/Softcatala/whisper-ctranslate2

また、モデルファイルや、cudnn、cuBLAS、zlibwapiのDLLもダウンロードしてwhisper-ctranslate2のexeファイルのあるフォルダに入れる必要があります。

アプリの使用方法はこちらの販売ページに書いてあるものを参考にしてください。→https://umiyuki.booth.pm/items/4663311

Credit

Whisper by OpenAI https://github.com/openai/whisper

CTranslate2 by guillaumekln https://github.com/OpenNMT/CTranslate2/

faster-whisper by guillaumekln https://github.com/guillaumekln/faster-whisper

whisper-ctranslate2 by jordimas https://github.com/Softcatala/whisper-ctranslate2