- 提供两种ocr方法: tesseract(体积小)和manga-ocr(效率高,推荐)
- tesseract可以参照下述方法安装;点击功能页截图按钮即可激活截图,完成框选后点击空格或回车键确定,c键取消,注意区分目标(竖排日文,横排日文),这里的截图是cv2的全屏截图和selectROI的区域选择
- manga-ocr可以在设置页点击安装,注意需要环境中已经安装python3.9;使用manga-ocr时需要确认功能页的剪贴板复选框已被选中,此时程序开始监听剪贴板,复制到剪贴板的日文文本会被直接翻译,使用win+shift+s截图并进入剪贴板的图片会被识别,无需选择目标是横排还是竖排,这里的截图是调用了win+shift+s快捷键
- 提供两种翻译方法: 谷歌翻译和chatgpt翻译
- 谷歌翻译:默认方法,免费开源,够用
- chatgpt翻译需要在设置页填入api-key
- 重新翻译: 识别到的原文内容如果有误,可以手动修改原文文本框,点击底部[重新翻译]按钮可以对修改后的原文再次翻译
- manga-ocr安装: 点击设置页的manga-ocr安装按钮,所需时间较长,需要等到终端消失,大概需要1.5G空间,内容在程序目录下/venv39/
- manga-ocr启动: 点击设置页的manga-ocr启动按钮,启动manga-ocr后终端不能关闭,如果要使用manga-ocr,每次启动软件都需要手动启动终端
- tesseract官方网站下载
- 安装时记得勾选 Additional language data 不然没有日文
- 把tesseract.exe添加到环境变量
- 开发所用python版本为3.10和3.9(manga-ocr不支持>3.9的版本)
pip install -r requirements.txt
- 推荐把tesseract.exe添加到环境变量,不想添加可以手动配置pytesseract路径
- 首先找到pytesseract的安装位置 pip show pytesseract
- 例如我是d:\s-code\self\auto_trans\venv\lib\site-packages\pytesseract
- 打开pytesseract.py,找到这句
tesseract_cmd = 'tesseract'
- 改为你的tesseract安装位置,比如我是
tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
- 运行打包脚本
python build_qt.py
- pyinstaller命令无法自动包含pykakasi的db文件,所以用add-data手动打包pykakasi\data文件夹,如果要重新打包记得把脚本里pykakasi\data的路径改成你自己的
- 想在漫画ocr翻译的时候能够看到汉字的注音,所以做了这个
- 截图: cv2全屏截图后将图片无边框全屏显示,保存矩形框选区域
- 识别: tesseract-ocr工具识别图像中的文字,需要首先本地安装tesseract
- 翻译: deep_translator.GoogleTranslator谷歌翻译接口
- 注音: pykakasi为汉字注音;注音仅供参考,这个库对多音字的标注效果不是太好
- 做好之后发现tesseract在实际使用中对竖排日文的识别效率较低,所以又做了剪贴板的监听功能,配合manga-ocr使用
- 2023.4.24 增加了chatgpt的翻译接口
- 2023.4.7 把manga-ocr的安装和启动加入设置页里了
- 2023.3.31 创建项目