电脑配件-自助翻译

界面

使用说明

提供两种ocr方法: tesseract(体积小)和manga-ocr(效率高,推荐)
- tesseract可以参照下述方法安装;点击功能页截图按钮即可激活截图,完成框选后点击空格或回车键确定,c键取消,注意区分目标(竖排日文,横排日文),这里的截图是cv2的全屏截图和selectROI的区域选择
- manga-ocr可以在设置页点击安装,注意需要环境中已经安装python3.9;使用manga-ocr时需要确认功能页的剪贴板复选框已被选中,此时程序开始监听剪贴板,复制到剪贴板的日文文本会被直接翻译,使用win+shift+s截图并进入剪贴板的图片会被识别,无需选择目标是横排还是竖排,这里的截图是调用了win+shift+s快捷键
提供两种翻译方法: 谷歌翻译和chatgpt翻译
- 谷歌翻译:默认方法,免费开源,够用
- chatgpt翻译需要在设置页填入api-key
重新翻译: 识别到的原文内容如果有误,可以手动修改原文文本框,点击底部[重新翻译]按钮可以对修改后的原文再次翻译

安装manga-ocr

manga-ocr安装: 点击设置页的manga-ocr安装按钮,所需时间较长,需要等到终端消失,大概需要1.5G空间,内容在程序目录下/venv39/
manga-ocr启动: 点击设置页的manga-ocr启动按钮,启动manga-ocr后终端不能关闭,如果要使用manga-ocr,每次启动软件都需要手动启动终端

安装tesseract

tesseract官方网站下载
安装时记得勾选 Additional language data 不然没有日文
把tesseract.exe添加到环境变量

开发环境初始化

开发所用python版本为3.10和3.9(manga-ocr不支持>3.9的版本)

pip install -r requirements.txt

推荐把tesseract.exe添加到环境变量,不想添加可以手动配置pytesseract路径
- 首先找到pytesseract的安装位置 pip show pytesseract
- 例如我是d:\s-code\self\auto_trans\venv\lib\site-packages\pytesseract
- 打开pytesseract.py,找到这句
```
tesseract_cmd = 'tesseract'
```
- 改为你的tesseract安装位置,比如我是
```
tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
```

打包

运行打包脚本

python build_qt.py

pyinstaller命令无法自动包含pykakasi的db文件,所以用add-data手动打包pykakasi\data文件夹,如果要重新打包记得把脚本里pykakasi\data的路径改成你自己的

简介

想在漫画ocr翻译的时候能够看到汉字的注音,所以做了这个
截图: cv2全屏截图后将图片无边框全屏显示,保存矩形框选区域
识别: tesseract-ocr工具识别图像中的文字,需要首先本地安装tesseract
翻译: deep_translator.GoogleTranslator谷歌翻译接口
注音: pykakasi为汉字注音;注音仅供参考,这个库对多音字的标注效果不是太好
做好之后发现tesseract在实际使用中对竖排日文的识别效率较低,所以又做了剪贴板的监听功能,配合manga-ocr使用

更新

2023.4.24 增加了chatgpt的翻译接口
2023.4.7 把manga-ocr的安装和启动加入设置页里了
2023.3.31 创建项目

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.vscode		.vscode
readme		readme
static		static
subprocess		subprocess
translator		translator
utils		utils
.gitignore		.gitignore
app.py		app.py
build_qt.py		build_qt.py
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

电脑配件-自助翻译

界面

使用说明

安装manga-ocr

安装tesseract

开发环境初始化

打包

简介

更新

About

Releases 2

Packages

Languages

umas2022/auto_trans

Folders and files

Latest commit

History

Repository files navigation

电脑配件-自助翻译

界面

使用说明

安装manga-ocr

安装tesseract

开发环境初始化

打包

简介

更新

About

Topics

Resources

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages