# 良好的文件翻译器 **Repository Path**: micosliang/good-translator ## Basic Information - **Project Name**: 良好的文件翻译器 - **Description**: 这是个简单的程序,先使用MinerU将pdf转化为Markdown格式,然后再用LLM进行翻译,保持图片、表格、公式结构,实现低成本、高质量的文件翻译。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-03-22 - **Last Updated**: 2025-03-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 良好的文件翻译器 这是一个简单的、基于大语言模型的文件翻译程序。市面上的翻译服务普遍偏贵,几十块钱只能翻译几篇文献,对于页数更多的专著、书籍价格更是太贵。而且经常将文献中的公式给翻译了,有些术语翻译得也是千奇百怪。而目前大语言模型价格低廉,即使是表现强劲的大尺寸的模型也只要1分钱/1k Token的价格,性价比高的模型每百万Token不到1元,甚至有免费、不限额的模型可供使用。如此看来,用大语言模型进行翻译性价比远高于购买翻译服务。另外一点,OCR技术已经可以很方便地将文献转化为机器方便处理的文本格式,并保留图片、公式、表格等结构。这样,文件翻译的痛点就都解决了。 ## API KEY 获取 这个简单的程序,先使用MinerU将pdf转化为Markdown格式,然后再用LLM进行翻译,目前使用的是阿里云的百炼平台。所以,需要配置这两个平台的API KEY。 [MinerU](https://mineru.net/apiManage/docs):在官网-API页面中,登录后创建API TOKENS即可,保存好TOKEN。 [阿里云百炼](https://bailian.console.aliyun.com/?apiKey=1#/api-key):在登陆后,在百炼平台-人头像-API KEY中,创建我的API KEY即可,保存好API KEY。 ## 运行前配置 ### python环境 有四个包不是标准库 ``` pip install requests openai fastapi uvicorn ``` 测试环境为python 3.8,但应该较新的python版本都适用 ### 创建config.json 创建一个名为config.json的文件(如果windows系统没有文件拓展名,在文件管理器上方的查看-选项-显示中,开启文件拓展名),复制如下内容,并且将对应平台的API KEY 填入 ```json { "minerU_api_key" : "MinerU平台的API TOKEN", "bailian_api_key" : "阿里云百炼平台的API KEY", "use_model" : "qwen-plus" } ``` ## 运行 在项目文件夹下,执行如下命令 ``` uvicorn good-transalate:app ``` 然后打开浏览器,访问 ``` http://127.0.0.1:8000/static/index.html ``` 即可使用 ## 输出格式 所有结果均保存至results文件夹中,结果文件夹名为文件名,包括MineU转化后的markdown文件和图片,翻译后的译文markdown文件。测试使用[Typora](https://typoraio.cn/)作为markdown阅读器,表格、图片、公式等格式均无错误。 ## 遇到的一些问题 1. 有时候文件名过长,Typora中图片显示加载错误,在Typora中另存为一个短一点的文件名(如译文)即可。 ## 速度、成本和翻译质量 使用qwen-max模型进行翻译,1小时处理并翻译完成200页7万词的英文,翻译后为10万字的中文,花费1元。所以估计使用qwen-plus,翻译为10万字中文约0.3元,相比起传统翻译可能花费数十元到几百元,大大降低了成本。经检查,翻译后文本流畅、符合专业背景,表格、公式和图片基本排版正确,翻译质量较传统翻译更高。