# 良好的文件翻译器

**Repository Path**: micosliang/good-translator

## Basic Information

- **Project Name**: 良好的文件翻译器
- **Description**: 这是个简单的程序，先使用MinerU将pdf转化为Markdown格式，然后再用LLM进行翻译，保持图片、表格、公式结构，实现低成本、高质量的文件翻译。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-03-22
- **Last Updated**: 2025-03-22

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 良好的文件翻译器

这是一个简单的、基于大语言模型的文件翻译程序。市面上的翻译服务普遍偏贵，几十块钱只能翻译几篇文献，对于页数更多的专著、书籍价格更是太贵。而且经常将文献中的公式给翻译了，有些术语翻译得也是千奇百怪。而目前大语言模型价格低廉，即使是表现强劲的大尺寸的模型也只要1分钱/1k Token的价格，性价比高的模型每百万Token不到1元，甚至有免费、不限额的模型可供使用。如此看来，用大语言模型进行翻译性价比远高于购买翻译服务。另外一点，OCR技术已经可以很方便地将文献转化为机器方便处理的文本格式，并保留图片、公式、表格等结构。这样，文件翻译的痛点就都解决了。

## API KEY 获取

这个简单的程序，先使用MinerU将pdf转化为Markdown格式，然后再用LLM进行翻译，目前使用的是阿里云的百炼平台。所以，需要配置这两个平台的API KEY。

[MinerU](https://mineru.net/apiManage/docs)：在官网-API页面中，登录后创建API TOKENS即可，保存好TOKEN。

[阿里云百炼](https://bailian.console.aliyun.com/?apiKey=1#/api-key)：在登陆后，在百炼平台-人头像-API KEY中，创建我的API KEY即可，保存好API KEY。

## 运行前配置

### python环境

有四个包不是标准库

```
pip install requests openai fastapi uvicorn
```

测试环境为python 3.8，但应该较新的python版本都适用

### 创建config.json

创建一个名为config.json的文件（如果windows系统没有文件拓展名，在文件管理器上方的查看-选项-显示中，开启文件拓展名），复制如下内容，并且将对应平台的API KEY 填入

```json
{
    "minerU_api_key" : "MinerU平台的API TOKEN",
    "bailian_api_key" : "阿里云百炼平台的API KEY",
    "use_model" : "qwen-plus"
}
```

## 运行

在项目文件夹下，执行如下命令

```
uvicorn good-transalate:app
```

然后打开浏览器，访问

```
http://127.0.0.1:8000/static/index.html
```

即可使用

## 输出格式

所有结果均保存至results文件夹中，结果文件夹名为文件名，包括MineU转化后的markdown文件和图片，翻译后的译文markdown文件。测试使用[Typora](https://typoraio.cn/)作为markdown阅读器，表格、图片、公式等格式均无错误。

## 遇到的一些问题

1. 有时候文件名过长，Typora中图片显示加载错误，在Typora中另存为一个短一点的文件名（如译文）即可。

## 速度、成本和翻译质量

使用qwen-max模型进行翻译，1小时处理并翻译完成200页7万词的英文，翻译后为10万字的中文，花费1元。所以估计使用qwen-plus，翻译为10万字中文约0.3元，相比起传统翻译可能花费数十元到几百元，大大降低了成本。经检查，翻译后文本流畅、符合专业背景，表格、公式和图片基本排版正确，翻译质量较传统翻译更高。