# ocr4j
**Repository Path**: ityeah/ocr4j
## Basic Information
- **Project Name**: ocr4j
- **Description**: ocr4j is a Java toolkit ocr4j.jar based on Tesseract-ocr.
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 2
- **Created**: 2024-09-02
- **Last Updated**: 2024-09-02
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# ocr4j
`ocr4j`是一个Java基于Tesseract-ocr实现的工具包`ocr4j.jar`,可以通过这个实现OCR(光学字符识别)🔥。
# 特性:
- 不需要额外安装`Tesseract`
- 不需要`tesseract.dll`
- 不需要网络
- 平台支持:`✅Mac`、`❎Linux`、`❎Windows`
# 使用示例:
```java
package test;
import me.ibyte.ocr4j.model.Tesseract;
import me.ibyte.ocr4j.standard.OpticalCharacterRecognition;
import org.junit.Test;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
/**
* @Author: SDing
*
* 测试OCR 支持Mac Linux Windows * 必须是64位操作系统。 *
*/ public class TestOCR { @Test public void Test() throws IOException { // 创建tesseract Tesseract tesseract = new Tesseract(); // 设置语言 tesseract.setLanguage(new String[]{"chi_sim","eng"}); // 设置字符模型目录 tesseract.setTessData("/Users/ding/Desktop/tessdata"); // 创建ocr OpticalCharacterRecognition ocr = tesseract.newOCR(); // 需要识别的图片 String text = ocr.scanText("/Users/ding/Desktop/test.png"); // 打印识别结果内容 System.out.println(text); // 你也可以通过writer来实现其他类型的存储 ocr.writer(new FileWriter(new File("/Users/ding/Documents/ocr4j/src/main/resources/1.txt"))); } } ``` # 使用其他开源项目 - [tesseract](https://github.com/tesseract-ocr/) - [gosseract](https://github.com/otiai10/gosseract) - [hutool](https://github.com/looly/hutool/)