diff --git a/README.md b/README.md index 8694a68fc450bd90b87a3eff2c3778906fb6f32a..d835824dfcefe188c6496a769882d2f7e3805a7b 100644 --- a/README.md +++ b/README.md @@ -1,498 +1,148 @@ -
-
- 🍬Java轻量级、免费、离线AI工具箱,致力于帮助Java开发者零门槛使用AI算法模型
- 像Hutool一样简单易用的Java AI工具箱
-
- 👉 http://smartjavaai.cn/ 👈 -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
|
-
-
- 人脸检测(Face Detection) - - 5点人脸关键点定位- |
-
-
-
-
- |
- |
|
-
-
- 人脸比对1:1 - |
-
-
-
-
- |
- |
|
-
-
- 人证核验 |
-
-
-
-
- |
- |
|
-
-
- 人脸比对1:N - - 人脸注册 - - 人脸库查询 - - 人脸库删除 - |
-
-
-
-
- |
- |
|
-
-
- 人脸属性检测 - - 性别检测(GenderDetection)- - 年龄检测(AgeDetection) - - 口罩检测(Face Mask Detection) - - 眼睛状态检测(EyeClosenessDetection) - - 脸部姿态检测(FacePoseEstimation) - |
-
-
-
-
- |
- |
|
-
-
- 活体检测 - |
-
-
-
-
- |
- |
|
-
-
- 人脸表情识别 - |
-
-
-
-
- |
- |
|
-
-
- 图像分类 |
-
-
-
-
- |
- |
|
-
-
- 目标检测(Object Detection) - - 视频流目标检测:rtsp、摄像头、视频文件等- |
-
-
-
-
- |
-
-
-
-
- |
-
|
-
-
- 语义分割 |
-
-
-
-
- |
- |
|
-
-
- 实例分割 |
-
-
-
-
- |
- |
|
-
-
- 自定义目标训练+检测 |
-
-
-
-
- |
- |
|
-
-
- 行人检测(Person Detection) - |
-
-
-
-
- |
- |
|
-
-
- 人类动作识别 |
-
-
-
-
- |
- |
|
-
-
- OBB旋转框检测 |
-
-
-
-
- |
- |
|
-
-
- 零样本目标检测 - |
-
-
-
-
- |
- |
|
-
-
- 姿态估计 |
-
-
-
-
- |
- |
|
-
-
- OCR文字识别 - - 支持印刷体识别 - - 支持手写字识别 - |
-
-
-
-
- |
- |
|
-
-
- OCR文字识别 - - 表格识别(Table Structure Recognition) - |
-
-
-
-
- |
- |
|
-
-
- 车牌识别 - - 车牌颜色识别 - |
-
-
-
-
- |
-
-
-
-
- |
-
|
-
-
- 机器翻译 |
-
-
-
-
- |
- |
|
-
-
- 语音识别 - - 支持实时语音识别 - |
-
-
-
-
- |
- |
|
-
-
- 语音合成(ASR) - |
-
-
-
-
- |
- |
|
-
-
- CLIP - - 文搜图- - 图搜图 - - 图搜文 - |
-
-
-
-
- |
-
-
--------------------------------------------------------------------------------
-
-## 📦 安装
-
-
-### 1、环境要求
-
-- Java 版本:**JDK 8或更高版本**
-- 操作系统:不同模型支持的系统不一样,具体请查看[文档](http://doc.smartjavaai.cn)
-
-### 2、Maven
-
-在项目的 `pom.xml` 的 `dependencies` 中可以一次性引入全部功能(如下所示)。
-
-⚠️ **注意:不推荐直接引入全部依赖**,更推荐根据实际需求,按功能模块单独引入,避免引入不必要的包。
-
-详细引入方式请查看 [文档](http://doc.smartjavaai.cn/install.html)、或查看[示例代码](https://gitee.com/dengwenjie/SmartJavaAI/tree/master/examples)
+### 人脸识别
+- 人脸检测(5点关键点定位)
+- 人脸比对(1:1、1:N)
+- 人脸属性检测(性别、年龄、口罩、眼睛状态、姿态)
+- 活体检测(图片、视频)
+- 表情识别(7种表情)
+- 人脸质量评估(亮度、清晰度、姿态等)
+
+### 图像分类
+- 支持 YOLOv8、YOLOv11 等分类模型
+- 可加载自定义训练模型
+
+### 目标检测
+- 支持 YOLOv5、YOLOv8、YOLOv11、Tensorflow Object Detection 等模型
+- 支持视频流检测(RTSP、摄像头、视频文件)
+
+### 语义分割
+- 支持 DeepLabV3 模型
+
+### 实例分割
+- 支持 YOLOv8-seg、YOLOv11-seg、Mask R-CNN 等模型
+
+### OBB 旋转框检测
+- 支持 YOLOv11-obb 模型
+
+### 动作识别
+- 支持 KINETICS400 数据集中的 400 种动作识别
+
+### 姿态估计
+- 支持 YOLOv8-pose、YOLOv11-pose 等模型
+
+### 零样本目标检测
+- 支持 YOLO-World、OWLv2 模型,无需预定义类别即可识别图像中的任意物体
+
+### CLIP 模型
+- 支持图像与文本特征提取
+- 支持文搜图、图搜文、图搜图
+
+### OCR 文字识别
+- 支持 PaddleOCR 3.0(PP-OCRv5、PP-OCRv4)
+- 支持任意角度识别、手写识别、表格识别、中文车牌识别
+
+### 机器翻译
+- 支持 NLLB-200 模型,200+ 种语言互译
+
+### 语音识别(ASR)
+- 支持 Whisper、Vosk、Sherpa-ONNX 等模型
+- 支持 100 种语言识别、实时语音识别
+
+### 语音合成(TTS)
+- 支持 Sherpa-ONNX,合成中文、英文、粤语、方言等
+
+---
+
+## 🛠️ 模块组成
+
+| 模块名 | 功能说明 |
+|--------|----------|
+| `common` | 基础工具类、图像处理、实体类、配置类 |
+| `face` | 人脸识别相关功能 |
+| `vision` | 图像分类、目标检测、姿态估计、分割等 |
+| `ocr` | OCR 文字识别、表格识别、车牌识别 |
+| `translate` | 机器翻译 |
+| `speech` | 语音识别与合成 |
+| `bom` | 依赖管理 |
+| `all` | 所有模块的聚合包(可一键引入) |
+
+---
+
+## 📦 安装方式
+
+### 环境要求
+
+- Java 版本:JDK 8 或更高
+- 操作系统:Windows / Linux / macOS(支持 x86 和 ARM)
+
+### Maven 引入
+
+推荐按需引入模块,避免冗余依赖:
+
+```xml
+
+