# 数据跨境传输合规审查系统 HKX CDCRS **Repository Path**: rootxss/HKX-CDCRS ## Basic Information - **Project Name**: 数据跨境传输合规审查系统 HKX CDCRS - **Description**: 此系统主要用于政府,企业(跨境电商、数据进出口、小游戏出海)等有数据出境审查需求的环境 - **Primary Language**: Go - **License**: AGPL-3.0 - **Default Branch**: master - **Homepage**: https://ww.sec.hn.cn/ - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-09-18 - **Last Updated**: 2025-10-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: Go语言, Google-cloud, C语言, Python ## README # CDCRS(Cross-Border Data Compliance Review System,数据跨境传输合规审查系统) ## 简介 **CDCRS**(数据跨境传输合规审查系统)是一个面向企业的数据合规解决方案,帮助企业在进行跨境数据传输时,满足国家法律法规与行业规范要求。 系统基于 **微服务 + 容器化架构**,支持 **高并发处理**、**多种接入方式**、**规则引擎驱动的合规审查**,并提供 **Web 管理后台** 与 **API 接口**,便于审计和二次集成。 --- ## 整体架构 系统分为三层: ### 1. 数据采集与接入层 - 对接企业应用系统(API、文件、数据库、消息队列)。 - 接收需要跨境传输的数据,进入审查流程。 ### 2. 合规审查与处理层 - **规则引擎**:国家法律法规、行业规范、企业自定义规则。 - **敏感数据识别**:身份证、手机号、银行卡号、邮箱等。 - **数据脱敏与加密**:AES / RSA / SM4 等。 - **传输控制与日志审计**。 ### 3. 管理与展示层 - **Web 管理后台**:策略配置、规则维护、审查结果展示。 - **RESTful API**:供外部系统调用。 --- ## 技术栈 ### 后端 - **Go**:核心审查服务(高性能、容器友好)。 - **Python(Flask)**:敏感信息检测等功能模块。 - **C语言**:高性能核心库(数据脱敏和敏感信息检测)。 ### 前端 - **React + Ant Design**(推荐) ### 数据存储 - **PostgreSQL**:业务数据存储(远程数据库)。 ### 部署与运维 - **Docker**:服务打包。 - **Docker Compose**:多服务编排。 - **Nginx**:反向代理。 ### 安全与合规 - 支持国密算法(SM2 / SM3 / SM4)。 - 国际标准加密算法(AES / RSA / SHA256)。 - 正则 + NLP 模型识别敏感信息。 --- ## 模块划分 ### 数据接入模块 - API / 文件上传 / 数据库同步 / Kafka 消息接入。 ### 合规审查模块(核心) - **规则引擎子模块**:匹配国家与行业政策(如《数据出境安全评估办法》)。 - **敏感数据识别子模块**:基于正则与 AI 模型。 - **数据脱敏子模块**:掩码、哈希、加密。 - **审查决策子模块**:允许 / 阻断 / 上报。 ### 安全与加密模块 - 传输前加密、存储加密、密钥管理。 ### 日志与审计模块 - 审查报告、数据传输日志。 - 异常告警(钉钉 / 飞书 / 邮件通知)。 ### 管理后台模块 - 策略管理(规则自定义、审批流程)。 - 用户权限(RBAC:管理员、审计员、普通用户)。 - 报表展示(敏感字段数量、传输次数、违规情况)。 --- ## 新增功能 ### 敏感数据检测增强 系统现在支持检测以下类型的敏感数据: 1. **手机号码**:中国手机号码 (11位,以1开头,第二位为3-9) 2. **身份证号**:中国身份证号码 (18位,最后一位可能是X) 3. **邮箱地址**:标准邮箱格式 4. **银行卡号**:银行卡号 (16-19位数字) ### 数据脱敏算法改进 系统采用更真实的脱敏算法: 1. **手机号码**:保留前3位和后4位,中间4位用*代替 2. **身份证号**:保留前6位和后4位,中间8位用*代替 3. **邮箱地址**:保留@符号前后完整信息,邮箱用户名部分保留首尾字符,中间用*代替 4. **银行卡号**:保留前6位和后4位,中间部分用*代替 ### 接入方式增强 系统现在支持多种接入方式: 1. **传统API调用**:直接调用Go或Python服务接口 2. **反向代理模式**:通过Nginx统一接入,简化客户端配置 3. **探针模式**:通过探针SDK集成到应用中,实现无侵入式接入 --- ## 数据库配置 系统现在使用远程PostgreSQL数据库,配置如下: - **主机**: ecs.sec.hn.cn - **端口**: 5432 - **用户名**: user_kwmBAP - **密码**: TeHeZKPzzr6mZ6R4 - **数据库名**: auditdb 环境变量配置: - `DB_HOST`: 数据库主机地址 - `DB_PORT`: 数据库端口 - `DB_USER`: 数据库用户名 - `DB_PASSWORD`: 数据库密码 - `DB_NAME`: 数据库名称 --- ## 服务架构 ``` crossborder-audit/ ├─ c_core/ # 高性能核心库(C) │ ├─ core.c # 核心逻辑示例 │ ├─ core.h # 头文件 │ ├─ Makefile # 构建动态库 │ └─ Dockerfile # C 核心库镜像 │ ├─ go_service/ # Go 微服务 │ ├─ main.go # 入口程序 │ ├─ go.mod # Go module 配置 │ └─ Dockerfile # Go 服务镜像 │ ├─ python_service/ # Python 功能模块(敏感信息检测等) │ ├─ app.py # Flask 服务入口 │ ├─ requirements.txt # Python 依赖 │ └─ Dockerfile # Python 服务镜像 │ ├─ frontend/ # React 管理后台 │ ├─ package.json # 项目依赖 │ ├─ public/ # 静态资源 │ │ └─ index.html # HTML模板 │ └─ src/ # React 源码 │ ├─ App.js │ └─ index.js │ └─ Dockerfile # React 前端镜像 │ ├─ probe_agent/ # 探针代理服务 │ ├─ agent.py # 探针代理服务 │ ├─ probe_sdk/ # 探针SDK │ │ ├─ __init__.py # SDK初始化文件 │ │ └─ detector.py # 检测器SDK │ ├─ requirements.txt # Python依赖 │ ├─ Dockerfile # 探针服务镜像 │ └─ README.md # 探针服务说明 │ ├─ nginx.conf # Nginx反向代理配置 ├─ docker-compose.yml # Docker Compose 集成文件 ├─ README.md # 项目说明 └─ .gitignore ``` ## 运行方法 1. 构建并启动服务 ```bash docker-compose up --build ``` 2. 访问应用 - 前端界面:http://localhost - Go服务API:http://localhost/api/go/ - Python服务API:http://localhost/api/python/ - 探针服务API:http://localhost/api/probe/ 3. 健康检查 - Nginx健康检查:http://localhost/health - 探针服务健康检查:http://localhost/api/probe/health ## API接口说明 ### 敏感数据检测接口 - **Go服务**:`POST /api/go/detect` - **Python服务**:`POST /api/python/detect` - **探针服务**:`POST /api/probe/detect` ### 合规检查接口 - **Go服务**:`POST /api/go/compliance` - **Python服务**:`POST /api/python/compliance` - **探针服务**:`POST /api/probe/compliance` ### 完整处理接口 - **探针服务**:`POST /api/probe/process` ## 部署说明 系统通过Docker Compose进行容器化部署,包含以下服务: 1. **nginx_proxy**:Nginx反向代理服务 2. **frontend**:React前端应用 3. **go_service**:Go后端服务 4. **python_service**:Python后端服务 5. **probe_agent**:探针代理服务 6. **c_core**:C语言核心库(构建时使用) 所有服务通过Docker网络进行通信,前端通过Nginx反向代理访问后端服务。