# announce-parse **Repository Path**: open_soft_bhy/announce-parse ## Basic Information - **Project Name**: announce-parse - **Description**: 标准公告解析 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-08 - **Last Updated**: 2026-01-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 标准公告解析 ### 1、支持解析标准内容 ### 2、支持解析标准word ### 3、支持解析标准pdf ## 标准公告 ### 国标公告:std_sa_notice ### 行标公告:std_sa_industry_announce ### 地标公告:发布:std_sa_sa_local_announce_pub 废止:std_sa_local_announce_del ### 团标公告: ### 企标公告: 标准公告解析(以国行地为基础扩展) 公告大类:国标、行标、地标 公告类型:批准公告、废止公告、外文版公告、复审公告 公告格式:html table、word、pdf、excel 1、批准公告字段有:序列、国家标准编号、国家标准名称、代替标准号、实施日期 2、废止公告字段有:序列、标准号、标准名称、复审结论、标准废止日期 3、外文版公告字段有:序列、国家标准编号、国家标准名称、国家标准外文名称、语种 4、复审公告字段有:序列、标准号、标准名称、归口单位、主管部门、复审结论 第一个工厂类区分国标GB、行标HB、地标DB 第二个区分公告类型 第三个区分解析格式工厂 该系统采用三层工厂模式设计: 第一层工厂:区分国标(GB)、行标(HB)、地标(DB) - StandardTypeFactory 第二层工厂:区分公告类型(批准、废止、外文版、复审) - NoticeTypeFactory 第三层工厂:区分解析格式(HTML表格、Word、PDF、Excel) - ParseFormatFactory 核心组件 实体类: ApprovalNotice - 批准公告实体 AbolishmentNotice - 废止公告实体 ForeignVersionNotice - 外文版公告实体 ReviewNotice - 复审公告实体 枚举类: StandardTypeEnum - 标准类型枚举 NoticeTypeEnum - 公告类型枚举 ParseFormatEnum - 解析格式枚举 解析器实现: ApprovalNoticeParser - 批准公告解析器 AbolishmentNoticeParser - 废止公告解析器 ForeignVersionNoticeParser - 外文版公告解析器 ReviewNoticeParser - 复审公告解析器 工厂类: HtmlTableParserFactory - HTML表格解析器工厂 WordParserFactory - Word解析器工厂 PdfParserFactory - PDF解析器工厂 ExcelParserFactory - Excel解析器工厂 统一服务入口: ParseService - 统一解析服务