组织介绍

高校内容创作者行为分析平台 V1.0

基于多模态深度学习技术的高校内容创作者行为分析与舆论风险预警平台。

项目概述

本平台是一个专为高校设计的内容创作者言论风险预警解决方案,支持本地视频上传与多模态分析,旨在自动识别高校学生身份、分析视频内容主题、预测舆论倾向,并提供实时风险评估与预警。

核心功能

✅ 本地视频上传与多模态分析(音视频文本三模态)

✅ 自动识别高校学生身份声明

✅ 视频主题提取与受众画像分析

✅ 舆论倾向预测与综合风险评估

✅ 实时预警与PDF分析报告生成

技术架构

模块划分

模块 技术栈 主要功能
视频处理模块 OpenCV, PyTorch, MoviePy 关键帧提取、场景识别、人脸检测
音频分析模块 Whisper, Librosa, PyAudio 语音转文本、声纹识别、情感分析
文本分析模块 BERT-Chinese, Jieba, SnowNLP 主题提取、情感分析、关键词识别
融合决策模块 Scikit-learn, Pandas, Numpy 多模态融合、风险评估、预警决策

工作流程

  1. 视频上传与预处理

    • 支持MP4、AVI、MOV格式,最大500MB
    • 提取视频基础元数据(时长、分辨率、帧率)
  2. 多模态内容提取

    • 视频:关键帧提取、人脸与表情识别、场景识别
    • 音频:语音转文字(Whisper)、情感分析、特征提取
    • 文本:字幕OCR、标题/描述分析、评论挖掘
  3. 高校身份识别

    • 基于预设高校库(985/211及知名高校)
    • 识别视频中的校服、校徽、校园场景等视觉元素
  4. 主题与受众分析

    • 主题分类:学习生活、校园恋爱、考试经验、专业介绍等
    • 受众画像:年龄段预测、兴趣偏好、地域分布
  5. 舆论倾向预测

    • 正面:赞扬学校、分享经验
    • 中性:客观描述、日常分享
    • 负面:批评学校、抱怨制度
  6. 风险评估与预警

    • 综合风险因子:负面情感强度、高校声誉关联度、传播潜力、历史行为权重
    • 预警阈值:>0.7高风险,>0.4中风险

开发计划(8周冲刺)

阶段 时间 主要内容
第一阶段:基础搭建 第1-2周 项目初始化、环境搭建、Web框架、视频上传功能
第二阶段:核心分析 第3-5周 视频/音频/文本分析模块开发、高校身份识别
第三阶段:融合预警 第6-7周 多模态融合、风险评估模型、报告生成
第四阶段:集成测试 第8周 系统联调、性能优化、测试与演示准备

预期成果

🖥️ 完整的可运行Web平台

📊 高校身份识别准确率 > 90%,舆论倾向预测准确率 > 80%

📚 完整的技术文档(设计文档、API文档、用户手册)

🚀 支持后续扩展:多平台爬取、实时流媒体分析等

快速开始

环境要求

  • Python 3.8+
  • FFmpeg
  • 支持CUDA的GPU(推荐,用于加速深度学习推理)

安装步骤

  1. 克隆仓库:
git clone https://github.com/your-repo/university-content-analyzer.git
cd university-content-analyzer
  1. 安装依赖:
pip install -r requirements.txt
  1. 启动服务:
python app.py
  1. 访问 http://localhost:5000 使用平台。

下一阶段规划(V2.0)

  • 支持视频链接自动爬取
  • 扩展多平台支持(B站、小红书、抖音等)
  • 实时流媒体内容分析
  • 移动端适配与轻量化部署

许可证

本项目遵循 MIT 许可证。

成就
2
Star
0
Fork
成员(4)
10391308 jialewww 1749265595
Jiale
刘明浩
16507579 smart xinxin 1766281866
star
16511709 chenyanhao11 1766388702
陈昊

搜索帮助