# ECommerceRecommendSystem **Repository Path**: xushenghu/EcommerceRecommendSystem ## Basic Information - **Project Name**: ECommerceRecommendSystem - **Description**: 基于scala推荐系统 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2022-11-11 - **Last Updated**: 2022-11-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # ECommerceRecommendSystem #### 介绍 基于scala电商推荐系统 #### 软件架构 **软件架构说明** mongodb存电商业务数据,redis做缓存。 现有数据加载模块,离线统计推荐模块,实时推荐模块等。各业务模块如下: ================================= 数据加载模块 ---> DataLoad(加载mongo数据) 离线统计推荐模块 ----> statisticsRecommender(基于mongo数据做历史热门商品,近期热门商品,优质商品统计推荐,将结果写回到mongo中) 基于隐语义模型的离线推荐模块 ---> OfflineRecommender(基于ALS隐语义训练模型,得到用户商品推荐列表和商品相似度列表【用于后续的实时推荐模块】), ALSTrainer ALS模型训练和参数选取。 实时推荐模块 ---> OnlineRecommender 。 实时推荐流程:1).埋点日志捕捉到当前用户的评分信息,该信息被flume采集后发送给指定kafka主题 2).sparkstreaming程序消费kafka,获取到实时评分流数据。根据评分流数据得到当前用户信息,查询redis中该用户最近k次评分数据用于后续做相似商品推荐优先级计算 3).拿到mongo中离线计算得到的商品相似度矩阵列表作为实时推荐的备选商品列表,依次对每个备选商品进行推荐优先级计算,把得到的当前用户推荐列表写回到mongodb。 基于内容的推荐模块:---> ContentRecommender。对商品信息中的标签字段利用TF-IDF算法提取商品特征向量,分词、计算词频、计算TF-IDF。最后利用向量余弦相似度计算相似商品,将结果写入到mongo集合中。 基于itemCF的协同过滤推荐 ---> ItemCFRecommender。原理:基于用户行为数据(评分,点击,收藏,购买等),利用用户对多个商品做过评分,点击或收藏等行为的原理,可用同现公式计算出商品之间的相似度。将结果写入mongo中。 ================================= #### 安装教程 1. mongodb安装 2. redis安装 3. xxxx #### 使用说明 1. xxxx 2. xxxx 3. xxxx #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)