@oceanrivers
糕级数据开发工程师
爬取京东网站的电脑配件商品数据,并使用MapReduce和Hive完成统计分析
HiveSQL资源分析工具
一个关于大学食堂的实时数仓项目
自己设计的第一个大数据项目,虽然很菜,但是颇具纪念意义
一个基于购物数据的实时数仓项目
爬取京东网站的电脑配件商品数据,并使用Spark的RDD算子、SparkSQL、SparkStreaming、StructuredStreaming、SparkML对其进行分析
一个基于购物数据的离线数仓项目
本项目选择以下数据源完成数据分析相关工作: https://www.kaggle.com/competitions/sp 其中ghj负责完成分类和聚类部分的工作,wwr负责完成数据预处理、统计分析、回归分析部分的工作,zhx负责完成频繁项集、关联规则挖掘部分的工作
本项目选择对全球自行车十年销售数据进行数据挖掘相关工作
本项目选取京东电商网站电脑配件数据进行NoSQL型数据库相关分析