pandas:数据处理“瑞士军刀”,1行代码完成数据清洗; openpyxl:轻量级Excel写入工具,适合生成基础报表; xlwings:控制Excel ...
本项目通过对网站用户购物行为数据集进行数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,获得最终的数据分析结果,运用Hadoop、HBase、Hive、Sqoop、Java&Python等技术,可作为数据分析案例。 网站用户购物行为数据集2000万条 ...