作者:韩信子@ShowMeAI
教程地址:https://www.showmeai.tech/tutorials/84
声明:版权所有,转载请联系平台与作者并注明出处

引言

本篇内容是ShowMeAI组织的「图解大数据处理与开发」系列教程入口,本教程以大数据技术为根基,给大家讲解大数据开发与数据处理分析的相关知识与技能,并配以相关的实战案例帮助大家学习理解。

内容覆盖:Hadoop,Map-Reduce,Hive, HBase,Spark,流式数据处理,Spark Streaming,大数据机器学习,GraphFrames,图数据挖掘

教程地址

点击查看完整教程学习路径

内容章节

1.导论:大数据生态与应用

2.分布式平台:Hadoop与Map-reduce详解

3.实操案例:Hadoop系统搭建与环境配置

4.实操案例:应用map-reduce进行大数据统计

5.实操案例:Hive搭建与应用案例

6.海量数据库与查询:Hive与HBase详解

7.大数据分析挖掘框架:Spark初步

8.Spark操作:基于RDD的大数据处理分析

9.Spark操作:基于Dataframe与SQL的大数据处理分析

10.综合案例:使用spark分析美国新冠肺炎疫情数据

11.综合案例:使用Spark分析挖掘零售交易数据

12.综合案例:使用Spark分析挖掘音乐专辑数据

13.流式数据处理:Spark Streaming

14.Spark机器学习(上)-工作流与特征工程

15.Spark机器学习(下)-分类回归聚类建模与超参调优

16.Spark GraphFrames:基于图的数据分析挖

ShowMeAI系列教程推荐

  • 图解Python编程:从入门到精通系列教程
  • 图解数据分析:从入门到精通系列教程
  • 图解AI数学基础:从入门到精通系列教程
  • 图解大数据技术:从入门到精通系列教程
  • 图解机器学习算法:从入门到精通系列教程

更多推荐

图解大数据技术:从入门到精通系列教程