本阶段开始学习大数据技术,课上设置随堂练习偏多,阶段结束时,基于Hadoop的广告数据仓库
★★★分布式存储系统:分布式数据库HBase★★★
HBase简介、优缺点、架构以及HBase API使用等
实战部分
搭建Hbase集群、使用Hbase Web UI、使用HBase Shell、利用Java编写程序在hbase中创建表、利用Java编写程序向hbase表中写入和读取数据
项目案例
用户画像系统、网络爬虫
课程目标
掌握HBase系统架构,能够编写程序读写HBase中存储的数据
★★★分布式分析引擎:Hive进阶★★★
理论部分
Hive内部原理,多计算引擎(Tez与Spark),Hive创建ORC/Parquet表,Hive调优
实战部分
程序方式访问Hive、Hive调优演示
课程目标
掌握Hive内部原理,了解常见Hive的优化方式
★★★交互式查询引擎Presto★★★
理论部分
Presto基本架构,Presto与Hive对比,Presto基本使用
实战部分
Presto集群搭建、Presto使用方式、Presto与Hive性能对比