
课程采用“基础入门—>Spark引擎实战—>Flink引擎实战”的三阶全链路模型,带你从数据湖(Data Lake)的核心理念与Apache Hudi的底层原理起步,彻底攻克传统数据仓库的痛点,掌握COW(写时复制)与MOR(读时合并)两种核心表类型,以及Hudi的快照查询、增量查询与时间点查询机制。课程核心聚焦于双计算引擎的深度集成,深入Spark与Flink两大主流计算框架,实战结构化流(Structured Streaming)写入Hudi、Flink SQL实时入湖以及Flink CDC(Change Data Capture)捕获MySQL binlog实现数据实时同步。你将掌握从大数据环境搭建(HDFS、Hive、Kafka、Zookeeper)到企业级项目实战(滴滴运营数据分析、交易订单实时处理)的完整闭环。这不仅是组件的堆砌,更是对企业级“实时入湖、ACID事务、增量处理”数据湖架构能力的深度重塑,助你从一名传统大数据开发工程师蜕变为具备湖仓一体架构思维与实时数据处理能力的稀缺技术专家。
课程目录:
数据湖架构开发Hudi
+—视频-2022数据湖架构开发Hudi
| +—1.Hudi 基础入门篇视频
| | 00–Apache Hudi 课程内容提纲.mp4
| | 01–Hudi 基础入门篇–课程内容大纲和学习目标.wmv
| | 02–为什么要学习Apache Hudi–什么是数据湖DataLake.wmv
| | 03–为什么要学习Apache Hudi–数据仓库和数据湖区别.wmv
| | 04–为什么要学习Apache Hudi–三大流式数据湖框架.wmv
| | 05–为什么要学习Apache Hudi–Hudi 框架基本介绍.wmv
| | 06–为什么要学习Apache Hudi–Hudi 快速发展.wmv
| | 07–Hudi 快速体验使用–编译Hudi 源码.wmv
| | 08–Hudi 快速体验使用–大数据环境准备概述.wmv
| | 09–Hudi 快速体验使用–HDFS 安装部署测试.wmv
| | 10–Hudi 快速体验使用–Spark 安装部署测试.wmv
| | 11–Hudi 快速体验使用–启动spark-shell添加jar包.wmv
| | 12–Hudi 快速体验使用–模拟产生乘车Trip数据.wmv
| | 13–Hudi 快速体验使用–保存数据到Hudi表.wmv
| | 14–Hudi 快速体验使用–查询Hudi表数据.wmv
| | 15–Hudi 快速体验使用–初识Hudi数据管理.wmv
| | 16–基于IDEA编程使用Hudi–构建Maven模块环境.wmv
| | 17–基于IDEA编程使用Hudi–模拟数据并插入Insert.wmv
| | 18–基于IDEA编程使用Hudi–快照查询及日期时间过滤查询.wmv
| | 19–基于IDEA编程使用Hudi–更新数据Update.wmv
| | 20–基于IDEA编程使用Hudi–增量查询Incremental数据.wmv
| | 21–基于IDEA编程使用Hudi–删除数据Delete.wmv
| | 22–Apache Hudi 核心概念剖析–三大基本概念.wmv
| | 23–Apache Hudi 核心概念剖析–数据计算三种模型.wmv
| | 24–Apache Hudi 核心概念剖析–Hudi数据三种查询类型.wmv
| | 25–Apache Hudi 核心概念剖析–COW 类型表.wmv
| | 26–Apache Hudi 核心概念剖析–MOR 类型表.wmv
| | 27–Apache Hudi 核心概念剖析–数据写操作流程.wmv
| | 28–Hudi 基础入门篇–课程内容内容总结和作业.mp4
| |
| +—2.Hudi 应用进阶篇(Spark 集成)视频
| | 01–Hudi 应用进阶篇之集成Spark–课程内容大纲和学习目标.wmv
| | 02–大数据环境准备–离线tar安装MySQL 5.7.wmv
| | 03–大数据环境准备–安装部署Hive.wmv
| | 04–大数据环境准备–安装部署Zookeeper.wmv
| | 05–大数据环境准备–安装部署Kafka.wmv
| | 06–滴滴运营数据分析–业务数据调研和需求分析.wmv
| | 07–滴滴运营数据分析–构建开发环境.wmv
| | 08–滴滴运营数据分析–工具类SparkUtils.wmv
| | 09–滴滴运营数据分析–日期转换星期测试.wmv
| | 10–滴滴运营数据分析–业务数据加载存储–思路分析.wmv
| | 11–滴滴运营数据分析–业务数据加载存储–加载CSV数据.wmv
| | 12–滴滴运营数据分析–业务数据加载存储–数据ETL转换.wmv
| | 13–滴滴运营数据分析–业务数据加载存储–保存Hudi表.wmv
| | 14–滴滴运营数据分析–指标查询分析–加载Hudi表数据.wmv
| | 15–滴滴运营数据分析–指标查询分析–订单类型统计.wmv
| | 16–滴滴运营数据分析–指标查询分析–订单时效性统计.wmv
| | 17–滴滴运营数据分析–指标查询分析–订单交通类型统计.wmv
| | 18–滴滴运营数据分析–指标查询分析–订单价格区间统计.wmv
| | 19–滴滴运营数据分析–指标查询分析–订单距离区间统计.wmv
| | 20–滴滴运营数据分析–指标查询分析–订单星期统计.wmv
| | 21–滴滴运营数据分析–集成Hive查询–创建表和添加分区.wmv
| | 22–滴滴运营数据分析–集成Hive查询–编写SQL指标分析.wmv
| | 23–结构化流写入Hudi–模拟交易订单数据和流程分析.wmv
| | 24–结构化流写入Hudi–流式程序开发.wmv
| | 25–结构化流写入Hudi–订单数据查询分析.wmv
| | 26–结构化流写入Hudi–工具类DeltaStreamer.wmv
| | 27–集成 SparkSQL–快速体验数据CRUD.wmv
| | 28–集成 SparkSQL–创建表方式.wmv
| | 29–集成 SparkSQL–MergeInto语句.wmv
| | 30–Hudi 应用进阶篇之集成Spark–课程内容内容总结和作业.wmv
| |
| \—3.Hudi 应用进阶篇(Flink 集成)视频
| 01–Hudi 应用进阶篇之集成Flink–课程内容大纲和学习目标.wmv
| 02–快速入门使用–Flink Standalone 集群安装部署.wmv
| 03–快速入门使用–集成方式及启动SQL Client.wmv
| 04–快速入门使用–创建表及数据插入更新查询.wmv
| 05–快速入门使用–流式查询StreamingQuery.wmv
| 06–Flink SQL Writer–Flink SQL集成Kafka.wmv
| 07–Flink SQL Writer–构建Maven开发环境.wmv
| 08–Flink SQL Writer–采用Flink SQL编程加载Kafka数据.wmv
| 09–Flink SQL Writer–编程实现数据实时增量存储Hudi表.wmv
| 10–Flink SQL Writer–编程实现流式增量读取Hudi表数据.wmv
| 11–Flink SQL Client 写入Hudi–整体思路流程及环境配置.wmv
| 12–Flink SQL Client 写入Hudi–编写DDL和DML语句数据实时入湖Hudi.wmv
| 13–Flink CDC Hudi–CDC 概念和类型.wmv
| 14–Flink CDC Hudi–重新编译Hudi源码集成Flink与Hive.wmv
| 15–Flink CDC Hudi–开启MySQL binlog和创建表.wmv
| 16–Flink CDC Hudi–使用Flink CDC创建表及测试.wmv
| 17–Flink CDC Hudi–创建视图View存储中间数据.wmv
| 18–Flink CDC Hudi–插入视图数据插入Hudi表.wmv
| 19–Flink CDC Hudi–使用Hive查询Hudi表数据.wmv
| 20–Flink CDC Hudi–Hudi管理命令hudi-cli使用.wmv
| 21–Hudi 应用进阶篇之集成Flink–课程内容内容总结和作业.wmv
|
\—资料-2022数据湖架构开发Hudi
HudiLinux.zip
第1部分、Hudi 基础入门篇-资料.rar
第2部分、Hudi 应用进阶篇(Spark 集成)-资料.rar
第3部分、Hudi 应用进阶篇(Flink 集成)-资料.rar
下载地址:
感谢您的来访,获取更多精彩文章请收藏本站。


















