
采用“基础组件—计算引擎—OLAP查询—湖仓一体—源码调优”的五维进阶体系,带你彻底打通从HDFS分布式存储到Flink实时计算,从Spark内核优化到数据湖架构落地的完整技术闭环。你将不再局限于SQL的简单编写,而是深入理解Spark SQL的Catalyst优化器与AQE自适应执行机制,掌握ClickHouse与Presto的高性能查询原理。课程重点攻克Data Lakehouse(湖仓一体)前沿技术,涵盖Delta Lake、Hudi与Iceberg三大主流框架,并结合Hadoop与Spark的核心源码解读,助你构建“懂原理、擅调优、精架构”的顶级工程能力,从容应对PB级海量数据处理与复杂业务场景挑战。

课程目录:
课程目录
├── 01大数据概述-1 .mp4
├── 02大数据概述-2.mp4
├── 03大数据“三驾马车”之HDFS-1.mp4
├── 04大数据“三驾马车”之HDFS-2.mp4
├── 05大数据“三驾马车”之HDFS-3.mp4
├── 06大数据“三驾马车”之HDFS-4.mp4
├── 07大数据“三驾马车”之HDFS-5.mp4
├── 08大数据“三驾马车”之HDFS-6.mp4
├── 09加餐 Hadoop集群部署演示.mp4
├── 10Hadoop命令和API、MapReduce、YARN的思想和架构.mp4
├── 11资源调度器、YARN高级特性(上).mp4
├── 12YARN高级特性(下)、Hadoop拓展之RPC和安全机制.mp4
├── 13练习题讲解、Hadoop拓展之Ozone、HBase概述 .mp4
├── 14HBase的逻辑与物理视图、整体架构、高可用性.mp4
├── 15Hive概述、Hive的基本原理.mp4
├── 16HiveQL详解、DDL和DML、常用存储格式.mp4
├── 17Parquet、Hive性能优化、Hive on Tez_Spark.mp4
├── 18RDD编程模型.mp4
├── 19SparkCore架构和原理、任务调度、Spark Streaming.mp4
├── 20Spark Shuffle、数据倾斜及其优化、Spark内存管理.mp4
├── 21Spark SQL基本架构、结构化数据和DataFrame.mp4
├── 22Spark SQL中的“树”、SQL编译器和ANTLR、Catalog.mp4
├── 23逻辑计划树和优化器、物理计划树和策略器.mp4
├── 24代码生成技术、向量化技术.mp4
├── 25SparkThriftserver、Spark的AQE和DPP加速.mp4
├── 26课后作业-彦功助教讲题.mp4
├── 27Spark SQL优化技术详解(上) .mp4
├── 28Spark SQL优化技术详解(下) .mp4
├── 29Presto详解.mp4
├── 30Kylin详解.mp4
├── 31ClickHouse详解.mp4
├── 32ClickHouse应用、Kafka详解.mp4
├── 33Flink详解(上) .mp4
├── 34Flink详解(下) .mp4
├── 35Data Warehouse详解、Data Platform详解(上).mp4
├── 36Data Platform详解(下)、Delta Lake详解(上) .mp4
├── 37Delta Lake详解(下).mp4
├── 38Hudi详解、Iceberg详解 .mp4
├── 39大数据基础算法、Scala基础.mp4
├── 40Hadoop核心源码解读、Spark核心源码解读.mp4
├── 41Spark核心源码解读、大数据工程师面试与成长.mp4
└── 资料/
下载地址:
感谢您的来访,获取更多精彩文章请收藏本站。


















