名师简介:
王磊老师是《offer 来了:Java 面试核心知识点精讲. 原理篇》&《offer 来了:Java 面试核心知识点精讲. 架构篇》两本书的作者,并且有着十余年丰富的物联网、大数据研发以及技术架构经验,对物联网及大数据的原理和技术实现有着深刻理解。长期从事海外项目的研发和交付工作,对异地多活数据中心的建设及高可用、高并发系统的设计,有丰富的实战经验。
目录:
极客时间 Spark核心原理与实战60讲完结百度网盘
├─01-课程介绍.mp4
├─02-内容综述.mp4
├─03-Spark简介及生态介绍.mp4
├─04-Spark原理及特点:模块概述+特点.mp4
├─05-Spark原理及特点:运行模式+集群组角色.mp4
├─06-Spark原理及特点:Spark作业运行流程.mp4
├─07-Spark的运行环境安装:Standalone入门实战.mp4
├─08-Spark的运行环境安装:YARN入门实战.mp4
├─09-Spark批处理做作业入门Demo.mp4
├─10-Spark流处理做作业入门Demo.mp4
├─11-SparkRDD原理:RDD抽象及相关概念.mp4
├─12-SparkRDD原理:RDD依赖关系、Stage、RDD持久化、SparkPreferredLocation及CheckPoint原理和使用.mp4
├─13-SparkRDD实战:如何利用外部数据集生成RDD?.mp4
├─14-SparkRDD实战:Transformation和Action概念、LazyLoad及SparkFunction的3种实现方式.mp4
├─15-SparkRDD实战:常用Transformation原理及实战.mp4
├─16-SparkRDD实战:Action原理和实战、Spark广播变量原理和使用.mp4
├─17-SparkSQL、DataFrame、DataSet原理和使用.mp4
├─18-SparkSQLJoin操作及SparkSQLFunction.mp4
├─19-SparkSQL原理和执行过程.mp4
├─20-常用数据格式原理和使用:TEXT、CSV、JSON、PARQUET在Spark中的使用.mp4
├─21-常用数据格式原理和使用:ORC、AVRO在Spark中的使用.mp4
├─22-SparkConnecter:HDFS及HBase.mp4
├─23-SparkConnecter:MongoDB.mp4
├─24-SparkConnecter:Cassandra.mp4
├─25-SparkConnecter:MySQL及Kafka.mp4
├─26-SparkConnecter:ElasticSearch.mp4
├─27-SparkStearming原理及实战:创建一个SparkStreaming应用.mp4
├─28-SparkStearming原理及实战:DStream操作、数据持久化及性能优化.mp4
├─29-SparkStructuredStearming原理及实战:StructuredStreaming概念、特点、数据模型和应用实战.mp4
├─30-SparkStructuredStearming原理及实战:StructuredStearming事件时间、延迟数据处理策略、容错语义和编程模型.mp4
├─31-SparkStructuredStearming原理及实战:StructuredStearming时间窗口操作、水位线和数据更新模式.mp4
├─32-SparkStructuredStearming原理及实战:StreamJoin操作、重复数据处理、多Watermark处理策略、StructuredStearming结果输出.mp4
├─33-Spark文件读写原理.mp4
├─34-内存调优:JVM内存调优、堆外内存设置及storageFraction设置.mp4
├─35-任务调优:Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4
├─36-失败重试与黑名单机制、推测式执行、资源申请机制.mp4
├─37-SparkOnYARN:Client模式与Cluster模式.mp4
├─38-SparkOnYARN:FIFOScheduler、CapacityScheduler原理和使用.mp4
├─39-SparkOnYARN:YARNFairScheduler原理、使用及特点.mp4
├─40-Spark文件读写原理.mp4
├─41-内存调优:JVM内存调优、堆外内存设置及storageFraction设置.mp4
├─42-任务调优:Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4
├─43-数据调优:数据本地性、复用RDD、BroadCast、Kryo序列化和CheckPoint.mp4
├─44-算子调优.mp4
├─45-SparkSQL调优和SparkStreaming调优.mp4
├─46-Spark数据倾斜问题处理.mp4
├─47-Spark机器学习概述:机器学习应用场景、分类和常用算法.mp4
├─48-机器学习流程:数据收集与存储、数据清理与转换.mp4
├─49-机器学习流程:模型训练、模型测试、模型部署与整合、模型监控与反馈及数据探索和可视化.mp4
├─50-Spark常用统计方法:基础统计、相关性分析、数据抽样.mp4
├─51-分类模型:概念与种类、线性回归及逻辑回归原理实现.mp4
├─52-分类模型:朴素贝叶斯原理实现、决策树原理实现及协同过滤原理.mp4
├─53-聚类模型:基于K-Means的聚类算法原理实现.mp4
├─54-MLPipLine:如何通过SparkMLPipLine模式实现模型训练?.mp4
├─55-Spark3.0新特性概述.mp4
├─56-Spark未来趋势:为什么需要数据湖?.mp4
├─57-Spark未来趋势:DeltaLake原理.mp4
├─58-Spark未来趋势:DeltaLake实战.mp4
├─59-Spark应用番外篇:大数据任务调度.mp4
├─60-结束语.mp4
└─资料地址.txt
极客时间 Spark核心原理与实战60讲完结百度网盘
此资源下载价格为200学币,请先登录
1、此非实物交易,具有可复制性,购买后不予退款,请考虑好再购买;
2、此价格仅为本页面上显示的所有课程资源价格,不保证课程完整性,请考虑好在购买;
3、充值比例1元=5学币。购买后积分未到账或者链接失效请联系QQ:1334634817 或者微信:tuniaoba520
请先
!