【Spark编程基础】
创始人
2024-05-29 19:34:59
0次
文章目录
- 第2章 Spark设计与运行原理
- 2.1 Spark概述
- 2.1.1 Spark简介
- 2.1.2 Spark与Hadoop对比
- 2.2 Spark生态系统
- 2.3 Spark运行架构
- 2.3.1 基本概念
- 2.3.2 架构设计
- 2.3.3 Spark运行基本流程
- 2.3.4 RDD设计与运行原理
- 2.4 Spark的部署方式
第2章 Spark设计与运行原理
2.1 Spark概述
2.1.1 Spark简介
- Spark特点:运行速度快、容易使用、通用性、运行模式多样
2.1.2 Spark与Hadoop对比
2.2 Spark生态系统
- 大数据处理包括三个类型:
- 复杂的批量数据处理
- 基于历史数据的交互式查询
- 基于实时数据流的数据处理
- 带来的问题:
- Spark生态系统
- Spark设计遵循理念:一个软件栈满足不同应用场景
- 提供内存计算框架,支持:SQL即席查询、实时流式计算、机器学习、图计算
- Spark可部署在资源管理器YARN之上,提供一站式大数据解决方案
- Spark生态系统支持 批处理、交互式查询、流数据处理
2.3 Spark运行架构
2.3.1 基本概念
2.3.2 架构设计
2.3.3 Spark运行基本流程
2.3.4 RDD设计与运行原理
2.4 Spark的部署方式
相关内容