ISBN/价格: | 978-7-302-61450-0:CNY89.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Spark 3.x大数据分析实战/.张伟洋著 |
出版发行项: | 北京:,清华大学出版社:,2022.09 |
载体形态项: | 310页:;+图:;+26cm |
提要文摘: | 本书基于Spark 3.2.x新版本, 从Spark核心编程语言Scala讲起, 涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章, 第1章讲解了Scala语言的基础知识, 包括IDEA工具的使用等; 第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行; 第3~9章讲解了离线计算框架Spark RDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理, 同时包括常用Shell命令、API操作、内核源码剖析, 并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。 |
题名主题: | 数据处理软件 |
中图分类: | TP274 |
个人名称等同: | 张伟洋 著 |
记录来源: | CN 湖北三新 20231017 |