《Spark快速大数据分析》PDF电子书教程下载

spark | 2019-11-04 08:53:56

 

《Spark快速大数据分析》介绍

spark快速大数据分析本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。spark快速大数据分析 pdf 高清2015年9月由人民邮电出版社出版发行,是一本非常经典的spark快速大数据分析方面的学习书籍。

《Spark快速大数据分析》目录

推荐序  xi
译者序  xiv
序  xvi
前言  xvii
第1章 Spark数据分析导论  1
1.1 Spark是什么  1
1.2 一个大一统的软件栈  2
1.2.1 Spark Core  2
1.2.2 Spark SQL  3
1.2.3 Spark Streaming  3
1.2.4 MLlib  3
1.2.5 GraphX  3
1.2.6 集群管理器  4
1.3 Spark的用户和用途  4
1.3.1 数据科学任务  4
1.3.2 数据处理应用  5
1.4 Spark简史  5
1.5 Spark的版本和发布  6
1.6 Spark的存储层次  6
第2章 Spark下载与入门  7
2.1 下载Spark  7
2.2 Spark中Python和Scala的shell  9
2.3 Spark 核心概念简介  12
2.4 独立应用  14
2.4.1 初始化SparkContext  15
2.4.2 构建独立应用  16
2.5 总结  19
第3章 RDD编程  21
3.1 RDD基础  21
3.2 创建RDD  23
3.3 RDD操作  24
3.3.1 转化操作  24
3.3.2 行动操作  26
3.3.3 惰性求值  27
3.4 向Spark传递函数  27
3.4.1 Python  27
3.4.2 Scala  28
3.4.3 Java  29
3.5 常见的转化操作和行动操作  30
3.5.1 基本RDD  30
3.5.2 在不同RDD类型间转换  37
3.6 持久化( 缓存)  39
3.7 总结  40
第4章 键值对操作  41
4.1 动机  41
4.2 创建Pair RDD  42
4.3 Pair RDD的转化操作  42
4.3.1 聚合操作  45
4.3.2 数据分组  49
4.3.3 连接  50
4.3.4 数据排序  51
4.4 Pair RDD的行动操作  52
4.5 数据分区(进阶)  52
4.5.1 获取RDD的分区方式  55
4.5.2 从分区中获益的操作  56
4.5.3 影响分区方式的操作  57
4.5.4 示例:PageRank  57
4.5.5 自定义分区方式  59
4.6 总结  61
第5章 数据读取与保存  63
5.1 动机  63
5.2 文件格式  64
5.2.1 文本文件  64
5.2.2 JSON  66
5.2.3 逗号分隔值与制表符分隔值  68
5.2.4 SequenceFile  71
5.2.5 对象文件  73
5.2.6 Hadoop输入输出格式  73
5.2.7 文件压缩  77
5.3 文件系统  78
5.3.1 本地/“常规”文件系统  78
5.3.2 Amazon S3  78
5.3.3 HDFS  79
5.4 Spark SQL中的结构化数据  79
5.4.1 Apache Hive  80
5.4.2 JSON  80
5.5 数据库  81
5.5.1 Java数据库连接  81
5.5.2 Cassandra  82
5.5.3 HBase  84
5.5.4 Elasticsearch  85
5.6 总结  86
第6章 Spark编程进阶  87
6.1 简介  87
6.2 累加器  88
6.2.1 累加器与容错性  90
6.2.2 自定义累加器  91
6.3 广播变量  91
6.4 基于分区进行操作  94
6.5 与外部程序间的管道  96
6.6 数值RDD 的操作  99
6.7 总结  100
第7章 在集群上运行Spark  101
......
第8章 Spark调优与调试  123
......
第9章 Spark SQL  141
......
第10章 Spark Streaming  161
......
第11章 基于MLlib的机器学习  187
......
作者简介  210
封面介绍  210

 

下载地址:
《Spark快速大数据分析》PDF电子书教程下载

扫描关注 -> 回复 615 -> 获取下载链接

注意:本电子书来源于网络,仅供参考预览了解本书,喜欢的请购买正版书籍。如有侵权,请联系我们,快速删除。
登录后即可回复 登录 | 注册
    
关注编程学问公众号