漫游鲸二手书店
淘二手好书+回收闲置图书
Spark快速数据处理
Spark快速数据处理
(美)Holden Karau | 机械工业出版社
ISBN:9787111463115
原价: ¥29.00
销售价:¥4.90元
参与书籍回收后,可享更低价格
分类 其他
作者 (美)Holden Karau
出版社 机械工业出版社
图书简介

【编辑推荐】从实用角度系统讲解Spark的数据处理工具及使用方法手把手教你充分利用Spark提供的各种功能,快速编写高效分布式程序【内容简介】Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等各大公司等。本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机\独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。

阅读更多

相关推荐
更多低价好书购买/书籍回收
扫码访问微信小程序
在线客服
了解更低购买价格、或有疑问需要帮助,可以找小鲸鱼噢~
咨询在线客服