
会员
Hadoop+Spark大数据分析实战
更新时间:2023-09-08 19:25:15 最新章节:14.3.5 数据可视化开发
书籍简介
本书是Hadoop+Spark大数据分析技术入门书,基于Hadoop和Spark两大框架体系的3.2版本,以通俗易懂的方式介绍Hadoop+Spark原生态组件的原理、集群搭建、实战操作,以及整个Hadoop生态系统主流的大数据分析技术。本书共分14章。第1章讲解Hadoop框架及新版本特性,并详细讲解大数据分析环境的搭建工作,包括Linux操作系统的安装、SSH工具使用和配置等;第2章讲解Hadoop伪分布式的安装和开发体验,使读者熟悉Hadoop大数据开发两大核心组件,即HDFS和MapReduce;第3~12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadoop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume,以及Spark框架数据处理、机器学习等实战技术,并通过实际案例加深对各个框架的理解与应用;第13~14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。
品牌:清华大学
上架时间:2022-07-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
迟殿委编著
最新上架
- 会员《R语言数据分析从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了R语言基础知识、核心技术与高级应用。全书分为3篇,共16章,包括初识R语言、集成开发环境RStudio、R语言入门、数据结构、流程控制语句、日期和时间序列、获取数据、数据处理与清洗、数据计算与分组统计、基本绘图、ggplot2高级绘图、lattice高级绘图、基本统计分析、方差分析、回归分析和时间序列分析计算机12.2万字
- 会员本书是编程大师“Bob大叔”40余年编程生涯的心得体会的总结,讲解要成为真正专业的程序员需要具备什么样的态度,需要遵循什么样的原则,需要采取什么样的行动。作者以自己以及身边的同事走过的弯路、犯过的错误为例,意在为后来者引路,助其职业生涯迈上更高台阶。计算机12.2万字
- 会员《C语言从入门到精通(第6版)》从初学者的角度出发,以通俗易懂的语言、丰富多彩的实例,详细介绍了使用C语言进行程序开发需要掌握的各方面知识。全书分为4篇,共20章,内容包括C语言概述、算法、数据类型、运算符与表达式、数据输入/输出、选择结构、循环控制、数组、函数、指针、结构体和共用体、位运算、预处理、文件、内存管理、网络套接字编程、单词背记闯关游戏、学生信息管理系统、单片机基础和GSM短信控制家庭计算机18.5万字
- 会员本书跟随了Node.js的标准与行业的发展趋势,在介绍新标准与新技术的同时兼顾了理论基础和实际应用,主要内容分为基础和应用两部分,基础部分内容包含了Node.js环境配置,npm项目管理,JavaScript语法基础,Node.js基本模块的原理与使用,异步代码的编写与组织,应用部分包含了网络编程,桌面应用开发以及测试和调试。本书讲解与示例并重,由浅入深地剖析了Node.js模块与语言原理,并通过计算机10.9万字
- 会员本书围绕Python技术栈,讲解测试开发技术栈领域的各项核心技术要点。全书共11章,首先讲解pytest单元测试框架在测试领域的技术栈要点,包含pytest从最基本的应用到高阶应用。接着讲解服务端测试开发领域主流的核心思想、主流测试开发工具在解决服务端测试开发中的技术难点,以及服务端测试框架的设计和项目实战案例。在框架的基础上扩展了服务端测试开发领域的知识面,主要介绍Docker容器化技术、基于D计算机7.8万字
- 会员本书以实用的设计模式为例,讲解了Java近年来在改善语法方面取得的进展,同时在实现这些模式的过程中展示了语言特性、设计模式与平台效率之间的关系。本书涵盖23种传统的设计模式、11种较为常见的模式,以及8种适用于多线程环境的并发模式。另外,本书还简要介绍了15种反模式。作者讲解这些模式的时候不仅给出了简洁、直观的范例代码,而且还利用UML类图与JFR工具展示了运用该模式的程序所具备的架构及运行细节,计算机11.6万字
- 会员本书详细阐述如何在设计、规划和实现软件时做出更好的决策,通过真实的案例,以抽丝剥茧的方式分析那些失误的决策,探讨还有哪些可能的解决方案,并对比各种方案的优缺点,摸索软件设计的常青模式。本书通过实例来说明某些决策的后果,例如代码重复如何影响系统的耦合与演进速度,以及如何在日期和时间信息方面隐藏细微差别。本书还介绍如何根据帕累托法则有效地缩小优化范围,确保分布式系统的一致性。通过阅读本书,读者很快就可计算机23.9万字
- 会员本书采用理论与实践相结合的原则,在各章的开篇会采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能是本书创作的初衷。全书共分为6篇:第一篇为入门篇(第1章和第2章),第二篇为基础篇(第3章和第4章),第三篇为强化篇(第5~7章),第四篇为进阶篇(第8章和第9章),第五篇为高阶篇(第10章和第11章),第六计算机11.8万字