
会员
深入大型数据集:并行与分布化Python代码
更新时间:2021-03-04 19:24:44 最新章节:内容简介
书籍简介
本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识,包括如何通过boto3的Python库将文件上传到AWSS3服务,以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。本书适合有一定Python编程基础,且希望掌握大型数据集处理能力的开发人员和数据科学家阅读。
译者:张若飞
上架时间:2021-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
(美)J.T.沃勒翰
最新上架
- 会员《Django+Vue.js商城项目实战》基于Django4.x和Vue3.x版本,以一个完整商城网站的开发流程为主线,介绍分别使用纯后端架构和前后端分离架构实现项目的全部技术细节。纯后端开发架构主要讲解Django的知识要点及每个功能模块的要点和实现方式,内容包括Django网站开发基础、项目需求与设计、路由规划与设计、商城数据模型的搭建与使用、数据业务视图、数据渲染与展示、商品信息模块、用户计算机15.4万字
- 会员本书涵盖深度学习的专业基础理论知识,包括深度学习概述、机器学习基础、神经网络基础、卷积神经网络、循环神经网络、正则化与深度学习优化,以及比较流行的应用场景实践。本书共11章外加3个附录,系统讲解深度学习的基础知识与领域应用实践。本书内容包括深度学习概述、机器学习基础、神经网络基础、卷积神经网络和循环神经网络、正则化与深度学习优化、计算机视觉应用、目标检测应用、文本分析应用、深度强化学习应用、Ten计算机17.9万字
- 会员本书在《C语言程序设计案例式教程》的基础上进行了完善、补充和修订,内容更加丰富、翔实,结构层次更加清晰、合理。本书共11章,第1章主要介绍C语言概述、C语言开发环境的搭建和C语言程序的编译机制等;第2章和第3章主要介绍C语言的基础知识,包括关键字、标识符、常量、变量、数据类型、类型转换、运算符与表达式等;第4~9章主要介绍C语言的核心知识,包括结构化程序设计、数组、函数、指针、字符串、结构体等;第计算机16.3万字
- 会员《Scrapy网络爬虫开发实战》介绍如何学习和使用流行的Scrapy框架开发网络爬虫应用,主要内容使用Python开发网络爬虫,识别网页的编码,结构化信息的提取,Scrapy爬虫的示例使用,ScrapyPlaywright抓取动态JS网站,将抓取的数据保存到数据库,部署、调度和运行Scrapy爬虫等。《Scrapy网络爬虫开发实战》适合作为高等院校计算机、软件工程专业本科生、研究生的参考书目,也适计算机4.7万字
- 会员《剑指JVM:虚拟机实践与性能调优》共分5篇:引言篇讲述了Java与Java虚拟机的关系,以及Java虚拟机的相关知识;第1篇讲述了运行时数据区,涉及Java内存区域的各个核心结构,以及对象创建的各种细节;第2篇讲述了垃圾收集,涉及各种收集算法、垃圾收集器;第3篇讲述了字节码与类的加载;第4篇讲述了性能监控与调优,带领读者学习Java虚拟机常用的监控与调优工具,并附有企业级的性能调优案例。计算机23万字
- 会员《TypeScript+Vue.js前端开发从入门到精通》以一个一线前端架构师的视角,深入浅出地介绍TypeScript与Vue.js整合开发大型前端应用的全部技术细节。全书共17个章节,主要内容包括TypeScript基础、面向对象编程、Vue中的模板、组件属性和方法、用户交互处理、组件基础与进阶、Vue响应性编程、动画技术、脚手架VueCLI和Vite工具的使用、ElementPlusUI计算机13.1万字
- 会员本书采用理论与实践相结合的原则,在各章的开篇会采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能是本书创作的初衷。全书共分为6篇:第一篇为入门篇(第1章和第2章),第二篇为基础篇(第3章和第4章),第三篇为强化篇(第5~7章),第四篇为进阶篇(第8章和第9章),第五篇为高阶篇(第10章和第11章),第六计算机11.8万字
- 会员本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育计算机12.6万字
同类书籍最近更新
- 会员本书参考高等学校理工科“高等数学”“线性代数”“概率论与数理统计”“运筹学”等课程教学大纲,使用Python语言实现相关计算、图形展示及模型求解,内容包含Python编程语言入门、极限的运算、函数的求导及积分、微分方程求解、级数、行列式计算、线性方程组求解、随机变量及其分布、随机变量的数字特征、参数估计、假设检验、方差分析与回归、线性规划、非线性规划、动态规划、图与网络计划及排队论等。本书内容翔实程序设计8.5万字
- 会员Thisbookisfor.NETdeveloperswhowouldliketomasterandimplementC#7and.NETCore2.0withpracticalprojects.Basicknowledgeof.NETCoreandC#isassumed.程序设计4.7万字
- 会员本书紧扣当今网店设计学的热点、难点与重点,主要涵盖了广义网店设计所包括的网店设计的背景、网店视觉营销的黄金定律、网店视觉设计中的色彩要素、网店视觉设计中的文字要素、网店视觉设计中的图片要素、网店视觉设计中的版式要素、网店核心功能区块的设计、网店页面创意设计、网店商品陈列设计、移动购物App设计、网店设计集锦共11个方面的内容,全面介绍了网店设计及相关学科所需掌握的专业技能,知识体系相辅相成,非常完程序设计9.2万字
- 会员XML已经在Web应用、新型数据库系统、移动互联网技术、网络数据交换和跨平台应用中发挥越来越重要的作用,已成为风靡全球的电子商务的核心技术。本书全面论述了XML技术的主要方面:XML1.0规范的基本技术要求和规定,XMLDTD、XMLSchema2.0、XPath3.0、XDM3.0、XPath、XQueryFunctions与Operators3.0、XSLT2.0、XMLDOMLevel3、X程序设计15.5万字
- 会员本书讨论了如何利用现代化的技术开发新一代的企业级Java应用。传统的单体应用已经难以适应云环境下的开发和部署,因此,作者首先介绍了在云环境下需要什么样的Java应用架构和开发实践。作者基于Quarkus、SpringBoot和Vert.x技术搭建了一个典型的云原生分布式应用,并将其容器化和部署至Kubernetes。Serverless是一种新兴的应用开发和部署模式,能够最大化地节省成本,作者以K程序设计6.3万字