
会员
短文本数据理解
更新时间:2019-01-04 19:26:42 最新章节:参考文献
书籍简介
短文本理解是伴随着搜索引擎、社交网络及聊天机器人等应用场景而兴起的一个研究课题。它是近些年的一个研究热点,且对未来人工智能的发展有重要的影响。由于短文本字词少、歧义大、不遵守语法规则等特点,传统自然语言处理技术如句法分析器等难以直接应用于短文本。因此,研究人员不得不另辟蹊径来解决机器理解短文本的问题。
品牌:机械工业出版社
上架时间:2017-02-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
王仲远
最新上架
- 会员《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字
- 会员本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字
- 会员高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证计算机11.7万字
- 会员本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例计算机10.4万字
- 会员本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训计算机6.9万字
- 会员MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8计算机9.7万字
- 会员时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。计算机7.6万字
- 会员这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影计算机12.7万字
同类书籍最近更新
- 会员本书以项目实践作为主线,结合必需的理论知识,以任务的形式进行内容设计,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。本书主要内容涉及Spark基本原理、基于IDEA搭建Spark开发环境、RDD基本原理、SparkSQL基本操作流程、电商业务系统的基本流程、电商用户行为分析的基本指标以及分析过程、通过不同的维度对销售数据进行分析数据库5.2万字
- 会员《LabVIEW完全自学手册》帮助读者从实用角度学习LabVIEW,内容分为三篇。入门篇包括LabVIEW基本操作、基本数据类型及其相互转换、程序结构、数据运算函数、控件及其用法、数据表达与显示等;提高篇包括文件的输入输出、字符串操作、数学分析、信号处理、与其他软件的通信、时间相关函数、应用程序控制、网络编程、总线与仪器控制、数据库访问及程序发布;应用篇以两个实例详细介绍如何运用LabVIEW解决数据库12.5万字
- 会员OpenCVisoneofthebestopensourcelibrariesavailableandcanhelpyoufocusonconstructingcompleteprojectsonimageprocessing,motiondetection,andimagesegmentation.ThisLearningPathisy数据库11.3万字
- 会员这是一本金融数据挖掘与分析领域的实战性著作,它能指导零Python编程基础和零数据挖掘与分析基础的读者快速掌握金融数据挖掘与分析的工具、技术和方法。读完本书,你将会有如下3个方面的收获。(1)Python编程基础和数据预处理:首先详细讲解了Python的核心语法,以及NumPy、Matplotlib、PySpark、JupyterNotebook等Python数据处理工具的使用;然后详细介绍了数据数据库18.3万字
- 会员本书主要介绍分布式数据库系统和大数据库系统的基本理论与实现技术。全书共13章,第1~10章重点介绍经典的分布式数据库系统的基本理论和关键技术、当前流行的商品化数据库系统的分布式数据管理机制,以及大数据库管理的关键技术和流行的大数据库系统。第11~13章介绍当下流行的区块链分布式数据管理技术、AI赋能的数据管理技术以及分布式数据库的发展前瞻。本书理论与实践相结合,可作为计算机及相关专业高年级本科生和数据库43.6万字