计算机
1

SQL必知必会(第5版)
63人今日阅读 推荐值 80.2%
SQL是使用最为广泛的数据库语言,几乎所有重要的DBMS都支持SQL。本书是麻省理工学院、伊利诺伊大学等众多大学的参考教材,由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。与其他同类图书不同,本书没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从SQLSELECT开始,讲述实际工作环境中最常用和最必需的SQL知识,实用性极强。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
2

利用Python进行数据分析(原书第2版)
29人今日阅读
推荐值 83.9%
阅读本书可以获得关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第2版针对Python 3.6进行了更新,并增加了实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到最新版本的pandas、NumPy、IPython和Jupyter。
3

利用Python进行数据分析:原书第3版
26人今日阅读 推荐值 75.5%
本书是Python数据分析经典畅销书的升级版,由Python pandas项目的创始人Wes McKinney撰写。本书自2012年第1版出版以来,迅速成为该领域的权威指南,并且为了保持与时俱进,作者对本书内容进行持续更新,以摒弃一些过时、不兼容的工具,添加新的内容来介绍新特性、新工具及方法。第3版针对Python 3.10和pandas 1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。
4

深入浅出数据分析
21人今日阅读 推荐值 71.6%
《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
5

精益数据分析
21人今日阅读
推荐值 76.1%
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了30多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。
6

湖仓架构:大规模数据平台的设计和实现
19人今日阅读 推荐值 75.8%
本书全面阐述了湖仓架构相关知识。首先介绍数据架构及其在构建数据平台中的作用,剖析湖仓架构的概念、特征和优势。接着对比传统架构(数据湖与数据仓库)和现代数据平台,明确湖仓架构在未来数据平台的重要地位。然后讲解行存储与列存储等概念,以及云对象存储、文件格式和表格式等组件,还给出设计存储时的考量因素。接着阐述数据目录、计算引擎在湖仓架构中的功能、类型选择和设计要点。在数据治理与安全方面,强调在湖仓架构中的统一治理和安全流程。之后提供了湖仓平台从前期准备到具体设计和实施的详细指南。最后探讨湖仓架构的未来发展趋势,如数据网格、混合事务与分析处理等。通过学习本书,读者可系统掌握湖仓架构知识,为相关实践提供有力支持。
7

数据结构与算法图解
12人今日阅读
推荐值 84.2%
本书是数据结构与算法的入门指南,不局限于某种特定语言,略过复杂的数学公式,用通俗易懂的方式针对编程初学者介绍数据结构与算法的基本概念,培养读者编程逻辑。主要内容包括:为什么要了解数据结构与算法,大O表示法及其代码优化利用,栈、队列等的合理使用,等等。
8

数据治理项目实施指南:方法、技巧与实践
12人今日阅读 推荐值 75.8%
内容简介 这是一本讲解如何成功实施数据治理项目的实战指南,能够帮助组织更清晰地认识到数据治理的本质,启发它们结合自身业务,找到适合自己的、务实的、有价值的数据治理策略。本书源自数据治理头部厂商亿信华辰在数据治理领域10余年经验的总结,提供了大量可立即上手的实用方法与技巧,旨在帮助读者切实解决数据治理项目实施过程中遇到的各种实际问题。书中案例丰富翔实,通过多个不同行业的真实项目实践案例,生动展示了数据治理在不同业务领域的应用成果和成功落地经验,为读者提供了极具价值的参考和借鉴。 本书分为四篇,全面覆盖了数据治理项目的各个方面。 建设篇(第1~3章):阐述了数据治理的价值与意义,并详细介绍了数据治理项目的准备工作以及建设流程,为组织提供了数据治理项目实施的全面框架和方法论。 场景篇(第4~9章):深入探讨了主数据治理、数据质量管理、数据标准管理、数据共享交换、数据资产管理以及数据应用等典型应用场景,并分析了这些场景中要解决的问题和实践方法。 案例篇(第10~16章):通过多个行业的数据治理项目实践案例,展示了数据治理在不同领域的应用成果和落地经验。这些案例涵盖了金融、汽车、新能源、教育、政务、ICT以及环保等不同业务场景中面对的问题、对应解决方案以及项目建设过程和复盘,为读者提供了丰富的参考和借鉴。 总结篇(第17章~19章):总结了数据治理项目实施的常见问题与解决方案,以及成功实施数据治理项目的几大技巧。同时,展望数据治理的发展趋势,为组织未来的数据治理实践提供了指导。
9

PostgreSQL修炼之道:从小工到专家(第2版)
10人今日阅读 推荐值 88.5%
本书分为四大部分,分别为准备篇、基础篇、提高篇和配套开源软件及架构篇。准备篇为没有数据库基础的读者准备的,如果读者已经具备了一定的数据库基础,可以跳过其中的一些内容。基础篇介绍了PostgreSQL数据库中的一些基础内容,读者学习完此篇可以完成基本的PostgreSQL数据库的日常操作工作。提高篇讲解了一些更深的内容,如PostgreSQL的一些技术内幕、特色功能、优化等方面的内容,读者仔细阅读此篇以便早日成为PostgreSQL数据库高手。第三方开源软件及架构篇讲解了与PostgreSQL数据库配套使用的一些常用的开源软件及架构设计方面的内容,通过阅读此篇,可以提高读者的眼界和数据库架构设计能力。
10

Flink SQL与DataStream:入门、进阶与实战
10人今日阅读 推荐值 88.0%
内容简介 这是一本从使用和定制开发双重视角,循序渐进地讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现的著作。 它面向Flink的初学者,内容沿着基础知识、实际问题和解决方案这条主线展开,不仅层层剖析了Flink学习中的重点和难点,而且还通过大量案例展示了如何快速获得工程化实践能力。 全书共11章,主要内容如下: (1)Flink基础知识(第1、2章) 主要介绍了Flink的定位、核心特性、API分类,演示了如何搭建Flink作业的基础环境、如何创建一个Flink项目以及如何开发入门应用程序WordCount,并结合该应用程序说明了常见Flink作业的骨架结构。 (2)Flink分布式架构及核心概念(第3章) 主要内容包括Flink作业的运行时架构、部署模式、资源提供框架,以及开发 Flink作业时涉及的核心概念,对于后续学习Flink DataStream API和Flink SQL API很有帮助。 (3)Flink DataStream API(第4~6章) 讲解了Flink DataStream API的核心知识,包括执行环境、数据源、数据简单转换、数据分组与聚合、数据汇等,并讲解了Flink DataStream API中的时间语义、时间窗口、有状态计算和检查点这四大“王*牌武器”的由来与实现原理。 (4)Flink有状态流处理API(第7章) Flink DataStream API不能优雅地解决窗口使用不灵活和分流成本高这两个问题,于是Flink提供了有状态流处理API。本章主要讲解了Flink有状态流处理API解决上述两个问题的方法。 (5)Flink Table API与SQL API(第8~11章) Flink Table API和Flink SQL API的底层原理相同,可以相互转换,但Flink SQL API更为简单和常用。这4章分别介绍了Flink Table API、Flink SQL API 的功能,以及使用SQL实现流处理的核心技术,结合大量代码示例着重介绍了Flink SQL API的语法、函数、参数配置及性能优化方法。
11

高性能MySQL(第4版)
10人今日阅读 推荐值 72.9%
《高性能 MySQL》一直是 MySQL 领域的经典之作,影响了一代又一代的 DBA 和技术人员,从第3 版出版到第 4 版出版过去了近十年,MySQL 也从 5.5 版本更新到了 8.0 版本。第 4 版中增加了大量对 MySQL 5.7 和 8.0 版本新特性的介绍,删除了一些在新版本中已经废弃或者不再常用的功能,还增加了对云数据库的介绍,减少了在官方文档中已有的基础使用和配置相关的内容。这些年,MySQL 经过在大量大规模互联网场景中的应用验证,使得本书在继续关注高性能之外,还用了较多的篇幅来介绍如何实现 MySQL 的大规模可扩展应用和合规性问题,这是相比第 3 版最大的不同,也是本书封面上所写的“经过大规模运维验证的策略”的体现。本书适合数据库管理员(DBA)阅读,也适合系统运维和开发人员参考学习。不管你是数据库新手还是专家,相信都能从本书中有所收获。
12

Python金融大数据分析(第2版)
10人今日阅读 推荐值 75.7%
《Python金融大数据分析 第2版》分为5部分,共21章。第1部分介绍了Python在金融学中的应用,其内容涵盖了Python用于金融行业的原因、Python的基础架构和工具,以及Python在计量金融学中的一些具体入门实例;第2部分介绍了Python的基础知识以及Python中非常有名的库NumPy和pandas工具集,还介绍了面向对象编程;第3部分介绍金融数据科学的相关基本技术和方法,包括数据可视化、输入/输出操作和数学中与金融相关的知识等;第4部分介绍Python在算法交易上的应用,重点介绍常见算法,包括机器学习、深度神经网络等人工智能相关算法;第5部分讲解基于蒙特卡洛模拟开发期权及衍生品定价的应用,其内容涵盖了估值框架的介绍、金融模型的模拟、衍生品的估值、投资组合的估值等知识。 《Python金融大数据分析 第2版》本书适合对使用Python进行大数据分析、处理感兴趣的金融行业开发人员阅读。
13

数据建模与数据分析:基于Power Query与Power Pivot
8人今日阅读 推荐值 75.8%
本书共15章,分四部分。第一部分是“数据准备与清洗”(第1~4章),首先介绍自助式数据分析的六大应用场景(第1章),然后详解Power Query在数据清洗、表格结构管理以及数据转换方面的全流程操作(第2~4章),为后续分析奠定规范的数据基础。第二部分是“数据整合与高级查询”(第5~7章),深入探讨数据管理(第5章)、数据查询(第6章)以及多表合并技术(第7章),涵盖同一工作簿内、跨文件、跨文件夹的自动化模板设计,并通过M函数实现动态路径管理,以应对数据源变更带来的复杂性。第三部分是“数据建模与DAX实战”(第8~14章),首先分析Power Pivot在数据加载(第8章)、数据建模(第9章)以及数据模型的管理与优化(第10章)方面的应用,然后系统讲解DAX函数体系(第11~13章),并进阶至VAR变量、通用日期表构建等数据模型的改进与完善技术(第14章),从而打造高效的数据建模、计算与分析引擎。第四部分是“综合案例:看板搭建”(第15章)。通过企业级销售分析的全景案例串联多表合并、动态度量值、交互图表与KPI看板设计,完整呈现从原始数据到决策支持的落地闭环。
14

数据产品经理的自我修养
8人今日阅读 推荐值 91.5%
本书作者结合自己近10年的数据岗位从业经验,运用丰富的案例,阐述自己对数据产品和数据产品经理简明而独到的认知思考,旨在帮助大家全面、深入地理解该岗位和所需人才的能力素质。全书正文共14章,另有附录。其中正文可分为三大部分,第一部分(第1~3 章)会通过案例对数据产品做出完备清晰的定义,并给出数据产品经理所需的能力维度;第二部分(第4~11 章)会通过8个翔实的案例,分享作者对不同场景、功能的数据产品,从规划设计到落地运营中的观察与思考,并期望读者通过案例体会、培养数据产品经理的多种能力;第三部分(第 12~14 章)会讨论数据产品经理的岗位选择,在当前环境下工作的现状,以及这个岗位的未来发展趋势。最后附录部分会对照数据产品经理所需的能力维度,提供延展阅读的书单;同时也会讲述作者自己的数据从业经历,为读者的职业发展选择提供参考。
15

数据库系统内幕
8人今日阅读 推荐值 80.9%
这本书既不是关于关系型数据库的书,也不是关于NoSQL的书,而是关于在各种数据库系统中使用的算法和概念的书,重点是存储引擎和负责数据分布的组件。第一部分讨论节点本地的进程,并着重于存储引擎这个数据库系统的核心组件以及最重要的一个特有元素。第二部分讨论负责数据分布的子系统和组件,介绍如何将多个节点组织到一个数据库集群中。
16

Spark快速大数据分析(第2版)
7人今日阅读 推荐值 72.9%
本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。
17

对比Excel,轻松学习Python数据分析(入职数据分析师系列)
7人今日阅读
推荐值 75.4%
Python虽然是一门编程语言,但是在数据分析领域实现的功能和Excel的基本功能一样,而Excel又是大家比较熟悉、容易上手的软件,可以通过Excel数据分析去对比学习Python数据分析。本书将数据分析过程中涉及的每一个操作都对照讲解,让你从熟悉的Excel操作中去学习对应的Python实现,而不是直接学习Python代码,大大降低了学习门槛,消除了大家对代码的恐惧心理。这也是本书的一大特色,让读者可以像学Excel数据分析一样,轻松学习Python数据分析。
18

一本书讲透数据治理:战略、方法、工具与实践
7人今日阅读 推荐值 75.2%
这是一本能为数字化转型企业的数据治理提供全面指导的著作。拥有集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为“3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具”: 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。 数据治理之法:8项关键举措 重点讲解了数据治理的8项举措:理现状与定目标、能力成熟度评估、路线图规划、保障体系建设、技术体系建设、策略执行与监控、绩效考核、长效运营。这8项举措构成了企业数据治理的完整实施方法论。 数据治理之术:7种技术能力 重点讲解了数据治理的7种能力:数据梳理与建模、元数据管理、数据标准管理、主数据管理、数据质量管理、数据安全治理、数据集成与共享。 数据治理之器:7个治理工具 从功能角度讲解了数据治理所用到的7个工具:数据模型管理工具、元数据管理工具、数据标准管理工具、主数据管理工具、数据质量管理工具、数据安全治理工具、数据集成与共享工具。 除此之外,本书还包括两个综合的数据治理案例,以及数据治理的6项准备工作和6个误区。
19

Flink原理与实践
6人今日阅读 推荐值 87.8%
本书围绕大数据流处理领域,介绍Flink DataStream API、时间和窗口、状态和检查点、Table API和SQL等知识。本书以实践为导向,使用大量真实业务场景案例来演示如何基于Flink进行流处理。本书主要面向对大数据领域感兴趣的本科生、研究生,想转行到大数据开发行业的在职人员,或有一定大数据开发经验的相关从业人员。读者最好有一定的Java或Scala编程基础,掌握计算机领域的常见技术概念。
20

数据库原理与应用(MySQL版)
6人今日阅读
本书从数据库基础理论、数据库实践、数据库设计、国产数据库等方面全面阐述了数据库技术的应用体系。全书理论阐述求精求易,理论与实践环环相扣,重点介绍国产数据库。 本书选用MySQL作为实践平台,附录中的上机实验可作为数据库课程的实验内容,便于读者学以致用。本书可作为普通高等院校计算机科学与技术及相关专业本科生数据库课程的教材,也可作为数据库初学者的入门读物。