简介
大数据分析涉及数据存储、数据处理、统计分析、数据可视化等技术问题。本书通过Hadoop和阿里云的MaxCompute架构介绍了大数据的数据存储、数据处理的原理。因为Hadoop等大数据存储和处理平台大多基于Linux操作系统,所以本书也介绍了Linux操作系统的基本使用方法。另外,本书还介绍了关系型数据库的重要原理、SQL语言及数据仓库的概念。统计学是数据分析的基础理论,本书概括了常用的统计学理论。数据可视化也是数据分析的重要工具,本书介绍了常用的图表、可视化的原则及可视化的工具。
版权
出版社电子工业出版社
出版时间2021年10月