cover

数据科学入门

Joel Grus / 人民邮电出版社 / 2016

我们从零开始着手数据科学工作。这意味着为了获得更好的理解,我们需要自己亲手构 建工具和实现算法。我花费了很多心思选择注释良好、简洁易读的实现范例。在大部分 情形下,所建立的工具意义清晰但实用性有限,它们对规模较小的示例数据集运转良好, 但对“网络级别”的数据集就束手无策了。

¥34.99 / 3个月在线服务,赠送PDF电子书
  • 正版授权内容
  • 在线练习环境
  • 答疑服务支持
  • 离线PDF下载
  • 1

    导论

    理解什么是数据科学,了解现实中的应用场景。

  • 2

    Python速成

    掌握Python的基础语法,以及数据处理中常用的生成器、迭代器、正则表达式等概念和使用方法

  • 3

    可视化数据

    掌握使用matplotlib进行数据可视化的方法,理解条形图、散点图、线图等不同种类数据图的应用场景。

  • 4

    线性代数基础

    理解向量和矩阵的概念,掌握使用python进行矩阵运算的方法

  • 5

    统计学基础

    理解统计学中的中心倾向、离散度、相关、因果等核心概念,掌握使用python计算统计值的方法

  • 6

    概率论基础

    理解概率中的独立性、随机变量、概率分布、贝叶斯原理等核心概念,掌握使用python进行概率计算的方法。

  • 7

    假设与推断

    理解置信区间、贝叶斯推断等核心概念,掌握使用python进行推理计算的方法。

  • 8

    梯度下降算法

    理解梯度下降算法的目的和思路,掌握使用python如何实现梯度下降。

  • 9

    获取数据

    理解数据的重要性,了解数据获取的途径,掌握通过文件读取、网络爬虫、云端API调用等方式获取数据的实现方法。

  • 10

    数据处理

    理解数据处理的一般环节划分,掌握进行数据清理、修复、降维等工作的方法。

  • 11

    机器学习

    理解建模、拟合、特征等机器学习中的核心概念。

  • 12

    K近邻算法

    理解K近邻算法的目的、思路和应用场景,掌握其python实现方法。

  • 13

    朴素贝叶斯算法

    通过垃圾邮件过滤软件的实现,理解朴素贝叶斯算法的思路和应用场景,掌握其python实现方法。

  • 14

    回归算法

    理解线性回归、逻辑回归算法的目的和思路,掌握其python实现方法。

  • 15

    决策树算法

    理解决策树算法的目的、思路和应用场景,理解熵的概念,掌握决策树的python实现方法。

  • 16

    神经网络

    理解感知器和前馈神经网络的基本概念和思路,掌握反向传播学习算法的python实现方法。

  • 17

    聚类分析

    理解聚类分析的目的、原理和应用场景,通过实例掌握其实现方法。

  • 18

    自然语言处理

    理解自然语言处理中的统计模型方法,掌握n-grams算法和主题模型的实现方法。

  • 19

    网络分析

    理解网络分析的定义及核心概念,掌握有向图等算法的实现方法。

  • 20

    推荐系统

    理解推荐系统产生的目的、分类及应用场景,掌握基于事物的推荐算法实现,以及基于用户的推荐算法实现。

  • 21

    数据库与SQL

    了解SQL与NOSQL,掌握常用SQL语句的用法。

  • 22

    MapReduce

    了解MapReduce的基本概念,掌握使用hadoop进行MapReduce计算的方法。