cover

机器学习实战

Peter Harrington / 人民邮电出版社 / 2013

本教程通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效可复用的Python 代码阐释如何处理统计数据,进行数据分析及可视化。学习者可从中学到一些核心的机器学习算法, 并将其运用于某些策略性任务中,如分类、预测及推荐等。 本教程适合机器学习相关研究人员及互联网从业人员学习参考。

¥39.99 / 3个月在线服务,赠送PDF电子书
  • 正版授权内容
  • 在线练习环境
  • 答疑服务支持
  • 离线PDF下载
  • 1

    机器学习基础

    了解机器学习的概念与主要任务,理解机器学习的作用,理解Python语言用于机器学习的优势。

  • 2

    k-近邻算法

    理解k-近邻分类算法原理,掌握从文本文件中解析和导入数据的方法, 掌握使用Matplotlib创建扩散图,理解归一化数值的目的并掌握其实现方法。

  • 3

    决策树算法

    理解决策树算法原理,掌握在数据集中度量一致性的方法, 掌握使用递归构造决策树的实现手段,掌握使用Matplotlib绘制树形图的方法。

  • 4

    基于概率论的分类方法:朴素贝叶斯

    理解使用概率分布进行分类的基本原理,学习并掌握朴素贝叶斯分类器的实现, 掌握解析RSS源数据的方法,掌握使用朴素贝叶斯来实现对不同地区态度的分类。

  • 5

    Logistic回归

    理解igmoid函数和Logistic回归分类器的基本原理,理解最优化理论, 理解梯度下降最优化算法的原理并掌握其实现方法,学会处理数据中的缺失项。

  • 6

    支持向量机

    理解支持向量机的算法原理,理解并掌握如何利用SMO进行优化, 掌握利用核函数对数据进行空间转换的方法,了解SVM与其他分类器的差异。

  • 7

    利用AdaBoost元算法提高分类性能

    理解组合相似的分类器来提高分类性能的基本思路,理解AdaBoost算法原理, 掌握如何处理非均衡分类问题的技巧。

  • 8

    预测数值型数据:回归

    理解线性回归、局部加权线性回归、岭回归和逐步线性回归的基本原理; 理解利用回归算法预测鲍鱼年龄和玩具售价的思路并掌握其实现方法。

  • 9

    树回归

    理解CART算法、回归与模型树算法、树剪枝算法的原理; 了解并掌握Python中GUI的使用方法。

  • 10

    利用K-均值聚类算法对未标注数据分组

    理解K-均值聚类算法的基本原理,掌握对聚类得到的簇进行后处理的方法; 理解二分K-均值聚类算法原理,并掌握利用该算法对地理位置进行聚类的实现方法。

  • 11

    使用Apriori算法进行关联分析

    理解Apriori算法的基本原理,掌握频繁项集生成的实现手段, 理解并掌握关联规则生成的方法,运用关联规则发现解决国会投票实例。

  • 12

    使用FP-growth算法来高效发现频繁项集

    了解发现事务数据中的公共模式的作用和意义,理解FP-growth算法的基本原理并掌握其实现方法, 运用FP-growth算法发现Twitter源中的共现词。

  • 13

    利用PCA来简化数据

    了解降维技术的目的,理解主成分分析算法的原理,掌握如何运用PCA算法对半导体数据进行降维处理。

  • 14

    利用SVD简化数据

    理解SVD矩阵分解的应用场景和目的,理解SVD矩阵分解的基本原理并掌握其实现方法; 了解SVD矩阵分解在推荐引擎中的应用,并运用该算法实现简单的推荐引擎。

  • 15

    大数据与MapReduce

    理解MapReduce的基本概念,了解并掌握Python中Hadoop流的使用; 了解并掌握使用mrjob库将MapReduce自动化,掌握如何利用Pegasos算法并行训练支持向量机。