机器学习的定义(Tom Mithchell):
给程序一个任务T和一个性能测量方法p,如果在经验E的影响下,P对T的测量结果得到了改进,那么就说程序从E中得到了改进.

对于常规程序而言,设计者实现设计程序的执行流程以及预期.机器学习不然,机器学习算法使用计算的方法从数据中获取信息,并不依赖于提前设计好的流程模型,用户只需要告诉算法什么是一个好的结果,剩下的交给计算机实现.

机器学习技术

  • 监督学习 使用带有标签的数据集,让数据充当老师训练计算机,从而提高计算机做出决策的能力.
  • 非监督学习 使用不带有任何签或者结构的数据集,通过将数据归入群集中寻找模式和关系.
  • 强化学习 通过一个代理(代表某人或者某事执行操作的计算机程序)替代人工的操作员,根据循环反馈帮助确定结果.

常见方向

  • 降维 试图压缩维度,并且尽可能保留分布消息
  • 聚类 在没有训练的条件下,对一些没有标签的数据进行归纳分类,根据相似性对数据进行分组,以便对数据进行概括.
  • 回归 监督学习的一种,需要实现向计算机中输入数据的训练样本让计算机学习.