ch2-01:情感分析与有监督学习

情感分析与有监督学习

情感分析

  • 情感分析:正面、负面
  • 更细粒度:兴奋、悲伤等

有监督学习

机器学习方法:有监督学习、无监督学习、增强学习
更一般的,对于有监督学习,需要提供一个用来学习的样本,机器学习输入数据(样本数据,对于分类来说,预先定义的有限集合,含有特征和标签),构建出模型。

机器根据样本,在模型的基础上,给出标签(Label、因变量)。对于现行问题,也就是找出y=f(x)=ax+b中的f。
对应于自变量->因变量
样本->标签

  • 线性问题:标签(也就是因变量)是实数,无限取值
  • 分类问题:标签是有限的集合(标签是集合的情况下,集合要预先定义)

更深入理解可以查看维基百科:监督式学习
监督式学习(英语:Supervised learning),是一个机器学习中的方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

科学研究与有监督学习

类比科学研究:

  • 从数据、经验 -> 模型
  • 机器从数据中找出一个模型

有监督学习:
从训练数据 -> 限定集合里的最优模型,也就是从训练数据里面找到的最优模型,前提是在一个限定的集合里面得到的。

  • 找y=f(x)的最优f(限定集合)
  • 对f的限定集合不同,找到的最优模型也不同(模型,都是限定了标签的集合)