机器学习算法分类
有监督学习
- 定义: 输入数据由输入特征值和目标值(标签)所组成,训练数据都是有标签的
- 特点: 训练数据有标签,模型根据人工标注的标签进行学习。
- 举例:分类任务,回归任务
分类任务
二分类
- 定义: 二分类任务指的是有两个类别的分类问题,即判断是或否,属于这两个类别中的一个。
- 举例:是否为猫,是否为狗
多分类
- 定义:多分类任务指的是有多个(超过两个)类别的分类问题。
- 示例: 如标签中包含猫、狗、鸽子等多个类别时,即为多分类任务
回归任务
无监督学习
- 定义: 输入数据没有被标记,样本数据类别未知,没有标签。
- 特点: 根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系。
- 举例:K-means算法,聚类算法
聚类算法
- 定义:根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系
- 举例:推荐系统,通过聚类新用户与老用户的相似性来推荐内容。
[!note] 有监督分类问题与回归问题
分类任务: 标签值是离散的,可以枚举出所有类别。
回归任务: 标签值是连续的,无法枚举
半监督学习
- 定义: 训练数据中部分有标签,部分无标签。
- 特点: 结合有监督学习和无监督学习的特点,利用有标签数据进行初步训练,再利用无标签数据进一步提升模型性能。
- 举例:医疗影像识别: 如新冠CT识别,利用少量医生标注的数据训练模型,预测未标注数据。
强化学习
- 定义:通过奖励或惩罚来训练模型
- 基本原理:
- 四要素:agent(算法),环境状态,行动,奖励
- 目标:agent根据环境状态进行行动,获得最多的累计奖励。
- 举例:ChatGPT(通过强化学习实现多轮对话和错误修正),机器人与无人驾驶(通过强化学习完成复杂任务)
1
2
3
4graph LR
Agent ==Action==> Environment
Environment ==Reward==> Agent
Environment ==State==> Agent
总结
1 | graph LR |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 LinHao's Pages!


