有监督学习

  • 定义: 输入数据由输入特征值和目标值(标签)所组成,训练数据都是有标签的
  • 特点: 训练数据有标签,模型根据人工标注的标签进行学习。
  • 举例:分类任务,回归任务

分类任务

二分类

  • 定义: 二分类任务指的是有两个类别的分类问题,即判断是或否,属于这两个类别中的一个。
  • 举例:是否为猫,是否为狗

多分类

  • 定义:多分类任务指的是有多个(超过两个)类别的分类问题。
  • 示例: 如标签中包含猫、狗、鸽子等多个类别时,即为多分类任务

回归任务

无监督学习

  • 定义: 输入数据没有被标记,样本数据类别未知,没有标签。
  • 特点: 根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系。
  • 举例:K-means算法,聚类算法

聚类算法

  • 定义:根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系
  • 举例:推荐系统,通过聚类新用户与老用户的相似性来推荐内容。

    [!note] 有监督分类问题与回归问题
    分类任务: 标签值是离散的,可以枚举出所有类别。
    回归任务: 标签值是连续的,无法枚举

半监督学习

  • 定义: 训练数据中部分有标签,部分无标签
  • 特点: 结合有监督学习和无监督学习的特点,利用有标签数据进行初步训练,再利用无标签数据进一步提升模型性能。
  • 举例:医疗影像识别: 如新冠CT识别,利用少量医生标注的数据训练模型,预测未标注数据。

强化学习

  • 定义:通过奖励或惩罚来训练模型
  • 基本原理
    • 四要素:agent(算法),环境状态,行动,奖励
    • 目标:agent根据环境状态进行行动,获得最多的累计奖励。
  • 举例:ChatGPT(通过强化学习实现多轮对话和错误修正),机器人与无人驾驶(通过强化学习完成复杂任务)
    1
    2
    3
    4
    graph LR
    Agent ==Action==> Environment
    Environment ==Reward==> Agent
    Environment ==State==> Agent

总结

1
2
3
4
5
6
7
8
9
10
11
12
13
14
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px

A([机器学习算法]):::startend --> B{训练数据有无标签}:::process
B -->|有标签| C(有监督学习):::process
B -->|无标签| D(无监督学习):::process
B -->|部分有标签| E(半监督学习):::process
B -->|与环境交互| F(强化学习):::process
C --> G{标签值是否连续}:::process
G -->|是| H(回归任务):::process
G -->|否| I(分类任务):::process
D --> |无目标值| J(聚类):::process
F --> K(决策+回归函数):::process