有监督学习

定义: 输入数据由输入特征值和目标值（标签）所组成，训练数据都是有标签的
特点: 训练数据有标签，模型根据人工标注的标签进行学习。
举例：分类任务，回归任务

分类任务

二分类

定义: 二分类任务指的是有两个类别的分类问题，即判断是或否，属于这两个类别中的一个。
举例：是否为猫，是否为狗

多分类

定义：多分类任务指的是有多个（超过两个）类别的分类问题。
示例: 如标签中包含猫、狗、鸽子等多个类别时，即为多分类任务

回归任务

无监督学习

定义: 输入数据没有被标记，样本数据类别未知，没有标签。
特点: 根据样本间的相似性对样本集进行聚类，发现事物内部结构及相互关系。
举例：K-means算法，聚类算法

聚类算法

定义：根据样本间的相似性对样本集进行聚类，发现事物内部结构及相互关系
举例：推荐系统，通过聚类新用户与老用户的相似性来推荐内容。

[!note] 有监督分类问题与回归问题
分类任务: 标签值是离散的，可以枚举出所有类别。
回归任务: 标签值是连续的，无法枚举

半监督学习

定义: 训练数据中部分有标签，部分无标签。
特点: 结合有监督学习和无监督学习的特点，利用有标签数据进行初步训练，再利用无标签数据进一步提升模型性能。
举例：医疗影像识别: 如新冠CT识别，利用少量医生标注的数据训练模型，预测未标注数据。

强化学习

定义：通过奖励或惩罚来训练模型
基本原理：
- 四要素：agent(算法)，环境状态，行动，奖励
- 目标：agent根据环境状态进行行动，获得最多的累计奖励。
举例：ChatGPT(通过强化学习实现多轮对话和错误修正)，机器人与无人驾驶(通过强化学习完成复杂任务)
1
2
3
4
graph LR
Agent ==Action==> Environment
Environment ==Reward==> Agent
Environment ==State==> Agent

总结

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
    
    A([机器学习算法]):::startend --> B{训练数据有无标签}:::process
    B -->|有标签| C(有监督学习):::process
    B -->|无标签| D(无监督学习):::process
    B -->|部分有标签| E(半监督学习):::process
    B -->|与环境交互| F(强化学习):::process
    C --> G{标签值是否连续}:::process
    G -->|是| H(回归任务):::process
    G -->|否| I(分类任务):::process
	D --> |无目标值| J(聚类):::process
	F --> K(决策+回归函数):::process

机器学习算法分类

有监督学习

分类任务

二分类

多分类

回归任务

无监督学习

聚类算法

半监督学习

强化学习

总结