机器学习笔记--机器学习概述
学习https://zh.d2l.ai/的笔记
机器学习的关键组件
数据
数据集由大量样本组成
样本由特征向量和标签组成
特征向量的长度称为数据的维数
每一个样本独立同分布
数据的准确性很重要,垃圾数据导致垃圾的输出
数据的量也很关键,大量的数据训练出更加强大的模型。
模型/机器学习算法
模型用于数据的转换,模型即解决问题的方法,可以是简单的机器学习算法,也可以是复杂的深度学习模型
目标函数(损失函数)
用于度量模型效果的函数,常见的方法是平方误差,由于求的是误差,所以越小越好,所以也称为损失函数
优化算法
用于优化目标函数结果的算法,常见的方法有梯度下降法。
机器学习解决哪些问题
监督学习问题
线性回归
解决预测数值类问题
分类
解决预测类别问题
标记
解决打标签问题
搜索
解决相关性问题(排序问题),例如pagerank算法
推荐系统
解决预测用户喜好问题
序列学习
解决输入是连续的问题,输入和输出都是可变长度的序列。主要是文本、音视频。
无监督学习问题
聚类
主成分分析
因果关系和概率图模型问题
生成对抗性网络
生成对抗性网络是一种人工智能技术,就像两个人在玩捉迷藏,一个人努力生成新的东西,另一个人则努力识别出真假。他们互相竞争,最终都能变得更好。
与环境互动问题(离线还是在线)
无论是监督学习还是无监督学习,都是离线的,或者说是独立于环境的。训练的数据都是预先获取的,启动模型后,就不再与环境进行交互。
我们需要人工智能解决的不止是独立的预测问题,而是更进一步在预测被使用也就是说与环境交互后,能够进行反馈并影响未来的预测。这个问题将打开一系列的更多的问题。
强化学习
定义
强化学习就是一种与环境存在交互的人工智能算法。这时模型更合理的被称为Agent,其预测被称为决策。
原理过程
在强化学习问题中,智能体(agent)在一系列的时间步骤上与环境交互。 在每个特定时间点,智能体从环境接收一些观察(observation),并且必须选择一个动作(action),然后通过某种机制(有时称为执行器)将其传输回环境,最后智能体从环境中获得奖励(reward)。 此后新一轮循环开始,智能体接收后续观察,并选择后续操作,依此类推。
深度学习(多级表示学习)
起源
发展
成功案例
特点