统计模型,监督学习和函数逼近¶
1 联合分布 的统计模型¶
-
可加误差模型
-
公式
-
其中随机误差 满足 且与 独立
-
大多数系统输入输出对 没有一个确定的关系 。一般地,存在不可测量的变量对 起作用,包括测量误差.可加误差模型假设我们可以通过误差 从确定关系中捕捉所有的偏移量。
-
一般地,条件分布可以以某种复杂的方式依赖 ,但是可加误差模型排除了这些情形。(TODO 不懂)
2 监督学习¶
- 学习算法能够根据原始输出和产生的输出之间的差异 来修改输入和输出的关系
3 函数逼近¶
-
线性基展开
-
非线性展开
-
对于线性模型我们得到该最小化问题的一个简单的 闭型 (closed) 解.如果基本函数本身没有任何隐藏的参数,这种方法也适用.否则这种解决方法不是需要迭代的方法就是需要数值优化.
closed-form 是指可以进行有限次赋值的表达式,其中可能包含常数、变量、常见的运算符(加减乘除)或函数(指数、对数、三角函数),但是通常不存在极限运算。依此理解,粗略地说,有显式解的应当为 closed form solution.
-
极大似然估计
-
假设我们有一个指标为 的密度为 的随机样本 。观测样本的概率对数值为,极大似然的原则是假设最合理的 值会使得观测样本的概率最大。
-
可加误差模型: 的最小二乘,等价于使用下面条件概率的极大似然
-
公式
-
证明
-
-
分类模型:给定 知道每一类的条件概率为 。则极大似然等于使得交叉熵最大
- 证明