BP神经网络

更新于 2022-10-19 分类于 Machine Learning 阅读次数：本文字数： 992 阅读时长 ≈ 2 分钟

对BP的一点记录

感知机Perceptron

由两层神经元组成，输入层接收信号传递给输出层，输出层是M-P神经元，称为阈值逻辑单元。实际上就是阶跃函数或者是Sigmoid函数。

是解决非线性可分问题的一种方法，称为多层前馈神经网络.

前馈：并不意味着网络中的信号不能后传，而是值网络拓扑结构上不存在环或回路

给定一个训练集，输入有d维，输出有l维，对于训练样例$(x_k,y_k)$，其神经网络的输出为$\hat{y}_k=(\hat{y}^k_1...\hat{y}^k_l)$，则

\[ \hat{y}^{k}_{j}=f(\beta_j-\theta_j) \]

则网络在$(x_k,y_k)$上的均方误差为

\[ \frac{1}{2} \sum_{j=1}^{l}\left(\hat{y}_{j}^{k}-y_{j}^{k}\right)^{2} \]

BP是一个基于梯度下降的迭代算法，接下来以$w_{hj}$为权重进行推导：

\[ E=\lambda \frac{1}{m}\sum E_k+(1-\lambda)\sum w^2_i \]

这样使得训练过程中偏好较小的连接权和阈值。

如何跳出局部最小，到达全局最小？

单隐层前馈神经网络，先使用径向基函数作为激活函数将输入变成线性可分的，然后通过线性的输出层实现预测和分类。

\[ f(x,c_i)=e^{-\beta_i||x-c_i||^2} \]

但是径向基函数中的中心$c_i$需要用随机采样、聚类等方式实现；$w_i$需要BP算法来确定.

胜者通吃的原则

除了上面还有级联相关网络、Elman网路、Boltzmann机等，具体可以查阅《机器学习》这本书