5.4 BP神经网络的基本原理
BP(Back Propagation)网络是1986年由Rinehart和McClelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结
构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图5.2所示)。 5.4.1 BP神经元
图5.3给出了第j个基本BP神经元(节点),它只模仿了生物神经元所具有的三个最基本也是最重要的功能:加权、求和与转移。其中x1、x2…xi…xn分别代表来自神经元1、2…i…n的输入;wj1、wj2…wji…wjn则分别表示神经元1、2…i…n与第j个神经元的连接强度,即权值;bj为阈值;f(·)为传递函数;yj为第j个神经元的输出。
第j个神经元的净输入值为:
???????????????? (5.12)
其中: ????
若视,,即令及包括及,则
于是节点j的净输入可表示为:
???????????????????? (5.13)
??? 净输入出
:
通过传递函数(Transfer Function)f (·)后,便得到第j个神经元的输
?????????? (5.14)
式中f(·)是单调上升函数,而且必须是有界函数,因为细胞传递的信号不可能无限增加,必有一最大值。 5.4.2 BP网络
BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。若在输出层得不到期望的输出,则转向误差信号的反向传播流程。通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。
设 BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间的权值为
,隐层与输出层之间的权值为
,如图5.4所示。隐层的传递函数为f1(·),
输出层的传递函数为f2(·),则隐层节点的输出为(将阈值写入求和项中):
???????? k=1,2,……q????????????? (5.15)
输出层节点的输出为:
?????? j=1,2,……m????????????? (5.16)
至此B-P网络就完成了n维空间向量对m维空间的近似映射。 1)???? 定义误差函数
输入个学习样本,用来表示。第个样本输入到网络后得到输出
(j=1,2,…m)。采用平方型误差函数,于是得到第p个样本的误差Ep:
???????????????????? (5.17)
式中:对于
为期望输出。 个样本,全局误差为:
??????????????? (5.18)
2)输出层权值的变化
采用累计误差BP算法调整,使全局误差变小,即
?????????? (5.19)
式中:—学习率
定义误差信号为:
????????????????? (5.20)
其中第一项:
????????? ??? 第二项:
???????????????????????? 是输出层传递函数的偏微分。 于是:
??????????????????? 由链定理得:
????? 于是输出层各神经元的权值调整公式为:
?????????????? 3)隐层权值的变化
????????? 5.21)
5.22)
5.23)
5.24)
5.25)
5.26)
((((((定义误差信号为:
?????????????????? (5.27)
其中第一项:
????????? 依链定理有:
????????????????? ??? 第二项:
???????????????????????? 是隐层传递函数的偏微分。 于是:
??????????????? 由链定理得:
?? 从而得到隐层各神经元的权值调整公式为:
??????????? 5.28)
5.29)
5.30)
5.31)
5.32)
5.33)
((((((
BP神经网络的基本原理 一看就懂



