神经网络的从数学上是咋证明可以无限逼近线性函数的
首先纠正,是连续函数。线性函数的话,实际上单个神经元就可以了不是吗?
实际上完整的陈述应该是:
神经网络可以在一个紧致集(compact set)上逼近任意连续函数。
划重点,首先是紧致集,这是集合论中的知识,你可以把它想象为在一个确切的闭区间 内,可以用神经网络接近任何函数。这个边界必须要明确,实际上你是不可能使用神经网络对输入 x 在
区间上逼近
。
第二是逼近这个在数学上的定义,已经有答主列出了相关wiki:Universal approximation theorem,实际上逼近就是对于原函数 f(x) 来说,定义一个逼近函数函数的实现为F(x),则对于任意小的误差
,都有:
。数学上的证明你可以看这一篇,使用 sigmoid 进行函数逼近
Universal Approximation Bounds for Superpositions of a Sigmoidal Function
当然,其实你理解一下就能明白了,那么多节点组合起来,总能拼成一个类似的图形的不是么?所以你可以看看这一篇:
A visual proof that neural nets can compute any function
实际上能逼近任何连续函数的特性也并不是神经网络独有的,像多项式函数,样条曲线,径向基函数都可以实现逼近任意连续函数,所以这也不神奇嘛 \\手动斜眼。
■网友
是逼近任何连续函数:早上起来想到一个简单的思路,没有写严格过程:测度有限的可测集的Indicators函数稠密于L2,由于R2上borel 测度的性质(可数不相交区间逼近任何有限测度可测集),区间的indicator 也稠密。所以只需要神经网络可以逼近区间的indicator 就行。Indicators 函数本质其实就是逻辑门小于b且大于a实际上只有一个hidden layer 的神经网络激活函数sigmoid 或者relu都可以很容易模拟逻辑门,所以通过调节weight 就可以很容易逼近区间的indicators.如此就证明了神经网络表示函数集可以L2地以及几乎处处逐点地逼近连续函数集了(因为有限测度集上L2逼近的函数列里面总可以挑选几乎逐点逼近的函数列),然后使用egorov 定理就可以证明几乎一致收敛。所以单hidden layer 的神经网络是universal approximator
■网友
不是逼近线性函数,是逼近任意连续函数。
Universal approximation theorem
其实问题和函数逼近理论相关,当然这个有点难:
北京师范大学现代数学丛书 《函数逼近论》
本质上与柯尔莫哥洛夫在1957年解决了希尔伯特第13问题的定理,关联在一起。
Kolmogorov-Arnold representation theorem
【神经网络的从数学上是咋证明可以无限逼近线性函数的】 所以结果是很深刻的,我们仰望一下就好。
推荐阅读
- 兰州启动进口冷链食品监管总仓“出仓”须查验证明
- 派出所|柳州民政局回应“市民无法证明自己是自己”:正帮助补领结婚证
- 趣头条|蔚来和小鹏汽车 用11月的销量 再次证明了他们的实力
- 人死了之后死亡证明会被提交给啥部门嘛
- 人类能证明除了自己,其他人也有意识吗(我有意识,其他人也一定有这种方式不算)
- 动态规划能得到一类问题的最优解,比如背包问题用动态规划来解决,怎样证明这个解就是相对应问题的最优解呢
- 柳州民政局回应“市民无法证明自己是自己”:帮助补领结婚证
- 装死躲审判?男子涉嫌诈骗190万 竟自办“死亡证明”逃避制裁
- “我证明,我死了!”警方:不,你没有!
- "我证明,我死了!"警方:不,你没有!
