神经网络的从数学上是咋证明可以无限逼近线性函数的

首先纠正,是连续函数。线性函数的话,实际上单个神经元就可以了不是吗?
实际上完整的陈述应该是:
神经网络可以在一个紧致集(compact set)上逼近任意连续函数。
划重点,首先是紧致集,这是集合论中的知识,你可以把它想象为在一个确切的闭区间 内,可以用神经网络接近任何函数。这个边界必须要明确,实际上你是不可能使用神经网络对输入 x 在 神经网络的从数学上是咋证明可以无限逼近线性函数的
区间上逼近 神经网络的从数学上是咋证明可以无限逼近线性函数的


第二是逼近这个在数学上的定义,已经有答主列出了相关wiki:Universal approximation theorem,实际上逼近就是对于原函数 f(x) 来说,定义一个逼近函数函数的实现为F(x),则对于任意小的误差 神经网络的从数学上是咋证明可以无限逼近线性函数的
,都有: 神经网络的从数学上是咋证明可以无限逼近线性函数的
。数学上的证明你可以看这一篇,使用 sigmoid 进行函数逼近
Universal Approximation Bounds for Superpositions of a Sigmoidal Function
当然,其实你理解一下就能明白了,那么多节点组合起来,总能拼成一个类似的图形的不是么?所以你可以看看这一篇:
A visual proof that neural nets can compute any function

实际上能逼近任何连续函数的特性也并不是神经网络独有的,像多项式函数,样条曲线,径向基函数都可以实现逼近任意连续函数,所以这也不神奇嘛 \\手动斜眼。

■网友
是逼近任何连续函数:早上起来想到一个简单的思路,没有写严格过程:测度有限的可测集的Indicators函数稠密于L2,由于R2上borel 测度的性质(可数不相交区间逼近任何有限测度可测集),区间的indicator 也稠密。所以只需要神经网络可以逼近区间的indicator 就行。Indicators 函数本质其实就是逻辑门小于b且大于a实际上只有一个hidden layer 的神经网络激活函数sigmoid 或者relu都可以很容易模拟逻辑门,所以通过调节weight 就可以很容易逼近区间的indicators.如此就证明了神经网络表示函数集可以L2地以及几乎处处逐点地逼近连续函数集了(因为有限测度集上L2逼近的函数列里面总可以挑选几乎逐点逼近的函数列),然后使用egorov 定理就可以证明几乎一致收敛。所以单hidden layer 的神经网络是universal approximator
■网友
不是逼近线性函数,是逼近任意连续函数。
Universal approximation theorem
其实问题和函数逼近理论相关,当然这个有点难:
北京师范大学现代数学丛书 《函数逼近论》
本质上与柯尔莫哥洛夫在1957年解决了希尔伯特第13问题的定理,关联在一起。
Kolmogorov-Arnold representation theorem
【神经网络的从数学上是咋证明可以无限逼近线性函数的】 所以结果是很深刻的,我们仰望一下就好。


    推荐阅读