数据信息的网络效应:与瓦里安商议

围绕数据网络效应 , 投资人讨论数据作为护城河 , 经济学家和法律专家们讨论数据作为进入门槛 , 文化和传媒学者讨论数据作为权力的来源 。 但数据网络效应这一概念存在争议 , 故文题数据的网络效应而非数据网络效应 。
数据信息的网络效应:与瓦里安商议
文章图片
本文的写作背景 , 之一是出于探索智能商业经济规律的兴趣我早前强调技术网络效应;之二是Google首席经济学家HalVarian撰文指出数据网络效应是伪命题 。 本文介绍了Varian的观点和思路 , 同时提出了几点商榷意见 , 并参考了OECD关于数字化时代数据竞争政策的报告 , 旨在加深对技术网络效应的理解 。 文末提供相关文档下载 , 推荐阅读 。
1Varian对数据网络效应的看法
在2018年的一篇论文中 , Google首席经济学家HalVarian的观点是 , 数据不存在网络效应 , 不构成进入门槛 。 请看他的这段话:
一个在律师和管制圈流传的概念是数据网络效应 。 该模型认为 , 一个公司由于具有更多客户因而可搜集更多数据 , 而这些数据可用来改进其产品 。 这是对的 , 改进运营正是机器学习的前景所在 , 但是这并没什么新奇的 , 并且这绝不是网络效应!这是供给侧的效应 , 通常被称为干中学或经验曲线 。 干中学区别于网络效应之处在于典型的网络效应或多或少是自动发生的
自动发生的意思是没有成本 , 或曰外部性 。 这个特征我在这里做过介绍 。 言下之意是 , 数据的价值正反馈 , 即如上文所指的“改进产品” , 并不是没有成本的 。 相反 , 这需要投入管理者的注意力和相应的投资 , 如数据的搜集、管理、分析、结果验证以及策略的实施等 。 因此 , 上述现象不是网络效应 。
Varian尤其强调技能:由于数据爆炸是一个较新发生的现象 , 数据分析技能的稀缺显得尤为突出 。 言下之意 , 巨头的竞争优势不是源于数据 , 而是源于在干中学的过程中汇聚了大量高技能的人才 。 随着数据爆炸 , 可用数据将越来越多 , 从而使得其他企业也具备干中学的机会 。 我注意到 , 这个观点出现在欧盟批准Facebook收购Whatsapp的文件中 。
在更早的一份演示文档中 , Varian还驳斥了认为Google广告业务涉嫌基于网络效应垄断的观点 。 他首先展示了对方的论点 , 然后把上述观点的关键词替换 , 得到另一个陈述 。 由于后者看起来是一个非常正常的商业现象 。 他试图说明 , 搜索引擎和其他业务没什么不同 。 他讽刺说:越多的客户 , 就能卖出越多的汉堡 , 就能获取更多的数据改进产品 , 进一步可以卖出更多的汉堡 , 进而获得更多收入投资新产品研发 , 进而获得更多的客户 。
我们都知道 , 干中学和经验曲线是供给侧规模效应的重要成因 , 而供给侧规模效应广泛存在于传统产业 。 大致估算 , 产量每增加一倍 , 单件成本下降10-25% , 这主要是因为对知识生产力的投资带来的效率优化 。 对此 , Varian说 ,
正循环无处不在 , 但真正重要的是规模增长背后的成本 。 很多人喜欢谈论正循环“越多的客户使用一个业务 , 业务收入就越高 , 进而有越多的资金可以投入到改进业务中去 , 进而吸引多更多的客户” , 但避而不谈背后的成本“越多的客户使用一个业务 , 业务成本就越高 , 进而需要越多的资金可以投入到业务维护和改进中去 , 如果想吸引多更多的客户的话” 。
确实 , 很多人艳羡拥有数据的巨大好处 , 却没有意识到维护如此巨量数据背后的成本 。 前几年雷军公开抱怨小米云存储成本过高 , 如果找不到变现模式会被拖死 。 近年来不断关停的网盘服务 , 固然有其他原因 , 成本恐怕也是关键 。 互联网巨头寻求白盒服务器 , 恐怕也不是为了颠覆谁 , 而是成本压力下的被动选择 。 压力逼迫着互联网巨头去尽可能开发数据综合价值、降低数据综合成本 , 进而具有了一般企业没有的学习机会 , 具备了独特能力 , 从而贡献了竞争优势 。
让我们回到效用侧 。 网络效应的边际报酬递增是指 , n节点构成的网络 , 其价值按照全连通的理想情况来计算是n/2 。 加入1个节点 , 增加的链接数为n , 加入下一个节点 , 增加的链接数为n+1 , 也就是说 , 网络规模越大 , 增加1个节点所得到的价值增量越大 。 Varian认为 , 数据之间构成的网络 , 其价值规律并非如此 。
恰恰相反 , 数据作为一种生产资料可能边际报酬递减 。 这个结论的主要依据是机器学习领域用来提升模型预测识别能力和其所需数据之间的曲线 。 如果把预测能力 , 或智能客服准确应答能力当作价值衡量标准 , 研究表明 , 要提升一个点的精度 , 所需要的数据量是递增的 。 反过来说 , 单位数据能贡献的精度提升递减 。
以上 , 是一种不同于流行的数据网络效应的观点 , 以经济学家Varian为代表 , 从成本和效用两个角度证否了数据网络效应 。
2对Varian观点的几点看法
我曾提出技术网络效应的概念来描述与数据和AI相关业务的经济规律 , 且正好以搜索引擎为例引出 。 所以 , Varian的观点实际上与我相左 。 本节剩下的部分 , 先简要铺垫下技术网络效应的基本观点 , 再深入考察Varian的观点
1)技术网络效应
到目前为止 , 我们所有对网络效应的阐释都是建立在网络节点之间自发存在需求依赖性的前提下 。 直接网络效应以社交为例 , 用户之间的社交需求是天然相互依赖的 , 间接网络效应以淘宝为例 , 卖家和买家之间交易需求是天然相互依赖的 。 也就是说 , 前述网络效应并没有创造依赖性 , 只是利用了已经存在的依赖性 。 我们称这种网络效应为自然网络效应 。 但存在另一种网络效应 , 它并不是利用已存的需求依赖性 , 而是利用技术创造新的依赖性 。
这个效应可以回溯到搜索引擎的发明 。 搜索业务作为智能化阶段的商业原型是有道理的 , 它可能是互联网上最早的大规模算法自动化应用 。 作为互联网基础业务之一 , 搜索引擎的发展既非如社交平台般受益于直接网络效应、也非如电商平台般受益于间接网络效应 。 我们认为 , 搜索引擎更多受益于这样一种网络效应——越多的用户使用该搜索引擎 , 其搜索算法就越优化 , 精度上的优势就越明显 。 这是因为每次点击行为 , 都为搜索引擎优化下一次判断提供了更多信息
这种网络效应源于同一群体 , 符合直接网络效应的定义 。 但不同于社交网络 , 它不是源于该群体个体之间的自发互动 , 而是经由某种技术如搜索算法而实现的 。 我们把具备这种特征的网络效应称为技术网络效应 。 它可以简单理解为 , 如果你有聪明的算法 , 则数据与数据会相互吸引 , 连成网络 , 创造价值 。 与自然网络效应的区别是 , 它需要平台本身足够聪明 , 否则数据不会主动互动 。
可见 , 尽管我和Varian同样反对数据网络效应概念 , 但我提倡的基于算法平台实现网络效应的观点 , 在Varian看来是数据规模效应 。 他认为 , 算法平台体现了经验积累 , 其知识以经验曲线所描述的模式增长 , 驱动数据规模效应而非网络效应 。
2)与Varian的三点讨论
第一 , 网络效应自动发生吗?Varian表达该观点时是谨慎的 。 原话是:
网络效应典型地被认为或多或少是自动发生的 。 但这也不一定对 , 毕竟关于网络效应情形下的战略行为的书籍汗牛充栋 。
意思是 , 战略行为带着主观意图 , 既然那么多讨论网络效应市场下的战略行为 , 说明网络效应可能被意图所操控 。 经典的网络效应例子 , 如前所述 , 都是自然网络效应 。 这导致 , 早期经济学文献把网络效应视为某种外生的市场属性 。 近年来 , 尽管经济学者和管理学者都开始强调网络效应的内生性 , 传统力量仍然强大 。
【数据信息的网络效应:与瓦里安商议】这种认为网络效应是某种外生的客观存在的观点 , 潜移默化地在产业界形成了不良影响 。 在一些人看来 , 网络效应在某个地方向创业者招手 , 只要按照某种模板采取行动 , 就能够获得它 。 然而 , 它具体长什么样 , 出现在什么地方 , 如何到达那个地方 , 实际上都是策略影响和动态运营的结果 , 绝不是一个客观目标 。


    推荐阅读