ChatGPT取代搜索引擎?谷歌急了,百度不慌:早已布局( 二 )


那么这些技术怎么用于搜索引擎呢?
这就要说到在百度Create大会上亮相的两大“杀手锏”技术,跨模态大模型“知一”,新一代索引技术“千流” 。

ChatGPT取代搜索引擎?谷歌急了,百度不慌:早已布局

文章插图
先看 跨模态大模型知一,是AI技术在搜索场景落地的代表 。
简单来说,知一大模型可以从全网形态各异的资源中持续学习,无论是文本、图片、视频还是结构化信息都可以融会贯通 。
打破了资源形态的界限,就 更容易理解用户的搜索需求 。
从技术层面讲,知一使用了百度文心大模型技术 。大规模预训练技术提升模型性能,蒸馏压缩率高达99%的模型小型化技术以降低成本,得以在搜索场景全面应用 。
据了解,目前知一在百度搜索的各场景中每天要进行上万亿次的推理 。如此巨大的使用规模又带来新的问题,如何把满足需求的结果高效呈现给用户 。
这就要提到 新一代索引技术千流,负责把不同维度的信息进行智能有序的组织 。
千流与之前的索引技术相比,主打多领域、多维度表达的 立体栅格化索引 。
如何理解栅格化?
在过去,搜索引擎为提高效率会把内容按质量横向切开,做分层处理 。先从高质量内容开始检索,满足需求就可以及时返回结果,还未满足再进入下一层 。
在千流中,进一步把质量最高的一批内容按领域垂直分层 。质量分层+内容命中结合,一横一纵把内容切分成栅格按需检索,大大减少每次检索的计算量 。
这是对搜索引擎后端架构的彻底改造,做到 成本降低一半、速度快两倍 。
但这又不光是节省成本的问题 。
百度工程师透露,节省下的计算量还可以投入到对内容的精耕细作中,如综合利用多种算法提升索引质量,或者加入最新的生成式AI技术 。
此外,在不同的栅格间也可以使用个性化算法,就好比 “一鱼多吃”,不同的部分使用不同的烹饪方法 。
知一和千流两者配合起来,一方面对用户搜索意图的理解更精确,一方面提高内容的质量和信息检索效率,为搜索打开了更多可能性 。
用户的高频需求,驱动着AI技术变革 。新技术又能激发新用户需求表达,两者构成“双轮驱动”,持续推动搜索进化 。
ChatGPT取代搜索引擎?谷歌急了,百度不慌:早已布局

文章插图
在这样不断反馈迭代之下,下一个质变即将到来 。
搜索即创作
回到最初的话题:生成式AI会取代搜索引擎吗?
作为国内最大的搜索引擎,百度的答案已经明了:
AIGC和搜索引擎是互补而非取代关系 。
百度搜索杰出架构师辜斯缪解释了百度如此判断的思维路径:
当前的AIGC对话系统,哪怕是最火最出圈的ChatGPT,尚有自身能力的明显瓶颈,(比如有时胡说八道,以及不能及时获取最新消息),且不能保证未来技术一定能够解决这些问题 。
因为从工业应用和落地可能性角度看,现有模型规模并不能支撑一个模型能记录所有知识 。
尤其是用户需求量巨大的强时效性内容 。
解决办法,就是换个角度,利用AIGC为用户开放式的搜索提问或定制化的信息需求“创作答案” 。
从单边的搜索或生成,融合为检索+生成,会达到更好的效果 。
这也是从2021年,百度就已经着手研发生成式搜索的重要原因 。
检索和生成的结合模式,注定了百度搜索升级后的产品形式会有变化 。
据了解,最终产品会与ChatGPT有很大不同,即虽是多轮交互,但 并非单纯的多轮对话 。
简而言之,用户可以更高效地向搜索引擎提出需求,生成式搜索则在满足需求的同时,迭代和调整这个需求 。
不会PS的人,可以利用生成式搜索搜出一张图片,再用语言描述想要怎么修改这张图片,搜索引擎就能根据要求,通过百度的NLP技术对图片进行修改,给予反馈 。
升级后,生成式搜索会实现 三个方面的体验提升 。