生成式人工智能:发展演进及产业机遇( 二 )


2)变分自编码器(VAE, Variational Autoencoders):VAE是一种基于概率生成模型的生成式方法 , 它通过编码器(Encoder)和解码器(Decoder)两部分来实现数据的生成 。编码器负责将输入数据映射到潜在空间中的一个分布 , 解码器负责从潜在空间中的分布采样数据并生成新的数据 。
3)循环神经网络(RNN, Recurrent Neural Networks):RNN是一种用于处理序列数据的神经网络结构 。RNN具有记忆功能 , 能够捕捉序列数据中的时序信息 。在生成式人工智能中 , RNN可以用于生成文本、音乐等序列数据 。
4)Transformer模型:Transformer是一种基于自注意力(Self-Attention)机制的神经网络结构 , 它在自然语言处理领域取得了显著的成果 。Transformer模型可以用于生成式任务 , 如文本生成、机器翻译等 。
其他相关技术:除了上述技术外 , 还有一些其他的生成式模型和技术 , 如PixelRNN、PixelCNN、WaveNet等 。这些技术在图像和音频生成等领域也取得了一定的成果 。
大语言模型等生成式AI技术带来了新的AI发展范式 , 其应用前景十分广阔 。。对于大众而言 , 生成式AI意味着新的创造力工具 , 将在更大程度上解放个体的创造力和创意生产 。除此之外 , AIGC还将改变获取信息的主要方式 。ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎 , ChatGPT或许在未来会改变我们获取信息、输出内容的方式 , AIGC有望成为数字经济时代驱动需求爆发的杀手级应用 。
比尔·盖茨将人工智能的发展和微处理器、个人电脑、互联网以及智能手机相提并论 , 认为其将重塑所有的行业 。微软公司首席执行官Satya Nadella认为 , ChatGPT是知识工作者的“工业革命” , 断言人工智能将彻底改变所有类型的软件服务 。目前 , 搜索、办公、在线会议等诸多软件服务都已融入了生成式AI的能力 。OpenAI公司首席执行官Sam Altman称 , 多模态的AI大模型有望成为继移动互联网之后的新的技术平台 。这意味着 , 开发人员基于预训练的AI大模型 , 可以通过模型微调快速开发出垂直领域的模型应用并予以部署使用 , 人工智能的革命性正在于此 。[2]
AIGC的应用领域及案例
1.文本生成领域
自然语言生成是一种AIGC 技术 , 可以生成逼真的自然语言文本 。生成式AI可以编写文章、故事、诗歌等 , 为作家和内容创作者提供新的创作方式 。同时 , 它还可以用于智能对话系统 , 提高用户与AI的交流体验 。
ChatGPT(全名:Chat Generative Pre-trained Transformer对话生成式预训练变换模型 )是由 OpenAI 开发的一个人工 智能聊天机器人程序 , 于2022年11月推出 。该程序使用基于 GPT-3.5 架构的大型语言模型并通过强化学习进行训练 。ChatGPT 目前仍以文字方式互动 , 可以解决包括自动文本生成、自动问答、自动摘要等在内的多种任务 。
Jasper已经开始为谷歌、脸书等知名公司提供文案AIGC的商业服务 。
2.图像生成领域
图像生成是AIGC 技术中最为普遍的应用之一 。Stability AI发布了稳定扩散(Stable Diffusion)模型 , 通过开源快速迭代大幅降低了AI绘画的技术使用门槛 , 消费者可以通过订阅旗下产品DreamStudio来输入文本提示词生成绘画作品 , 产品已经吸引全球50多个国家超过100万的用户注册 。
3.音视频创作与生成
AIGC 技术可以用于语音合成 , 即生成逼真的语音 。例如 , 通过学习人类的语音特征 , 生成式模型可以生成逼真的语音 , 从而用于虚拟助手、语音翻译等应用 。AIGC 技术可以用于生成音乐 。生成式AI可以根据给定的风格和旋律创作新的音乐作品 , 为音乐家提供新的创作灵感 。这种技术还可以帮助音乐家更有效地探索音乐风格和元素的组合 。这些曲目可以用于音乐创作、广告音乐等应用 。
4.电影与游戏
生成式AI可以用于生成虚拟角色、场景和动画 , 为电影和游戏制作带来更多的创意可能 。此外 , AI还可以根据用户的喜好和行为生成个性化的故事情节和游戏体验 。
2023年3月 , 腾讯AI Lab在GDC上提出了3D虚拟场景自动生成解决方案 , 能够帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市 , 提升3D虚拟场景的生产效率 。其中重点分享了城市布局生成、建筑外观生成和室内映射生成三大能力 。整个路网生成和微调过程仅需要不到30分钟 , 相比手动设计效率提升近100倍;而单个独特建筑的制作时间也降低至17.5分钟 , 大大提升了场景制作的效率 。


推荐阅读