英特尔中国研究院宋继强:芯片、系统、软件成为异构计算的三层级

集微网(文/Kelven)在集微网举行的第十期龙门阵当中 , 以“异构计算带来智能互联的下一个黄金十年”为主题 , 英特尔中国研究院院长宋继强作为嘉宾参加了这期活动 , 并且发表了对异构计算的观点和看法 。
点这里观看回放
英特尔中国研究院宋继强:芯片、系统、软件成为异构计算的三层级
文章图片

宋院长认为 , 在万物互联的时代下 , IoT设备像雨后春笋大量被催生出来 , 多种的设备的通用性要求都不一样 , 因此每个都有自己的功能、数据等的需求 。 在这情况下 , 那便需要异构计算这种方式把他们连接起来 , 可以通过采用不同的芯片组合 , 甚至不同的的组合工艺来达成 。
不论是从经济效益还是从时间成本来看 , 异构计算必定能够在未来发挥很大的功用 。
传统计算在万物互联下遇到哪些挑战?
现在相比以往 , 我们是依靠着机器上传数据的 , 宋院长表示数据种类和数据量相比以前PC时代 , 单单靠人工输入到电脑里面的数据量要大得多 。 往后摄像头的出现让数据获取来源变得多样 , 加上我们日常使用手机 , 里面有各式各样的传感器 , 数据量同时也变得巨大 。
宋院长认为:“目前流行的人工智能里面的深度学习 , 便是需要各式各样的数据进行机器学习 , 才能够让人工智能变得更聪明 。 ”
日常我们生活应用便有很多要求能够快速给出一些解决方案 , 而不是去重新定义一些芯片架构 。 如果要又快又好去解决这个问题 , 宋院长表示异构计算是必需的 , 它能够把方案小型化 , 能把成本和效果达到一个不错的平衡 。
异构计算带来的好处之一便是它能够针对未来多种不同的应用快速给出高性价比的方案 。 宋院长给出了一个高铁的例子 , 实际上高铁需要去做很多快速计算 , 同时沿线很多设备也需要运算 , 其本身便是一个庞大的系统 , 具有很多不同计算的负载 。
“异构计算虽然是一个芯片硬件层级的内容 , 但是实际要把它的能力释放出来 , 这就需要芯片、系统、软件三层去一体考量 , 才能够发挥它的作用 。 宋院长总结着 。 ”
oneAPI助力异构计算发展
在异构计算的发展中 , 虽然它能把不同架构的优势整合起来 , 最终目的便是让不同架构能做最擅长的东西 , 但是也需要打破整合架构中制约互相发挥的障碍 。
宋院长举了一个例子:“很多不同核整合在一起 , 它变成一个算力的集合体 , 这时候便需要考虑它们核与核之间的数据传输和控制 。 ”
此外还有一个制约的因素便是针对不同硬件架构的编程语言的多样化 。 在经过近20年的发展 , 针对不同的模型已经有多样的编程语言出现 , 如果要求编程人员把不同架构的芯片编程语言全学会这是不现实的 。
宋院长认为 , 在这种硬件层次增长的前提下 , 那就需要一个中间层把通用的流行软件开发框架和硬件层级联系起来 , 目的便是尽可能去把不同硬件架构的编程差异减少 , 提高效率 。
英特尔因此提出了oneAPI的概念 , 目的便是让软件框架层的中间层去掉 , 把它放到不同的架构上 , 针对不同的硬件架构 , 如CPU、GPU、IP等 , 独立开发专用的硬件加速器 , 为其进行优化 , 降低程序员的应对不同硬件架构时编程的难度 , 让他面对异构的硬件世界能够获得较为统一的软件开发环境 。
据宋院长介绍 , 目前oneAPI还是一个开放的产业联盟 , 未来有望成为一个产业规范 。 它目前拥有从芯片、系统、软件层面的技术和方法 , 如完整的开发包组合 。 现在产业已经有几十家行业伙伴加入到英特尔oneAPI的联盟里面 。
英特尔六大支柱支撑异构计算的实现
宋院长回忆:“对比20多年前那时候提出的异构计算 , 从硬件到软件 , 现在的技术发展复杂了很多 。 以往架构相对简单 , 编程模型语言也简单 , 全栈人才还是相对容易比较培养 。 ”
“目前随着软硬件架构的复杂 , 如果要求一个软件或者硬件人员全部去完成工作 , 现在是不太现实的 。 不过整个产业还是需要更多人投入到创新当中 , 因此在系统越做越复杂的情况下 , 需要有办法让开发人员工作变得简单 , 这是目前需要解决的问题 。 ”宋院长解释着 。
英特尔提出的oneAPI是朝着这个方向去努力 , 其通过一些方法让编程人员降低开发难度 , 令他们把更多精力投入到产业的创新上 , 而不是在软硬件的开发流程上 。
根据了解 , 英特尔提出了六大产业支柱 , 制程和封装位于最底层 , 但同时也是其余五大支柱的重要核心 , 其是关乎硬件芯片的封装 。 未来从晶体管层面来说 , 必然希望尺寸越来越小 , 功耗越来越低 。
第二层便是架构 , 以往英特尔使用的是X86的通用架构 , 可是进入到新时代 , 则需要掌握更多不同的架构组合 , 以此满足专属特定领域的需求 , 如FPGA、图像处理和人工智能加速器等等 。
第三层是内存和存储 , 目前内存和存储领域面临一个全新的瓶颈 , 英特尔在该技术构建中希望可以开发更加领先的技术和产品 , 以继续消除传统内存和存储层级结构中的固有瓶颈 , 同时实现加速互连 。
第四层便是多种芯片硬件中的互连 , 包括了芯片内部的互连 , 还有芯片之间的互连 。 数据之间的互连和流通也是非常重要的 , 这就是英特尔做不同层级的互连技术投资的原因 , 目的是为了满足数据层面和封装层内的数据流通 。
第五层是软件 , 这便是把复杂的硬件简单化 , 让更多人可以方便去使用互连起来的硬件功能 。 英特尔在全球已经有超过1.5万名工程师 , 而在未来 , 英特尔仍会继续在软件领域大展拳脚 , 并加强软件领域的创新 。
第六层是贯穿硬件到软件的安全 , 因为在多设备互连起来后 , 互相之间传输数据 , 还涉及到控制的问题 。 不管做任何事情、创新技术 , 安全都是需要考虑的最中间的要素 , 因为它可以为其他一切的发展提供可靠的基础 。
异构计算的未来契机
“异构计算在未来是一个能够激发多样性创新的一个动力 , 同时也是未来创新的一个首席架构师 , 他会帮我们打开新的智能世界的一个大门 。 ”宋院长预测 。
未来的设备都是具有智能自主能力 , 如智能机器人、智能汽车等等 。 它的特点便是同时具有感知能力 , 通过传感器感知外界 , 此外还需要做决策和行动 。
以无人驾驶汽车为例 , 其上下高速公路的匝道是在真实世界进行的 , 这就要求它具有很强的实时能力 , 这类的系统能力在未来是必定存在的 , 而它便是一个完整的从感知到抉择再到执行的闭环 , 因此它需要进行多种不同的运算 。
无人驾驶汽车的视觉感知数据来源是毫米波、雷达等 , 获取这些信息后便需要进行并行计算加速决策 , 这时候便需要引用大量的内存资源做线性判断 。 此外在判断决策后 , 真正做执行便需要实时控制 。
宋院长表示:“从感知到决策再到执行 , 无人驾驶骑车在这过程中已经需要三种不同的运算才能完成 , 显然这是异构计算才能满足其要求 。 ”
最后宋院长认为 , 未来异构计算必定能快速解决实际的应用问题 。 我们可以通过3D封装等一些技术工艺 , 将具有不同运算能力的芯片做得体积又小 , 而且功耗又低 , 最终把它装进未来的一些智能设备上 。
【英特尔中国研究院宋继强:芯片、系统、软件成为异构计算的三层级】(校对/Andrew)


    推荐阅读