优图|腾讯优图开源深度学习推理框架TNN，助力AI开发降本增效框架|优图|深度学

从学界到工业界， “开源”已经成为AI领域的一个关键词。一方面，它以“授人以渔”的方式为AI构建了一个开放共进的生态环境，帮助行业加速AI应用落地；另一方面，在解决行业实际问题时持续更新和迭代，源源不断地给AI领域输送重要的技术养料和创造力，可以说开源是AI落地和繁荣不可或缺的源动力。

文章图片

文章图片

6月10日，腾讯优图实验室宣布正式开源新一代移动端深度学习推理框架TNN ，通过底层技术优化实现在多个不同平台的轻量部署落地，性能优异、简单易用。基于TNN ，开发者能够轻松将深度学习算法移植到手机端高效的执行，开发出人工智能 APP ，真正将 AI 带到指尖。
轻量级部署， TNN助力深度学习提速增效
深度学习对算力的巨大需求一直制约着其更广泛的落地，尤其是在移动端，由于手机处理器性能弱、算力无法多机拓展、运算耗时长等因素常常导致发热和高功耗，直接影响到app等应用的用户体验。腾讯优图基于自身在深度学习方面的技术积累，并借鉴业内主流框架优点，推出了针对手机端的高性能、轻量级移动端推理框架TNN 。
TNN在设计之初便将移动端高性能融入核心理念，对2017年开源的ncnn框架进行了重构升级。通过GPU深度调优、ARM SIMD深入汇编指令调优、低精度计算等技术手段，在性能上取得了进一步提升。以下是MNN, ncnn, TNN框架在多款主流平台的实测性能：

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

TNN在麒麟970、骁龙835、骁龙845 ，骁龙615平台实测性能数据
注：纵轴单位：ms 测试分支：MNN:1.0.0(2020.05.07), ncnn:20200413, TNN: master(2020.06.10)
低精度计算的运用对TNN的性能提升发挥了重要作用。在神经网络计算中，浮点精度在许多研究和业务落地成果上都被证明存在一定冗余，而在计算、内存资源都极为紧张的移动端，消除这部分冗余极为必要。TNN引入了INT8、 FP16、 BFP16等多种计算低精度的支持，相比大部分仅提供INT8支持的框架，不仅能灵活适配不同场景，还让计算性能大大提升。TNN通过采用8bit整数代替float进行计算和存储，模型尺寸和内存消耗均减少至1/4 ，在计算性能上提升50%以上。同时引入arm平台BFP16的支持，相比浮点模型， BFP16使模型尺寸、内存消耗减少50% ，在中低端机上的性能也提升约20% 。骁龙615平台实测：

文章图片

文章图片

通用、轻便是TNN框架的另一大亮点。长久以来，不同框架间的模型转换都是AI项目应用落地的痛点。TNN设计了与平台无关的模型表示，为开发人员提供统一的模型描述文件和调用接口，支持主流安卓、iOS等操作系统，适配CPU、 GPU、NPU硬件平台。企业一套流程就能部署到位，简单易用、省时省力。同时，TNN通过ONNX可支持TensorFlow, PyTorch, MXNet, Caffe等多种训练框架，目前支持ONNX算子超过80个，覆盖主流CNN网络。TNN所有算子均为源码直接实现，不依赖任何第三方，接口易用，切换平台仅需修改调用参数即可。

优图|腾讯优图开源深度学习推理框架TNN，助力AI开发降本增效

推荐阅读

OnFire|火箭56次三分出手刷新季后赛历史纪录

香脆黄瓜丁

『趣溪勘』原因竟是玩家刷出的图纸，魔兽世界：怀旧服紧急闭服维护

矮地茶的功效与作用有哪些呢？

英国已有23所高校出现疫情超3000名学生被隔离

扬子晚报网|酒后去要“补偿费” 结果把自己要“进去了”

小茱茱分享时尚|TS与DYG一战有多关键？不止破纪录、总决赛名额那么简单！

央视缩减不合理准入限制，民航局：优化货运航线航班管理

我阻止了父母复婚，这样做对吗

高血压不是吃降压药就行的，牢记这6大用药原则，才管用

Aggro电竞|S10将诞生新科冠军，谁还记得5位最强无冠选手？组一起就无敌

中国篮球|写真美照吊打网红，女篮国手却用实力征服球迷，她就是前锋郭子瑄

怒怼|鱼总怒怼黑心商人, 凡总无级别棒子卖了13万, 《皇宫生死赔偿协议》

「大哥」挪威大哥发明一款新型自行车，装有透明保护罩，不怕被

人民日报海外版|景观石一块达数万元 “重金造景”偏离了初衷

梦见自己生了个小女孩对自己笑梦见自己生了个小女孩周公解梦

怎样把寝室装修成歌舞伎町风格

地下室装修的注意事项是什么

「APP」假冒金融APP套路深专家支招教你远离“陷阱”

好看的TVB电视剧推荐 tvb最新古装电视剧