载风月|深度学习中的内存管理问题研究综述
深度学习中的内存管理问题研究综述
马玮良1,2, 彭轩1,2, 熊倩1,2, 石宣化1,2, 金海1,2
1 华中科技大学计算机科学与技术学院
2 华中科技大学大数据技术与系统国家地方联合工程研究中心 , 服务计算技术与系统教育部重点实验室
论文引用格式:
马玮良, 彭轩, 等.深度学习中的内存管理问题研究综述[J].大数据, 2020, 6(4):56-68.
MA W L, PENG X, et al.Memory management in deep learning:a survey[J].Big Data Research, 2020, 6(4):56-68.
1 引言【载风月|深度学习中的内存管理问题研究综述】互联网规模的迅速扩张促使全球数据呈现爆炸式增长、海量聚集的特点 , 社交媒体、物联网等技术的迅速发展导致了大量非结构化数据的出现 , 从海量数据中提取有价值的信息的难度越来越大 。 在大数据时代 , 深度神经网络(deep neural network ,DNN)借助大规模数据的训练取得了极高的准确率 , 深度学习得以快速发展 , 并逐渐应用于人们生活的方方面面 。
近年来 , 人们见证了深度神经网络在许多领域取得的成功 , 如计算机视觉、语音识别、自然语言处理等 。 这些成功是由深度神经网络新架构的创新带来的 。 卷积神经网络(convolutional neural network , CNN)对空间模式进行建模 , 在计算机视觉任务中能够达到当前最优的预测结果;循环神经网络(recurrent neural network ,RNN)在序列建模和结构预测方面也取得了令人备受鼓舞的结果 。 深度和宽度是构建深度神经网络最重要和有效的两个因素 。 神经网络的深度越深、功能层越多 , 越能有效地降低超参数选择的复杂性 , 提高模型的鲁棒性 。 与深度相比 , 宽度是构建网络的另一个重要因素 , 它通过不同大小的卷积积累了更多的特征图 。
深度学习应用是一种计算密集型和内存密集型的任务 。 图形处理器(graphic processing unit , GPU)、专用集成电路(application specific integrated circuit ,ASIC)、可编程逻辑门阵列(fieldprogrammable gate array , FPGA)、张量处理器(tensor processing unit , TPU)等各种专用加速设备为深度神经网络的发展提供了强大的算力支撑 。 设计更深层次的深度神经网络可以达到更高的精度 , 但是这也给各种加速设备带来了极大的挑战 。 例如 , 谷歌公司提出的基于转换器的双向编码表征(bidirectional encoder representations from transformers ,BERT)模型在训练中使用了768个隐藏层 , 占用了73 GB的内存(批处理大小为64) 。 然而 , 高带宽的GPU内存是一种稀缺资源 , 目前比较强大的NVIDIA GPU V100内存最多只有32 GB , 而主流商用云计算GPU类型(如P100)只有16 GB内存 。 这一限制阻碍了深度学习研究者去探索更先进的模型架构 。 目前 , 有一些工作探讨了大数据环境下新型存储系统的相关内容 , 从存储系统的角度来解决大数据时代的内存瓶颈问题 。 王孝远等人从体系结构、系统软件等多方面对当前面向大数据的异构内存系统进行了分析研究 , 提出了一系列异构内存系统的优化方法;陈游旻等人详细阐述了构建大数据环境下的存储系统所面临的挑战、当前的研究方向以及未来的发展趋势;李鑫等人则从大数据应用的角度对混合存储架构进行了深入的探讨 。 本文从深度学习应用的角度 , 侧重于探讨深度学习系统中的内存管理问题 , 与之前的工作有本质的不同 。
内存管理是大规模深度学习发展的一个重要挑战 。 深度学习中的内存管理已经成为当前深度学习系统研究的重要问题 。 本文将介绍深度神经网络的基本特征以及训练过程 , 分析深度学习中内存管理的问题 , 从技术的角度对一些代表性工作进行分类阐述 , 对比它们的优缺点 , 并对深度学习中内存管理的未来发展趋势进行展望 。
2 背景介绍2.1 DNN的结构及训练过程DNN是由多种不同类型的层组成的层次结构模型 , 例如 , 用于计算机视觉任务的卷积神经网络、用于自然语言处理的循环神经网络都可以被称为深度神经网络 。
推荐阅读
- 上海市交通委员会|市交通委党组参加《民法典》学习会
- Java|计算机专业的本科生,该选择学习Java技术体系还是.NET技术体系
- 深度|创意信息:与成都市大数据股份有限公司签署深度合作协议
- |西装、奶奶针织衫显老气?深度解析“衣橱单品”,多看一眼就赚了
- 时尚穿搭生活馆|40、50岁女人就别穿“大妈装”了!学习博主减龄穿搭,洋气又减龄
- |西装、奶奶针织衫显老气?深度解析“衣橱单品”,建议你一定要看
- 中国新闻网|瓦努阿图群岛附近海域发生6.6级地震 震源深度10千米
- 环球网|【深度】突然驱逐15名中国公派留学生,美对华留学限制还将走多远……
- 消除"学历歧视",鹰视教育助力全民终身学习教育体系建设
- 光明网|回馈“山川异域,风月同天”中国援助抵达世界各地
