科技一哥无监督方法实现C++,Java,Python代码转换,程序员:出了bug怎么办？( 二 ) 机器之心报道参与：魔王Facebook提出的

原则二：语言建模
第二个原则利用去噪自编码（DenoisingAuto-Encoding ， DAE），训练解码器使之总能生成有效的序列，即使输入数据带有噪声也是如此。也就是说增强编码器对输入噪声的稳健性。
回译
第三个原则回译，即令模型生成可用于训练的平行数据。
举例来说，当Python→C++模型质量不错时，用它为C++→Python模型生成更精确的数据，反之亦然。
下图展示了训练后获得的跨语言嵌入表示：

文章图片
图5：跨语言token嵌入空间。
TransCoder效果如何？
研究者进行了一系列实验，来评估TransCoder的效果。
具体而言，他们使用具备6个层、8个注意力头的transformer架构，并将模型维度设置为1024 。此外，对所有编程语言均使用同一个编码器和解码器。
在跨语言语言模型预训练过程中，研究人员在C++、Java和Python这三种语言的批次中交替进行，它们由32个源代码序列构成，每个序列包含512个token 。
在训练阶段，研究人员和在去噪自编码和回译目标中交替进行，使用批大小约为6000个token 。
至于模型优化，研究人员使用的是Adam优化器，学习率为10^?4 ，学习率调度器与Vaswani等人[45]相同。
在实验中，研究人员使用PyTorch实现模型，并在32块V100GPU上进行训练；使用16位浮点运算，以加速模型训练，降低模型内存占用。
实验结果
该研究使用三个评估度量指标：BLEU值、参考匹配（referencematch）和计算准确率。 BLEU值用于评估生成函数的质量；参考匹配用于评估转换结果完美匹配真值参考的比例；计算准确率用于评估当输入相同时，假设函数是否生成与参考相同的输出。
下表1展示了TransCoder在测试集上的结果，模型使用了贪婪解码（集束大小为1）。

文章图片
表1：使用贪婪解码后， TransCoder在测试集上的结果。
下表2展示了使用束搜索解码后的结果，并对比了TransCoder和现有基线方法的性能。

文章图片
看起来，效果很不错。
不过，也有程序员吐槽：
简直是debug的地狱，出了问题程序猿两种语言的代码都得看……

文章图片
参考内容：
https://arxiv.org/abs/2006.03511

科技一哥无监督方法实现C++,Java,Python代码转换,程序员:出了bug怎么办？( 二 )

推荐阅读

云海石|看起来很贵重的珠宝，其实不一定值钱！

槟榔有毒，小心口腔癌

中国|中国人喝酒时，为啥最喜欢喊“五魁首十全有”里面全是古人智慧

玉莹星座|桃花纷飞，红鸾星入命，兜兜转转还是你，苏珊米勒星座运：10月底

「广州日报」首家安全防范五星级标杆网点亮相，工商银行广州分行

防再遭袭，丘吉尔雕像被封

震撼世界的十大最美花海全球十大花海

北京买老破小的西城学区房呢还是丰台面积大一点的房子

解放双手不用密码就能登录的笔记本推荐

【在家ZAIJIA】三高人群和减肥者的福音，脱糖率达到44%，小米众筹破1000万的脱糖饭煲

北京西站派出所|高中生黑色背包被拿错铁警帮寻回

「运势」7月起，“大喜”降家中，财运最旺，事业红火，人生大转弯的属相

感恩父母的优秀小学生作文4篇小学生感恩父母作文

那年初夏小米火力全开，四摄手机跌至1289，8＋128GB内存

华南虎老照片华南虎照片

悬崖|四川悬崖村800米藤梯变钢梯，原来是他们建的！

水浒传|《水浒传》里这三人看透宋江，结局都还不错，有个人还成了国王！

【流浪猫】草丛里堆着几只橘猫，以为是什么虐待事件，看清后却觉得上当了

「婆婆」去给母亲送红包，接到电话我赶回来，看到满屋行李，我冷笑两声

港澳海南云南旅游专线|身穿一袭长裙搭配微卷长发，尽显小女人味！，颖儿越来越会穿了

科技一哥 无监督方法实现C++,Java,Python代码转换,程序员:出了bug怎么办？( 二 )

推荐阅读

科技一哥无监督方法实现C++,Java,Python代码转换,程序员:出了bug怎么办？( 二 )