汉语堂|矣晓沅,孙茂松:计算机的诗意 | 机器写诗的背后( 二 )


我们面临的第二个问题是诗歌写作的“扣题” 。 人类写诗时 , 往往会在脑海中选定一个主题 , 然后围绕该主题展开创作 。 对于自动作诗系统 , 主题一般以用户输入的一个或多个关键词 , 如“春风”、“相思”等来确定 。 现有的系统要么漏生成某个关键词 , 无法很好地表达用户要求的主题;要么把用户给定的关键词直接生搬硬套地嵌入到生成的诗歌中 , 直接露出机器的马脚 。
对于这样的问题 , 我们从心理语言学里得到了一定的启发 。 人的大脑中存在一个名为工作记忆(Working Memory)的模块 。 心理语言学相关理论表明 , 人阅读一篇文章时 , 如果能够把当前看到的句子和存储在工作记忆模块中的内容以及该篇文章的主题联系起来 , 就会觉得这篇文章扣题紧密 , 行文连贯 。
因此我们提出了基于工作记忆模型的诗歌生成方法 , 该方法使用不同的记忆模块存储用户输入的不同关键词和生成的上文内容 。 模型动态地不断读取和更新“自我”的记忆 , 以此来提升扣题的紧密度和灵活度 。
“柳丝无力绾春愁 , 燕子归来恨未休 。 记得当年锦绣楼 。 为君留 , 别后相思泪满眸 。 ”这是我们的模型以“柳色”和“思君”为关键词 , 生成的一首宋词《忆王孙》 。 整首词的主题连贯一致 , 紧密围绕离别和相思展开 , 同时用户输入的关键词的语义也得到了灵活的体现 。
除此之外 , “九歌”研发的过程中还遇到了很多困难 。 不论对待什么样的问题 , 团队在研究思路上一直在向人类的写作模式和创作技法取经 , 从诗中总结规律 , 由诗而思 , 由思而行 。
让机器同人一起追寻 诗意的远方
诗歌自动生成是一个有趣的任务 , 但同时面临着很多挑战和争议 。 “九歌”系统经过了两年的不断研发改进 , 生成诗歌的质量不断提高 , 也曾于2017年登上央视《机智过人》舞台 , 与当代青年诗人比拼诗词创作 。 但同时 , 九歌团队也逐渐意识到机器诗作和人类诗作之间的鸿沟 。 或许诗离不开人 , 我们读的是诗的文字 , 然而脑海中浮现的是一个个具象的诗人及他们的爱恨与忧愁 。 我们希望“九歌”在未来的定位不仅是一个机器“诗人” , 而是一名智能机器“助手”;不是替代人类写诗 , 而是辅助人类 , 尤其初学者进行诗词写作的学习 , 从而为我们中华优秀传统文化的传承和弘扬助力 。
“九歌”目前刚刚迈出了第一步 , 我们将不断进行更加深入的研究和探讨 。 诗在远方 ,“九歌”将携手人类 , 在追求诗意的道路上步履不停 。
附:
“九歌”在线系统链接:
http://jiuge.thunlp.org/
九歌开源代码链接:
https://github.com/THUNLP-AIPoet/
汉语堂|矣晓沅,孙茂松:计算机的诗意 | 机器写诗的背后
本文插图
【汉语堂|矣晓沅,孙茂松:计算机的诗意 | 机器写诗的背后】


推荐阅读