当机器成为文学作品的读者

济南时报 2019-12-12 18:15 大字

□新时报记者 钱欢青

在一个人工智能已经能够写诗的时代,阅读文学作品也不再只是人的专利。没错,机器也能阅读文学作品,在大数据和人工智能的支撑下,机器的阅读能力在很多时候都比人更强——比如,面对一部数百万字甚至上千万字的网络小说,机器能够在极短的时间内读完并迅速提炼出小说的要点;面对浩如烟海的小说作品,机器同样能够迅速找到更适合改编成影视剧的IP;面对数量庞大的文本,机器还能通过分析,找到常常被人忽略的重要信息。

知名作家、原《收获》杂志资深编辑走走,眼下正在着力打造的软件“一叶·故事荟”,就是一个具有强大文学作品阅读能力的机器。在12月4日晚上山大文学院“锐讲座”中,走走以“数字人文看文学”为题,用清晰的思路和丰富的例子,讲述了机器阅读文学作品的神奇效果。

这个想法的产生来自现实的困惑,在做文学作品的影视转化过程中,走走发现,比起纯文学作品来,很多影视公司更看重网络文学,但网络文学动辄数百万字,看起来实在“太过痛苦”,走走于是想到了“情感曲线”——早在1965年,库尔特·冯内古特就提出了这一理论,当时,他向芝加哥大学提交了一篇讨论分析《灰姑娘》等经典故事都有基本套路的论文,文章认为这些经典故事的套路和《圣经》旧约中亚当和夏娃的情感曲线相似,但这篇论文当时因为样本有限被学校拒绝了。而如今大数据时代让“情感曲线”的总结变得十分容易,基于对海量文本的阅读,六种主要故事曲线被迅速总结出来,比如《琅琊榜》是W型,《霸王别姬》是M型,《那些年,我们一起追的女孩》是N型,《长安十二时辰》是倒N型,《白夜追凶》是V型,《鬼吹灯之精绝古城》则是倒V型。情感曲线的表现是“故事曲线”,机器在大数据的支撑下,之所以能迅速描绘一部作品的“故事曲线”,就是因为对文字本身勾连的“情感曲线”的迅速把握。以此来分析莫言的长篇小说《娃》,就能迅速发现其在故事和情感曲线中属于W型,小说的中间部分是情绪的转折点,后面部分情感曲线的昂扬是因为出现了语言亢奋的话剧。通过这一分析,就能迅速找到一部作品的故事走向、情感曲线、情节高潮等信息。

不仅仅是对故事曲线的把握,机器通过阅读,可以迅速生成词云,于是小说里出现的地点、人物及其关系等等信息,都能迅速呈现出来。

对于海量文本,机器的阅读能力尤其表现出色。比如,让机器阅读《收获》杂志自1979年复刊至2018年40年间680位作者的1618篇长中短篇小说,通过对小说文本主题词的词频数据分析,“机器”发现《收获》第一个十年(1979年-1989年)刊载作品的高频词是“我要”,切合“文革”之后个人主体意识的觉醒和自我表达欲望的提升;第二个十年(1990年-1999年)的表达主体从“我”扩展到“我们”,“家庭”伦理关系成为最受关注的话题;在第三个十年中(2000年-2009年),自我表达仍是小说创作的主流,但“我们”“他们”之间的清晰划分体现出社会阶层的分化与固化;到了第四个十年(2010年-2018年),文学创作重新恢复对日常生活的关注、描摹和书写。此外,“《收获》小说每十年地理位置的变化”“《收获》年度明快—沉郁作品比例变化”等有意思的话题也纷纷涌现。机器阅读的结果,既可以验证我们自己在阅读时的直觉,也可以发现我们在阅读时没有想到的角度。

再比如,通过对2018年749部中国网络小说的“阅读”发现,所谓的仙侠武侠类小说和玄幻魔幻类小说在主题词方面呈现出来的特征区别其实并不大,两类小说的主题词统计结果都呈现出以修炼为核心的特点,进而辐射到修炼人物之间的伦理关系、修炼所达到的状态境界等相关词语。

机器阅读文学作品的能力,在人文甚至心理疗愈领域都能发挥更大的作用。因为机器可以测算每一句话的情绪值,所以可以做更多有趣的事情,比如当一个遭受过性侵或者校园霸凌创伤事件的人,用第一人称叙述该事件的时候,负面情绪会很大,用第二人称叙述时情绪会缓和很多,叙述过程自然会给叙述者带来一定程度的心理抚慰,用第三人称叙述时,叙述者会进一步带上分析的视角。走走说,西方的创意写作其实分为两类:一类以当作家为目标,另一类则是基于这种不同叙述方式所呈现的情绪而进行的“疗愈写作”。研究还表明,当当事人以第一人称直接叙述创伤事件时,会造成第二次伤害,但如果从童年记忆开始叙述,无论开心还是伤心的事一路讲下来,情绪就会缓和很多,这同样能启示我们在面对创伤事件进行新闻采访或口述历史采访时,应该具有什么样的采访伦理。

新闻推荐

《庆余年》以小见大 小人物体现大情怀

剧集里的滕梓荆,把自己的性命交付给范闲。范闲离开澹州去京都,临别前与奶奶“吻别”颇为现代。【国剧观察】改编自...

 
相关推荐