不 / 人 / 山 / 无 / 风 / 一 / 日 / 云 / 有 / 何 / 马 / 松 / 竹…… 世界读书日 用大数据读唐诗
又是一年一度的“世界读书日”了。就在本周二,中国新闻出版研究院发布了最新的“国民阅读调查报告”:2016年,中国国民人均图书阅读量为7.86 本,比去年多了0.02本。其中,人均纸质书阅读量为4.65本,比去年多0.07本,而人均电子书阅读量为3.21本,比去年少0.05本。
这么看来,大家对纸质书的热爱并未因电子书的流行而消减。
与此同时,我们对手机的依赖与日俱增:微信成为中国人最主要的阅读工具, 62.4%的成年国民都进行过微信阅读,人均每天微信阅读时长为26分钟。
不久前,一篇用计算机分析《全唐诗》的文章,也在微信朋友圈里广为流传:一个爱好古典诗词的航天科技人员,用一种计算机程序设计语言,解析《全唐诗》中收录的4万多首诗,从中找出了不少有趣的点——唐朝诗人们最常用到的字、最喜欢的季节、彼此的友谊、走过的风景,都能一窥特色,不失为现代科技与古典阅读的一次有趣碰撞。
任何能让你对阅读、对文学发生兴趣的东西,我们也都感兴趣。文/大牙
我们无法创造“诗云” 但可以从云中看诗
很多年之前,我看过刘慈欣的一篇科幻短文《诗云》。当时他还没有写出著名的《三体》,但那些短篇已经征服了无数科幻迷的心,篇篇都有着瑰丽奇幻、脑洞大开的想象。
在《诗云》里,一个可以纵横宇宙、熄灭恒星的“神”级超能智慧生命,偶然间发现了地球文明遗产中的唐诗之后,打算用纯技术的方式写出比李白还好的诗——它运用的方式,是在符合格律的前提下,试遍所有汉字的所有组合。
一团直径100亿公里的“诗云”在太空中出现了,为此消耗了两个星系的物质。然而“神”却发现:它无法把好诗从中挑选出来,因为那需要与技术无关的鉴赏力……
刘慈欣是这样在《诗云》中描述古诗的——“用如此少的符号,在如此小巧的矩阵中涵含着如此丰富的感觉层次和含义分支,而且这种表达还要在严酷得有些变态的诗律和音韵的约束下进行。”
用技术的方式去写诗,并不难。但是要用技术的方式写一首感天泣地、超越李白的诗,就太难了。科幻小说里那位“神”级智慧生命,虽然在技术的层面已经纵横宇宙无力能及,最后还是败给了纯粹感性的野心。
从这个野心往后退上几大步,仅仅用科技的手段来分析诗歌,找点儿规律和特点,就简单很多。事实上,用科技手段来分析文艺作品在学术界并不新鲜,只不过这些文章多流传在学术圈中,并没有流传开来。
那篇分析《全唐诗》的微信公号文章之所以流行,也是因为足够简明和通俗。在更加专业严谨的研究人员眼中,这甚至算不上研究。但对于普通读者来说,有趣得刚刚好。
诗作数量谁最多?白居易第一,“无名氏”不少
程序员从大数据里分析的第一个问题是:唐朝诗人中,谁写的诗最多?
统计的结果前三名是:白居易(2643首)、杜甫(1151首)和李白(897首)——他们三个,差不多也是绝大多数现代人最耳熟能详的三位大诗人。数据与感受很是贴合。
位居第四的是谁?估计没有人想得到,竟然是“无名氏”,843首。
在《全唐诗》的第785卷,收录了十九首没有标题没有作者的七言绝句,统称为杂诗。后来,经过学者的多方考证,有些杂诗找到了确切的作者,但大多数依然茫无头绪。
很多人猜测,他们或许多是古代女子,生前不受重视,可能自己也没有想到要留名。虽然诗作流传了下去,作者的名字却湮没在历史的尘烟里。
这其中最著名的一首,我个人觉得,应该就是那首《金缕衣》了吧?
劝君莫惜金缕衣,劝君须惜少年时。
有花堪折直须折,莫待无花空折枝。
这首诗长期有两种截然相反的解读,一说是要珍惜年少光阴,努力求取功名学识;另一说则是让人及时行乐,不要等老了才后悔没痛快活过。那个“花”到底代表着怎样的寓意,恐怕只有作者才知道了。
还有一首感觉很像边塞将士所写的“北斗七星高,哥舒夜带刀。至今窥牧马,不敢过临洮。”作者也是无名氏。
回到高产诗人白居易这里,需要特别说明的一点是:全唐诗中白居易的诗最多,有个重要原因是白居易生前自己编纂过文集,李白和杜甫则没有,所以白的文章流传到后世的就比李杜的多一些。
诗人们最喜欢的地方 江南和长安,隐居在沧洲
根据数据分析,全唐诗中最常出现的地名是江南和长安,恰好一南一北。长安是唐朝首都,重要又繁华,自不必说。当时的江南也一定是风景美如画,外加青楼歌女有文化,吸引无数文人。
江南好,风景旧曾谙。日出江花红胜火,春来江水绿如蓝。能不忆江南?(白居易《忆江南》)
说到这里,不禁又想起那句著名的“腰缠十万贯,骑鹤下扬州”了。这两句话目前能考证到的一个出处,是隋唐之前的南北朝时期,南朝文人殷芸的小说:几位读书人赶考路上遇见神仙,允许每人提一个心愿。有人说想发财——腰缠十万贯;有人说想去富庶的扬州当官——愿当扬州刺史,还有人也想当神仙——骑仙鹤。
第四个书生野心最大,把前面三人的心愿都揉在一起提,于是就有了那著名的两句话,流传至今。
那么,在这些风景胜地,什么具体场景最能引发诗人们的兴致呢?
数据分析显示:门前、海上、江边、楼上——这就跟我们现在到景区门前要合影留念,在海滩上晒比基尼照、在高楼上拍城市风景发朋友圈差不多意思吧?
此外,还有个叫“沧洲”的地方很受诗人青睐,注意:不是河北的那个沧州,而是一个泛指,意思是滨水的地方,古时常用以称隐士们居住之处,难怪诗人们常常提起那里,是为了寄托一份遗世独立的心情啊。
脑海中浮现一句“此生谁料,心在天山,身老沧洲”,但不是唐诗是宋词,作者陆游。
不人山无风,一日云有何 这不是诗,是最常用到的字
你猜全唐诗中出现最多的字是哪个?
排名第一的是“不”字,和它意思差不多的“无”排在第4位。表示疑问的“何”排在第10名。何处、何时……都是诗人喜欢问自己的问题。
朱自清先生在《<唐诗三百首>指导大概》里也说过:后人从唐诗七绝中选了11首经典之作,其中有8首都用了否定语——
劝君更尽一杯酒,西出阳关无故人。(王维《渭城曲》)
玉颜不及寒鸦色,犹带昭阳日影来。(王昌龄《长信怨》)
但使龙城飞将在,不教胡马度阴山。(王昌龄《出塞》)
醉卧沙场君莫笑,古来征战几人回?(王翰《凉州曲》)
两岸猿声啼不住,轻舟已过万重山。(李白《下江陵》)
羌笛何须怨杨柳?春风不度玉门关。(王之涣《凉州词》)
不知何处吹芦管,一夜征人尽望乡。(李益 《夜上受降城闻笛》)
商女不知亡国恨,隔江犹唱后庭花。 (杜牧《泊秦淮》)
分析者猜测,也许是因为否定句表达的语气更强,比较适合传唱,所以,“不”字才能得到诗人们的青睐吧。
山、风、云,这包含了辽阔自然与天空气象之意境的三个字,也是诗人的心头爱。李白那首著名的《关山月》里,开头气势磅礴的四句,将这三个字全部囊括——
明月出天山,苍茫云海间。
长风几万里,吹度玉门关……
他们喜欢青草和马匹 他们更懂得“活在当下”
诗人们最喜欢的季节,没有任何意外,春天和秋天呈现出“压倒性的场面”,从寒冷的冬天转换到温暖的春天,从炎热的夏季变化为清冷的秋天,诗人们对季节的反转尤其敏感,也因此给世人留下“伤春悲秋”的印象。
我最爱的一首惜春之诗,是那位反复琢磨“鸟宿池边树,僧(推?敲?)月下门”的贾岛,在那首《三月晦日送春》中,他对春天的留恋,已经到了不舍入睡的地步。
三月正当三十日,风光别我苦吟身。
共君今夜不须睡,未到晓钟犹是春。
至于秋天,给我印象最深刻的,不是比例较大的悲秋,而是一首别开生面的“反悲秋”之诗,来自中唐诗人刘禹锡,那首豪情壮阔的“九曲黄河万里沙,浪淘风簸自天涯。如今直上银河去,同到牵牛织女家。”就是出自他之手。
他的诗里,写春天比写秋天多许多,感觉他很喜欢春天,但是到了秋天也同样精神抖擞,这一点我特别欣赏,你看——
自古逢秋悲寂寥,我言秋日胜春朝。
晴空一鹤排云上,便引诗情到碧霄。
多么潇洒,多么豁达!
作者还分析了唐朝诗人们最喜欢的颜色,首选是白色,其次是青色,都很素净淡雅,我猜他们可能都很爱雪的意境,也中意代表着草木的青色吧。但是喜庆的红色也排在第三位,看来人家并不那么高冷。
松树、竹子和柳树,是最受诗人们喜爱的三种植物,也很符合普通人的想象。有了植物,当然也不能少了动物。他们最爱的是马,那当然,这就是唐朝的私家车啊!
令我略感意外的是关于时间的数据分析,“今日”一词高居榜首,紧随其后的是今朝、当时、此时和如今——看来,诗人们不仅怀旧,更懂得活在当下。
数据分析者还特地搜索了一下与“寂寞”关联密切的10个词,分别是——唯有、今夜、摇落、怅望、故国、伴、惆怅、深春、明日、旅。
他总结道:“能看出来,诗人们往往在春日的深夜里,在树叶摇落的季节里,在旅途中,怀念故国的时候,最容易寂寞。”
“
诗人们往往在春日的深夜里,在树叶摇落的季节里,在旅途中,怀念故国的时候,最容易寂寞。”——数据分析者说“寂寞”
新闻推荐
环绕兴隆湖的成都科学城成都日报记者胡大田摄□成都日报记者杨扬张婷婷黄颖时代的发展,远比任何宏大的书写更发人深思。每一个时代的前行,意味着使命的交付。2012年11月29日,在承载了中华民族厚...