文学不是科学,但更不是玄学
时间:2017-04-02 作者:于溯 点击:次
我在大学教了几年古代文学,发现对这门课,年轻的学生们往往有不切实际的幻想。外专业的学生觉得诗词歌赋就是风花雪月,适可作为做实验写代码背公式的调剂,欣然定为跨专业修学分的秒选。本专业尚未入门的学生以为诗词歌赋就是背背文学常识——李白是飘逸的,杜甫是沉郁的,二十个形容词可以囊括两千年的作者,助人从大学一路考到博士。我常想,若这就是中文系的日常,则大学不如取消这个专业。但凡识字的人,穿个汉服,戴个手串,喝壶小酒,挥把小扇,临风陨行泪,对月伤番怀,吟上句人生若只如初见,不也低成本地满足了内心中的文学幻想了吗?
是的,每个人都有欣赏文学的权利,但并不是每个人都有研究文学的能力。中文系期待的,从不是充满文学幻想的文艺青年或死记硬背的学霸,而是思维清晰、逻辑严密的研究者。如果一个人高数和逻辑学学得还可以,又很热爱艺术的话,那学文学再合适不过了——因为文学作为研究对象是一门艺术(不能靠背),而通向文学的研究方法却必然是符合学术伦理的(不能靠吹)——逻辑严密是最基本的学术伦理。喃喃私语式的言说,超凌文本的顿悟,这属于文学对个体生命的影响,我们感佩文学对人生产生的这种力量,但这和研究文学,终究是两码事。
一个作者写下一首诗,可能是出于某种感动;但他写出的是这样一首而不是那样一首诗,则是他所拥有的技术决定的。我们对生活的感触未必比杜甫少,我们对山山水水的热爱未必比王维少,我们之只能发圈吐槽、拍照留念,盖因不曾习得杜甫和王维的那种表达技术而已。舍技术而谈感动,是普通的读者;懂技术而不忘感动,才是文学研究者。
然而文学爱好者,也包括一些文学研究者,常怀有一种古老的傲慢,觉得技术分析是低端的、匠气的,同时也对一些“技术手段”的“入侵”,抱有相当警惕。其实在科学主义大行其道的时候,大家也曾热情地拥抱过表格和数据,甚至有的时候,拥抱的姿态还因过于急迫而有失优雅。然而此一时也彼一时也,就像当年的父母逼孩子读《十万个为什么》,如今的父母逼孩子背四书五经,大趋势下,与文学研究者本来就八字不合的各种技术手段,难免日见冷落。所以我常怀疑,一种人文社科学类研究方法要在国内流行,大概得同时满足两个条件,一是由国外舶来,二是与国内的大环境合拍。以此论之,近年在人文学科低温发酵的大数据挖掘,好像只满足了后一个条件,未来能不能成大气候,真倒让人捏把汗。
想到数据发掘,是因为偶然看到网上有个帖子,叫《计算机告诉你,唐朝诗人之间的关系到底是什么样的?》(以下简称《诗人关系》),因为和我的工作相关,不免颇感兴趣。这个研究的思路,大致是通过哈佛大学编纂的《中国历代人物专辑资料库》(China Biographical Database Project)提供的诗人名号数据,对四万多首唐诗呈现的诗人间引用关系进行计算,以此构拟唐代诗人的交际网络。正如网上一些评论所说的,作者通过新(对文学研究而言)技术,最终得到的结果却大致符合旧有的文学史认知。不过在我看,符合文学史既有认知,不等于研究无价值,这种吻合,既是互相检正,也说明由于唐诗的总量不大,计算机处理这些数据并没有明显超过人脑的优势——如果换成清诗,我倒是很相信它能捕捉到文学史所未曾关注过的小规模社交现象。
我并不觉得《诗人关系》是一个尽善尽美的研究,首先是一些小毛病,比如“引用”本身不能仅靠人名(字号、行第、别称)来捕捉——你看到的还可能是一个集合名词,像杜甫《同诸公登慈恩寺塔》中的“诸公”(我们根据杜甫自注和现存唐诗知道“诸公”至少包括高适、薛据、岑参和储光羲)、贾至《早朝大明宫呈两省僚友》中的“两省僚友”(我们根据现存唐诗知道“僚友”中有王维、岑参和杜甫);再比如没有排除“伪引用”——像李商隐效仿杜诗风味写的《杜工部蜀中离席》,模拟李贺特色写的《效长吉》,那可不等于说李商隐与两位作古的前辈有什么来往。
然后是一个大毛病:《诗人关系》把“诗人关系”“诗人引用关系”“诗人社交网络”三个不同概念混为一谈了。“诗人引用关系”只是“诗人关系”的一个类型而已,还有“诗人共作关系”呢——假设老王和老李去老张家,各赋《老张》一首,两篇《老张》就能说明王李“诗人关系”的存在。实际上,在诗成为士人流行交际手段的唐代社会,《老张》这种同场合共作诗非常之多,像褚遂良、上官仪、岑文本、杨续、刘洎和许敬宗都有一首《安德山池宴集》,就是他们在安德公杨师道家宴游所作的,这种作品也一样能反映(不同程度的)交际的发生。再者“诗人关系”又只是“诗人社交网络”的一个类型而已,诗人老王和诗人老李好了一辈子,不曾有一首诗往还,也没有什么不可以,写诗本不是诗人社交的唯一方式——换言之,诗对于构拟“诗人社交网络”,就是一个不充足的样本。
应该说,《诗人关系》在方法设计、数据库搭建及人工判别筛选剔除上,都存在些许问题,目前的工作只是为研究唐代诗人交往情况做了一些前期准备,提供了一些可以进一步分析的数据,而全部工作还远没有完成。但我认为以上这些问题,应该责之文学研究者去解决,而不应该责之为我们提供这个方法的人。打个比方,当文学研究和数据挖掘相遇时,他们的关系就好比医生和医疗器械工程师,各自都要对对方的工作懂一点,才好相互合作,但谁也不可能取代谁。
不错,大数据是把好用的柳叶刀。《诗人关系》的作者还用这把刀做过唐诗用字、用词(季节、颜色、植物、动物)等数据分析(《当我们在读唐诗时,我们在读什么?》,下面简称《读唐诗》)。如果说《诗人关系》是对文学的外部研究的话,《读唐诗》则是文学文本的内部分析。这种分析取径也是古已有之,我们说杜甫喜欢用乾坤、天地、万古、宇宙之类的大词,李贺喜欢用各种颜色,这都是古今文学研究者总结出来的文学现象,所谓总结,其实就是一种算法,通过这种算法,我们能把握诗人创作的某些特点。我读大学的时候,我的老师考学生的一个办法,是找几首名家写的不那么常见的诗(相对于本科生的阅读量),让大家猜作者。猜,其实就是对诗人的用词、语法、章法习惯的一个综合计算。而古人习诗,特重拟作,模拟一篇作品,其实和读作品猜作者一样,也得先对诗人的用词、语法、章法习惯做综合计算。 |