本文为“量化历史研究”第523篇推送
地方志提供了历史上关于灾害记录的丰富内容,可用于研究人类活动对全球环境变化的影响。最近数字人文方法的兴起,地方志数据库也日益受到重视。但如何能准确理解和利用灾害记录并开展历史研究? 其间又存在何种陷阱?这是值得思考的问题。
德国马普科学史研究所所长薛凤(Dagmar Schafer)教授团队长期耕耘中国地方志数据库项目,并推出了数字人文研究工具LoGarRT(Local Gazetteers Research Tools)①。她和团队成员以桑灾的记载为例,观察地方志的编辑者是如何收集整理元代灾害的记录。通过对“蚕灾”信息数据的分析,发现古人在地方志中对灾害的记载,其主要目的是观察灾害对其自身生计与统治产生的影响。
根据公元1673年的《东明县志》,在蒙元统治时期(1271–1368年),各类灾害严重侵袭河北东明县。在中国历史诸多记载中,类似《东明县志》中的灾害记录促进了几个世纪以来对中国政策和气候变迁的认识。明代(1368–1645年)以来,学者们根据这些记录,试图证明蒙元统治者的战争政策和统治中国的举动得罪了上天,破坏了北方的自然平衡。
1925年,竺可桢发表文章指出,中国现存约一万册的地方志涵盖了帝国统治的核心区,能够借此增进对长时段历史地理环境变化的“地方性”认识。由此,地方志数据为环境史学家、文化气候研究专家以及那些声称“1230-1260年可能是随后的两千年来华东和华中地区最温暖的三十年”的科学家提供了依据。
薛凤等人针对地方志中记录的灾害情况质疑其可靠的“地方”性问题。这项研究涉及地方性知识、环境变化与数字人文应用(以下简称DH)。地方志提供了一个不同于断代史中关于帝王将相、王朝政治的阐释视角,能够揭示全球现象在文化、经济、社会形态和知识领域的局部且多样的影响。地方志中有关气候和灾害的记录是地方官员与帝国中央关于“知识-空间生产”之间长期历史辩证发展的产物,其中灾异事件是审视天命和王朝合法性的标准。
与环境史学家和利用历史气候数据来解释历史的文化气候史学家不同,薛凤团队将灾害相关的定量文本数据与灾害政策、天命论述的定性研究结合起来,探寻历史灾害数据的本质,寻求地方志编辑者用来收集灾害数据、并组织和解释该信息的策略,探求灾害数据收集的方法是有多普遍或多特殊。这些问题在宏观的空间尺度范围进行提问时,构成了定性历史工作的一种定量方法,可以更好了解地方志中关于灾害表达的价值与可靠性。
从历史事件到话语表达的灾害视角的转换,以及将地方性知识视为认知实践的做法,促使薛凤团队提出跟DH相关的第二个问题,即数字化工具如何帮助评估定量现象的定性含义。这一方面要求探索与元朝政策、灾害处理实践相关的地方志;另一方面,需要从局部传播和受到人文心态影响的文本中观察元朝统治的合法性。
通过研究现存《志顺镇江志》中灾害事件的记录,可以了解元代帝国政治与地方种植桑树及丝绸生产之间的关系,以及灾害的影响。元代地方志编纂者——俞希鲁(1279-1368年)在地方志中指出镇江地方的习俗、社会形态、建筑特征、景观和税收。在“土产”一章中,介绍了植物“桑”的外在形式与具体功能,从而证明镇江的桑树自元代已开始种植。但奇怪的是,镇江的各种地方志版本都没有记录到存在任何的蚕桑灾害。
薛凤团队利用LoGaRT来分析、解释这一奇怪现象。LoGaRT的优点有四。首先,允许对整个语料库进行文本/句法搜索与结构(节标题)搜索;其次,通过数据可视化进行概括性认知,以揭示信息的时空分布模式;再次,能够使研究者通过精读来调用个别案例进行检查与比较;最后,实现标记,这将有助于将定性的信息转化为定量结构。
针对大数据的分析,LoGaRT也提供了协助研究者探究未知信息的工具。以地方志而论,元代现存地方志覆盖的地理范围很小,但这对于理解宋辽金元时期,地方志为什么主要分布于中南地区意义非凡。绘制文本语料库的地理覆盖范围有助于研究者定性评估数据的基准分布,这也有助于解释地图上空白区域代表的是文本缺失或遗失。地方志的缺失会导致没有赋税或灾害的判断。
尽管断代史研究倾向于消解区域的差异性,但是地方志提供了观察地方实际状况的条件,有时甚至能看到这种状况随时间推移而动态变化的过程。显然,有关元代桑灾的地方志记载遍及整个北方,但在南方几乎没有出现过(见图1)。
图1 地方志中提到的与桑树相关灾害的地理分布
事实上,正如范金明教授指出,长江下游地区成为清朝主要的丝绸生产中心,这将使得地方官员对传播与蚕业有关的信息和灾害产生兴趣,从而整理过去的桑灾历史、以便将来使用。这表明,灾害记录一定程度上受到人为动机的影响。
对于这种认识,薛凤团队又提出疑问,是否应该假设南方的养蚕业比较稳定,且受天气影响的程度比北方低呢?囿于时代限制,《元史》编纂者主要依靠以往元代首府、北京及其附近的档案。元末战争导致地方档案的丢失,这严重影响了北方地区关于灾害地方记录。仅元代而言,在208个基于地理位置的桑灾记录中,有87件记录实际上与《元史》的记录相吻合,其他朝代的记录中符合正史的更少。地方志中关于元代桑蚕灾害的区域重点与《元史》相一致,河北(38.5%)、山东(44.4%)、河南(8%)和山西(9.1%)。
要证明造成灾害的环境原因是非常困难的。王培华认为,北纬三十到四十度之间区域主要遭受虫灾、霜冻或积雪灾害,很少会提及风雨灾害。东明县就属此纬度范围,但并非这些地区所有生产桑树的地区都会报告此类灾害事件。与王培华提到的北纬三十至四十度地带相反,地方志反应出山东省遭受霜冻灾害的危害更大,而遭受虫灾的危害更小;而河北省的情况则恰好相反。
作者认为,建立LoGaRT的主要目的就是使这种类型本身能够自查:无论地方制定标准、遵守标准还是忽略标准,诸如灾害控制是如何成为个人活动或公共活动的。分析人员在鸟瞰大数据和仔细阅读个案之间来回转换,有助于提出新的研究问题。首先,它能够研究地方志是如何出现、发展以及产生影响的。地方志虽各有不同,但均是经有意安排产生的,提供了地方化的重要信息来源,以此作为建构地方身份、归属感与历史感的基础。地方志提供了观察同权力产生必然关系的途径,即任何“给定的”、“不可避免的”或“有害的”或战争、定居、耕种产物的环境条件具有的政治性特征,以表明政治权力与中国灾害史的重要联系。
此项研究创建的数字化数据库表明,关于地方志的许多假设都还需要进一步研究,包括地方志是如何迄宋至明,逐渐传播与扩展,抑或这些地方志对灾害和赋税的提及是如何在区域内产生变化;以及地方志是如何塑造二十世纪八十年代对中国经济和马尔萨斯有关人口的假设。数字人文研究方法可以帮助研究者解决结构性的问题,运用到能够对中国灾害史特定类型的分析中。中国的灾害记录不仅提供了长篇幅的关于天气记录的报告,而且还提供了一种特定类型的记录,其中的日期、位置和严重程度需要经过仔细辨析方可使用。
发表评论