数字人文已经成为国内历史学研究中越来越流行的一个概念。有关这个概念对历史学研究的影响,讨论、会议在过去的六七年间也越来越频繁。与此同时,也有越来越多的历史学者参与到数据库建设与数字工具开发。12月7日,来自中国人民大学、复旦大学、云南大学、上海图书馆、上海交通大学等多个科研院所的学者汇聚于上海交通大学人文学院历史系,举办“数字人文与史学研究视野的拓展”青年工作坊,共同讨论数字人文为历史学研究拓展新的空间的可能性。
与会学者合影
历史学研究中的“史料”通常总是人类历史记忆的不同形式的遗存。数据库与数字工具提供了面对这些历史记忆的新的方式。夏翠娟(上海图书馆)以上海图书馆藏家谱为例,尝试将历史记忆可视化,试图在提供文献服务之外,为大众和研究者提供更优质的数字人文服务。在家谱文献数字化的基础上,将文献中的内容文本化、数据化,并提供了开放的API接口,使得数据艺术家可以获取数据,将家谱世系表以三维的数字树形式呈现,为家族记忆赋予艺术的美感;通过将家谱中记载的移民事件数据化并在地图上展示,使得以静态文本记载的移民记忆成为可交互、可展演、可远观全貌、可细察个案的动态图景;通过提供在线的众包工具,使得公众和研究者可以参与到家谱数字化的过程中,丰富家谱的内容,试图实现资源公共价值的最大化。
中国家谱知识服务平台
复旦大学正在建设的《中国社会生活资料数据库》则聚焦于当代中国私人生活中的情感与记忆。承载这些情感与记忆的书信、日记数以万计,其形式、体裁也各异,因此,如何设计一种适用的元数据格式应用于这些资料是数据库建设中的难点。李甜(复旦大学)强调,这些资料最重要的特点是“信息传达”与“情感对话”,元数据与数据库的设计,也力图传达资料这种特征。如果分析某一个群体或者时段的词汇的变化,或许可以观察到当代中国人整体心态的变化。然而数据库建设仍然十分具有挑战,焦点在于如何分级和阅览,目前还在探讨之中。
如何在历史学理论、史料学当中理解近年来蓬勃发展的史料数据库建设,也是此次工作坊的讨论热点。任玉雪(上海交通大学)指出,目前历史学界流行的数据库可以分为检索型数据库与量化数据库。检索型数据库主要提供史料的全文检索,量化数据库则试图通过建立若干变量,分析史料的时间、空间等属性。制作量化数据库的难点在于如何设计并提取变量,这又要求能够从整体上把握史料。在这个意义上说,传统的文献学考据仍是史学研究的基本方法。在建设与应用量化数据库时,都要做数据清理的工作,这其实与考据工作有异曲同工之处。
大部分史料是以描述的形式记录的,描述方法在史学研究中具有无法替代的优势。但是,如果发现规模庞大的适合建立量化数据库的材料,定量分析方法在处理大数据方面,则展现了独特的优势。两种方法并没有孰优孰劣,切合研究主题和史料情况,充分发挥各种方法的长处是最为重要的。考据是历史学的根本方法,在量化数据库的构建和定量分析的过程,也至关重要。
作为量化数据库的尝试,胡恒(中国人民大学)与蒋勤(上海交通大学)都尝试对史料进行结构化处理。胡恒首先从制度史入手,分析了清代知府选任的三种途径:请旨缺、题调缺、部选,其中又以由皇帝决定的请旨缺明显多于后两者。进而,基于《缙绅录》的量化分析显示,担任知府实缺较多的是江苏、浙江、湖南、直隶等地人,其中又以民人占据绝对主体地位。另一方面,能够从知府一级成功向中央升迁的人数比例很低。通过结构化分析显示出的这些现象都有助于理解清代地方治理以及中央、地方关系中的机制困境。
蒋勤从生员层级的科举资料的量化分析入手,承继了何炳棣先生以来对科举与中国社会流动性的讨论。蒋勤指出,通过对南通、海门生员录、科名录的量化分析可以发现,科举选拔中,世家大族、官绅家庭的优势主要来自教育资源在家族内的传承,财富或权力的直接影响则比较微弱。何炳棣先生的研究没有直接讨论生员层级的社会流动,但目前的量化分析大体上支持何先生的总体论断。 GIS技术在历史地理学中应用已久,近来则在更多领域的研究中得到广泛运用。潘威(云南大学)以“黄河云”平台为例讨论“数字历史河流”研究平台的可能性。以历史时期保留的河工图、测绘图、工程蓝图、水利工程笔记为资料基础,模拟、重建历史时期河流水文的数字模型。这些数字模型既可以为历史学家提供历史水域场景重建,也可以为当下水利防灾提供场景模拟。
民国时期的实测地图是建立历史时期GIS分析的重要资料基础。党荧与徐建平(复旦大学)利用民国时期测绘地图分析近代中国城池规模与形态,他们的研究依据紧凑度估测了20世纪初中国城池、城墙形态的类型分布,量化评估了城池规模与行政等级的关系。赵思渊(上海交通大学)的研究同样使用民国实测地图。他提出一个问题,在建立乡、镇一级行政区划之前,江南乡镇志编纂中,对市镇范围的描述时如何建立的?例如清末的枫泾镇,记载在其范围内的村落有上百个,如果利用实测地图做分析,这意味着怎样的一个空间?进而,不论乡镇志或实测地图,都是对空间描述,这两种不同系统的描述之间的差异、重叠是否具有更大的阐释空间?
会议现场
圆桌讨论中,数字人文的发展为历史学带来的更多可能性成为讨论的焦点。夏翠娟提问,今天各个领域的学者已经建设了大量的专题研究数据库与数字工具,这些数据库与数字工具如何能够更为可持续地发展?历史学界与图书馆是否可能在数据库的长期运营与可持续发展方面进行更为深入的合作?与会学者都表示,共享而可持续的数据库建设无疑对于未来的历史学研究裨益良多。另一方面,值得思考的是,史料整理是史学研究的核心,史料整理常常也是史料解释的过程。随着史学研究方法的拓展,史料整理的方法也常常随之演进。数字人文与史学研究之间的关系,必然也要面对这样的演进。任玉雪提出了一个有趣的比喻:对于历史学来说,数字人文方法犹如一个“机械臂”,历史学有自身的核心方法论与核心议题,数字人文则是为历史学研究方法提供辅助,从而拓展历史学的研究空间。 作者:青木夏香(上海交通大学历史系) 责任编辑:于淑娟 来源:澎湃新闻