当前位置:网站首页 > 社会 > 综述 |“数字人文”的产生、发展与前沿

综述 |“数字人文”的产生、发展与前沿

综述 |“数字人文”的产生、发展与前沿综述 |“数字人文”的产生、发展与前沿

数字人文领域的知名学者、伦敦国王学院的Willard McCarty教授及其同事Harold Short对该图进行了深入阐释,他们认为图中央区域指的是数字人文研究的方法论共同基础,它们是数字人文的核心,包括各种可计算的基础数据对象,如自由文本、格式化数据、图像、声音等。针对这些数据而进行的计算活动包括文本分析、数据库设计、数字绘图、音乐检索等。

数字人文的方法论基础并不稳定,它们随着信息技术的发展而不断变化和扩展,这其中最关键的技术是现代通讯技术、超媒体和数字图书馆等基础性研究平台。图中上部分的方块代表的是各种科学共同体,如文学与语言学研究共同体、历史研究共同体、哲学研究共同体等。双向箭头代表不同的科学共同体与不同的数据类型和计算方法之间的对应关系,这种对应关系也并非固定的,它们随着研究条件和信息技术的发展而不断变化。图中下半部分的云朵表示不同的学科及其子学科使用的具体方法[3]。

这幅知识地图不仅解构了数字人文研究的学科定位和学科框架,还指明了数字人文研究的核心在于通过将研究对象数字化来支撑、保障和创新人文科学研究的内容、方法和模式,其未来发展方向是在数字环境下系统化探索新的人文研究方法论基础,以保障人文研究的可持续化。

数字人文的发展沿革

Digital Humanities作为一个学科名称和专业术语,是从Humanities Computing发展而来的。早期的人文计算发端于文学和语言学领域。从Roberto Busa对语言计算的初步探索算起,人文计算的发展已有近50年的历史。文学与语言学计算协会(The Association of Literary and Linguistic Computing)和《文学与语言学计算》(Literary and Linguistic Computing)期刊分别于1973年和1986年建立和首次发行。此后,人文计算研究的队伍日益壮大,研究对象的形式也从电子文本逐渐扩展到多媒体。

20世纪90年代初期,人文计算作为一个独立的交叉学科逐渐成形。1999年,McCarty讨论了人文计算作为一个独立的学科与其它学科的关系[4],以及如何在制度和学术层面来为人文计算活动提供切实的保障和支撑。

90年代后期,人文学者开始越来越频繁和深入地使用各种新型的数字技术处理人文资料,并进行人文知识生产,如创作电子文本、扫描古籍图书和绘本、使用虚拟技术复原古建筑模型和历史上的都市、开发和建设各种在线的声视频数据库等。人文知识的可计算性快速从文学和语言学领域向历史、音乐、艺术学等多个领域扩展。在这一进程中,数字原生数据越来越多,如数字地图、计算机图像、在线网页、虚拟人物等,它们的产生极大地丰富了人文研究的对象,同时也对人文计算的定义产生了深刻影响。

互联网的快速普及也给人文研究带来重大变革。互联网不仅改变了人类社会的生存环境,也促使人文研究的基础从印刷文本向超文本全面转型,各种用于人文知识共享的学科门户纷纷建立,由此导致人文知识的创作、传播和共享都呈现出网络化趋势。在此过程中,很多人文学者开始使用含义更为丰富的“数字人文”这个学术术语代替范围较为狭窄的“人文计算”,以突现其学科范围的扩展和研究活动的数字化烙印[5]。

目前,无论是从研究项目的主题、学术机构的名称,还是已发表论文的题目来看,数字人文研究的学术共同体已经相当清晰[6],[7]。各种数字人文研究学会和专门的研究中心遍布全球,很多数字人文研究项目和研究成果也已经获得政府和学界的资助与关注。人文计算领域影响力最大的文学与语言学计算协会、人文领域计算机应用联合会(The Association for Computers in the Humanities)和数字人文学会(The Society for Digital Humanities / Société pour l'étude des médias interactifs)还联合组成了国际上最大的数字人文联盟组织——国际数字人文组织联盟(The Alliance of Digital Humanities Organizations)。目前,该联盟拥有四本同行评审期刊,向全球传播数字人文研究的理念、方法和成果。这四本期刊分别是牛津大学出版的《Literary and Linguistic Computing》期刊、加拿大麦克马斯特大学出版的《Text Technology》电子期刊、在线预出版物《Computers in the Humanities Working Papers》以及该联盟自身的专业电子刊物《Digital Humanities Quarterly》。该联盟每年召开一次数字人文年度大会,最近一次会议在美国马里兰大学召开,来自全球各国的近300名数字人文研究者集中展示了各自的研究成果和研究进展。

国际数字人文研究现状

01

整体情况

目前,全球范围内的数字人文研究中心不下20家,主要集中在欧美日等发达国家,其中较为知名的研究中心包括:伦敦国王学院的人文计算研究中心、美国斯坦福大学的计算机辅助人文研究中心和斯坦福人文实验室、麻省理工学院的Hyper studio、南加利福尼亚大学的数字人文研究中心、马里兰大学的人文技术研究机构、伊利诺伊大学的科学与学术情报研究中心、日本立命馆大学的京都数字文艺研究中心等。数字人文研究项目也已经在文学、历史学、艺术等多个领域得到展开,知名的项目包括:JSTOR Data For Research、Google Book Search、 Perseus Project、Crowds、The MONK project、Zotero、Text Analysis Portal for Research、ANDS、中国哲学书电子化计划等等。由于数字人文项目不仅涉及传统的人文领域,还涉及数字图书馆和数字博物馆建设,所以这些项目不仅受到像美国国家人文基金会(NEH)、日本科学技术振兴机构(JST)、德国研究基金会(DFG)、英国信息系统联合委员会(JISC)、加拿大人文社会科学联合会、澳大利亚联邦政府创新、产业、科学与研究部(DIISR)等国家级的科研基金会和科研管理机构的资助,还受到了包括梅隆基金会(Mellon Foundation)、麦克阿瑟基金会(MacArthur Foundation)、国际图书馆联合会(IFLA)、图书与信息资源委员会、美国博物馆和图书馆学会等众多公共基金会和专门的图书馆联盟和文化遗产保护机构的资助。

02

美国的情况

美国的数字人文研究较为领先,研究团队众多,研究项目也十分丰富。美国国家人文基金会(NEH)认为数字技术在改变人文学科方面有着巨大的潜力,同时也会改变人文学科的知识、教学以及规划和设计。2006年该基金会专门设置了数字人文办公室用于推动数字人文实践项目的发展。2007年2月,该基金会资助布鲁克林大学考古研究中心,探寻使用数字激光扫描和三维定量制作古美索不达米亚楔形文字板的数字模板的可行性。这些数字模板可以让学者们连接零碎的文字碎片,以此推断这些碎片是否出于同一篇文章,从而使大量地复制楔形文字成为可能,这将更有助于学术研究和展览。2008年资助佛罗里达州的一所大学,利用多媒体和地球空间信息技术,以数字化方式重建重现1964-1965年的纽约世界博览会,使游客们在真实的博览会场景中获取档案文件、图片和电影镜头。目前,该基金会正在资助德克萨斯州的农业机械大学,利用高动态图像技术,促进建筑遗迹的档案整理工作。此外还有一个旨在推动16世纪文艺复兴时期音乐的研究和学术交流的开放源码数据库和合作数字论坛。2009年初,美国国家人文基金会将数字人文办公室升级成了一个永久性机构,展示了基金会对数字人文的重视。

03

欧洲的情况

欧洲的数字人文研究起步较早。欧洲科学基金会人文常务委员会(ESF/SCH)对数字人文也给与了高度关注,并联合IEEE举办了多次e-humanities会议。欧盟数字图书馆也于2008年11月在布鲁塞尔正式启动,该图书馆门户网站包括各种书籍、音乐、绘画、照片和电影等各种信息和数字资料,该图书馆的启动为欧洲的数字人文研究提供了极大的便利。欧盟资助的专门的数字人文项目包括公共语言与技术基础平台项目(CLARIN)和DARIAN项目。在欧盟众多国家中,英国的数字人文研究走在了前列。英国信息系统联合委员会(JISC)已经资助了多个数字人文项目,例如人文万维网项目(World Wide Web of Humanities),其目标就是利用开源软件采集互联网档案为英国的数字人文研究建立一个框架和数据集合;TextVRE项目则是为数字人文研究中文本分析提供全生命周期的服务,以帮助人文学者处理和分析研究数据。在大学方面,英国的伦敦国王学院和曼彻斯特大学的数字人文研究在全球处于领先地位。此外,法国、德国、意大利、西班牙等国的人文学者也都已经开始了数字人文研究与实践。

04

日本的情况

日本政府近年来致力于尖端科学研究,借助于COE和21GCOE两个项目,日本政府在多家大学择优支持建立了多个全球领先的科研机构,这其中就包括日本立命馆大学的京都数字文艺研究中心。该中心致力于京都文艺的数字人文研究,借助于GIS、视频扑捉、虚拟现实、3D建模、网络数据库和Web2.0等多种技术创新日本和京都的历史与文艺研究、教育和传播方法与途径。该中心每年接受的资助经费超过2亿日元。中心与日本任天堂游戏公司的游戏研发中心合作紧密,研究成果直接推动了日本文化在电子游戏中的展示,由此极大地促进了日本传统文化和文艺的延续、发展和全球化传播。在2009年3月,该中心召开了一次数字人文国际研讨会,与全球多国的数字人文学者开展了学术交流和对话。目前,该中心正在成为全球数字人文研究的重镇。

05

港台的情况

由于港台人文学者与西方人文学界的合作较为紧密,交流较为频繁,所以港台的数字人文研究发展步伐也较快。在GIS技术与历史学交叉研究方面,台湾中央研究院开发了中国历史文化地图系统(CCTS)和台湾历史文化地图系统(THCTS),这两套系统已经在台湾历史学界产生广泛影响。近两年来,台湾人文学界对数字人文的研究热情逐渐高涨。2007年6月,台湾中正大学人文研究中心协同台湾中央研究院人文中心GIS专题组和中正大学历史学系举办了地理资讯系统与人文研究研讨会。2009年1月,国立政治大学文学院身体与文明研究中心、历史学系和地政学系联合召开了2009人文地理资讯系统研讨会。此外,国立台湾大学数位典藏研究发展中心,也将于2009年12月召开数位典藏与数位人文国际研讨会。此次研讨会的中心议题包括:艺术、文学、音乐、历史方面的计算机应用研究、数字典藏和数字语料库建设、人文领域的电子数据获取与分析、文本挖掘、可视化与图形化的应用、存档与图书馆领域的IT应用、数字档案的文化影响、GIS等。这些主题基本上涵盖了当前数字人文研究的所有前沿领域。

香港的数字人文研究刚刚开始起步。2009年3月,香港中文大学太空与地理信息科学研究所联合北京大学历史地理研究中心、台湾大学地理环境资源学系联合召开了“空间综合人文学与社会科学论坛”,研讨了地理信息、地理信息系统、空间分析方法、空间模拟方法在历史学、经济学、政治学、考古学、人类学、社会学、人口学、犯罪学、城市学、语言学、景观学、旅游学、宗教文化、文化遗产、新闻学等人文社会科学领域的应用问题。2009年5月,香港城市大学中文、翻译与语言系召开了首届亚洲数字人文小型研讨会,主题为“全球科技与地方知识”。这两个会议彰显出香港的人文学者正在紧跟数字人文的发展。

06

大陆的情况

与西方的人文研究相比,大陆的人文学者对计算机技术的应用研究并不算落后。目前,大陆的人文计算研究主要集中在GIS与历史学交叉领域,如复旦大学历史地理研究中心与美国哈佛大学东亚系、哈佛燕京学社、澳大利亚格林菲斯大学亚洲空间数据中心、数字化文化地图集行动计划( ECAI) 等机构从2001年开始合作,共同建立了一套中国人口地理信息系统。此外,武汉大学的历史学院与武汉大学国家遥感工程重点实验室开展了密切合作,南京师范大学在华夏家谱GIS平台构建方面进行了尝试,而中国社会科学院与北京超图软件股份有限公司也于2009年3月联合开发成功了《中国社会科学综合地理信息服务平台系统》。

在古代文学研究方面,北京大学中文系开发了全唐诗电子检索系统,该系统能智能化的分析古代诗词的韵律信息。开始于2004的中国国家数字图书馆工程也已经建设了包括馆藏甲骨实物与拓片数字化资源库、敦煌遗珍数字化资源库、民国图书数字化资源库、馆藏年画数字化资源库等多个数字人文资料数据库,这些数据库的建设为我国数字人文研究与教学奠定了良好的基础,但目前大陆的人文学者对数字人文学科的发展关注不够,由此导致众多人文与计算机跨科研究仍处于一个自为状态,缺乏数字人文理论的有效支撑和指导,由此限制了人文计算的可持续发展,更不利于传统人文的突破创新和研究范式的革命性升级。

数字人文的实践前沿

数字人文是一个正在快速发展中的文理交叉学科,其研究内容和研究边界随着数字技术的发展和深入而不断被改写。从目前国际数字人文研究趋势来看,以下六个方面是数字人文实践前沿。

01

历史学方面的基于GIS的历史地理可视化

在历史学研究方面,越来越多的学者开始借助GIS技术进行历史知识和历史事件的静态和动态的可视化展示研究。哈佛大学的地理分析研究中心与中国合作者共同完成了中国历史地理信息系统。美国加州大学圣达巴巴拉分校的空间综合社会科学研究中心(CSISS)和英国伦敦大学学院(UCL)的高级空间分析中心(CASA)都集聚了GIS、地理学、经济学、物理学、计算机科学等多学科的专家,集中研究社会经济系统在时空演变中的客观规律以及相应的政策与规划手段。北京的“虚拟故宫”和日本立命馆大学矢野桂司教授开发的“虚拟京都”也都吸引了大众的眼球。最近美国德克萨斯州立大学的芦咏梅还利用GIS技术研究了毒品犯罪在城市建成区的空间分布。总的来看,目前GIS技术在历史领域的应用可以总结为三个方面:展示历史地图资料的数字化、空间历史数据的管理和可视化和基于空间分析方法探知历史过程[8]。

02

文学方面的文本挖掘与TEI标准

随着数字出版浪潮的兴起,越来越多的文学出版物被制作成电子文本,这为文本挖掘提供了便利。在1981年首届国际《红楼梦》研讨会上,美国威斯康大学的陈炳藻发表了《从词汇上的统计论作者的问题》一文,他首次借助计算机进行了《红楼梦》研究,轰动了国际红学界。陈炳藻从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为一百二十回均系曹雪芹所作。这一研究体现出字词统计分析已经成为一种特殊文学研究方法,特别是在作者鉴别和文学风格和文学流派分析上已经显示出其强大威力。

为了提高电子文本的规范化和标准化程度,计算机与人文联合会(Association for Computers and the Humanities),计算语言学联合会(the Association for Computational Linguistics)与文学与语言学计算联合会于1987年成立了文本编码组(Text Encoding Initiative,TEI),并随后发布了多个文本编码标准。这些标准主要面向于人文社会科学研究,其目的是便于机器编码和识别,提高数字文本的传播、分析和教学效率。目前,TEI主要由英国牛津大学、美国布朗大学、美国维吉尼亚大学等机构资助,其标准已经得到数字人文学者广泛支持。这些标准的实施为人文社科领域的文本挖掘提供了极大的便利。

03

语言学方面的基于大型语料库的语料库语言学

计算语言学是通过建立形式化的数学模型来分析和处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的的一门学科。1990年8月,在赫尔辛基召开的第13届国际计算语言学大会上,大会组织者首次提出了处理大规模真实文本的战略目标,并在会前组织了“大型语料库在建造自然语言系统中的作用”、“词典知识的获取与表示”和“电子词典”等专题讲座,预告了语言信息处理的一个新的历史阶段即将到来。近年来,计算语言学者在语料库的建立和开发中逐渐创造了一些独特的方法,提出了一些初步的原则,并且对这些方法和原则在理论上进行了探讨和总结,逐渐形成了“语料库语言学”(corpus linguistics),这是语言学和计算机科学交叉形成的一门边缘学科,它主要研究机器可读自然语言文本的采集、存储、检索、统计、自动切分、词性标注、语义标注,并研究具有上述功能的语料库在词典编纂、语言教学、语言定量分析、词汇研究、词语搭配研究、语法研究、多语言跨文化研究、法律语言研究、作品风格分析等领域中的应用。[9]

我国的计算语言学和语料库语言学发展较为迅速,目前已有的计算语言学和语料库语言学专门研究机构包括北京大学计算语言学研究所、台湾中央研究院语言学研究所、中国教育部语言文字信息管理司牵头成立的“国家语言资源监测与研究中心”等,这些研究机构都已经建立了面向各个领域的大型语言语料库,从根本上改变了传统语言学研究的范式。

04

舞蹈方面的视频扑捉、运动分析与虚拟现实再现

利用计算机视频扑捉和运动分析技术进行人体运动轨迹的建模是一个十分前沿的研究方向。该技术可以构建人体运动模型,进而为制作虚拟人物提供数据基础。目前该技术已经被广泛应用与电影制作以及虚拟场景和虚拟人物制作。由此技术构建的虚拟人物可以达到与真实人物几乎一模一样的运动姿态,这为传统舞蹈在虚拟现实场景中的再现提供了便利。日本立命馆大学影像学部的研究员已经利用该技术在Second Life(网络3D游戏)中建立了一个虚拟的剧场表演日本传统舞蹈,这种舞蹈可以称为“数字舞蹈”,它在游戏开发和网络文化传播方面拥有巨大的发展空间。

目前,我国的人文社会学界还没有利用该技术展开相关的学术研究。国内该项技术的专门研究机构也较少,较为知名的虚拟现实实验室包括中国科学院计算技术研究所虚拟现实技术实验室、武汉大学虚拟现实实验室、北京航空航天大学虚拟现实技术与系统国家重点实验室等,这些实验室主要从事虚拟场景和虚拟建筑方面的研究,较少从事人体运动和虚拟人物研究,所以在这一方面我国基本上还处于空白阶段。

05

考古学方面的图像分析、色彩还原和数字重建

计算机技术在考古学方面的应用已经不再陌生,除了利用数码扫描仪对古籍和文物进行2维或3维扫描之外,考古学者还利用计算机进行了3维虚拟遗址绘图、文物虚拟复原、色彩还原、古代语言分析等工作。例如,在甲骨文研究方面,利用甲骨文信息管理系统,研究者可以将甲骨文词汇类聚,研究者可以根据断代、祭祀、军事、战争、职官、尤其是地名,调阅有关资料,这给甲骨文学术研究带来很大的方便,是学者繁琐的资料查阅工作中解放出来,极大地提高了研究的效率。

计算机技术除了在研究方面拥有巨大作用外,在考古教学和宣传方面也大有用处。虚拟的遗址场景可以给学生或普通大众带来身临其境的感觉,进而提高了考古学的吸引力。总的来看,计算机技术已经并且正在深刻改变着考古学的传统面貌。

06

数字图书馆和网络数据库

为了提高人文社科领域的知识共享水平,越来越多的图书馆、博物馆、文化机构以及大学科研机构开始进行人文资料的数字化和网络化,大量的人文主题网站、专题数据库被建立和向大众公开。它们不仅丰富了数字图书馆的内容,也加快了人文学者间的知识共享以及人文知识的大众化普及。支撑数字人文研究是数字图书馆建设重要的目标之一。在这种应用驱动下,人文知识的网络数据库正在健康有序发展。

总结与建议

随着e-science的深化,计算机技术对人文社会科学研究的影响越来越大。人文社会学者与计算机学者的跨界合作研究已经成为一种流行趋势。从欧美发达国家的数字人文发展历史来看,数字人文学科的建设必须关注三个方面:①建设和开发一批人文数据库和基础性应用软件;②发展一般性的研究方法来理解和分析新的数据集合;③开展新的学术研究,创新人文社会科学的研究方法和研究范式。

随着我国各种科学研究保障平台的完善,数字人文学科的发展条件已经具备。为了加快我国人文社会科学研究方法创新,学术界和教育科研管理部门还需创新教学培养和科研管理机制,从以下四个方面着手推动数字人文研究、教学与实践的发展。

1. 设立专门的数字人文跨学科研究中心。鼓励各高校跨院系成立以传统人文学科为核心的数字人文研究中心,实现文理学科之间的优势互补和资源交叉,同时创新人员管理机制,便于跨学科研究和资源分配。

2. 加大对数字人文研究项目的资助力度,重点研发和建设一批数字人文研究基础软件,以改善我国数字人文研究的基础条件平台,方便个人和团队开展数字人文研究和知识共享。

3. 通过联合培训、短期培训班和暑期学校(Summer School)提高人文社会学者的信息素养和计算机应用水平。修订人文类学科的学生培养方案,增加计算机通识教育,使学生了解更多的信息技术,知晓如何进行数字文化资产的生产、存档、管理、交付和长期保存。

4. 鼓励我国的人文学者积极参加国际上的数字人文专题会议和组织联盟,争取与国外的人文学者共同开展数字人文项目,共同推进我国人文研究的进步。

参考文献

[1]Busa, Roberto. 'The Annals of Humanities Computing: The Index Thomisticus’, in Computers and the Humanities, 1980, 14: 83-90.

[2]Schreibman Susan, Siemens Ray, and Unsworth John eds. A Companion To Digital Humanities, Blackwell Publishing, 2004.

[3]

[4]McCarty, Willard. Humanities computing as interdiscipline. Is Humanities Computing an Academic Discipline? Paper delivered at IATH, University of Virginia. 5 November 1999.

[5]Wang Xiaoguang, Mitsuyuki Inaba. Co-word Analysis of Research Topics in Digital Humanities. In Proceedings of the International Conference of Digital Humanities 2009 (PP: 148-150), USA: 2009.6.

[6]Warwick, Claire. No Such Thing as Humanities Computing? An analytical history of digital resource creation and computing in the humanities. Paper presented at ALLC/ACH 2004, Gothenburg. 2004.

[7]Schreibman, S., R. Siemens, and J. Unsworth, eds. A Companion to Digital Humanities: Blackwell Publishing, 2004.

[8]李凡. GIS在历史、文化地理学研究中的应用及展望. 地理与地理信息科学, 2008, 24(1).

[9]

上一篇: 第十四章 社会优抚制度——军人社会保障.ppt
下一篇: 数据见证新时代伟大成就

为您推荐

发表评论