敬请关注并星标,欢迎点赞、在看、转发!
为学日益,渡人渡己。欢迎投稿!
作者:Diego Chapinal-Heras , Carlos Díaz-S´anchez
摘要:本文整理了人工智能在人文科学领域相关的贡献,介绍了使用到的不同应用、软件和技术的发展,旨在呈现人工智能在人文研究中的主要突破,同时指出研究案例的稀缺。人工智能的应用提供了许多融合的机会。通过本文的梳理和回顾,以期展示我们如何通过人工智能提供的不同技术和方法获益,并且表明人工智能具有较大的发展潜力。
来源:Diego Chapinal-Heras, Carlos Díaz-Sánchez,A review of AI applications in Human Sciences research,Digital Applications in Archaeology and Cultural Heritage,Volume 30,2023,e00288,ISSN 2212-0548,
关键词:人工智能技术;人文;人文科学;数字人文;历史;古文字学;碑文;考古学;历史学
一、引言
本人旨在回顾人工智能在人文科学领域的应用,尤其是在历史、文学和其它诸如古文字学、碑文及考古学相关领域的应用。出于不同的目的,人工智能已被广泛应用于其它的知识领域,例如商业运营提升、虚拟场景开发和卫生保健。联合国教科文组织将人工智能在教育领域的应用纳入了其《2030 年可持续发展议程》中。在人文科学领域中,人工智能的发展要相对缓慢。本文,我们将重点回顾人工智能在人文科学研究中已经开展或正在逐步开展的项目。
人工智能的含义、功能和使用多种多样。但其根本宗旨是确保机器能够具备解释外部数据、精准执行任务、从任务中自主学习并最终将所学知识运用到特定任务中的能力。要实现这一目标,主要途径是对大量的数据进行重新编译、分类和管理。通过采用一系列运算法则,计算机不仅能够精准地执行任务,还能够同使用该资源或工具的代理人互动并学会提高自身效率。
人工智能的发展经历了不同的阶段,逐步地融合更多资源,并具备了更大的潜力。事实表明,这一进步对其在人文科学中的应用产生了直接的影响。例如,通过文本加工识别术语和音译,我们能够部分或完整地修复零碎的铭文。软件受训练的同时也在学习。类似地,从最初的帮助减少工作量,现在人工智能能够掌握不同领域的一些专业技能。能够做到这点主要得益于深度学习领域取得的关键性进展,在该领域,允许机器像人类的大脑一样自主学习和思考。为做到这点,科学家们利用神经网络模型同步处理不同级别和水平的数据。在该领域,传统神经网络对于虚拟分析尤其有用。传统神经网络可同时适用于有监督的和不受监督的学习范式。在有监督的学习机制下,对系统的投入和预期产出是已知的,模型在两者之间形成一个学习地图。在不受监督的学习机制中,相反,给定的一组输入函数值不可知,模型需要去估算输入的数据样本的潜在分布。
另外一项进步显著的是自然语言处理,能够执行诸如文本恢复的任务。自然语言处理通过计算机系统自主习得的算法和不同的方法,促进人与机器之间用语言进行交流。
但值得一提的是,人工智能在人文科学领域的应用无法替代人类的工作。本文借鉴的所有研究都一致认为人工智能的主要目的是提供一种资源,帮助人们更快更高效地开展研究。毕竟,计算机比人类能够更加快速地处理大批量的信息。因此,人工智能应该被视为人文科学研究的一种有用的工具,而不是对我们工作的一个阻碍或威胁。实际上,常见的步骤是专家对人工智能执行的任务进行检查,查缺补漏,因为人工智能也无法保证100%的准确率。之后,检查者对发现的错误进行纠正。这个检查的过程相对不那么费时。在一些必须处理大规模数据的领域,人工智能的用途和好处是不可否认的。
使用这些新方法和资源对于所有知识领域而言都是非常关键的。如果Makridakis(2017)是对的话,这一代将视人工智能为一场比工业革命还更厉害的技术革命。铭记这点,在人文科学领域推动人工智能就尤为重要了。近几十年来,数字技术的发展给我们领域不同的学科带来了很大的变革。因此,这不是一个随时就可能马上结束的进程。以下部分涉及的资料呈现的是人工智能在不同研究领域的不同应用方式。
二、方法
本文涉及的资料主要通过两个途径获取。一是通过数据库,比如Semantic Scholar和 Google Scholar,以关键词“人工智能故地理学”“人工智能考古学”等进行检索。二是从近期出版物中整理资料。通过以上方式,我们收集和挑选出来了人工智能在人文科学领域的代表性贡献。
我们根据贡献度和人工智能的应用程度对资料进行分类。同时,每个主题我们按照时间顺序进行排列,以呈现新方法的新发现的渐进式融合。但是,在一些特定的情况下,我们也会将两种密切关联的研究一起呈现,因为他们反应了在某一方面研究的持续性。如此,我们能够了解到人工智能应用在文学、古文字学、碑文、考古学和艺术史方面的不同案例。
三、人工智能在人文科学中的应用
过去二十年,通用人工智能、自然语言处理和数据分析成为了数字人文项目中最常见的技术手段。通过采用不同的方法和技术,我们取得了有价值的结果。倘若只依靠传统方法,没有借助技术发展手段,我们需要再花费几十年的时间才能取得这些成绩。很大程度上来说,这是因为这些研究所涉及到的数据十分庞大,需要大量的专门人才才能处理。
文学方面,人工智能有了新的应用领域。2013 年,DiMaggio 等人组成的团队运用不同的算法,使用人工智能进行语篇分析,识别非洲出版社1986年到1991年间的模式或解释框架。这就减少了分析大量作品以辨别那个时期思想动态所需的时间。另外一个值得一提是Schoch开展的关于法国古典和启蒙运动时期文学作品产出的研究。该研究采用了自然语言处理领域的一种非监督方法——主题建模。这一方法能够在整个文本中找到主题模式和趋势。为开展这项研究,作者整理了1610年至1810年间的890部戏剧。不同级别的语义分析产生的结果均可接受,并且具有较高的精确度,体现了不同的主题。但正如作者所解释的,这些主题的分类尚需进一步的解释。同时,也使得验证次类型还包含一些不同的主题成为可能。
最近,Kontges(2020)尝试辨别古希腊最初的一千年间文献中反复提及并使用到的哲学思想流派的概念元素。该项研究采用的是隐含狄利克雷分布主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。使用的是Kontges开发的开放存取程序 Topan。在这个案例中,涉及的资料多达3千万个单词。比以往其他出版物的分析都更难的是,这些出版物是古希腊文撰写的。研究结果很好,并且证实人工智能能够从那个时期的哲学思想中提取参考资料。
对手写文件进行分析和加工是人工智能在文学和历史研究中的另外一项成果。据我们所知,第一项这种类型的古文书研究项目是由比萨大学 1999 年开展的。A.Sperduti 和A.Starita 教授带领的研究生团队发明了古文字检测系统软件,用于识别手稿中字母的相似性。这一技术能够识别不同类型的手写体,以及手写体的演变,进而帮助人们提升文件的准确性。但遗憾的是,该项研究未完成。但是,这一方法为数字古文,Wolf等(2011)称作“计算机化古文”奠定了基础。他们将其定义为“改善人类书法家分析的数字工具,具备大规模能力和基于证据的推理能力。”在这种趋势下,应用文体测量分析,一种根据手稿用途文本对比的信息技术就有很用了。
此后,有许多人工智能应用于文本分析,如内容检查。Batjargal(2010)等重点研究了传统蒙古文数字图书馆中的5万份手稿。借助人工智能,研究人员既可以从现代蒙古语(西里尔文)文本也可以从古文本中检索到文档和数据,且具有很高的精确度。同样在亚洲,Azmi(2011)等将比萨大学开发的古文书检测系统应用于7789份马来西亚语手稿。这项研究旨在基于写作风格的分析,推断出文本的日期和地理位置。考虑到包含空间和时间信息,研究主要通过用特殊材料——彩饰来装饰页面。
西班牙语方面,第一项研究是 Meza-Lovn(2012)开发的书写文本识别系统。这种方法通过图示和支持向量机技术转录历史文献。现代意大利语文献方面,Tuzzi 和Cortelazzo(2018)对40多位不同作者的150部作品进行研究,以期找出笔名为Elena Ferante 的作者。为此,使用了自然语言处理和风格分析。他们得出结论,笔名为Elena Ferante 的作者似乎与知名小说家Starnnone 有些许关联或受到一些影响,尽管仍无法肯定两者就是同一个人。
近年来,人工智能在人文科学领域取得了很多高质量的进步。例如,Kang等(2021)研究了韩国14至20世纪乔森王朝年鉴和皇家秘书日记。本研究分别涉及5千万和2亿4千3百万的字母。研究队伍通过多任务方法旨在修复文件受损部分并翻译为现代语言。这项研究的基础在于人工智能学习的自注意力机制,该机制能够处理更多的文件。
人工智能在古文字学中的另一个用途是辨别署名为“匿名”的手稿的作者。这一方法涉及光符识别和风格分析。最近,Guellar 和 Vega Garcia-Luengos(2023)的西班牙团队,成功将喜剧《法国女人劳拉》和《洛佩德维加》联系起来。手稿收藏于西班牙国家图书馆。通过借助手写文本识别软件Transkribus 进行文本是写,研究人员能够将西班牙文学黄金时代的文件转录为现代语言的文本。该项目从那个时代的文学体裁中提取了300万单词。
古典时期取得的一些进步也值得一提。自20世纪末珀尔修斯计划启动以来,无数的研究借助信息技术处理文本及其它不同元素。人工智能同新技术的使用相融合。2018年,谷歌开发的一种预训练的自然语言处理模型(BERT)带来了新的机遇。该项技术的主要功能是对自然语言处理的预训练,协助系统能够提升分析和阐释能力。BERT带来了自然语言处理的重大突破,其是一种基于上下文的嵌入模型。这意味着每个单词是在句子的情境中进行考虑,为此能提供更精确的理解,尤其是对于有多种意思的单词,可以通过上下文来确定意思(Ravichandarain,2021)。
很多研究人员将BERT技术应用到特定的语言中。一个很好的例子是Bamman和Burns(2020)年建立的拉丁文处理模型,涵盖了公元前200 年至今的拉丁语资源。尽管现在古拉丁语已经没有再被使用,BERT 技术通过分析6亿4270 万的字符能够处理这么长一个时期内不同文本中拉丁语的使用和进化。得益于该技术,软件能够修正不完整的文本。具体来说,该模型估算单词概率,使得研究人员能够选择出每个案例最匹配的单词。
古碑文领域最早的相关研究开始于 21 世纪初对文多兰达文本的研究。其中一个考古遗址古罗马兵营位于罗马不列颠哈德良城墙附近,发现了大量的油墨碑。这些史料包含了很多曾经居住在那的军方和个人信息。M.Terras 在其 2002年的博士论文中利用计算机技术分析以上文本,并于四年后出版了该著作(Terras,2006)。这一方法对文件进行加工,确保计算机能够像古文稿学家一样阅读,进而协助研究者。后续,Roued-Cunliffe(2010)深入了该项研究,他使用决策支持系统网页应用程式DUGA,并开发了基于知识的APELLO网页服务。这一服务需要对文多兰达数据集重定格式,转换为标准通用标记语言。这拓展了记录和读取字板的可能性,包括修复丢失的单词或字母。
同时,借助信息技术资源,过去二十年间碑文学取得重大进展。较早的一项研究是Tracy 等(2007)开展的,他们尝试在整理古雅典碑铭时辨别字母切割的手艺。第一次的研究对象仅有6份文件,但也足以展示技术的潜力,成功将字母笔划中蕴含的信息转换为数学公式。从技术层面而言,该方法不属于人工智能领域,而是采用了数学运算进行加工。尽管我们认为这是对人工智能应用相关的进展,研究并没有用到某种特定的软件确保通过训练而学习。该方法之后得到改进并被前面提及的一些其他研究者采用,他们研究了24篇雅典碑文,并辨别出六种不同的执笔者。
自此,人工智能被世界各地广泛应用于碑文研究。Soumya和Hemantha Kumar(2014)采用随机森林分类检测印度一种古语——卡纳达语书写的文件,以拟定年表。Gan 等(2016)研究Mayan 字体,主要是对其进行可视化分析。具体而言,他们用稀疏自编码器单隐层网络的模型参数测试结果是否和传统描述符结果一致。苏美尔文明方面,Page-Perron等( 2017)基于自然语言处理无监督方式和神经机器翻译做了开展了一项研究,帮助翻译大量的苏美尔语文件,这些只是我们所知的10%的保存的铭文。Luo等(2019)通过神经解密算法对近东乌干达文本和迈锡尼希腊语进行研究。
Amato 等(2016)开展了希腊语和拉丁语文本的研究。该项目在鹰形网络框架内展开,整理了那些文化中的碑文。团队使用费舍尔向量对当地的描述符和各种类型的卷积神经网络进行编码。借助于这些技术,利用图片查找工具对数据库中的图像进行检索和匹配。
本领域最近的贡献来自于Assael的团队。他们首先开发了PYTHIA,一种全自动深度学习模型,通过预见组成假设修复体的字符序列修复古希腊碑文。该团队还借助了 PHI-ML,一种机器可操作的包含超过 320 万单词的数据集(Assael2019)。最近,该项研究随着伊萨卡,一种应用深度神经网络提升分析和古希腊铭文修复的软件,取得了更大的进展。和PYTHIA以及其他研究一样,伊萨卡基于重复的公式、模式和表达。通过文本和上下文平行,该系统能够对铭文的地理和时间有较高的精确度。该机器数据集包含76608 份铭文。一得出结果,研究人员只需对其进行检查,确认是否还需进一步修改(Assael等2020)。
人工智能在考古学领域也取得了进展,主要在深度学习、数据处理和分析方面,主要用于远程信息处理前景和遥感。无人机在该领域的使用最为常见。有软件在远程信息调查时使用深度神经网络辨别史前古器物和结构。这些系统采用自主学习和深度学习算法加对远程遥感发现的器物进行处理和分类,使得自主辨别和分类更加便捷。
Orengo and Garcia-Molsosa (2019)引入人工智能自主学习算法到无人机,通过高清晰度的远程遥感系统更快地开展调查,并辨别地表和地下特征。这节约了人力和财力资源。同样的,Caspari and Crespo (2019)运用同样的技术远程发现墓地,促进分析过程以及追踪埋葬痕迹。Berganzo-Besga et al. (2021)使用自主学习算法,通过光谱遥感和激光雷达探测伊比利亚西北部的墓地。另一个相关应用是Domínguez-Rodrigo 等(2020)开大的软件,运用大数据研究不用的骨头痕迹。人工智能技术能够识别每种类型的痕迹并进行诠释。
艺术史领域,人工智能基于图像扫描和仿真,能够和大视觉数据合作。通过算法,能够识别一些存在疑惑的或匿名的作品。其他一些比较有代表性的结合历史和艺术史的研究,得益于DIMH。这个研究旨在开发工具,承担语义标注,信息查找,提取文本中隐含关系和结果可视化的任务。
四、讨论与结论
尽管人工智能在数据加工和分析方面有优势,但其在人文科学领域的应用仍较少。主要原因主要有:资金成本、人工智能程序设计加工和算法的复杂性、数据库的使用等。同时,人文领域传统研究动态的改变比较缓慢。其他知识领域,新技术的应用意味着核心进展。而在历史和文学研究中,情况更为复杂。尽管如此,新技术正逐渐地融入。借助新技术,我们可以更高效和精确地处理数据。
本文论证了人工智能在人文科学领域的潜力。描述了近年来采用一些不同方法和技术的,在数据分析领域取得的代表性突破。一个学者可能需要花费几年时间才能完成的任务,人工智能软件可能在几周甚至几天内完成。人工智能的角色应该是协助研究者的工具,而不是取代研究者。人工智能技术也不是一种不需要人类进行干预的技术。学者对软件结果进行完善、修改和拓展是非常关键的。
目前关于人工智能在人文领域的应用的关注仍然比较少。尤其是在美术史和考古研究方面。本文中提及的人工智能的贡献主要集中在实物遗存的调查方面。人工智能和地理信息系统提高了对结构、建筑与城市发展模式的辨别效率。这意味着挖掘有助于对该领域有更深的理解。然而,人工智能在考古领域的很多应用尚在胚胎期。比如,对已发现的挖掘和存储物的定性和定量分析。毫无疑问,还有很多的可能性,比如寻找普遍的或不同的模式,采购原材料生产特定物品。这些自动化研究能够帮助专家在更短的时间内完成研究。
发表评论