学术文本词频统计:马克思哲学思想史研究中的一个新视角
——从《回到马克思》第三版修订谈起
Word Frequency Statistics of Academic Text: A New Perspective in the Study of Intellectual History of Marxist Philosophy
--Talking from Revising the Third Edition of Back to Marx
张一兵
内容提要:学术文本词频统计,这是指统计一个思想家在其经典文本母语原文中居权力话语结构中的支配性概念或范畴出现的频率,并将其与不同时期中发生重要思想变异的文本的词频统计结果进行历时性比较研究的全新文献计量学方法。学术文本词频统计之所以必须建立在文本母语中,是因为在语言翻译转换中,新的翻译文字已经在一个陌生话语体系中被重新构境。词频统计本身并不直接产生文本分析的结果,而只能是对深度文本学研究进行辅助说明的一个实证科学的工具性手段。将这种文献计量学的方法引入对马克思思想史研究,无疑为正在深化的经典文本学细读提供了一个全新的思考维度。
关键词:文本词频统计 文献计量学 回到马克思 两次转变论 话权力语关键词消长
《回到马克思》一书自2009年出版它的第二版之后,先后获得国家新闻出版署“2010年度中国图书对外推广计划”(日文版)和国家社科基金首批“2010年中华学术外译项目”(英文版)的鼎力资助。也是在《回到马克思》的英文版和日本版的翻译工作基本结束之后,我停下了手中正在修改的《回到海德格尔》的第三稿,开始了长达一年多的本书中文第三版的校订工作。中文第三版,仍然保留了原文本的基本学术构境质性和总体场境支点。有变化的地方是:
首先,在这一次的修改中,我补写了关于马克思1843年《论犹太人问题》的讨论,特别是集中改写了赫斯 一节的内容。其中,包含了我对青年马克思与赫斯关系的一些新的想法。此外,在全书的修订的过程中,也有一些少量观点上的改写和文献补充。这次修订与前两版最大的不同之处,我直接依照MEGA2、NEW版等德文原文重新校定了马克思本文在中译文转译中的一些再现细节,并且修正了一些过去在中译文语境中明显误判。在本书第一版的写作中,我对MEGA2的文献引述基本上建立在先期的德文转译中文的基础之上,而这一次,则是直接依据德文。同时也因为,最近几年我正在为海德格尔的文本研究大伤脑筋,所以,年过半百的我不得不为德文的学习付出大量的艰辛努力。不过,现在看来这一切都是值得的。因为,也是在这一次的校订工作中,我才发现,原来自己十多年前“回到马克思”时所依据的主要文献《马克思恩格斯全集》中文第一版中相当多数的文本,竟然多半是从俄文转译而来的。一些极为关键性的概念和范畴,都基于前苏联专家在俄文语境中的理解之上的意译,比如,对理解马克思的哲学和经济学都十分重要的Vergegenständlichung(对象化)一词竟然在《1844年经济学哲学手稿》和《1857-1857年经济学手稿》的不少地方都被误译成“物化”;而Gemeinwesen(共同本质)一词则被译成“社会联系”;而有确定含义的Dasein(一定存在)与Existenz(生存)一同被混译为“存在”;马克思用以表征社会生活复杂关联性的概念群:Band(联结)、Beziehung (联系)、Verhältnis(关系)、Zusammenhang(共同关联),Relation(相对关系)等不同概念则被简单混译为关系(联系),等等。其中,有相当一部分内容在中文第二版中已经得到修订,但也有一些没有改过来。从马克思哲学文本的中译文具体讨论语境看,这些误译都已经导致了我们传统汉译文本研究中对马克思思想理解中的一定误识(Quidproquo),在这个意义上,我在本书第三版中的校订工作则具有了一种新的理论和现实意义。
其次,在这一版的改订中,我还对书中所依据的马克思的主要德文文本进行了文献学的不完全词频统计工作,我将这项新开启的工作称之为学术文文本词频统计学研究。这也是本文想重点讨论的一个问题。
之所以会进行这项词频统计工作,缘起于与日本学者望月清司的交道和教训。2009年,当我第一次在他东京家中访问他的时候,已经86岁的望月讲了这样一个故事:在上个世纪70年代,为了弄清楚马克思是否真的如布罗代尔所言,“从来没有使用过资本主义一词”,他花了数月,一页页细查了马克思主要学术论著的全部德文文本,最后,终于在《资本论》第2卷中查到了马克思“唯一一次”使用德文名词状态中的Kapitalismus的出处,从而证伪了布罗代尔的断言。为此,他大大地兴奋了一下。并且,他后来在每一次的课堂教学中,都让学生们去查找这一出处,“谁能查到这一出处,我就请他喝啤酒”。可是,从来没有学生喝到望月先生的啤酒。其实,当时我坐在他老人家的对面,脸上真是红一阵白一阵的,因为,多年以前,我在没有认真做文献学数据查询的情况下,就曾经很笃定地说过类似布罗代尔的话。日本学者的这种治学态度实在令我汗颜,这也让我下决心认真重做一下这项原文关键词的检索工作。
开始,我只是在对望月先生在《马克思历史理论的研究》 所提出的马克思明确在德文中所区分了市民社会和资产阶级社会的说法存有疑虑,因为过去我们只知道马克思在1940年代至1850年代在德文中使用的bürgerliche Gesellschaft一词组,在中文翻译中,通常译者会依马克思文本的不同语境将bürgerliche Gesellschaft分别译为“市民社会”和“资产阶级社会”,可是从来没有听说马克思真的直接使用过两个不同的德文词来界划这两个概念。望月先生的这一观点对于我们科学理解马克思对资本主义批判的科学认识的形成具有极为关键的意义。有趣的是,望月先生在《马克思历史理论的研究》一书中竟然真的给出了存在马克思文本中的两个不同词组,资产阶级社会(Bourgeoisgesellschaf)和市民社会(bürgerliche Gesellschaft),并将其与马克思后来使用的“资本主义的社会(Kapitaliste Gesellschaf,望月先生执意要将此词日译为“资本家社会”)”相对置。对于并不熟悉德文原文的中国读者来说,这似乎是我们只能接受的具有充分证据的文本事实。可是后来,要经过长时间的仔细文本查阅,终于发现在马克思的文献中,他对bürgerliche Gesellschaft和Bourgeoisgesellschaf这两个词组的使用并没有作出真正具有不同质性的区分,它们的差异仅仅是bürgerliche Gesellschaft出自德文,而Bourgeoisgesellschaf一词,同是资产阶级社会,只不过此词由法语而来,马克思而只是在《德意志意识形态》一书第二卷中两次使用此词,而大部分使用bürgerliche Gesellschaft。
在《1857-1858年经济学手稿》开始,马克思开始使用Kapitaliste Gesellschaf,而bürgerliche Gesellschaft一词的使用逐步下降。这一研究成果大地鼓舞了我,所以我开始将这种研究方式扩展到《回到马克思》一书第三版修订的全过程中。在开始,我完全是用手工查找,并分别使用过WORD查询功能和ADOBE系统中的PDF查询功能,后来在相关文献学和计算机专家的帮助下建立了独立的数据库专用的词频软件,从而真正完成了文本词频统计的科学化。我深深地体会到,文献学词频统计工作的意义在于,通过基于德文文本中马克思学术关键词的消长波动情况的历史流变状态的分析,我们能够发现马克思学术话语实际运作的第一手思想构境细节,这使我们对马克思不同时期思想状况的质性认定获得了坚实的客观文献基础。可以说,我从中获益良多。
我们知道,词频统计方法是文献计量学(Bibliometrics)的传统分析方法之一。所谓词频(term frequency,TF),就是指在一份给定的文献中,某一个给定的词语在该文献中出现的次数。词频统计则是研究者根据一定的研究目的,运用统计学的方法,从不同的文献文本中(如网络引擎、报纸杂志、历史文件、档案记录等)搜集所研究问题的核心词汇,再进行特殊的编码之后,据以进行定量词频分析的方法。在文献计量学研究中,研究者通过词频统计分析,可以对科学研究某一领域的发展趋势、语言习惯的演进和各种社会现象的变化等问题进行定量研究。我在与文献学相关专家的交流中得知,这一前沿性方法的使用对于推动整个文献情报学方法论的提升有着重要的意义。正是这个重要的科学前沿的基础上,我提出了所谓文本词频统计,这是指统计一个思想家在其经典文本母语原文中居权力话语结构中的支配性概念或范畴出现的频率,并将其与不同时期中发生重要思想变异的文本的词频统计结果进行历时性比较研究,并且在二维词频图上以可直观的曲线图标识出来,以达到对已有文本学分析的数据支持。词频统计之所以必须建立在文本母语中,是因为在语言翻译转换中,新的翻译文字已经在一个陌生话语体系中被重新构境。在我看来,词频统计本身并不直接产生文本分析的结果,而只能是对深度文本学研究进行辅助说明的一个实证科学的工具性手段。在目前已经完成的《回到马克思》一书的第三版修订中,我依据MEGA2和其他德文原始文献的全文数据库对马克思在不同文本中重要学术关键词的出现和消失、增多与减少情况尝试进行了一定文献数据统计工作,说实话,这种文献计量工作使得我自己原先的文本学研究有了一个全新的思考维度。
这里,我再举一个具体例子,即《回到马克思》一书中我所坚持并发展的由孙伯鍨教授首先指认的马克思的“两次转变论”。1970年代末,当前苏东那种目的论和平滑进化论式的思想史模式还占主导地位的时候,青年马克思哲学思想的发展被确认为一次转变,即哲学立场上从唯心主义向辩证唯物主义的转变,政治立场上从民主主义向共产主义的转变,通常,人们将青年马克思这一思想转变的时间节点置于1843年,由此,马克思写于1844年之后的大量文本则被直接指认为马克思主义的东西,固然其中也被指认出一些“不够成熟”的地方。而孙老师则第一次明确说明了马克思思想进程中1843年的那次转变并不是马克思主义诞生的时刻,在这里青年马克思1845年3月以前的思想发展进程本身被具体地一分为二:“其一是从1837年加入到青年黑格尔派哲学阵营一直到1843年夏天以前,青年马克思的哲学思想主要受到经过青年黑格尔派改装过的黑格尔哲学的影响,这在他的博士论文《德谟克利特自然哲学与伊壁鸠鲁自然哲学的差别》以及《莱茵报》时期的一系列文章中得到反映;其二是当青年马克思思想遭遇现实问题而十分困窘的情况下,他通过以法国大革命为重心的历史学研究,并在魏特林、赫斯和青年恩格斯等人的影响下,发生了第一次(并不是自觉开始创立马克思主义)重大思想转变,即从唯心主义转向费尔巴哈式的人本学唯物主义,从民主主义转向一般共产主义(不是科学社会主义)。与这一时期相关的文本包括青年马克思在1943年夏天以后写下的《克罗茨纳赫笔记》、《德法年鉴》时期的文章、最初研究经济学的《巴黎笔记》,以及在这一过程中逐步完成的著名的《1844年手稿》、《神圣家族》、1845年3月写下的《评李斯特》的手稿。而第二次转变则是在《评李斯特》一文中初见端倪,并发生于《关于费尔巴哈的提纲》,完成于《德意志意识形态》、《马克思致安年柯夫》和《哲学的贫困》的真正自觉创立马克思主义的思想革命。这种转变是一次格式塔式的整体转换,而不只是一个量的渐进过程。只有在这时,马克思恩格斯才第一次确立了实践的新唯物主义哲学视界。这不是什么哲学逻辑体系,而是一种活的科学立场、观点和方法;也只有在此时,马克思恩格斯才真正创立了科学的社会主义。”
我们已经知道,与孙老师的观点看起来相近的观点还有20世纪60年代法国西方马克思主义者阿尔都塞的 “断裂说”。 阿尔都塞着眼于马克思思想发展的不同特点的深层理论结构(“问题式”,即提问的基本方法和逻辑结构),从而指认了存在着以1845年4月马克思《关于费尔巴哈的提纲》为分界线的两个马克思,即处于人本主义意识形态逻辑框架中的青年马克思与创立了全新科学世界观的马克思主义者的马克思。与此观点相接近的还有日本马克思主义哲学家广松涉的论点,即1845年4月马克思从异化逻辑向“物象论(Versachlichung)”逻辑的转换。当然,广松涉的观点由于受到海德格尔和当代其他思潮的影响,因而是一个更为复杂的理论变体。 与他们二人的观点不同,孙老师并没有将发生在1945年青年马克思的思想转变视为一种简单的断裂,所以,他更精细地指认了存在于《1844年手稿》中实际存在的两种截然不同的理论逻辑:其一是从工人的先验类本质——劳动出发,将社会历史(主要是现代工业文明)视为人的本质之异化和复归的过程的人本主义隐性唯心主义历史观构架,这是此时支配着第二时期青年马克思哲学的主导理论框架;其二是在马克思真实地接触无产阶级实践和经济学史实之后,不自觉发生的一种新的从历史客观现实出发的理论逻辑在1844年至1845年3月间,这两条理论逻辑始终处于一种动态的相互消长之中。我在《回到马克思》一书中,更仔细地从文本学解读的视角进一步说明了孙老师的观点。
我也注意到,北京大学的王东教授多次写文章对孙老师和我们的观点提出质疑,他主要是通过说明《1844年手稿》等文本中出现的拟似历史唯物主义的词句来反驳孙老师所提出的“第二次转变”,但并没有提出什么真正基于第一手文献学考证或者文本解读语境中的新证据。 在这里,我就用自己新近进行的学术话语关键词的词频统计数据来提供一个新的文献学证据。在《回到马克思》一书中,我已经提到,“在1844年至1845年3月间,这两条理论逻辑始终处于一种动态的相互消长之中。当然,在青年马克思这时整体的理论运演过程中,居支配地位的还是费尔巴哈式的人本学劳动异化史观”。 我的观点并完全不同质于孙老师,因为我进一步区分了1844年前后在青年马克思思想构境中起不同作用的两种学术话语,一是受制于费尔巴哈人本主义逻辑影响的劳动异化史观,这是居学术构境和治理的统治地位的权力话语逻辑,它由工人的本真性的类本质(Gattungswesen)——理想化的抽象的劳动为基础,以劳动本质在现实国民经济学体制中所发生的异化(Entfremdung)和外化(Entäußerung), 来说明资产阶级经济制度的反人本质,而扬弃这种劳动异化和外化,消灭私有制的共产主义则是对人的类本质的重新占有,共产主义就是人本主义(Humanismus)的复归。在这里,我和孙老师共同认为,由类本质-异化(外化)-扬弃异化复归类本质建构起来的人本主义话语并不是历史唯物主义基本线索。在1845年的思想革命中,这种人本主义的劳动异化史观恰恰被马克思和恩格斯所摈弃。
从我新近完成的基于德语原文本的学术关键词的词频统计中,我们可以清楚地看到在1845年马克思思想发生第二次转变中,人本主义哲学话语与历史唯物主义的科学理论交接在主导性概念词频图上所发生的多重“断裂性”峰值,比如在《穆勒笔记》和《1844年经济学哲学手稿》中作为权力话语关键词的Entfremdung(异化)、Entäusserung(外化)和Gattungswesen(类本质)三词,分别从高值25/151、27/100和0/16,突然在《评李斯特》和《德意志意识形态》中降低为1/17(其中他引4次)、1/3(其中他引1次)和0/0(参见图1)。
图表 1
而在《1844年》中作为正面肯定的人本主义Humanismus(人本主义)则从相对高峰值8到《德意志意识形态》中的底谷峰值负13(即作为批判对象的指称,参见图2)。
图.2
在我所给出的二维词频图组中,我们可以直观地看到这个支撑孙伯鍨先生所提出的“马克思第二次思想转变说”的奇异性的话语转换曲线。此外,这两个词频统计图都可以从一个客观数据的层面直接支持我在《回到马克思》一书中所指认的青年马克思异化劳动为核心的人本主义话语的消解过程。因为一种重要的理论逻辑,当支撑它发生学术思想运作的关键词的缺失时,将必然导致这一话语逻辑的自我解构。并且,更有趣的事情是,与此词频值完全对应的,是作为历史唯物主义主导话语关键词群的Produktivkraft(生产力) 、Produktionsverhältnisse(生产关系)和Produktionsweise(生产方式),从《穆勒笔记》、《1844年经济学哲学手稿》、《神圣家族》和《评李斯特》的零词频〔0/0/0(他引24) ;0/0/0;0/0/0〕直接突现为《德意志意识形态》中的73/7/17(参见图3)。
图表 3
这个词频图直接说明,只是在《德意志意识形态》中,马克思恩格斯所创立的由生产力-生产关系-生产方式等核心关键词构成的历史唯物主义才真正成为全新的权力话语,由此,马克思主义的科学新世界观才真正得以确立。
当然,在本次修订中,我只是初步记录了文献统计的部分结果,而没有进行更深入的质性分析。还必须说明的是,我已经完成的文献统计学工作都还只是非常初步和粗略的统计,原因有四:一是MEGA2的出版情况的限制,所以这造成了数据库中基础文本版本的非同一性;二是文献词频统计中并没有仔细排除马克思引述他人文献时的词语;三是马克思等经典作家在自己的文本写作中,由于外来语和写作习惯方面的原因,常常用不同词语表达相同的指称对象,如“Kapital”-“Capital(拉丁语拼写)”,“Bourgeoisie(资产阶级,法文而来)”-“bürgerlicher”,“ sociale(社会的,法文而来)”-“soziale”等,三是现代德文对历史文本的重构问题,在这一次的词频统计中,我发现,一些后来重新编辑的德文文本都发生了现代词语重构,这主要是德国近代以来两次重要的“正字法”(1880年的正字法和1996年的新正字法)的结果,而MEGA版则保留了马克思恩格斯的写作词语使用中的原初状况。比如我在这次修订中发现的“Theilung der Arbeit(分工)”→“Teilung der Arbeit”、“ Waare(商品)”→“ Ware”、“ That(活动)”→“Tat”等词的变异情况。令人头痛的是,马克思的原文中的一些德文词拼写甚至在现在的一般德语字典中竟然查不到 。这种情况也发生了赫斯、李斯特等人身上。虽然我已经尽可能注意到这些问题的存在,并努力做了一些校正,但这些德文写作和新旧德语词汇的历史差异必然导致数据生成中的相对意义。这是读者一定要注意的地方。
我知道,要真正完成科学意义上的文献学词频统计,这会是一个巨大的科学统计工程。不过,值得高兴的是,马克思研究领域文献学工作中较为完整的系统词频统计这重要的一步终于由中国马克思主义研究者来开启。当然,当望月先生2011年访问南京大学时,我已经能够很自豪地告诉他,过去他得花数月才能完成的工作,如今我们已经可以利用自己初步建成大型原文文献数据库在几分钟之内就能完成了。据我所知,在国际马克思研究的学术界,这也是第一次尝试。
参考文献:
Karl Marx, Ökonomisch-philosophische Manuskripte,,Gesamtausgabe(MEGA2),Ⅰ/2, Berlin: Dietz Verlag, 1982.
Marx/Engels: Die deutsche Ideologie MEW Bd. 3, Berlin: Dietz Verlag.1969.
邱均平:《文献计量学》,科学技术文献出版社, 1988年版。
张一兵,《回到马克思——经济学语境中的哲学话语》,江苏人民出版社2009年第二版。
(2012年第9期)
发表评论