数位人文与数位佛学

道观

0724-3-1

图1:网络版CBETA与SAT测试。输入“般若”一词,前者得10900条/项结果,后者得21674条/项结果。

0724-3-2

图2:五位七十五法一览表

 0724-3-3

图3:《道行般若波罗蜜经》文献数据和古写本纪录,除经录提供的咨询外,还网罗了敦煌本资料。图为金刚寺所藏写本。

近年欧美日多所高等学府齐声响应一新概念——“数位人文”(digital humanities,或“电子人文”),引起大众广泛关注。人文科学一般泛指与人和社会直接相关的学问,比对自然科学的硬科学。自然科学与现代科技紧密衔接,看似理所当然。人文科学给人感觉就是只管读书,究竟有没有追赶时代步伐,把学问数位化的必要呢?

学问的本质就是求真,尽管领域和方法论上的差异,知识必然经过探索、累积、整理、过滤和淘汰的不同阶段。“数位人文”的目标就是希望充分利用科技,克服人类社会既有的各种限制,促进学术和人文科学的研究,整合和普及知识,把人类视野推到最前线。

随着过去二十多年来个人电脑和网络普及化,各种为学习而设计的电子工具如雨后春笋,应运而生。我们所指的“数位人文”除了各种数据化典籍和工具外,实际上牵涉到整个学习的模式和人文学科的整体面貌。举例说,扫描本和维基百科给大家带来前所未有的便利,但其中利弊则尚待探讨。资讯质素良莠不齐,搜索器的操作局限,还有讯息紊乱的情况,相信对学佛的人来说并不陌生。

数位化讯息如何整合和优化本身也是一门学问。在专业佛学研究的领域里,不少院校近年耗费大量资源去推动“数位人文”,其中有成功的,但也有些彻底失败的例子,值得反思探讨。

国内一位梵学泰斗曾经被质问为何不去编一套梵汉字典。他淡淡地回答说,字典不是随便编的,背后需要一个学术团队,还有基础研究去支撑,编出来的东西才有价值,不然人家不用便没有意思。他的一个学生后来当了教授,为了申请国家基金,打着科研的旗号,希望利用科技去编一套梵汉字典。其实当时台湾的林光明已经发愿要编译一套以日本的《梵和大辞典》为基础的梵汉字典,不过这位教授不理,觉得他有他做,我有我做,反正不用亲力亲为,只是下判给一群学生“干活”,马不停蹄的把荻原云来的《梵和大辞典》重新输入,打算随便加删一点便交货。至于数位格式和校对步骤等则完全没有周详考虑,觉得先干着再说。后来日港台多地学府公开他们的数据库,于是这个名副其实的“国家豆腐渣工程”亦告吹。不过事情还没完结,这位教授连同另一位不谙梵语的教授在香港申请了一个更大的资金,这次打着“佛经数位化”的旗号,目标是通过电脑分析去比对佛经汉译与梵语原文之间的语法关系云云。听起来很科学,但实际操作层面上出现不少问题。首先他们利用的并不是自己输入的数据,而是抄袭国外学者的公开档案。不是正规合作,人家的东西质量如何无法辨认。加上自己不是电脑专业,程式编写的工序只能外判出去。至于梵语的语法分析,则下判给一批博士生和年轻博士去做机器化的标签工作。其实西方学者早已经写出辨认梵语语法的程式,无须依赖人力辨认。他们在这个工程半途才发现自己如何落后,人家的自动化标签程序,按一个键便完成,把那群超时工作的博士和博士生吓得目瞪口呆。

这情况的出现,先不说资源的浪费,归根究底还是学者之间缺乏沟通。既没有处理大型数据库的经验,亦没有掌握好“数位人文”发展的脉络,加上好大喜功,闭门造车,最后的结果自然就是失败。

今年9月笔者在日本松江举行的日本印度学佛教学会年会发表论文之际,参加了一场“数位人文”的座谈会,了解日本佛教界在电子佛学里的一些前沿工作。其中最令人欣慰的,除了技术的先端性,最重要的还是背后精密的思维,团队的合作和分工。简单的说,首要的为眼光和眼界,想清楚,做好准备才去动手。而且项目必须公开,让各方学者指点批评,互相切磋,这才说得上因缘具足,项目才会至臻完善。实际上,世界各地不少高等学府都在各自建立自己的数据库,其中只有部分对外公开,笔者亲眼目睹现今一些高端程式组合,可以让学者不用按几个键便能引经据典,进行多语言对勘,并搜索出所有相关的研究论文和材料。至于两岸三地,台湾在佛学研究中一直占着领先地位,近十多年来推出不少大部头的数据库,其中以法鼓山牵头成立的中华电子佛典协会的电子佛典集成(CBETA)最为瞩目。中国大陆近年得到国家投放大量资源推动佛学研究,而大众对佛学和“数位人文”的需求亦甚殷切,可惜国内网络受到诸多限制,学术体制欠透明,引致国内佛学资讯异常紊乱,重量不重质,错漏百出的情况十分普遍。至于香港就更不用说了,由于就连一个国际水平的佛学图书馆也没有,学术以营商的管治方式运作,相关的古典学、印欧语言学、印度学、印度哲学、文献学等基础学科长期处于真空状态,因此本地佛学一直未能与世界接轨。不过由于香港拥有高度自由,还有丰厚的经济基础和国际交通枢纽的优势,在网络开通的时代“电子佛学”也许能够弥补一些先天的不足,为未来带来转机。

网页推介:

1)电子大藏经:CBETA还是SAT?

SAT大正新修大藏经テキストデータベース:

http://21dzk.l.u-tokyo.ac.jp/SAT/ddb-bdk-sat2.php

CBETA电子佛典集成

http://tripitaka.cbeta.org

要在浩如烟海的大藏经里翻查资料,就算是熟读经藏的大德也可能无从入手,经典电子化彻底改变了读经和研究佛经的模式。CBETA和SAT是两个当今研究汉文佛典的重要资源,前者原来为东京大学《大正藏》电子化的科研项目,其后法鼓山的CBETA后来居上,开发出读经软件和搜索器,其光盘安装版功能甚多,并包涵大量其他经藏。不过SAT仍然具有一定优势,因为包含了《大正藏》55卷以外CBETA所欠的内容,而且网络版搜索平台操作方便。近年SAT继续发展,与东大Muller教授的半开放式电子佛教辞典和BDK“平行文数据库”结合。至于CBETA走的方向则集中文献收集,搜索工具和引文功能比前者方便,两者可以说是各有千秋。

图1:网络版CBETA与SAT测试。输入“般若”一词,前者得10900条/项结果,后者得21674条/项结果。

2)多方位佛教辞库

Bauddha Kośa佛教用语用例集

http://www.l.u-tokyo.ac.jp/~b_kosha/start_index.html

佛教名相复杂,在不同经典里有不同的用法和含义,随便翻阅佛教辞典有时只能一知半解。要掌握佛教的名相,必须配合经文和注释,还有整体知识系统和正确的历史观才说得上是“如实正知”。东京大学建立Bauddha Kośa的目的就正是要以多方位角度去让读者理解复杂的佛教名相。像阿毘达磨的“五位七十五法”,以图表和HTML链接化表达,内容细心挑选,除了提供各种相关语言讯息,还有出典、译文等等,一目了然。(http://bushiso.mydns.jp/~bkosha/html/index_75dharma.html#)

图2:五位七十五法一览表

3)写本数据库

日本古写经数据库

http://koshakyo-database.icabs.ac.jp/p02_canonList.seam

汉译佛经有多古老?《四十二章经》、《道行般若经》等相信都是东汉时代译出,至今近二千年了。不过从文献学的角度去看,我们今天的汉译佛经,一般以刻版印刷的经藏为依据,年代最早的而又最为流通的是韩国海印寺的再雕版高丽藏,至今有八百年左右的历史,其他我们日常接触到的大藏经,其版本最早的也不会超过北宋。二十世纪学者发现的敦煌残卷,还有日本的手抄写本,其中内容往往与后来版本颇有出入。随着“数位人文”的普及,各国科研机构争相把自己国家收藏的写本陆续数据化和公开。国际佛教学大学院大学设置的日本古写经数据库便是一个极好的例子。日本哪一个寺收藏了哪一部经,一目了然。由于古经卷十分珍贵,一般放在寺院的藏经阁或博物馆里并不公开,位于东京的国际佛教学大学院大学收藏了大量重要古经卷的扫描档,而部分已在网站公开。

图3:《道行般若波罗蜜经》文献数据和古写本纪录,除经录提供的咨询外,还网罗了敦煌本资料。图为金刚寺所藏写本。

文章来源:http://mingkok.buddhistdoor.com/cht/news/d/36414

 

欧美篇

麦文彪

0724-3-4

图一:《金刚经》中经末“一切有为法……”的梵语、汉语(什译)、藏语校勘,并附上英译,一目了然。

0724-3-5

图二:程式把经文句子分析,提供各种解读可能,此外“stemmer”和“grammar”两项亦提供语法分析引擎。

0724-3-6

图三:IndoSkript软件界面,以婆罗米文“ku”字为例,辨认结果首推为“tra”和“ta”,辨认功能尚待提升。不过参考数据库,以人眼辨认,软件还是有参考价值。

通过数位和网络的各种技术,佛学研究出现了一次大革新。

就佛经而言,四种主要的古典语言,即巴利语、梵语、汉语和藏语,至今数位化工程进度不一。除了上期介绍不同的汉文佛典数位化工程外,其他语种的佛经,至今从事整理工作的主要以欧美学者为主,而最具权威性的版本和数位化工程则列举如下:

南传大藏经

英国巴利圣典学会(Pāli Text Society)1885年始编辑和出版的巴利三藏和其他南传佛典,学术界一致公认最具权威,可惜电子版并未公开。现今搜集南传典籍最为齐全,而又对外开放的,是美国网站http://www.accesstoinsight.org。此网站包含几乎所有主要的南传典籍,提供英译和巴利原文对照,使用方便。网站所载的经文来自1994年“斯里兰卡三藏计划”(Sri Lanka Tripitaka Project)的电子档(http://www.metta.lk/sltp/)。由于学界专业翻译只参考巴利圣典学会版的原典,而且电子档准确性尚待商榷,使用时必须多加注意。至于其他版本的巴利三藏,最具代表性的为缅甸版(1954年结集,1990年数位化,详见http://www.tipitaka.org),具一定参考价值,但由于内容与过去的版本大致相同,并未受到学界重视。

除英译本外,外语译本首推高楠顺次郎等学者1935年始编译和出版的日语《南传大藏经》。至于汉译本,至今比较完整的只有台湾出版的《元亨寺版南传大藏经》,最近被收进台湾CBETA数据库,参考使用变得更方便。然而,其内容主要参考日译版,质量尚待提升。直接参考巴利原文的汉译本,自上世纪初零星累积,至今尚待整理。较具规模的原文今译本,首推香港志莲净苑文化部的“巴利文佛典选译”(http://www.chilin.edu.hk/edu/report_section.asp?section_id=5)。

梵语佛典

梵语为大乘佛教的主要经典语言。尽管现存梵语经典数目不少,至今并未有出现过一套像巴利三藏,或藏文丹珠尔和甘珠尔一样的梵语大藏经。不同的梵语佛经,版本不一,除了佚失的梵本外,不少大乘经论尚没从贝叶和写本转写整理出来。加上材料四散各地,古文字解读和写本修复工作艰辛,令梵语佛典的状况变得相当复杂。现今梵语佛典的数据化资源,主要来自佛光山西来大学的“梵语佛典库”(http://www.dsbcproject.org),和德国哥廷根大学的数位文献库(http://gretil.sub.uni-goettingen.de/#BauddhDa)。后者为公开数据库,得到国际学者支持,而且不断修订和更新,质量较前者优秀。然而,现今梵语佛典整体质素未如理想,而梵语佛经数据档错漏的情况也比较严重。

藏语大藏经

藏语佛经与巴利语、梵语、甚至汉语佛经相比,翻译年代晚得多。不过,由于藏译佛经文风比较规范,加上中晚期的梵语佛经大量佚失,所以还是有一定的参考价值。藏语佛典数位化工程中,较有代表性的为美国的http://www.asianclassics.org和http://www.tbrc.org。两者均为甘珠尔和丹珠尔的数位化工程,前者侧重文字档,后者侧重扫描档。

综上所述,可以看出梵语佛典的研究最为落后,欧美学者尽管累积了超过百年的研究成果,整体上梵语佛典的相关研究和文本整理,情况尚未如理想。大乘佛教以梵语佛典为根本依据,东亚诸国深受大乘佛教影响,因此一直以来都意识到梵语佛典的重要性,然而碍于缺乏梵语人才,相关研究一直不能突破语言文字的关口,长期以来依赖西方学者的学术成果。就算是以学术水平见称的日本,汉文和梵文佛典研究至今尚未能完全统合,而研究语言文字和研究思想哲学的学者亦一向各自分居,让很多基本的问题,如佛经是怎样翻译出来的,大藏经编修的理据,佛经出自何处,什么是伪经等等,一直难以厘清。西方学者亦同时意识到这些问题,所以从语言学、古文字学、写本学、文献校勘学等多个领域入手,开发出不少数码工具,让佛学研究迈进一大步。以下介绍的数码工具,为当今佛学研究中最具代表性。

网页推介:

1)多语言佛经校勘

《金刚经》的四句偈是什么?《心经》最后的咒语应该怎样念?把不同版本和不同语言的原文和译本互相比较,不难获得答案。一些网站(如http://www.suttacentral.net)把不同语言的佛经搜集起来,附上连结,方便读者参考。不过如果能把相应的文句,放在同一个画面里拼合比较,那么就更一目了然。多语言佛经校勘的数据化工程,以挪威奥斯陆大学的Thesaurus Literaturae Buddhicae为先驱(拉丁文意思为“佛典文库”):http://www2.hf.uio.no/polyglotta/index.php?page=library&bid=2。

图一:《金刚经》中经末“一切有为法……”的梵语、汉语(什译)、藏语校勘,并附上英译,一目了然。

2)印度语言辞典

好不容易找到佛典原文,但却读不懂巴利语和梵语,怎么办?那当然要找老师。没有老师的话,至少也要懂得使用好的字典。巴利语字典,首推巴利圣典学会1921-1925年编辑出版的巴英字典,而数位版已由美国多所大学联合整理公开(http://dsal.uchicago.edu/dictionaries/pali/)。巴日辞典以水野弘元著《巴利语辞典》最为优秀,由于版权限制,没有电子版公开。受学界接受的巴汉字典则尚未现世。至于梵语字典,种类繁多,首推Monier Williams的《梵英大字典》(A Sanskrit-English Dictionary);而Apte的《梵英字典》(The Practical Sanskrit-English Dictionary)规模较少,佛教用词略嫌短缺,但附上例文,仍可作参考。针对梵语佛教用词,最具参考价值的是Edgerton的《佛教混合梵语辞典》(Buddhist Hybrid Sanskrit Dictionary)。

《梵英大字典》:http://www.sanskrit-lexicon.uni-koeln.de/monier/

《梵英字典》:http://dsal.uchicago.edu/dictionaries/apte/

《佛教混合梵语辞典》:http://doc.thanhsiang.org/Online_Dic/Buddhist_Hybrid_Sanskrit_Dictionary/index1.html

3)梵语语法分析工具

义净在其《梵语千字文》的序文说到,“若兼悉昙章读梵本,一两年间即堪翻译矣。”这是古人的理解,其实明白字义,但语法不明,最后还是文义不通。要熟悉并完全掌握梵语语法,倒不是一两年的事情。而且,由于梵语书写和发音的特殊规则,必须先学会拆字,然后确定动词语态和名词数、性、格等属性,最后厘定文字之间的语法关系。法国学者开发出的梵语语法分析工具(http://sanskrit.inria.fr/DICO/reader.en.html)能有助使用者解读梵语文本,十分便利。

图二:程式把经文句子分析,提供各种解读可能,此外“stemmer”和“grammar”两项亦提供语法分析引擎。

此外,也有德国学者开发出梵语语法分析引擎Sanskrit Tagger和高端数据分析程式(http://www.indsenz.com/int/index.php?content=sanskrit_tagger)。若要充分利用,必须具备电脑语言基础。

4)印度文字辨认程式

现今梵语经典一般以罗马体或天城体印刷发行,前者可以利用一般OCR扫描辨认程式,选项略作调整后,进行数据化。至于后者,近年德国学者亦开发出扫描辨认程式:http://www.indsenz.com/int/index.php?content=software_ind_ocr_sanskrit

至于写本文字则只能依赖人手辨认。印度文字两千年来变化多端,要掌握不同地域和时代的文字,需要累积大量经验。有见及此,有德国学者开发出印度文字数据库IndoSkript,并附上文字辨认功能。只要给程式提供文字模样,程式除了辨认外,还会自动显示文字出现的地域和年代,为研究者提供极大的方便。程式免费下载,但暂时只有德语版:http://userpage.fu-berlin.de/falk/download.htm

图三:IndoSkript软件界面,以婆罗米文“ku”字为例,辨认结果首推为“tra”和“ta”,辨认功能尚待提升。不过参考数据库,以人眼辨认,软件还是有参考价值。

5)文献总目录

佛学博大精深,文献材料和相关研究浩如烟海,要找资料必须参考各种文献目录(http://www.mbingenheimer.net/tools/bibls/biblBibl.html)。不过,要知道哪一部目录包含什么内容,则要参考目录的目录!这类型的大部头的文献整理工作,还是日本学者最为擅长。最近日本国际佛教学大学院大学的末木康弘教授,免费公开了电子版Bibliographical Sources for Buddhist Studies(Version 1.4),内容可算是包罗万有,就算是没有你要找的,也可以给你足够的提示和提供正确的方向:

https://icabs.repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=322&item_no=1&page_id=13&block_id=17

文章来源:http://mingkok.buddhistdoor.com/cht/news/d/40416