佛教圖書館館訊 第四十期 93年12月
(http://www.gaya.org.tw/journal/m40/40-main3.htm)

佛教藏經資源的檢索與運用

皎月藝術科技專案顧問 李志強


【摘要】透過檢索工具及數位化藏經資源的運用,能夠更有效的進行研究及學習。本文將就單機版的藏經資源、網路資料庫,以及個人資源的建置三個面向,分別以普及和容易取得的資源為例,介紹其檢索與運用的方法。

關鍵詞:藏經(Tripitaka);搜尋(Search);檢索(Retrieval)


一、前言:由Google的發展看檢索的威力

  這是一個資訊的時代──不僅僅只是資訊爆炸而已──掌握資訊通路的傢伙,將漸漸掌握我們的世界觀。在過去如此,現在如此,未來亦如此──只不過,那個傢伙可能由國家、媒體轉變成Google,如是而已。

  二○○四年十二月,全球使用人次最多的搜尋引擎Google宣 布,要製作世界上最大的「線上圖書館」,合作的圖書館有牛津、哈佛、史丹福、密西根等大學的圖書館和紐約公共圖書館,使用者可透過搜尋引擎檢索瀏覽這些資 料。如此一來,許多市場上已經絕版的書籍,就能夠在網際網路的世界重現,無怪乎紐約公共圖書館總裁兼執行長雷克雷科表示:「這是人類資訊傳播史上,自古騰 堡發明現代活字印刷術以來的最重大事件。」(註1

  其實,在二○○三年底,Google就推出了書摘檢索的功能print.google.com,類似服務的提供者還有亞馬遜書站(Amazone.com)的「search inside the book」。而Google也企圖以Scholar.google.com進入專業學術期刊的領域,除了查詢期刊內容之外,也提供參照(references)。

  Google做的事情不止於此,在二○○四年中推出了桌面搜尋(http://desktop.google.com/)程式,讓電腦裡的檔案也能夠透過Google的軟體來檢索,導致微軟和雅虎也宣布將計劃跟進(http://desktop.yahoo.com/),將推出相關的產品。不過Google的桌上檢索對於中文的相容性還不是很好,加上安全性及隱私權的考量,對於單機版漢文檢索上的運用,仍然有待進一步觀察。

  如果以Google的例子來看整個檢索運用的發展,由於採取使用者免費的機制,付費的竟是內容的供應商──付費以廣告或是排序的方式取得較佳的曝光機會,以換取更多的交易發生。換句話說,某個程度上,檢索引擎已經龐大到能夠影響人們獲得知識或資訊的內容了。

  當然,本文主旨並不在討論Google的發展,而是如何透過檢索及進一步運用佛教藏經資源。資訊「質」與「量」的抗爭仍持續進行著,透過藏經的電子化,使得量化的研究變得可能,對於想要查詢佛教經藏的讀者們,有哪些資源可運用,又能做些什麼,則是十分值得關注的事情。

  本文將針對單機版的藏經資源、網路資料庫以及個人資源的建置三個面向,分別以普及和容易取得的資源為例,介紹其檢索與運用的方法。至於許多專業及付費的服務,各有特色,本文不詳加說明。

二、單機版藏經檢索與運用

  目前市面上可取得的佛教藏經光碟,有《CBETA電子佛典集成》、《CSCD南傳大藏經》、《高麗藏電子版》、佛光山出版的《佛光阿含藏》等。而學術上使用較便利的,可能屬中華電子佛典協會《CBETA電子佛典集成》。此光碟除了可以在網站(www.cbeta.org)上下載鏡像檔外,也提供免費結緣。

  另外,CBETA電子佛典系列《大正新脩大藏經》五十六冊的全文,也同時收錄在《印順法師佛學著作集》第二版的光碟中,使用Accelon系統,在研究《印順法師佛學著作集》本文內容的同時,可連結至相關經文的出處,十分便利。

  在過去CBETA提供了HTMLHelp版本、RTF/Doc版、純文字版,甚至PDF版本的經典,運用上各有優缺點。自二○○四年CBETA推出了以自行開發的讀經器CBReader為核心的介面,解決了許多版本使用上的不便,並可以不斷的更新強化。以下將就《CBETA電子佛典集成》二○○五年一月版中所使用的CBReader為例,介紹單機版的藏經檢索的運用情形。

CBETA各檔案格式經文特性簡易對照表

檔案格式

檔案

瀏覽

檢索

缺字

排版

純文字

跨平台,帶行首資訊

一般程式,但不美觀

使用純文字檢索工具

組字式

一般

Doc/Rtf

較大

RTF相容瀏覽器

要使用支援Doc軟體

可使用字型及Unicode

可排版,分欄

HTMLHelp

windows介面,經過編譯

輔助檔及瀏覽器格式

500筆限制

組字式加圖檔

一般橫式,一頁一欄

PDF

跨平台

PDF瀏覽器

使用專屬之PDF檢索軟體

內嵌字型

列印格式,標點要避頭尾

CBReader

原始XML檔案,可增添

IE介面,可自訂多種呈現風格

多樣化

可自訂

可直排,或橫排,一次一經列印

  目前CBETA提供《大正新脩大藏經》第1冊至第55冊暨第85冊,以及《卍新纂續藏經》第63冊至第73冊(禪宗著述)暨第78冊至第87冊(禪宗史傳)全文內容的電子檔。

  打開CBReader(如圖一),左方的欄目提供「目錄」、「書籤」、「經目搜尋」、「到」(快速選取)、「經文搜尋」各項功能,分別可以依照經典目錄、自訂的書籤和移動至指定的位置來瀏覽經文;另外,也可以針對經目或是經文進行檢索。

圖一:CBReader



  關於目錄的部份,提供CBETA部類目錄、《大正藏》分部及分冊的目錄、《卍新纂續藏經》經目,並於此版新增了自訂目錄的功能。自訂目錄提供使用者能夠設訂自己的目錄,像是依照印順導師《雜阿含經論會編》中的目錄,或是教師上課指定使用的目錄等。(如圖二)

圖二:自訂書目



  「經目搜尋」頁籤提供了「藏經」、「部別」、「冊數」、「經號」、「經名」、「作譯者」等檢索選項,快速選取頁籤則可依照書本結構、經

卷結構或普及版行首資訊尋找所要的經典。

 

  經文檢索功能,目前只能輸入漢字,並且只有Big5字集的缺字部份可以使用組字式、通用字或Unicode查詢,不過瀏覽時要使用相同的設定,檢索結果才能順利顯示。全文檢索可使用布林運算元,如「和」、「或」、「在之前」和「相近」等四種關係,並可限制檢索的範圍,及關鍵字出現的距離,相關的內容可在選項中設定。目前檢索的結果尚不能匯出,未來將提供相關匯入、匯出的功能。

四種關係如下所示:

運算

符號

輸入範例

檢索結果說明/範例

Near

+

佛陀 + 阿難

在字數間隔內同時出現,沒有順序的限制。

Before

*

佛陀 * 阿難

在字數間隔內依序同時出現。

And

&

佛陀 & 阿難

兩者同時出現,沒有順序與字距的限制。

Or

,

佛陀 , 阿難

出現兩者之一即可,沒有順序與字距的限制。

  點選檢索的結果會在瀏覽區呈現關鍵字出現的位置,反白選取瀏覽區的經文,可以進行引用複製或查詢丁福保辭典的功能。

  引用複製是寫作論文時常常使用的功能,格式的設定在選項中,目前提供經名在前或在後,是否包括校勘,以及是否增加卷數等選項。《卍新纂續藏經》則提供了三種不同的版本:

Z: Zokuzokyo《卍大日本續藏經》(卍續藏)。京都:藏經書院。

R: Reprint《卍續藏經.新文豐影印本》。台北:新文豐。

X: Xuzangjing《卍新纂大日本續藏經》(卍新纂續藏)。東京:國書刊行會。

  另外值得一提的是,CBETA提供了經文呈現,缺字處理,梵文、巴利文、悉曇字的處理等設定,而經過校訂的經文,也可選擇依照底本文字、CBETA修訂或是對照呈現,例如:

底本:

《長阿含經》[22]「一曰裸十。」CBETA, T01, no. 1, p. 147, c23

對照:

《長阿含經》[卷22]「一曰裸[十>土]。」CBETA, T01, no. 1, p. 147, c23

如此一來,做研究時就不會因為電子版和原書的差異而傷腦筋了。CBReader中,還提供許多瀏覽時的

設定,如字型大小顏色、工具列、多視窗等,十

便利。(如圖三)


圖三:字型設定



 

  過去HTMLHelp版經文所能提供的功能,現在可說是有過之而無不及,不過純文字版的檢索可輸出的功能,以及更友善的使用者介面,諸如做筆記、評論、經文內連結等的功能,仍有許多值得強化的空間,讓我們一同期許CBETA的菩薩們能夠更上一層樓!

三、網路版藏經檢索與運用

  網路藏經檢索,主要分成經目檢索和經文全文檢索兩個部份。

  目前網路上最完 善的經目查詢系統之一,就是香光尼眾佛學院圖書館提供的多樣性檢索系統,例如「藏經目錄整合查詢系統」、「心經索引典」、「佛教年表資料庫查詢系統」、 「佛書解題資料庫檢索系統」、「佛教經典主題詞全文檢索資料庫」、「南傳大藏經目錄檢索系統」、「藏經題名多語對照檢索系統(測試版)」。

  以「藏經目錄整 合查詢系統」為例,收錄了《大正新脩大藏經》、《卍續藏經》、《佛教大藏經》、《高麗大藏經》(新文豐)、《明版嘉興大藏經》、《大藏經補篇》、《中華大 藏經》(大陸版)、《乾隆大藏經》、《卍正藏經》、《磧砂大藏經》、《敦煌大藏經》、《大藏新纂卍續藏經》等十二種藏經目錄,能查詢「經名」(有四種模 式)、「朝代」、「譯作者」、「經號」和「冊號」等選項。

  此系統查詢同一經典在不同藏經之中的位置,很具有參考價值;不過,如果這些檢索系統能彼此連結,如「藏經目錄整合查詢系統」和「佛書解題資料庫檢索系統」連結,查詢到經目之後,如果再進一步提供連結到《CBETA電子佛典集成》或是《高麗藏》等線上資料庫,提供經典全文瀏覽,便可以發揮更好的加值效果。又如CBETA的網站提供了經名和經文的檢索系統,直接連結是很容易的,反之,如果能夠從CBETA的網站連到解題資料庫,提供讀者經典的基本介紹,也是一項加值服務。

  藏經的全文檢索,除了CBETA的檢索介面之外,許多利用CBETA藏經資料庫建置的檢索引擎,各有特色,如角虎大藏經www.jhoo.com,提供類似Yahoo的分類目錄,當然也可以直接透過Google來檢索。

另外,《高麗大藏經》也有提供網路檢索(http://211.46.71.250:8088/condsearch/), 可透過「經名」、「主題」和「分類」來檢索。分類如年代、譯著者、部別等,主題則有教理、修行、信行、護教和通佛教等的分項。其經文的顯示是利用圖檔的方 式直排呈現,由於《高麗大藏經》在電子化的過程中,針對異體字做了許多的研究,在全文檢索中也提供了異體字輸入的介面。(如圖四)


圖四:高麗大藏經



  除了漢文佛典外,網路上也有其他語文的藏經,像是www.accesstoinsight.org提供南傳大藏經(英譯)的資料,或是VRI的巴利大藏經(http://www.tipitaka.org/tipitaka/booklistframe2.html)等。附帶一提,許多網路資料庫亦針對獨特的主題,提供不同的藏經內容,如「瑜伽師地論資料庫──電子佛典製作與運用之研究」(http://ybh.chibs.edu.tw/index.htm)提供的梵文藏文經典及科判對照,對研究於《瑜伽師地論》的朋友,便十分值得參考。(如圖五)

圖五:瑜伽師地論資料庫




四、個人資源的建置

  如何將單機版或是網路版的資源,變成「個人版」的資源呢?   由於資訊量過於龐大,加上資訊設備及網路的普及,因此,未來能掌握最核心資訊的,就擁有最大的價值。舉例而言,諸如收發電子郵件E-mail), 重要的是有效的郵件(排除垃圾信件及病毒,以及常態性可置入資料庫的電子報等),而不是電子郵件軟體。好的電子郵件軟體可以提供我們更有效率的操作方法, 讓我們運用自如。也因此,如何透過軟體協助我們處理重要的資訊,能夠提供更快、更廣、更深、更精確、更穩定且更便利的服務,就成了需要考慮的重點。

Google資料庫

  如前言所述,Google提供了一般檢索、學者、書摘及桌上檢索軟體等服務。整體而言,Google對中文的相容性並不是非常的好,在Gmail和桌上檢索軟體上都有這樣的問題。不過透過一些參數的設定,Google便能尋找到許多有用的資訊,您可以下載安裝IE的外掛程式google toolbarhttp://toolbar.google.com/),而MSNopenfind也提供類似的服務。

  簡介Google搜尋時一些好用的設定,如下頁附表。

  表中許多功能可以合併使用,例如

buddhism OR buddha site:print.google.com

搜尋Google書摘中含有buddhism或是buddha的文章。

  除了網路工具之外,也有一些好用的單機版工具,如cbgrep全文檢索工具,是CBETA提供的免費純文字經文檢索軟體。然而真正重要的不是複雜或是昂貴的工具,而是使用和需求。以書目管理軟體為例,諸如Reference ManagerEndNoteRefWorkProcite等,都是很好的軟體,但就實際需求,如操作介面、文獻數量、多語文相容性、匯入匯出、加註筆記、輸出格式、檢索維護等,都需要加以考量。

  除了收集並建置資料庫之外,透過社群(實體或是網路)共同分享,也是一個不錯的點子,甚至還可以共同完成一些計劃,如Charles Muller主編的電子佛教辭典Digital Dictionary of Buddhismhttp://www.acmuller.net/ddb/),就是很好的例子。

Google搜尋功能設定

功能

標示

說明

合併搜尋

OR」=或

+」或空白=和

在關鍵字中加上空白即可,例如:「金剛經 玄奘」;或者是「金剛經 OR 金剛般若波羅蜜經」。(OR是大寫)

排除搜尋

減號

排除含有不必要字串的搜尋結果,在關鍵字前加上減號,例如:「菩薩 阿羅漢」。

整句搜尋

加雙引號

在關鍵字前後加上雙引號,例如:「阿彌陀佛」。

搜尋網站

site:

把網址當成關鍵字,並在其前加上“site:”標示,例如:「site:www.cbeta.org “大正藏

這個方法也可以用來搜尋國別碼,如twhkcn等。

搜尋網址

inurl:

加上“inurl:”標示,就可以在網址列中搜尋,例如:「inurl:buddhism」是指網址列中出現buddhism的連結。

搜尋檔案格式

filetype:

加上“filetype:”,可以搜尋文件檔案的副檔名,像是DocPDFppt,這招十分好用,例如「filetype:Pdf 阿含經」

搜尋標題

intitle:

加上“intitle:”,可以搜尋網頁的標題名稱,像是「intitle:普門品」。

反向連結

link:

加上“link:”標示,可以查詢反向連結,像是想知有多少網站連結到香光尼僧團的網站,就可以輸入「link: www.gaya.org.tw

其他設定

可以利用Google提供的「使用偏好」和「進階搜尋」功能,包括語系,顯示筆數和漢字簡繁體是否要轉換等的設定,十分便利。

計算機

「等於多少」

=?

Google的計算功能強到令人咋舌,不單是「1+1」,連「一磅=?,」、「光速乘以二秒等於多少公里」之類的問題,都能告訴你答案。

英文定義

http://www.googlism.com

googlism提供了英文字的定義查詢,這是屬於Google的辭典,僅供參考。

  此外,許多單機版的藏經,在資料格式上並不相容,這一點也是處理上較困難的地方。CBETA採用的XML標記具有一致性和交換性,在Accelon平台上和其他的資料庫,如《印順法師佛學著作集》、《中華佛教百科全書》等進行連結,並不是困難的事情。

  不過為了能夠建置自己的檔案庫,筆者建議應該先建好檔案管理的機制,並定期進行備份與整理。除了檔名的編碼外,在檔案中加上必要的摘要說明,也能加速檢索和運用。

五、結語

  隨著資訊科技的進步,網際網路的普及和電子商務的發展,未來的生活,人們將愈來愈倚靠電腦,也愈益加速研究的腳步。雖然有人說,網路上找不到真正的知識;然而實際上,能否找到知識,重要的並不是那些訊息本身,而是解讀者所擁有的洞察力!

   現有的佛教藏經資源,已經可以查詢、瀏覽、檢索,相較於十年前的環境,簡直是天壤之別。筆者過去有幸參與中華電子佛典協會的藏經數位化計劃近五年,了解 它許多的功能正逐漸在進步,卻也仍有許多改善的空間。不過,如果我們一味的因為尚不完善而貶低現有的服務,或是因為太多功能而拒絕使用,不也是太愚笨了 嗎?(註2

【附註】

註1:《自由時報》,2004年12月16日。
註2:《百喻經》[卷1]「過去有人。癡無智慧。極渴須水。見熱時 焰謂為是水。即便逐走至[22]辛頭河。既至河所對視不飲。傍人語言。汝患渴逐水。今至水所何故不飲。愚人答言。[23]君可飲盡。我當飲之。此水極多俱 不可盡。是故不飲。爾時眾人聞其此語。皆大嗤笑。」(CBETA, T04, no. 209, p. 543, c6-11)

[22]辛=新【宋】【元】【明】

[23]君=若【宋】【元】【明】

《百喻經》[卷2]「昔有一人。行來渴乏見木筩中有清淨流水。就而 飲之。飲水已足即便舉手語木ⓣ言。我已飲竟。水莫復來。雖作是語水流如故。便瞋恚言我已飲竟。語汝莫來。何以故來。有人見之言。汝大愚癡無有智慧。汝何以 不去。語言莫來即為挽却牽餘處去。」(CBETA, T04, no. 209, p. 548, c13-18)

0 意見:

張貼留言