CBETA E-News 中華電子佛典協會新聞電子報

2000-05-25 第十三期

【 本期專題 】電子佛典推進協議會(EBTI)簡介(四)
【 本期內容 】
最新訊息》《專題報導》《心靈小語》《交流園地

最新訊息

◎持續進行T16-21、T33-55、T85校勘條目輸入工作。(輸入組)

◎T41(論疏部二)、T44(論疏部五、諸宗部一)經文校對預計五月底完成。(校對組)

◎預計六月初上網 T33-T36 (經疏部一~四)。(網路組)

◎單經下載已完成普及版,Word版與精簡版上傳。(網路組)

◎文字切割程式進行中。(資訊組)

◎光碟再版與更新相關事宜。(研發組、資訊組、發行組)

◎(研發組)

  1. 缺字處理(查通用字)--T33-T36,T38-T39。
  2. 整理寄文字鏡造字資料--T33-T36,T38-T39。
  3. XML檔檢查--T38。
  4. normal檢查--T38。
  5. HtmlHelp版轉檔後檢查--T38。
  6. juan檢查--T38。
  7. 校勘條目缺字處理(查通用字)--T01-T02。
  8. 校勘條目校對--T01-T02。
  9. 悉曇(siddam)缺字之字型檔與輸入法之增補--T18-T21。
  10. 悉曇(siddam)一校--T18-T21。

專題報導

電子佛典推進協議會(EBTI)簡介(四)

中華電子佛典協會 杜正民 編譯

肆、第五屆電子佛典推進協議會會議紀實

筆者註:
1. 本篇第9期- 11期資料摘編自 :
佛教圖書館館訊 第十五期 87年 9月當代國際佛典電子化現況:電子佛典推進協議會(EBTI)簡介

2. 第12期- 13期資料摘錄改篇自:
現代佛教學會通訊 (1999年4月15日第二期)「從台北看國際電子佛典實況:1999 EBTI會議大會實錄」(Report of 1999 Electronic Buddhist Text Initiative)

一、前言:

  由教育部電算中心及中研院計算中心主辦,法鼓山中華佛學研究所、菩提文教基金會暨台大佛學研究中心協辦的第五屆「國際電子佛典推進協議會」(Electronic Buddhist Text Initiative, EBTI) 於九九年元月15日至21日,假中央研究院學術活動中心與地球科學研究所會議廳盛大舉行,主題豐盛內容充實。

  不同於往年的單獨舉辦,九九年的EBTI會議擴大為一大型的聯合會議,與會的團體除了EBTI之外,還有文化地圖協會 (Electronic Cultural Atlas Initiative, ECAI),學者電子資源協會 (Scholars Engaged in Electronic Resources, SEER) 以及太平洋鄰里協會 (Pacific Neighborhood Consortium, PNC) 等團體參加。本次聯合會議與會的國內外學者多達三百多人,發表論文與展示研討者計有一百五十多位學者專家參加,而與會學者則分別來自十七個不同的國家,可說是一大型的國際會議。

  此外,本次會議另一特色就是於元月15日至16日兩天,特別舉辦會前的講習會(Tutorial),本次的「會前會」特別邀請澳洲、英國與美國等學有專長及實務經驗豐富的學者專家來台講習,提供很多務實的實際經驗。於研討課程中,講者就其工作經驗與專長,提供很好的實務方法與先進技術的解說,實為一難得的機會,而且也是提昇台灣佛典電子化工作的重要講習會。本次講習的主旨,誠如中研院簡章所言,主要是提供台灣「研習相關範疇技術的人員得以掌握其精髓」。

  本次的會前會共計四場分兩天舉行,計有超資料製作 (Metadata)、文獻編碼 (TEI, Text Encoding Initiative)、地理資訊系統 (GIS, Geographical Information System)、圖像資料 (Image Database) 四種課程。因為這些講習不同於以往的會議,且這些技術也是台灣佛教電子化單位較少使用,因而特別記錄於下,與有興趣的工作者分享:

二、會前會:

超資料製作 (Metadata)

  第一場的Metadata講習會,分別是由澳洲的 Dr. Helen Jarvis 與 Dr. Ian Johnson 主持,主要是介紹文化地圖協會 (ECAI ,http://www.ias.berkeley.edu/ecai/main.html) 所採取的Dublin Core標準。Dublin Core是一套簡潔易學的標準,主要是以十五個元素來記錄所有電子化資料的屬性,作為先製資料。共分為DC.Title, DC.Creator, DC.Subject, DC.Description, DC.Publisher, DC.Contributor, DC.Date, DC.Type, DC.Format, DC.Identifier, DC.Source, DC.Language, DC.Relation, DC.Coverage 及 DC.Rights 等15項目,作業人員可以用這些項目來管理電子圖書館與電子博物館的文獻資料及文物項目,以作為檢索與交換的標準。

[筆者註:Metadata 於佛學文獻資料的電子化是一重要的概念,尤其在佛學書目的管理,及佛教文物圖像的電子化,皆可採用Dublin Core 的十五個元素作為標準建立先製資料,以做檢索與交換之準則。]

文獻編碼 (TEI, Text Encoding Initiative)

  第二場次TEI文獻編碼 (Text Encoding Initiative,http://www-tei.uic/orgs/tei/app/) 的講者,是來自英國牛津大學的Dr. Lou Burnard,他也是《TEI手冊》(Guidelines for Electronic Text Encoding and Interchange, TEI P3) 一書的作者與推廣者之一。由他親自來講解 TEI準則自是最恰當不過了,在他幽默的講習下,相信與會者的收穫應該是頗為豐盛的。本次講習主要是介紹基本的TEI 規則,首先他先定義說「TEI 是一種文法 (Grammar),也就是文獻電子化的規則」,進而介紹如何將這些規則應用於詩句、劇本、講稿、字典等文件。總之, TEI 就是說明如何應用這些標準,以記錄及保存原來的文獻,完善的將之呈現於電子模式上。

  講者並進一步對如何於電子文獻中呈現各種語言,如何指向其他的電子文獻、影像,如何標記出名相、時間、地點等資料,如何呈現文獻內的不同對話,如何連結其他的參照資料,及如何編輯論疏等參考文獻等方法作詳細解說。

  接著,則說「TEI 的由來是因為人文檢索的需求」,也就是因為目前的全文檢索無法滿足學者與使用者的需求,因而需借助其他的方式來達成此需求。 TEI 的目標就是希望能支援各種類型的文件、各種不同的語言、及不同時代的文獻,幫助專家如何對任何有興趣的資料編碼,以作為檢索或交換之用。並且, TEI 可以用SGML (Standard Generalized Markup Language) 或XML (Extensible Markup Language) 自訂所需的屬性規範,可在WWW上使用的XML語言,因不必受限於HTML的格式,將有助於TEI 的開展。

[筆者註:中華電子佛典協會(CBETA),目前正在進行的大正藏電子化作業,完全採用Dr. Brunard 的TEI 規則,以SGML/XML 的表達進行標記工作,相信對於將來電子佛典文獻的呈現與使用,較能達到使用者的需求。]

地理資訊系統 (GIS, Geographical Information System)

  本場次是由澳洲 Dr. Lawrence Crissman 及美國 Dr. Karl Longstreh 共同主持,主要是介紹如何運用GIS建立資料結構與地圖的對應等工作。會中並以實務經驗介紹GIS的技術、建立與應用GIS的程序、以GIS做研究及組織資源與資訊的方法等。

  Dr. Longstrech 更以芝加哥大學有名的中國研究所建立的「中國資料中心」(China Data Center, http://www.umich.edu/~iinet/chinadata) 網站資料做展示與解說,使與會者對於GIS 的實際運用有更進一步的瞭解。譬如中國同一村落於歷代的地理變遷,以歷史地理資訊,架構一個多層次超越時空的資訊與資料,就可以很明確的顯示出來。

  講者在講習會中,主要是就GIS 的重要性,時間、空間的參照,與GIS 專有名詞等課程做解說。並且認為GIS的使用與發展,對將來的資訊研究有很大的影響。

[筆者註:此GIS系統將來在佛學研究及應用上,將會有很大的幫助。因為,不但可以建立歷年來的佛教史料與地理資料外,更可以連結中華電子佛典協會處理過的標記 (Markup) 經文,建立完整的各種時空的佛教狀況,以作為進一步的佛學研究。譬如各寺院史料的研究,佛教歷史的發展,歷代高僧大德的研究等等,都可以用時間與空間加上語言文獻的研究,重新建立一新的架構作為研究資料。]

圖像資料庫 (Image Database)

  最後這一場次則由美國Ohio State University 的Dr. Janice Glowski 主持,有別於前幾場的講習,本場次先以腦力激盪 (Brainstorming) 的方式,確立計畫目標與任務的方式進行。再依國際標準、所需設備、應用軟體等需求,以建立協定 (Establishing Protocols)、 攝影協定 (Photography Protocols)、數位化協定 (Digitization Protocols) 等方式,進行第二步驟的「計畫階段」(Planning Phase),作為建立電腦之間通信與資料傳送所遵守的規則 (Protocols),以達成圖像影像檔的方便交換與管理。

  最後,則以Huntington Archive of Buddhist and Related Art 佛教圖像資料庫的實務經驗,做影像校正 (Image Correction) 的範例說明,並以實際經驗提出許多很好的建議,譬如說資料庫收錄超過5,000個圖檔,則可考慮採用具有自動功能的高速掃描器 (例如Nikon LS-2000),甚至建議以掃描器的最高解析度 (1,800dpi) 來掃描等實際的工作情形,以提高品質。講者並於會中,提出許多工作上常犯的錯誤與改進的方法等實際經驗,實為一場務實的講習。

[筆者註:Huntington Archive (http://kaladarshan.arts.ohio-state.edu/) 蒐集有相當豐富的佛教圖像,是一豐富的佛教圖像資料庫。台灣如果要建立一佛教圖像資料庫,任教於Ohio State University的Huntington夫妻的作法及其所提供的經驗與建議,是相當有用的資訊。]

....(待續)....

心靈小語


菜根譚 選錄

﹝明﹞ 洪應明

關於修身


一念錯,便覺百行皆非,防之當如渡海浮囊,勿容一針之罅漏﹔
萬善全,始得一生無愧。修之當如凌云寶樹,須假眾木以撐持。

忙處事為,常向閑中先檢點,過舉自稀。
動時念想,預從靜里密操持,非心自息。

為善而欲自高勝人,施恩而欲要名結好,修業而欲驚世駭俗,植節而欲標異見奇,
此皆是善念中戈矛,理路上荊棘,最易夾帶,最難拔除者也。
須是滌盡渣滓,斬絕萌芽,才見本來真體。

能輕富貴,不能輕一輕富貴之心﹔
能重名義,又復重一重名義之念。
是事境之塵氛未掃,而心境之芥蒂未忘。
此處拔除不淨,恐石去而草復生矣。

紛擾固溺志之場,而枯寂亦槁心之地。
故學者當棲心元默,以寧吾真體。亦當適志恬愉,以養吾圓機。

昨日之非不可留,留之則根燼復萌,而塵情終累乎理趣﹔
今日之是不可執,執之則渣滓未化,而理趣反轉為欲根。

無事便思有閑雜念想否。有事便思有粗浮意氣否。
得意便思有驕矜辭色否。失意便思有怨望情懷否。
時時檢點,到得從多入少、從有入無處,才是學問的真消息。

士人有百折不回之真心,才有萬變不窮之妙用。
立業建功,事事要從實地著腳,若少慕聲聞,便成偽果﹔
講道修德,念念要從虛處立基,若稍計功效,便落塵情。

身不宜忙,而忙于閑暇之時,亦可儆惕惰氣﹔
心不可放,而放于收攝之后,亦可鼓暢天機。

鐘鼓體虛,為聲聞而招擊撞﹔
麋鹿性逸,因豢養而受羈糜。
可見名為招禍之本,欲乃散志之媒。學者不可不力為掃除也。

一念常惺,才避去神弓鬼矢﹔纖塵不染,方解開地網天羅。

一點不忍的念頭,是生民生物之根芽﹔
一段不為的氣節,是撐天撐地之柱石。
故君子于一虫一蟻不忍傷殘,一縷一絲勿容貪冒,便可為萬物立命、天地立心矣。

撥開世上塵氛,胸中自無火焰冰競﹔
消卻心中鄙吝,眼前時有月到風來。

學者動靜殊操、喧寂異趣,還是鍛煉未熟,心神混淆故耳。
須是操存涵養,定云止水中,有鳶飛魚躍的景象﹔
風狂雨驟處,有波恬浪靜的風光,才見處一化齊之妙。

心是一顆明珠。
以物欲障蔽之,猶明珠而混以泥沙,其洗滌猶易﹔
以情識襯貼之,猶明珠而飾以銀黃,其洗滌最難。
故學者不患垢病,而患潔病之難治﹔不畏事障,而畏理障之難除。

軀殼的我要看得破,則萬有皆空而其心常虛,虛則義理來居﹔
性命的我要認得真,則萬理皆備而其心常實,實則物欲不入。

面上掃開十層甲,眉目才無可憎﹔胸中滌去數斗塵,語言方覺有味。

完得心上之本來,方可言了心﹔盡得世間之常道,才堪論出世。

我果為洪爐大冶,何患頑金鈍鐵之不可陶熔。
我果為巨海長江,何患橫流污瀆之不能容納。

白日欺人,難逃清夜之鬼報﹔紅顏失志,空貽皓首之悲傷。

以積貨財之心積學問,以求功名之念求道德,
以愛妻子之心愛父母,以保爵位之策保國家,
出此入彼,念慮只差毫末,而超凡入聖,人品且判星淵矣。人胡不猛然轉念哉!

立百福之基,只在一念慈祥﹔開萬善之門,無如寸心挹損。

塞得物欲之路,才堪辟道義之門﹔馳得塵俗之肩,方可挑聖賢之擔。

容得性情上偏私,便是一大學問﹔消得家庭內嫌雪,才為火內栽蓮。

事理因人言而悟者,有悟還有迷,總不如自悟之了了﹔
意興從外境而得者,有得還有失,總不如自得之休休。

情之同處即為性,舍情則性不可見,欲之公處即為理,舍欲則理不可明。
故君子不能滅情,惟事平情而已﹔不能絕欲,惟期寡欲而已。

欲遇變而無倉忙,須向常時念念守得定﹔
欲臨死而無貪戀,須向生時事事看得輕。

一念過差,足喪生平之善﹔終身檢飭,難蓋一事之愆。

從五更枕席上參勘心體,氣未動,情未萌,才見本來面目﹔
向三時飲食中諳練世味,濃不欣,淡不厭,方為切實工夫。

交流園地

電子佛典光碟使用心得分享(二)

電子佛典光碟使用心得分享(二)

  如果您需要利用到中華電子佛典協會提供的光碟進行兩個經文檔案的比對,您可以利用敝會在網路上提供的檔案比對程式,針對純文字經文檔案,找出相關的差異,再以純文字檔的編輯器編輯。

  最新版的FGFC提供了以下的功能:

(一)忽略比對符號:可自行設定不要比對的符號,如圈點;
(二)可設定最大差異的字數:如果差異超過這個字數,就中斷比對作業;
(三)隨時中止比對作業;
(四)設定文件編輯器,可直接點選開啟;
(五)提供兩檔及三檔的比對;
(六)缺字及組字式最佳化的處理,將缺字代碼及組字式視為一個中文字參與比對;
(七)可調整比對參數,以求得最好的效果。

  然而由於此程式大量的利用在敝會的校對作業之中,許多的功能均依照敝會的作業流程而設計,對於差異過大的檔案,可能並不十分完美。另外,程式亦未提供即時的差異顯示視窗,因此,如果您希望能自行於線上尋找差異,您可以利用Word或是其它程式尋找。

【 CBETA E-News 中華電子佛典協會新聞電子報】
http://ccbs.ntu.edu.tw/cbeta
台北市朱崙街36號303室 TEL:(02)8773-6469 FAX:(02)8773-6470