◎本會預訂於今年十二月十九日舉行本年度成果發表會。(發行組) ◎T18(密教一)經文校對預計月底完成。(校對組) ◎T03(本緣上)校勘條目輸入完成。(輸入組) ◎T01-T17,T22-T32--NORMAL,APP1 版完成。 ◎T01-T17,T22-T32--DOC 版測試中,HTMLHelp版測試中。 ◎十一月初完成第一至第四冊(阿含部 及 本緣部)上網,預計於十二月初上網第 13 (大集部) 、14~17 (經集部)、 30 (中觀部)、31~32 (瑜珈部)等共計八冊。(網路組) ◎特別感謝林光明先生熱心指導本會同仁梵字悉曇字及陳惠珍女士的慷慨協助。(CBETA) 中華電子佛典協會相關工具簡介...............................網資組 這次主題是 CBETA所使用的工具程式簡介,後學就依時間的演進,將過去、現在及未來打算進行的程式,做一個粗略的介紹。 *** *** *** *** *** *** *** 【去點程式】 86年 8月,在獅子吼站 buda-tech 發表的去點程式 Mvdot 算是 CBETA最早期使用的程式之一。 一般的書籍,多少都會有標點符號,就算是古籍,也會在文字旁加上圈點,以利讀者閱讀。然而在使用OCR處理掃瞄的圖檔時,那些標點卻成了增加誤判的符號,有一度網路上的友人用「雜點」來稱呼它們呢!在經過朋友的實驗之後,認為事前手動將「雜點」去除再來進行 OCR,效果遠比事後手動一一校對來的省事,但長時間手動去除雜點所造成的抽筋,激起了利用電腦程式來去除雜點的構想。 在大伙的不斷實驗下,去點程式的運作雖不能算是非常完美,但的確省下不少人力,最新的一個版本可以去除「大正藏」、「佛教大藏經」及「續藏經」的「雜點」,在本網站的技術篇中,有去點前後的圖檔可供參考比較。 【檔案比對】 關於檔案比對程式,在本網站的技術篇及本電子報之創刊號,有著很詳盡的介紹,有興趣的朋友請直接前往參考。 【看圖校對】 開發「看圖校對」與「檔案比對」程式的概念,是我在 CBETA學習到最有創意的東西,也是我最喜歡分享的心得。 在傳統的校對工作上,就是將書面稿或電子稿,配合原始書面資料,逐字查看,這是我們所了解的校對。而「檔案比對」則是利用交叉比對的觀念,將可能會發生錯誤的地方挑出來,不但省去逐一閱讀的時間,也改進了人工校對所不易發現的盲點。 我們試想,當我們發現某處可能發生錯誤時,翻書找到該頁、該行,並查看該字時,大概會花費多少時間呢? 為了改進這一點,我們保留 OCR時所用的圖檔,依其架構整理,並將處理中的電子經文也附予基本的書面結構資訊,我們一般稱之為「行首資訊」,例如我們看到 T05n0220_p0001a01 表示是大正藏第五冊 220 經第一頁上欄第一行,當這些資訊配合圖檔,就是一套校對的利器了,在「看圖校對」的程式中,一但遇到有問題的字,只要按一下鍵,原圖的該字就會立刻呈現在使用者面前,只要再按一下滑鼠,大部份的情況就可以選到正確的文字,所省下的時間是非常龐大的,更令人欣慰的是,在高速校對下所完成的品質,不亞於傳統人工十校的正確率。 這支程式目前只適用於直式的原始資料,曾答應過一些朋友要加上橫式文章的校對功能,但一直沒有時間進行,這是目前很抱歉並引以為憾的地方! 【看圖校對(II)】 從對大正藏圖檔的分析對映到文字檔,使我們可以校對目前文字檔中的校勘符號、圈點或特定的圖形等等。這個程式目前正在開發中,亟盼各界高手給與指導。 【漢書與 Perl】 這個似乎很眼熟?沒錯,這並不是 CBETA自行開發的工具,卻也是我們在做文字處理工作時很常用的程式,故特地介紹一下。 漢書是由大方廣資訊施得勝先生所開發的文字編輯器,它除了是一個功能極強的編輯程式之外,其所提供的巨集功能,更是協助我們省下許多重覆又無聊的工作,而對於巨集使用上的問題,施得勝先生更是不吝給予指教,在此要特此提出感謝! Perl程式也是處理文字的利器,它簡單、易用、跨平台及對文字處理的極強大彈性,使得日常處理的工作幾乎都交給 Perl 了,我們也寫了許多Perl小程式來進行內部的諸多流程,這是我所樂於推薦的程式。 *** *** *** *** *** *** *** 以上的介紹是屬於生產時期的程式,以下要介紹一些應用類及未來打算開發的程式。 【缺字小工具】 這個 Wordtool 程式並沒有對外公開,因為只是實驗性質的試作,目的在於統一缺字組字式的組合法,關於「組字式」可參考我們網頁技術篇中的缺字部分,以 [金*本]為例,這是我們標準的組法,若有人輸入[釱-大+本]也可以自動轉換成 [金*本],這個界面有助於統一組字式的輸入,就不會在查詢時,因為輸入不同的組字式,造成無法找到的結果。 若是輸入 Big5 系統字的部份,本程式也會自動轉成系統字,例如輸入[門@狊] 或[門@(目/犬)],程式會知道這是系統字,進而轉換成「闃」字,在某個角度來看,這也算是一種輸入工具吧! 【文字搜尋工具】 CBGrep是針對一般文字所設計的文字搜尋工具,這是參考童闓運先生所提供的 CTGrep 原始碼修改而成,CBGrep 有著視窗介面的好處,而 CTGrep的搜尋速度則是令人難以想像的快速! 這二支程式並不是需要索引檔的全文檢索式工具,速度總是不如全文檢索,但它是針對 CBETA電子佛典而設計的,它可以跨行搜尋、忽略行首資訊、忽略全半型空白的影響,雖然沒有美觀花俏的介面,但不失為輕巧好用的工具。 【佛學電子辭典】 不論初學或老參,有一本好的佛學辭典是不可或缺的工具,拜於科技所賜,佛學電子辭典的功能更遠超過傳統書本的功能,使我們在佛法大海中,不致因過多難解難懂之名相而產生望之卻步的困擾。 感謝「佛教電腦資訊庫功德會」提供「丁福保佛學辭典」的資料,本協會也在參考「佛光山佛學電子辭典」的架構之下,開發完成一支電子辭典程式,這支程式的特色是採開放式的架構,每個人都可以依標準格式而將自己整理的資料加入這支程式中,讓它更有擴充的彈性與空間。而本協會目前只提供上述之「丁福保辭典資料」及「陳義孝佛學名相」,這些可在本協會網頁之下載區找到並下載,希望能對大眾有所助益。 關於「佛光山佛學電子辭典」,由於版權之故,本協會無權散佈及提供下載,但這亦是極為有用的工具,個人樂意介紹大家使用,更希望日後可以看到此一珍貴資料得以無條件的在佛教界廣佈流傳,那就是眾佛子的福氣了。 【全文檢索】 全文檢索這個領域,本協會僅有實驗性質的成品,並無對外提供,這也是未來 CBETA經文逐漸完成之時,很重要的檢索工具,關於這個領域,本人也在此徵求,希望對這個領域有研究的朋友,能不吝指教的與我們交換心得,以期日後能完成好的作品提供大眾使用。 目前在 CBETA網站上,是使用中正大學GAIS團隊所發展的gais search engine ,歡迎網友們多加利用。 【讀經器】 一個好的讀經器,包含的層面是廣泛的,除了上述技術方面的問題,如:缺字處理、全文檢索等,也要考慮讀經器本身的特性,使用功能、親和力、未來的擴充性及許許多多的考量,這一部份的構想也是逐漸在成形中,同樣的,希望對這方面有經驗及有興趣的朋友,我們很歡迎您與我們聯絡,讓我們一同為「電子讀經器」打造一個良好而實用的環境。 *** *** *** *** *** *** *** 介紹了這一些,或許日後還有許多新的概念會陸續產生,不論是構想和技術、或是心得與批評,都歡迎告訴我們,為大眾提供更好的環境是我們的動力,而您的支持則是這個動力成長的因素,期待您的大力參與! ┌ 天海藏(寬永寺本)(1637-1648) │ 黃蘗藏(鐵眼本)(1669-1681) │ 弘教藏(縮刷藏本)(1880-1866) │ 卍字藏(1902-1905) 日本 │ 卍字續藏(1905-0912) │ 大正新修大藏經(1922-1932) │ 昭和再訂縮刷藏(1935-) │ 聖語藏(古寫本與版本集合而成約自759-1093) └ 宮本(即福州東禪寺與開元寺本合成之全藏) 《卍字藏經》 全稱《大日本校訂訓點大藏經》。又稱《大日本校訂藏經》、《日本藏經書院大藏經》、《卍(萬)大藏經》。係日本京都藏經書院於明治三十五年至三十八年間(1902∼1905)編輯鉛印,依據忍澂所校訂的黃檗本,以四號活字印行的方冊本。其經目略依《北藏》,經文多從《麗藏》,經名亦以《麗藏》為主。全藏計有三五七冊,分裝三十七函(包括目錄和索引一函兩冊),共收一六二二部(不計目錄和索引)、六九九○餘卷。全藏印完後不久,藏經書院失火,存書被焚殆盡,因此流傳不多。 所錄典籍分為經、律、論、西土聖賢撰集、此土撰述等五類。經分大小乘經及宋元入藏諸大小乘經、宋元入藏諸大小乘經之餘。大乘經又分般若部、寶積部、大集部、華嚴部、涅槃部及五大部外重譯經、單譯經;小乘經又分阿含部、單譯經,共十八部門。一至三十五函每函十冊,三十六函分甲乙兩套,甲套二冊,乙套三冊。 此部大藏經,由於所收書之絕大部份為風行於其後的《大正藏》所收,故此藏之使用價值大體已為《大正藏》所取代。然其續編《卍續藏經》所收書之未見於其他藏經者為數至多,因此,往往獨立於此《卍字藏經》之外,而單獨刊行。 《卍續藏經》 又稱《大日本續藏經》、《卍續藏》、《續藏經》。日本明治三十八年至大正元年(1905∼1912)間,前田慧雲、中野達慧等編集收錄《大日本校訂藏經》(卍大藏經)所未收者,而成此續藏。京都藏經書院刊行。全藏分三編,共為線裝七五一冊,一五一函,每函五冊。計收九百五十餘人之著作。共一七五六部、七一四四卷(一說一六五九部,或說一六六○部、六九五七卷)。其中頗多中國古代大德的著述。版式每面分上、下欄。每欄十八行,每行二十字。為線裝方冊本。其編目主要分二部分。即︰ (1)印度撰述︰包括經、律、論三部。經分大小乘,大乘按華嚴、方等、般若、法華、涅槃之順序。 (2)中國撰述︰包括大小乘釋經、釋律、釋論、諸宗著述、史傳等。 本藏全部印就之後,存書和《卍字藏經》一起被焚,流傳不多。商務印書館曾在民國初年據原本影印500部發行。 此一藏經雖係《大日本校訂藏經》之續編,然以收錄九百餘部為其他藏經所無之佛典,且絕大部份係中國佛教著述,因此每為研究中國佛教者所特別重視。且常被單獨刊行,而獨立於其正編《卍字藏經》之外。第二次世界大戰以後,日本出版界且將此藏重新整理,以新式版面(分上中下三欄,每欄二十四行)印行於世。大約在 1990 年左右,全部出齊。共計精裝(十六開)九十冊。 參考資料:《二十二種大藏經通檢》、蔡念生《二十五種藏經目錄考釋》、《歷代漢文大藏經概述》 聖嚴法師法語 摘錄自中華佛學研究所專輯光碟,您亦可在法鼓山的網站找到最新的資料,感謝法鼓山網站概允本會張貼 http://www.ddm.org.tw/education/chibs/ 【福與慧】
【少欲、知足、慚愧、懺悔】
●Sophia大德來函詢及以下之事項: 一、讀經器無法執行; □CBETA 發行組的答覆是: 一、針對目前在網路上的測試版讀經器,由於係利用VB所撰寫的原型程式,經多位大德指出安裝執行上有困難,目前已經進行進一步的研究處理中;不過佛學辭典程式則經測試尚無類似問題產生。 二、由於讀經器需要另外安裝相關的目錄檔案,因此目前尚無法支援所有的經文。對於下載經文格式的部份,是係用大正藏經號方式命名,目前已委請敝會網路組同仁研究處理。 三、目前本會致力於大正藏經文的輸入與校對,而學術版預計在經文目標完成後才會大量投入人力製作,目前學術版仍在研發階段。而本會曾出版大正新脩大藏經第五至第十冊之光碟供大家結緣,詳情可至本會網站查詢。 謝謝您的指導,並對讀經器無法正確執行感到十二萬分的歉意。 敬祝 法喜充滿 中華電子佛典協會發行組 厚德 合十 以下是一小部份來自世界各地支持本會的朋友陸續寄來的支持信函,在此一併致謝並簡覆之。 首先感謝所有支持本會的朋友,以及義工菩薩們的指導與鼓勵,本會將秉持初衷繼續為大眾服務,以最好的品質及內涵將佛經呈現給大家。 目前本會已先後將完成的大正藏經文普及版依續上網供大眾下載,如有需要可至本會網站取得相關訊息,您亦可至本會網站訂閱本電子報,除了每月在電子報之中和大家分享本會的成果之外,也提供不定期的 CBETA之友通訊,使您能在最快的情況下得到本會最新的訊息。 本會的網址是: 或 當然,除了提供大家經文之外,本會也極需要各位朋友對本會發行的光碟和經文提供使用上的建議和指導,雖然礙於本會之人力物力不一定能夠針對您的問題提供滿意的解決方案,但是皆將納入本會未來努力的方向。因此,誠懇盼望諸位大德給予指導。 敬祝 法喜充滿 中華電子佛典協會發行組 厚德 合十 敬啟者: 華梵哲學系 郭朝順 敬啟者: 感謝您贈送CBETA-2電子佛典光碟,使用起來非常方便,也很人性化,真感謝您們!請告知劃撥帳號,以盡微薄之力,感恩您。 高雄市前鎮區瑞豐國小 高志成 敬上 中華電子佛典協會的諸位大德: 諸位大德!謝謝您們!您們所結緣的CBETA電子佛典(含佛學辭典)光碟,已於日前收到,非常感激您們的法布施,謹代表台大晨曦佛學社禪作組向您們致以萬分的感謝,言不盡意,總之,謝謝您們的發心與成就! 祝諸位大德: 身心安康! 願以此功德,普及於一切,我與眾生等,皆共成佛道! 台大晨曦佛學社 禪作組負責人 趙東明 合十 中華電子佛典協會惠鑒: 謹啟者,日前承蒙 貴會惠贈「電子佛典系列」光碟,欣喜不已,故以電子郵件謹表鳴謝之意。私衷銘感,特此奉達,敬請 道安 晚 十一月四日 感謝寄贈佛典光碟,感謝諸大德的努力. 後學E-Mail是: 後學 彭雲宏敬上 East Asia Library Date:Aug , 10 ,1999 From:Yeen-mei Wu 吳燕美 On behalf of the East Asia Library. University of Washington, CBETA電子佛典 We would appreciate it very much if you would continue to send us, Thank you for your generous support of the University's programs, 專題報導: 本年度成果發表
|