諸位法師大德們好, 中華電子佛典協會自成立以來,即受到大家的支持與關照,在去年底完成般若部、法華部和華嚴部電子佛典光碟後,接到源自全球各地的迴響以及許多的鼓勵和建議,讓 CBETA全體同仁感到無比的喜悅。 中華電子佛典協會於去年(1998)成立至今已逾一年,長期來受到諸位的協助和教導,在此深表敬意與謝意。對於未來佛典電子化的走向以及 CBETA的發展,仍需要諸位大德的指導與支持。 也因此,CBETA 成立發行推廣組,以求能將免費而高品質的電子佛典介紹推廣給廣大的群眾。如果您有什麼建議或心得,歡迎您不吝給予我們批評指教,您的關心將是 CBETA前進的最大動力。 應讀者需求,本協會近期推出 CBETA E-News 電子報。刊物中除提供佛典電子化訊息和介紹 CBETA近況外,也將 CBETA所使用的電子化資源和技術一併提供大眾分享。同時,也將在刊物中設立交流園地,無論是您使用CBETA電子佛典資料庫的建議與感想,或是您對佛典電子化的心得,乃至於您對 CBETA的期許,都歡迎您來信給我們,而任何的建議與問題,我們也將擇要在電子報以及網站上同時給您回覆。 我們很榮幸能與諸位在此刻同為佛典電子化這一件法界大事共盡一份綿薄的心力,也期許我們能為大家做出更好的成果。 感謝諸位的支持與愛護,願諸大德 深入經藏、智慧如海、法喜充滿 也祝您 事事順心如意 中華電子佛典協會全體 合十 ◎中華電子佛典協會三月二十三日會議中決議,於四月份開始,由校對組同仁厚德居士轉任發行組組長,並開始進行發行推廣工作。 (網路組) 中華電子佛典協會為加強提供大眾有關佛典電子化的訊息,並期使能和使用者保持良好的互動關係,特別企畫這一份電子刊物,希望能成為 CBETA和大家相互溝通成長的橋樑。 中華電子佛典協會新聞電子報(以下簡稱本報)預計於每月二十至二十五日出刊乙份,若遇特別的活動,則發行特刊。如果您先前已成為 CBETA之友的訂戶,則將成為本報的當然訂戶。與本報不同的是, CBETA之友通訊是不定期的「活動或訊息的通知」,而本報是定期且有固定主題的。 本報每期內容有本會最新訊息、專題報導、心情分享、網際導覽及交流園地等單元。而每期的專題報導,以單數月份提供佛典電子化的相關報導,雙數月份將本會電子化的相關技術提供各位分享為原則。 訂閱或取消訂閱的方式,只要您到本會網址,選擇電子報相關選項,輸入您的 E-mail 即可。 為考量不同的電子郵件界面以及網路傳輸的速度,所以本報採用純文字格式傳送,如果想要瀏覽HTML格式的文件,歡迎您到本會的網站上參觀。當然,這一份刊物不僅屬於本會同仁,更是屬於大家的。也希望每一位支持中華電子佛典協會的朋友,都能參與我們,給與我們支持,如果您有任何的建議和心得,歡迎發表在本報與大家分享。 正式的創刊號預訂於五月二十二日(農曆四月八日)正式發行,也請大家告訴大家。有關電子報之來函請寄至 cbetanews@ccbs.ntu.edu.tw 本文作者:Heaven 【前言】 後學目前服務於中華電子佛典協會(以下簡稱 CBETA),而 CBETA最令人讚佩的就是以高品質高精確度的電子佛典著稱。而其中最大的奧秘,主要是得力於 "檔案比對" 的觀念。 所謂檔案比對,就是將至少二份不同來源的檔案,把內容相互比對,將相異處找出來。若能利用電腦精確迅速的特性來完成這個工作,將會比人工校對來的正確而有效率。我們相信,在找到相異處之後,只要針對相異的部份來處理,必然可得到一份更高品質的資料。因為人為疏失是必然的,但兩份不同來源的文件在同一個地方發生錯誤的機率會變小,若三份文件在同一個地方都發生錯誤,那機率就更小了。 以三份不同來源而相同內容的經文來處理,CBETA 的目標是小於萬分之一錯誤率的品質。而在實際的測試中,CBETA 的確有能力達到這個目標。 【體驗】 檔案比對實際的情況是如何呢? 讓我們來體驗一番。 以此二句為例: 句一:戰士某申,身被鎧冑,直穿巿集而去,玆夫者誰?二王子是也! 也許您並不能馬上的找出所有的差異,倘若使用比對程式處理,呈現的結果如下: 戰{{士||土}}某{{申||甲}},身被鎧{{冑||胄}},直穿{{巿||市}}集而去,{{玆||茲}}夫者誰{{?二|| ﹖三}}王子是也! 共有六處七字的差異呢!您是否都發現了呢? 這個例子,也許能幫助我們了解使用檔案比對的好處。 【緣起】 電腦複製資料的快速和便利,帶給人們許多的好處。當然,人們很早以前就知道利用檔案比對來尋找差異,或是發現錯誤。 而筆者涉略檔案比對最先是源自於幾位從事電子佛典的朋友,他們在網路上提議以檔案比對的方式,針對網路上許多大德們提供的佛典電子檔案進行比對校正,以達到更高的品質。後來筆者也得到了中研院所設計的檔案比對程式,他們在輸入資料時是請兩家打字行輸入,再利用程式來比對。令人讚嘆的是,他們公開此一比對程式提供大眾使用,但有一個限制是:二份文件輸入的格式必需相同,如此才能做有效的處理。 但網路上流傳著許多佛典,其輸入者不一,來源也不同,格式很不一致,故無法利用中研院的程式,有些肯下工夫的朋友,就將文章的標點、空白等去除,再做成一字一行的檔案,然後使用 dos的 fc 來處理。如此也可以得到不錯的成效。 筆者在某個機緣下得知此事,就嘗試利用程式來幫忙。程式的構想如下: 【程式原理】 原文一 : ---,------,-----aaa----------bbbb-------- 1、設定 "忽略字",逐一讀取 "非略忽字" 比對,直到出現差異為止。 若忽略字為標點與空白,則第一個找到的差異處在 aaa---- 與ccccc---
的第一個字 本例的暫存區如下: buffer 1 : aaa----------bbbb-------- 3、另一個參數叫 CompareNum ,記錄判斷差異在何處結束。本來內定值為 4 ,意即:當有連續 4 個字在二個暫存區都相同,表示差異至此結束。 程式就是先捉 buffer 1 前四個字 [aaa-] 去 buffer 2 找是否有相同的,若無,就用下一組四個字 [aa--] 去 buffer 2 找。 若都找不到,則程式結束,表示有連續 100 個字找不到相同的片段。也就表示二篇文章差異性太高,建議使用者做適當的修正或是結束比對。 本例會在 buffer 1 第 4-7 個字找到, 即第一次出現的 [----] buffer 1 : aaa [----]------bbbb-------- 於是第一篇的 aaa 與第二篇的 ccccc 相異, 然後從 [----] 再由第一個動作開始。直至檔案結束或發生太大差異中斷。 如此,fgfc 的主要程式碼就完成了初步的設計。然而,這樣的邏輯仍然不是很理想。主要的問題是,倘若 buffer 分別如下: buffer 1 : aaa----------bbbb-------- 則依上述原理,會在 buffer1 的 2-5 字 [aa--] 在 buffer 2 找到。結果就變成 buffer 1 : a [aa--]--------bbbb-------- 結果就不是我們所需要的,後來利用遞迴的方式,相互的修正比對,以求能得到較好的結果。亦即找到後並不立刻採用,而去記錄在 buffer 1的第 n 個對應 buffer 2 第 m 個。記錄 n+m 的最小值,然後逐一試過,直到buffer 1 超過最小的 n+m 個字(也就是說再做下去也不可能是最小值),然後採用最小那一組,例: buffer 1 : a[aa--]--------bbbb-------- n = 2 buffer 1 : aa[a---]-------bbbb-------- n = 3 buffer 1 : aaa[----]------bbbb-------- n = 4 ............ 以 n + m = 10 這組最小,便採用這組。這個做法與採用 fc.exe 的方式比較,效果不差。且速度更快。 如果您設定的比對字數為 2 ,則執行的結果,和 fc.exe 的結果相同。然而,卻有其他的問題發生,底下是一個實例,例子中 B: 少了前面的第一句, 而我們將標點移去會比較清楚。 A: 大般若經第一卷般若經卷一大唐沙門某某序奉天承運... 若相同字數設為 2 (差異後面至少要有二個相同的中文字) A: [大]般若經 [第一卷般若經] 卷一大唐 [沙] 門某
[某] 序奉天承運 若相同字數設為 4 (差異後面至少要有四個相同的中文字) A: [大般若經第一卷] 般若經卷一大唐 [沙門某某]
序奉天承運 我們會發現設為 2 時,前半段的判斷並不理想,分的太細了,設為 4時,後面 [沙門某某] 我們則希望再分細一點。 有時我們不想計較太多,但在實際操作時,很容易因為不好的判斷,造成後面的文章不易繼續比對下去,因此,只能另尋他途了。 後來與朋友討論,得到了一個較好的方法。亦即先找到連續十個相同的地方,也就是設定相同字數為 10,再將差異處獨立出來,嘗試找 7 個相同的字,如此每次尋找相同的字的字數減少 3,一直到一個相同字。再以上例而言, 底下已經是找到七個相同字了, A: [大般若經第一卷] 般若經卷一大唐... 但再分析下去,都是相同的結果。至下一組差異時,假設目前這是相同字數為 4 的情況 A: [大般若經第一卷] 般若經卷一大唐 [沙門某某]
序奉天承運 若降為 1 時, 發現 [沙門某某] 與 [少門某人] 之中有二個字是相同的 [門某] 於是又分離出來,最後結果就是我們要的 : A: [大般若經第一卷] 般若經卷一大唐 [沙] 門某 [某]
序奉天承運 程式實際上是由 10 , 7 , 4 , 1 這四種逐一比較,而這種方式不但不會變慢,事實上反而比之前的方案還快呢! 至此,fgfc完成了二個不同的適用版本:
有一點要提醒,就在讀取資料時,若是非中文的半型字(英文,數字,符號等)皆先行轉成二個位元字組,程式中就是在前加一個0x01,這樣一來,所有資料都變成雙位元,不論中文英文,程式處理起來也就單純多了。 有同事對程式進行了進一步的試驗,只要妥善處理,便可利用兩兩比對的方式,進行多個檔案的比對。 在今年三月,終於完成許久的心願,將 fgfc 改成視窗(winodws)介面的版本,並將 fgfc 與 fg3fc 合併。在改良使用介面後,正式命名為Wfgfc 1.0 版。這也是目前最新的版本了。 【其它應用】 曾經有朋友詢問,在英文文件的處理上,是否也能使用同樣的方式處理。經朋友測試的結果發現,若能改良成一次比對一個字(word),則比較能適合英文資料的處理。畢竟,
後者較前者更容易檢查。 經後學思考過後,覺得修改程式的邏輯和原本的設計的方向有所不同,但若使用其它處理方式來達到以字為單位的比對結果,倒是容易的多。例如以空白為分割單位,以字串為比對的樣本。若有朋友對此類討論有興趣,歡迎與後學連絡。 【結語】 其實不只檔案可以比對,在本會的電子經典製作過程中,許多事都採用比對的方式處理。同一件事由二個不同的同事或程式各做一次,再將結果互相比較,我們發現這種作法所得到的結果和所投資的成本,相較於只做一次,然後花二次,三次或更多的精力去進行校對檢查,實在是省時省力又精確。因此,很樂意的將這個方式推薦給各位,倘若您對檔案比對程式有興趣,您可與我們聯絡,並且您也能在我們的網站上找到我們使用的檔案比對程式。 本協會開發的經文檔案比對程式是免費軟體,您可在非營利的情況下,完整的使用和散佈,任何對程式的破壞和反組譯,都是不被允許的。如果您在使用時有任何的建議或發現任何的錯誤,也請您告訴我們。 《大藏經》 又稱一切經、一代藏經、大藏、藏經、三藏聖教等。略稱為藏經或大藏。原指以經、律、論為主之漢譯佛教典籍的總集,今則不論其所使用之文字為何種文字,凡以經、律、論為主的大規模佛教典籍的集成,皆可稱為「大藏經」。「大藏經」一詞,原不見於印度或我國最早期之記載,於南北朝時代僅有「一切眾藏經典」、「一切經藏」等稱呼,直至隋唐之後,始有「大藏經」之稱,當時係指由朝廷敕命纂集之一切經。隋書開皇元年,京師及諸大都邑之處,並官寫一切經,置於寺內。而又別寫藏於秘閣。一切經之名便是本於此。 而現存的大藏經,依使用的文字不同,可分為漢文、日文、巴利語、藏文、蒙文、英文、滿文、傣文及西夏文等九個系統。 《大正新修大藏經》 略稱《大正藏》。是在現代學術界最受歡迎的中文大藏經,由於是在日本•大正年間開始編修,因此稱之為大正藏。日本大正13年(1924)由高楠順次郎和渡邊海旭發起,組織大正一切經刊行會;小野玄妙等人負責編輯校勘,1934年印行。全書總共一百冊,分為正編五十五冊、續編三十冊、昭和法寶總目錄三冊、圖像部十二冊,共收經、律、論及中日兩國撰述共三四九七部、一三五二○卷,是自古以來卷帙最龐大的善本大藏經。 大正藏》的正編,包含由印度語譯成的佛典三十二冊及中國古德的著述二十三冊。依據經典發展史的先後順序排列的分類法,分為阿含部、本緣部、般若部、法華部、華嚴部 、寶積部、涅槃部、大集部、經集部、密教部、律部、釋經論部、毗曇部、中觀部、瑜伽部、論集部(以上為譯典)、經疏部、律疏部、論疏部、諸宗部、史傳部、事彙部、外教部、目錄部(以上為中國撰述)。共收經典二二七六部、九○四一卷。這個部份也是中華電子佛典協會預計在三至五年要完成並提供大眾免費使用的經典。 大正藏由於所收經典相當齊全,校勘也很精審,編排亦符合學術要求,因此成為現代佛教學術界最為通用的大藏經。在學術著作中援引經文,常以《大正藏》為依據,並標明其所在冊數、頁數。本藏的重要性由此可見。也因此,中華電子佛典協會便選擇以「大正新脩大藏經」(大藏出版株式會社(C)) 第一卷至第八十五卷為底本,並正式取得該底本版權者「大藏出版株式會社」輸入與公開之授權。 印順導師法語 佛法是簡要的,平實中正的,以修行為主,依世間而覺悟世間,實現出世的理想──涅槃。(《雜阿含經論會編》(上)自序,頁 1) 慈悲──與樂和拔苦,對這苦痛重重的世間而言,顯然的,拔苦更為它所急需。如一塊荒蕪的園地,必先將那不良的荊棘雜草除去,然後播下好種,才有用處。眾生的煩惱病太多,若不設法去其病根(也是苦因),一切快樂的施予,都不會受用。(《學佛三要》,頁 100) 人是不能沒有缺點的,希望能在不斷的經驗中,能從佛法的觀點,容忍的,警覺的去適應一切,創造一切!(《平凡的一生》增訂本,頁146) 佛法所說的信,從正確理解佛法而來。有了澄淨的信心,一定會引起進修的意願。所以如對佛法有些理解,不能引起信心,那不過世間知識,與佛法無關。(《印度佛教思想史》,頁29) 改善社會,應從根本的人格思想改善起,這是佛法的立場。(《佛法是救世之光》,頁 406) 修學佛法,應先了解佛法不是從假設、推論、想像中來,而是有自覺的體驗為依據的。不過佛所悟證的境界,為最極圓滿的,而歷代菩薩祖師們所體悟的境界,就不免有淺深偏圓的不同。(《佛法是救世之光》,頁170) (太虛)大師謂:求學時,『要警策自己,適應環境,利用環境去充實自己』。作事時,『要透視現實,確定理想, 根據理想去改造現實』。(《太虛大師年譜》,頁503) 歡喜人的讚歎,怕別人批評,那是私欲與淺見作怪。其實,受到讚歎,是對自己的一種同情的鼓勵;受到批評,是對自己的一種有益的鞭策。鼓勵、鞭策,一順一逆的增上緣,會激發自己的精進;修正自己,充實自己,不斷的向前邁進。(《教制教典與教學》,頁 201) 佛法,是理智的德行的宗教,是以身心的篤行為主,而達到深奧與究竟的。「法」為佛法的根本問題,信解行證,不外乎學佛者傾向於法,體現於法的實踐。(《佛法概論》自序,頁 1) 菩薩發心,當然以「利他為先」,這是崇高的理想;要達成利他目的,不能不淨化自己身心。這就是理想要高,而實行要從切近處做起。(《華雨集》〈四〉,頁60) 利他的菩薩行,不出於慧與福。慧行,是使人從理解佛法,得到內心的淨化;福行,是使人從事行中得到利益(兩者也互相關涉)。(《華雨集》〈四〉,頁62-63) 人生的理想,不是彼此鬥爭不已;人與人間,應有互助合作,相敬相愛的態度。養成自我負責,彼此和樂的社會風氣,才能減輕世間的苦難。(《學佛三要》,頁22) 生活的艱苦,可以從淡泊中度過。人事的不安,可從勤勞與謙退中改善。(《佛法是救世之光》,頁263) 佛法是一切人依怙的宗教,並非專為少數人說,不只是適合於少數人的。所以佛法極其高深,而必基於平常。本於人人能知能行的常道(理解與實行),依此向上而通於聖境。(《說一切有部論書與論師之研究》序,頁2) 佛的慈悲,是悲智平等的,慈悲而能體驗真理,智慧而又能救護眾生。(《佛法是救世之光》,頁14) 佛法無他事,「淨化世間以進趣出世之寂滅」而已。(《印度之佛教》,頁37) 釋尊是一位國際主義者,對軍閥的爭霸戰,根本不表同情。「戰勝增怨敵,戰敗臥不安,勝敗兩俱捨,臥覺寂靜樂」,這是佛陀對侵略者著名的教訓。(《佛在人間》,頁7) 學佛法,首先應擴大心胸,去我去私。(《佛法是救世之光》,頁264) 依緣起的因果觀,佛法確認人生的身心活動,或善或惡,不但影響於外,更直接的影響自己,形成潛在的習性。(《佛法是救世之光》,頁279) 不單是佛法重視心的力量,凡尊重宗教,重視道德的,也都會重視心力的。人類都需要和平,安樂,就必須重視這心的力量。如大家忽視他,一味著重外物環境的發展,而不改進自心,那就永遠達不到目的的。古人有比喻說:如一輛牛車,停著不動,應該打牛呢?還是打車?當然,應該打牛,牛覺痛就走;牛一走,車就跟著前進了。這是說:要求環境變化,世界和平,先要著重內心的改善。(《學佛三要》,頁61-62) 摘自《搞笑寶寶的囈語(一)》http://members.xoom.com/jesterhouse 作者:搞笑寶寶 編按:感謝搞笑寶寶居士慨允本刊得以刊載其作品,以解決稿荒之苦。如果您有任何對佛典電子化的心得,亦或是使用電子佛典CD的感想,都歡迎您來信和大家分享。
網址 : http://www.yinshun.org.tw 【介紹】 「印順文教基金會」是印順法師於民國八十六年(一九九七年) 年底捐資成立的財團法人。 宗旨: 提倡佛教學術研究,獎勵僧伽從事佛法的專精修學, 實踐佛教智慧慈悲的精神,以利益社會,淨化人心。 網站收錄內容: 印順法師簡介及著作年表、印順導師墨寶、印順導師法語選粹、《印順法師佛學著作集》網路版、印順文教基金會簡介及公告等,有繁體和簡體字版。 佛教電腦資訊庫功德會 (美國) 網址 : http://www.baus.org/ebs (美國東岸) 網址 : http://www.best.com/~shawny/buddhis/ebs (美國西岸) 【介紹】 佛教電腦資訊庫功德會(資功會)成立於1994年冬,總會會址在美國紐約上州莊嚴寺、和如紀念圖書館內,世界宗教研究院中。資功會的宗旨是將中文佛典電腦化,並製作成便於保存、複製以及輕便易用多媒體光碟。資功會將按朝代、佛教宗派、作者等不同分類方式製作多媒體光碟專集,有英文版及中文版。目前網站並提供金剛經相關的電子檔。
■CBETA網路組: 請您準備好回郵信封,大小要能容納一片光碟,並寫上您的大名及地址,附上回郵 20 元[註],寄至
屆時我們會將最新的成果郵寄給您! 我們也希望您能將 email 及聯絡電話等資料附上,若日後有最新的消息,我們也能立刻通知您! 若您上網很方便的話,我們在網路上亦提供經文的閱讀及下載,網路上能隨時提供最新的經文內容,這也是光碟所不及的,歡迎您儘量利用此一管道。 其它您覺得尚能加強注意的地方,也請不吝指教! 我們的網址是 http://ccbs.ntu.edu.tw/cbeta [註] 小包郵資 20元,若要掛號則 34元。 其它各國郵資 CBETA 網路組 敬啟 ◎蕙菁居士來函詢問:如果要請印順導師的光碟片的話,要如何請呢? ■CBETA發行組: 由於這份光碟並非由本協會所製作,因此代為詢問印順導師文教基金會,以下的訊息提供您做為參考:
CBETA 發行組敬啟 下一期是CBETA E-News正式發刊的第一期,內容精彩,錯過可惜: 專題報導: 中華電子佛典協會CBETA簡介 網際導覽: 下期將帶您瀏覽國際上有關藏經輸入的相關網站,讓您了解目前國際上藏經輸入的點點滴滴。
|