流程管理 輸入 校對 研發 資訊 網路 其他
去點程式
當我們打算使用掃瞄書本及使用 OCR 技術來產生經文時,第一個遇到的問題就是經文圖檔的「雜點」,「雜點」是指非經文本身的符號,在OCR時,會造成較低的判斷正確率,所以就寫出了這支程式來協助解決這個問題。

   介紹





去點前的圖檔   去點後的圖檔
大正大藏經要去除的雜點為閱讀符號, 位置大多在一般文字的左下方,形狀大多是 一、二、中... 等小字




去點前的圖檔   去點後的圖檔
續藏經文中的讀音符號與大正藏相似, 差別僅是其位置是在文字的左邊.

 





去點前的圖檔   去點後的圖檔
佛教大藏經要去除的雜點為圈點符號, 形狀為一個實心黑圓圈.

Fgmvdot 佛經去點程式 (除商業行為, 歡迎任意使用) -- by heaven

版本說明-------

12/05 '97

1. 修正佛教藏有些圈點太小, 造成無法刪除. 但也因此會增加誤刪的機會. (感謝 maha 反應)
2. 在輸入第一個問題 (使用何種格式經文) , 不論輸入 1, 2, 或 3,都會在下一個問題中出現則才輸入的數字, 可能是編譯的錯, 故換方式處理.

12/03 '97

1. 詳細說明請執行 Fgmvdot /? (中文說明請執行 Fgmvdot /c /?)
2. 改成 32位元版, 額外記憶體要求 640 k (原來只要求 64k ), 速度加快. (感謝黃郁婷小姐, 因為不忍她因為大量去除雜點, 花費太多時間)
3. 因為是 win95 版, 無法判斷是否有倚天, 故中文訊息請使用 /c 參數.
4. 改正 10/28 '97 版去點時刪角過於嚴重的 bug. (感謝顧偉康先生反應)

10/28 '97

1. 詳細說明請執行 Fgmvdot /? (中文說明請執行 Fgmvdot /c /?)
2. 加入去除續藏雜點的功能. (感謝顧偉康先生提供資料)
3. 修正一些我自己寫的簡短英文訊息. (感謝張文明先生提供)
4. 加入 /v (用來區分不同格式的經文) 的說明, 前一版忘了寫上.

9/15 '97

1. 檔名正式改為 Fgmvdot.exe , 能依參數分別去除佛教藏及大正藏的"雜點".
2. 詳細說明請執行 Fgmvdot /? (中文說明請執行 Fgmvdot /c /?) (感謝顧偉康先生提供英文說明, 因為我英文很爛 :p)
3. 能依參數調整而去除不同掃瞄 dpi 的經文.

9/7 '97

1. 檔名 : Mvdot2.exe , 不加參數執行時, 會有使用說明.
2. 可以去除大正藏經文 (多少 dpi 不確定) (黑白 bmp 格式) 的讀音符號.

8/15 '97

1. 檔名 : Mvdot.exe , 不加參數執行時, 會有使用說明.
2. 可以去除 430 dpi (不很肯定) 的佛教藏經文 (黑白 bmp 格式) 的圈點符號.

8/2 '97

緣起 : maha 在 buda-tech 版抱怨去除手動去除雜點時, 手都快抽筋了....


Fgmvdot 註冊說明:

由於本程式因需要不定時修正,故除了在

東坡站 (ftp://dongpo.math.ncu.edu.tw/buddhism/upload)
七葉窟 (ftp://buddha.nsysu.edu.tw/pub/upload)

放置一份最新的版本, 以及在 buda-tech 版面通告外, 會直接通知有註冊的朋友. 以保持取得最新的資訊.想加入註冊的朋友, 只要寫封 mail 給我, 說要加入名單中即可. 下回有新版就會直接通知您. 想從名單中除去亦可 mail 我.

目前註冊名單如下:

(名單恕略)