流程管理 輸入 校對 研發 資訊 網路 其他
看圖校對程式
在校對過程中,查詢原書也是一件花費工夫的事。由於我們已有大部份的掃瞄的圖檔,故寫了本程式,希望能在利用「比對程式」之結果,進行校對時,根據經文中大正藏格式的資料,能立刻在電腦上秀出原書的字,以增進校對判斷速度,並讓沒有書的人亦可進行校對工作。

介紹

本程式利用線上直接看圖的功能,結合了以下數種功能:

  1. 最基本的看圖功能,能直接讀取 TIFF G4 格式的圖形檔,此部份程式要特別感謝楊忠權先生提供原始程式碼,授權予本協會使用。
  2. 尋找經文中由「檔案比對程式」(FGFC) 所產生的差異符號 {{ , 並在線上查閱圖形後,得以直接修改。如圖:



  3. 字串取代的功能。在經典文字處理的過程中,有許多錯誤的發生,其實都是有因有緣,有跡可尋的。OCR 有 OCR 常見的錯,使用注音、倉頡等輸入法的朋友,亦都有常犯而難以發現的失誤。故在校對的過程中,吸取錯誤經驗,並加以記錄統計,進而設計了各式的「常見錯誤字串取代表」。

    除了「常見錯誤字串取代表」之外,亦有各式「缺字代換表」,故將字串取代功能整合至「看圖校對程式」之中,如此在找出不易發現的錯誤之同時,配合看圖功能,可立刻叫出原書圖檔,進而加以比較,加速了處理的速率。
    如圖:



看圖校對程式說明檔

※ 看圖校對主要步驟

1. 在 "工具->選項" 中, 設定圖檔位置. 若您的光碟是在 D: 則設定 D:\T<V>\<@>\<V>-<P>.TIF 就沒錯了.

若您是看第 10 冊第 360 頁, 則

<V> = 冊 = 10
<P> = 頁 = 360
<S> = 經 (這裡沒有用)
<@> = 特殊符號 = 301-400 (這是配合我們目前圖檔設計的)

所以 D:\T<V>\<@>\<V>-<P>.TIF 經過處理, 就會變成 D:\T10\301-400\10-360.TIF

選項中其它設定比較不需要更改. (以我們目前的經文及圖檔)

2. 若電腦處理速度太慢者, 在開啟文字檔時, 建議不要太大, 一次處理幾卷就好, 處理太多也沒有什麼好處.

3. 可使用 "尋找差異" , "秀圖" , "選擇字串" 三種功能來進行校對.

==============================================================

※ 設定圖檔偏移資料主要步驟

由於每一頁圖檔第一個字的位置都不同, 故需要事先做設定, 校對時就可直接使用, 而不用每頁都處理了.若讀到的圖沒有處理過, 就等於沒有任何偏移值, 而處理過的每一頁, 資料都會自動記錄下來, 記錄檔底下會說明.

設定的方法: (底下以大量處理的狀況為例, 看來很難理解, 實際操作一次就很好懂了)

1. 先開啟某一圖檔 (指定第幾冊, 第幾頁即可)

2. 將圖移至右上角 (一般都會自動移過去, 除非您的所在位置不在右上角)

3. 在第一個字的最右上角按下滑鼠右鍵, 在 popup 選單選第一個功能"設定為右上角第一個字 (X,Y)"

4. 若這部份剛好是某卷起頭, 沒有字可設定時, 可往下移動, 移至第二欄或第三欄第一行字最右邊的邊緣, 按下滑鼠右鍵, 在 popup 選單選第二個功能 "設定為右上角第一個字的 X 座標". 同理, 移至第一欄第一列的字的最上方邊緣, 按下滑鼠右鍵, 在 popup 選單選第三個功能 "設定為右上角第一個字的 Y 座標". 如此就等於是為第一個字設定 X, Y 座標了.

5. 如 4. 的例子, 由於是起頭, 經文字體會比較大, 可能第 4 行為本文的開始, 在大正藏格式化中是被列為第 4 行, 但與其它欄比起來, 可能是第 6 行了, 所以此欄的偏移值是 2 , 故按下滑鼠右鍵, 在 popup 選單選最後一個功能 "設定特殊欄的行偏移" 即可.

6. 再選擇下一張.

註 : PopUp 選單的功能在 Tool Bar 與主選單都有, 依個人習慣使用即可.

================================================================

※ 圖檔偏移值記錄檔 :

程式中對每一冊都有一個資料檔, 叫 Vol[xxx].vps
例如第 28 冊的資料就叫 Vol028.vps
在存取各冊的資料時, 都是自動處理, 無需使用者操心.

vps 為 Volumn Page Shift 的縮寫, 其格式如下:

頁碼, X , Y , 上欄, 中欄, 下欄(的行偏移)
===========================================
661, 160, 85, 3, 0, 0
667, 186, 94, 0, 2, 0

第 661 頁第一個字右上角座標為 (160, 85) , 其上欄的行偏移要加 3
第 667 頁第一個字右上角座標為 (186, 94) , 其中欄的行偏移要加 2

========
※ 版本
========

5/26

1. 圖形增加設定比例之功能. (但無法超過 100 %, 否則會被切去).
2. 在設定第一個字的偏移值時, 可使用雙擊滑鼠來完成 (Double Click).
3. 在設定第一個字的偏移值之後, 立刻畫出此字的中心紅線, 以供判斷.
4. 增加一個大按鈕, 在處理經文時, 可增加瞄準的機率. :p
5. 增加 Alt+1 的熱鍵 (Hot Key) , 以避免原來 Ctrl+1 造成手指之不適.
6. 原 Ctrl+1 ~ Ctrl+4 , 各加上 F1 ~ F4 之 HotKey , 以增加選擇機會.

5/21

1. 解決載入過多圖檔, 造成記憶體沒有釋放而耗盡的問題. (感謝楊忠權先生提供解法)
2. 解決載入之文字檔不在本程式同一目錄時, 造成無法讀取 "圖檔偏移值記錄檔" 的問題.

5/16

完成書籤, 以及字串取代功能

5/13

在 FGFC 的判斷上, 若三個差異有二個相同, 加上顏上輔助判斷.

5/3

加入圖檔偏移資料之設定功能.

4/24

搶鮮版完成, 針對 fgfc 之差異符號處, 可進行選擇處理.