紙質(zhì)圖書數(shù)字化加工
時(shí)間:2009-8-11 16:27:13 人氣指數(shù): 【 大 中 小 】
北京天潤智力專業(yè)從事紙質(zhì)文獻(xiàn)的數(shù)字化加工,將文獻(xiàn)資源制作成符合國際標(biāo)準(zhǔn)的數(shù)字資源,進(jìn)行深度數(shù)據(jù)加工和加密處理,制作成全文檢索光盤供用戶使用,非常適合于圖書館、出版社、期刊雜志、各類企事業(yè)單位以及個(gè)人用戶。文檔整理
對原始文檔進(jìn)行整理、拆分、分類,區(qū)分是否適合掃描,制定數(shù)字化方案。
圖書掃描
對特色圖書、期刊、論文進(jìn)行篩選后進(jìn)行掃描?梢圆捎酶咚賿呙鑳x進(jìn)行快速圖像采集,也可以采用平板掃描儀進(jìn)行不拆分掃描,生成TIFF、JPG、PDF等圖像格式。
影像處理
對掃描后的圖像增強(qiáng)處理,提高識別率和增強(qiáng)美觀度,如格式轉(zhuǎn)換、動(dòng)態(tài)二值化處理、自動(dòng)校正、自適應(yīng)紙張大小、灰度加強(qiáng)和去黑邊等功能。
文字識別
采用OCR軟件支持對掃描的圖像文件進(jìn)行文字識別,生成文本文件。天潤智力采用國際領(lǐng)先的OCR識別技術(shù),既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,超強(qiáng)的版面分析能力,最大限度減少手工操作量,識別準(zhǔn)確率高達(dá)99.8%。
格式轉(zhuǎn)換
轉(zhuǎn)換成雙層PDF格式,可以對圖像內(nèi)容進(jìn)行全文檢索,檢索結(jié)果定位到文檔所在頁面的具體位置,文件內(nèi)容原版顯示,無須二次排版。
數(shù)據(jù)標(biāo)引
對文檔的元數(shù)據(jù)進(jìn)行標(biāo)引;制作文檔目錄;在PDF中制作書簽鏈接,非常便于閱讀使用。
光盤發(fā)布
以全文檢索數(shù)據(jù)庫為核心,以HTML模版為界面,支持單字段(著錄項(xiàng))簡單查詢,也能進(jìn)行多字段多條件模糊檢索、二次檢索、復(fù)合檢索,還可以實(shí)現(xiàn)數(shù)據(jù)的導(dǎo)入導(dǎo)出、添加片頭片尾多媒體等多種功能。
數(shù)據(jù)加密
通過數(shù)字版權(quán)保護(hù)技術(shù)(DRM)將電子文檔進(jìn)行加密處理,例如數(shù)據(jù)庫加密、文件加密、口令保護(hù)、軟件序列號認(rèn)證、硬件加密等,有效保證數(shù)據(jù)安全。