檔案數(shù)字化是對(duì)狹義檔案數(shù)字化掃描的回應(yīng)。人類的判斷力已經(jīng)達(dá)到了一個(gè)更加全面的發(fā)展階段。但我們有可能逐漸進(jìn)入一個(gè)更智能的新發(fā)展階段。
主要原因如下:
1. 行政推動(dòng)。全國電子文件管理部際聯(lián)席會(huì)議成立十多年來,檔案數(shù)字化進(jìn)入了快速發(fā)展的階段。由于國家推進(jìn)檔案信息建設(shè)的政策,在一些機(jī)構(gòu)中,檔案數(shù)字化程度已經(jīng)成為檔案工作的評(píng)價(jià)指標(biāo),對(duì)檔案數(shù)字化達(dá)到要求的速度也有了明確的要求。因此,系統(tǒng)內(nèi)檔案數(shù)字化具有行政驅(qū)動(dòng)力。政府購買檔案數(shù)字化服務(wù)有很多。目前,沒有一家檔案行業(yè)發(fā)展較好的企業(yè)不以檔案數(shù)字化為主營(yíng)業(yè)務(wù)。
2. 技術(shù)發(fā)展的趨勢(shì)是不可逆轉(zhuǎn)的。在商業(yè)部門等更自由的機(jī)構(gòu)中,數(shù)字化也有一個(gè)強(qiáng)大的市場(chǎng)。特別是銀行、房地產(chǎn)等提供2C服務(wù)的行業(yè),由于業(yè)務(wù)量大,在大數(shù)據(jù)興起之初就將客戶業(yè)務(wù)文件數(shù)字化。因此,據(jù)我所知,檔案數(shù)字化市場(chǎng)也有很大一部分是滿足這種需求的。這完全是由信息產(chǎn)業(yè)對(duì)效率的需求驅(qū)動(dòng)的。在將客戶檔案數(shù)字化之后,大數(shù)據(jù)應(yīng)用將緊隨其后。
3.只要雙套系統(tǒng)存在,檔案數(shù)字化就永遠(yuǎn)存在。所謂的雙套系統(tǒng)是指紙張和電子文件須以雙套歸檔。以往檔案數(shù)字化大多針對(duì)的是庫存檔案,因?yàn)樵跈n案的形成過程中,大部分的原始檔案還是紙質(zhì)的,為了適應(yīng)信息轉(zhuǎn)型的需要,紙質(zhì)檔案每年都會(huì)被掃描成電子檔案,考慮歸檔要求和利用效率。而現(xiàn)在雖然國家政策已經(jīng)非常積極地探索了電子檔案的單套管理,但由于檔案管理是千禧年的事,對(duì)于長(zhǎng)久保存的檔案還是不完全單套。因此,這種雙套系統(tǒng)將持續(xù)一天,文件將以紙質(zhì)和電子形式存在。隨著信息量越來越高,我們要處理的雙套系統(tǒng)方法也要慢慢從掃描到打印,也就是將原始電子檔案打印出來并存檔。因此,可以說,目前形式的檔案數(shù)字化產(chǎn)業(yè)市場(chǎng)在未來應(yīng)該會(huì)萎縮。
4. 行業(yè)細(xì)分。我個(gè)人認(rèn)為早期的檔案數(shù)字化比較廣泛,基本上是掃描紙質(zhì)檔案——記錄目錄——數(shù)據(jù)連接,有的可能做OCR識(shí)別。未來,檔案數(shù)字化產(chǎn)業(yè)可以利用現(xiàn)有產(chǎn)業(yè)優(yōu)勢(shì),轉(zhuǎn)向文本挖掘和智能文本分析,成為資源開發(fā)。此外,可能會(huì)更注重電子檔案管理平臺(tái)的服務(wù),而不是勞動(dòng)密集型的掃描。至于市場(chǎng)的規(guī)模,可以說只要規(guī)模小的單位就會(huì)有這個(gè)需求,而政府和事業(yè)單位部門、檔案有特別大的需求。此外,對(duì)上述2C行業(yè)的客戶檔案進(jìn)行了數(shù)字化處理。
行業(yè)龍頭企業(yè)問題。需要注意的是,一般檔案數(shù)字化企業(yè)需要由檔案管理部門或檔案協(xié)會(huì)備案,在選擇購買服務(wù)時(shí),一般單位也在綠色檔案清單中選擇。所以這個(gè)行業(yè)本身是有界限的。而對(duì)于龍頭企業(yè)來說,我認(rèn)為不應(yīng)該特別的優(yōu)先于另一家或幾家企業(yè),因?yàn)檫@種優(yōu)先并不完全依賴于檔案數(shù)字化業(yè)務(wù)的支持,大多數(shù)會(huì)坐著同時(shí)進(jìn)行檔案軟件的開發(fā)。簡(jiǎn)而言之,如果你看看那些在名單上出現(xiàn)時(shí)間長(zhǎng)的公司,那些在名單上出現(xiàn)的公司,基本上都是頭。