通過(guò)模擬人腦活動(dòng)進(jìn)行學(xué)習(xí)的手寫漢字識(shí)別技術(shù)
北京時(shí)間2013年10月09日消息,寶威科技網(wǎng)訊,富士通研究所和富士通研究開發(fā)中心開發(fā)出了一種通過(guò)模擬人腦活動(dòng)進(jìn)行學(xué)習(xí)的手寫漢字識(shí)別技術(shù)。該技術(shù)的開發(fā)目的是,針對(duì)各種各樣的合同文件等,提高手寫文本數(shù)字化錄入工作的效率。
據(jù)富士通研究所介紹,傳統(tǒng)的手寫漢字識(shí)別技術(shù)是把筆畫的方向和數(shù)量信息作為文字的特征,由此來(lái)識(shí)別每個(gè)字,但存在的問(wèn)題是,無(wú)法識(shí)別變形較大的文字,而且,通過(guò)“學(xué)習(xí)”來(lái)提高識(shí)別精度是個(gè)非常耗時(shí)的過(guò)程。
在文字識(shí)別必需的數(shù)據(jù)學(xué)習(xí)方面,此次的新技術(shù)使用的是與人腦內(nèi)部細(xì)胞架構(gòu)類似的分層神經(jīng)元網(wǎng)絡(luò)模型。對(duì)文字的特征從簡(jiǎn)單到復(fù)雜地分層提取,像人類記憶文字的過(guò)程那樣捕捉文字的特征,不斷積累學(xué)習(xí)成果。識(shí)別時(shí),根據(jù)學(xué)習(xí)到的文字特征,通過(guò)分析哪一特征對(duì)輸入的文字做出了反應(yīng)得到識(shí)別結(jié)果并輸出。
研究人員使用并行處理能力強(qiáng)的GPU(圖形處理單元)來(lái)構(gòu)筑學(xué)習(xí)數(shù)據(jù),將傳統(tǒng)方法需要4個(gè)月的學(xué)習(xí)時(shí)間縮短到了約一周。另外,此次技術(shù)在第12屆文檔分析與識(shí)別國(guó)際會(huì)議(ICDAR2013 : International Conference on Document Analysis and Recognition)主辦的手寫漢字識(shí)別比賽中獲得了第一名,并以94.8%的文字識(shí)別精度創(chuàng)下了歷史最高紀(jì)錄。 順便一提,該技術(shù)還可用于識(shí)別日文。