Google公司表示,將對一家人工智能研發團體提供贊助,未來將共同研發文字特征識別技術。
據CNET報道,該項目屬于開放資源類型,名為Ocropus,主要有幾個目標,其中包括“開發高端易用的手寫識別系統,從而將手寫文檔轉化為電腦文本,幫助Google更好的打造自己的電子圖書館,并且分析歷史文檔,還可以幫助那些視力有問題的用戶閱讀信息。”據悉該項目名稱中的頭三個字母OCR代表了最優化文字識別的意思。
該項目研發小組位于德國人工智能研發中心圖像理解和模式識別研究組。在日前的Google公司博客上,搜索巨頭發布了上述計劃。除了得到Google的研發贊助之外,該小組還從德國政府多個部門以及政府和私營機構得到投資。
據Ocropus小組預計,該項目將持續于未來三年,并且他們將贊助三名博士研究生和博士后。在此之前,該領域已經有了兩項研究成果,分別是上世紀九十年代中期由美國人口統計局提出的手寫識別系統,以及最新提出的層分析方法。而此次的研究將基于這兩項成果。另一方面,Google贊助的其他文字識別項目,也將向該小組提供資源幫助,例如:Tesseract——一項由惠普最先提出,并且由Google去年改進的開放資源最優化文字識別技術。
目前Ocropus系統的預覽版本已經可以在項目網頁上下載,而項目負責人表示,考慮到開放資源的性質,希望招募更多的志愿者加盟完善系統。例如:為系統創建桌面應用程序、加入第三方工具、將Ocropus系統用于多種語言,目前其只能支持英語。