NTTドコモ、写真・画像から文字列を抽出できる「文字認識API」を無償でトライアル提供

NTTドコモが、写真や画像に含まれる文字列を認識・抽出する「文字認識API」の無償トライアル提供を開始すると発表しました。API利用受付申請期間は2011年10月5日~11月30日、API提供期間は12月上旬~2012年5月31日と予定されています。文字認識APIには、処理時間が3秒程度の「行画像文字認識API」(行画像=文字を1行だけ含むような画像)と、2分程度の「情景画像文字認識API」(情景画像=通常の風景写真などの画像)の2種類があり、どちらもJavaライブラリとして提供されるほか、後者についてはWeb APIでも提供されるようです。

文字認識API(NTTドコモ)
http://recognize.jp/

NTTドコモ、独自開発した文字認識技術をAPIでトライアル提供(マイコミジャーナル 2011/10/5付けニュース)
http://journal.mycom.co.jp/news/2011/10/05/081/

参考:
CA1718 - 動向レビュー:電子化の現場からみたOCRの動向 / denshikA
http://current.ndl.go.jp/ca1718

E960 - BL新聞デジタル化プロジェクトでのOCRの正確性評価<文献紹介>
http://current.ndl.go.jp/e960

E662 - OCRで識別できない大量の文字を,効率的に識別する方法?
http://current.ndl.go.jp/e662

オープンソースの日本語OCR「NHocr」、1行画像を認識するベータ版をリリース
http://current.ndl.go.jp/node/8810