OCR – matoken's blog

dGPUがなくても動作する国立国会図書館のNDLOCR-Liteが公開されていたので試す

2026-03-022026-03-03 matoken コメントをする

国立国会図書館がNDLラボでNDLOCR-Lite を公開しました．
元々NDLOCR が公開されていましたがCUDA 対応のNVIDIA GPU が必須でした．今回のNDLOCR-Lite はdGPU の無いPC でも動作するようなので試してみました．

続きを読む

NDL古典籍OCR-LiteをLinux laptopで試す

2024-11-292024-11-30 matoken コメントをする

YomiTokuという日本語に特化したAI 文章画像解析エンジンを知りました．OCRだけでなく，レイアウト解析機能を持っていて複雑なレイアウトの画像でも解析してOCRしてくれるようです．(CPUでも動きそうなのでこれも試したいところです．)

国立国会図書館でも似たようなのがあったけどGPU専用だったよなとリポジトリを見に行くとやはりCUDA対応のNVIDIA GPUが必要そうです．

ndl-lab/ndlocr_cli: NDLOCRアプリケーションのリポジトリ（ソースコードを含む）

やはり駄目かと思いながらなんとはなしにndl-labを眺めてみるとndl-kotenocr-liteという新しいリポジトリが出来ていました．
GPUがなくても動作する古典籍資料のOCRが出来るツールのようです．古典は読まないのですが面白そうと思い試してみました．

続きを読む