テクノロジー

書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録

1: nakex1 2026/05/11 18:01

処理時間が大幅に増えてしまうのは課題だが,魅力的ではある。

2: kyukyunyorituryo 2026/05/11 18:02

ライトノベルだとbunkOCRが良かったとか https://lithium03.info/ios/bunkoOCR.ja.html

3: nguyen-oi 2026/05/11 18:03

NDL OCRとLLMの組み合わせは鉄板になりそう。構造化まで自動でやれるのは自炊勢にはたまらんな

4: tu_no_tu 2026/05/11 18:27

特に元データが悪いものでなければ、OCR単体で95%くらい、LLM使うと98-99%くらいまでは上がるように思うので、何がこの悪い結果の原因だろう。

5: pendamadura 2026/05/11 18:38

それこそHTMLで出力したらいいと思うが