処理時間が大幅に増えてしまうのは課題だが,魅力的ではある。
ライトノベルだとbunkOCRが良かったとか https://lithium03.info/ios/bunkoOCR.ja.html
NDL OCRとLLMの組み合わせは鉄板になりそう。構造化まで自動でやれるのは自炊勢にはたまらんな
特に元データが悪いものでなければ、OCR単体で95%くらい、LLM使うと98-99%くらいまでは上がるように思うので、何がこの悪い結果の原因だろう。
それこそHTMLで出力したらいいと思うが
書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録
処理時間が大幅に増えてしまうのは課題だが,魅力的ではある。
ライトノベルだとbunkOCRが良かったとか https://lithium03.info/ios/bunkoOCR.ja.html
NDL OCRとLLMの組み合わせは鉄板になりそう。構造化まで自動でやれるのは自炊勢にはたまらんな
特に元データが悪いものでなければ、OCR単体で95%くらい、LLM使うと98-99%くらいまでは上がるように思うので、何がこの悪い結果の原因だろう。
それこそHTMLで出力したらいいと思うが