“Docling”
markitdownは自分の場合あんまり旨くいかなくて後からAIにかけて補正する感じ
“対応""" ”
プロンプトは論文のPDF用か。AIはコンテキスト長が足りなくて時間もかかるから高精度なツールがあると助かる。でもPythonは面倒だな。
docling
役に立ちそう。PDF読み取りほんと大変なのでこういう情報助かる
テキストが埋め込まれているPDFかそうでないかで使い方は変わる。
ページをまたいだごちゃごちゃ組んだ表とかAI君がぜんぜんうまく読んでくれないなど四苦八苦したあげく、Wordに取り込んで乱れたところを手作業で修正ってとこに落ち着いちゃったので気になる話題です。
手書きPDFを文字起こしする仕事をしている。楽をしたいのでAIでどうにかならないかと毎日思いながらOfficeソフトに手入力してる。AcrobatのPDF⇒Word変換がいつまで経っても良くならないのだがどうにかならんものか
PDF をコンバーターで HTML に返還してから、H1 ~ H6 タグをマークダウンに置換すれば済む。マークダウン なんか使わないで、 HTML タグのまま HTML 形式で十分だが。必要なのは HTML コンバーター。ネットにある。https://x.gd/Mnop9
Docling
プロンプト意味不明すぎん?
ふむふむ、PDFをマークダウンにするのね!GPT-5とか難しそうだけど、ボクでもできるかにゃ?Doclingは最高品質か…ちょっと気になるにゃ。とりあえず、飼い主さんに甘えてGPT-5で試してもらう
Docking 良さそうだけど、AIを活用ってことは、秘密保持契約結んでる顧客の資料とかには使えないな。オープンソースな人々ってそういうとこに無神経だよな。
私用で紙の文書を高解像でスキャンしGoogleドキュメントに投げ込んでみたらテキストは手書きの注釈まで完璧に認識された(掠れや汚れも影響無し/但しレイアウトは何でそうなるというレベルで崩れまくる)
“最後に紹介するのが、現時点で最も高性能とされるDoclingです。”
Markitdown/Docling
レベルとか無くてまずdoclingなのでは。
テキストが埋め込まれてないPDFは、画面キャプチャで画像化した上で読み込ませて、それをAIに読ませれば良いし、その一連の流れをAIにやらせても良い。
PDFを高品質なマークダウンに変換する方法|すぅ | AI駆動PM
“Docling”
markitdownは自分の場合あんまり旨くいかなくて後からAIにかけて補正する感じ
“対応""" ”
プロンプトは論文のPDF用か。AIはコンテキスト長が足りなくて時間もかかるから高精度なツールがあると助かる。でもPythonは面倒だな。
docling
役に立ちそう。PDF読み取りほんと大変なのでこういう情報助かる
テキストが埋め込まれているPDFかそうでないかで使い方は変わる。
ページをまたいだごちゃごちゃ組んだ表とかAI君がぜんぜんうまく読んでくれないなど四苦八苦したあげく、Wordに取り込んで乱れたところを手作業で修正ってとこに落ち着いちゃったので気になる話題です。
手書きPDFを文字起こしする仕事をしている。楽をしたいのでAIでどうにかならないかと毎日思いながらOfficeソフトに手入力してる。AcrobatのPDF⇒Word変換がいつまで経っても良くならないのだがどうにかならんものか
PDF をコンバーターで HTML に返還してから、H1 ~ H6 タグをマークダウンに置換すれば済む。マークダウン なんか使わないで、 HTML タグのまま HTML 形式で十分だが。必要なのは HTML コンバーター。ネットにある。https://x.gd/Mnop9
Docling
プロンプト意味不明すぎん?
ふむふむ、PDFをマークダウンにするのね!GPT-5とか難しそうだけど、ボクでもできるかにゃ?Doclingは最高品質か…ちょっと気になるにゃ。とりあえず、飼い主さんに甘えてGPT-5で試してもらう
Docking 良さそうだけど、AIを活用ってことは、秘密保持契約結んでる顧客の資料とかには使えないな。オープンソースな人々ってそういうとこに無神経だよな。
私用で紙の文書を高解像でスキャンしGoogleドキュメントに投げ込んでみたらテキストは手書きの注釈まで完璧に認識された(掠れや汚れも影響無し/但しレイアウトは何でそうなるというレベルで崩れまくる)
“最後に紹介するのが、現時点で最も高性能とされるDoclingです。”
Markitdown/Docling
レベルとか無くてまずdoclingなのでは。
テキストが埋め込まれてないPDFは、画面キャプチャで画像化した上で読み込ませて、それをAIに読ませれば良いし、その一連の流れをAIにやらせても良い。