テクノロジー

# 【AI駆動開発】100ページ超のPDFをMarkdownに変換してAIに読ませる方法 - Qiita

1: bellonieta 2026/01/31 11:18

PyMuPDFで良くない?

2: nguyen-oi 2026/01/31 12:07

AIに読ませるために人間がPDFを画像化して管理するの、結局泥臭い労働で草

3: ornomental 2026/01/31 12:19

仕事でaws bedrock knowledgebases で同じような機能使ったことあるが、結構金かかるうえ誤読(難しい漢字とか)も多かった

4: hiroomi 2026/01/31 12:32

PDFを一度「画像」に変換して、AIに「視覚的に読ませて」Markdownとして書き起こさせる

5: ty356trt5 2026/01/31 12:48

MarkItDownかました方が早くない?発想は好き

6: Kmusiclife 2026/01/31 12:50

画像化してノイズも取りつつVision AIに投げるのがベスト。登りくんもいい仕事してる。

7: miketaro1234 2026/01/31 13:03

こういうのはコメントまで含めて参考になる

8: hazlitt 2026/01/31 13:40

形式の変換にAIを噛ますのはややこわい気もする

9: Nunocky 2026/01/31 13:54

お役所の超絶技巧Excelは一旦画像にしないと LLMが解釈できないからではと思う

10: yarumato 2026/01/31 14:26

“PDFをそのままAIに渡すと、トークン消費が激しい。構造が失われる(この数値は何の列?)、検索・参照が困難(AI「その仕様はたぶんこの辺...)、Git差分管理不可。PDFをpng画像化、AIでMarkdownに。グラフが表に”

11: mistake 2026/01/31 14:43

PDF=>Word=>Google Docs=>MD ってやったりはする。

12: udddbbbu 2026/01/31 14:45

よさそう

13: pecan_fudge 2026/01/31 15:46

PDFのまま読ませるとトークン消費が激しくて困っていた。ありがたくブクマ。追記:コメントに書かれていたPyMuPDF4LLMをためしてみたい。PDF→Markdown変換だけでなくPDF 内のテキスト・表・リスト・画像を構造化して抽出可能

16: FreeCatWork 2026/01/31 17:17

PDFをMarkdownに変換してAIに読ませるなんて、ボクには難しすぎるにゃ~!でも、みんなが賢くなるのは嬉しいにゃん!

17: D_first 2026/01/31 17:31

PyMuPDFよりも良いのかな?

18: myr 2026/01/31 18:04

cursorとかにMarkdownにしてくれっていったらやってくれますぜ

19: strawberryhunter 2026/01/31 18:12

1ページずつ画像にするなら1~5ページずつPDFでも良い気がするというか、自分はそうしてる。変換ミスが怖いならレビューさせれば良いのではないか。

20: sds-page 2026/01/31 18:19

PDFをテキストに変換するライブラリ色々使ってみたけどPDF側の実装が魔境過ぎてちゃんと読んでくれないのが結構ある。そんな時はいったん画像にするしかない

21: oguri0220 2026/01/31 18:39

コメントを後で読む

22: six13 2026/01/31 19:12

興味ある

23: kahlua-dane 2026/01/31 19:14

確かにアリか。pdf2mdなんて世に沢山あると思ったけど、pdfの色んな仕様とかそもそとpdfに画像が入ってる時のこと考えるとaiにマークダウンにさせるのは有りかも。ただヘビーだしチーム内共通RAGにするとかが良さそうだな

24: hiro7373 2026/01/31 19:37

“資料のほとんどがエクセルで構成されているのと、外部API仕様書のほとんどが100P以上あるPDFデータ” 申し訳ないが働きたくない

25: yossy_etf 2026/01/31 19:46

PDF から直接 markitdown だと、タイトルや太字といった構造やグラフの情報が失われるから優秀なOCR-AI が必要なんだよね。

26: ls-ltr 2026/01/31 21:21

なぜかpdfしかない引き継ぎドキュメント、あるある。あと、Excelも mdにした方が良いよね。(元からExcelを使うなという話はさておき)

27: poponponpon 2026/01/31 21:23

この記事の処理をまとめて /pdf_to_markdown skillを作って。ってclaude codeに頼むと良さそう

28: kiririmode 2026/01/31 22:13

popplerでpdfをpngに変換し、aiでmarkdown に変換

29: mobanama 2026/01/31 22:31

へー

30: magi00 2026/01/31 23:24

LlamaParseとかMinerUとか使えるといいけどねー。画像情報の文書化は事前にすべての質問に対応するものを書き出すのは難しく、無くなるとマルチモーダル生かせないのでmarkdownに中間画像のリンクと説明を埋め込み保存したい

31: welchman 2026/01/31 23:48

ベクターデータをラスターデータにして、それをまたベクターデータにするのって、とても倒錯的でいいな。味がある。

32: ryskosn 2026/02/01 00:30

便利そう!

33: auto_chan 2026/02/01 00:40

Wordで読むのちょいちょい表がぶっ壊れるの許されざることザルの如しだし、チャットボット君の読み精度も悪いし、解析スクリプト書いてもらってもうまくいかないし、なるほど画像って手もあるのね。

34: panoramaafro 2026/02/01 01:18

えー、AI側で、pdfのアップロードで裏でmdににしてるんだと思ってたよ。。画像は画像で読むと。

35: zgmf-x20a 2026/02/01 05:01

ブコメで思い出したが、VibeコーディングでPyMuPDF使われて、何が特徴なんだろうと思い忘れていた…w、で思ったんだけど、LaTeXだったらどうなんだろう?

36: hirorinya 2026/02/01 09:53

グラフとかポンチ絵とかそいういうところが結局どれくらい理解できるものになるのかだよなー

37: xanaduuu 2026/02/01 13:59

雑にmarkdown化するやつで叩いてた。モノによってこの方法でやってみるか

38: Tomokun-S 2026/02/01 16:57

“brew install poppler”

39: misshiki 2026/02/01 18:10

“今回のアプローチはこうです: PDF → 画像(ページごと) → AI精読 → Markdown 「なぜ画像を経由するの?」と思うかもしれません。 理由は単純で、AIは画像を「見る」ことができるからです。”

40: shunt_i 2026/02/01 22:24

pdf2markdown

41: takashi001 2026/02/04 09:02

]