テクノロジー

非エンジニアの私が、プログラミングなしでWebスクレイピングした方法を伝えたい

1: rekishi_chips 2025/07/14 11:33

昔はエンジニアといえば、つなぎ着てペンチ持って油でベタベタのイメージがありましたが。

2: gm91 2025/07/14 11:54

試験は?

3: fukken 2025/07/14 12:00

webプログラマだけど、スクレイピング+定期クロールくらいの作業はプログラミング技能なしでできた方がみんなハッピーだよなーと思う。

4: peketamin 2025/07/14 12:07

すごい

5: kenzy_n 2025/07/14 12:11

こういう活用は進んでいく。

6: dbfireball 2025/07/14 12:20

AIを通すとたまに存在しない数値に書き換えられたりするので、もう一歩進めてAI通さずにデータ取ってくるツールをAIに作ってもらったほうが良いかも

7: kyukyunyorituryo 2025/07/14 12:56

Puppeteerのほうが簡単じゃないかな

8: xlc 2025/07/14 13:08

ヘボプログラマはスクレイピングがお好き。

9: momomoid 2025/07/14 13:15

これスクレイピングスクリプト組ませるとかじゃなくて直接LLMにやらせてるってこと? たかがスクレイピングでトークン大量に食わせてGPUガンガン回すの普通に環境破壊では

10: queeuq 2025/07/14 13:15

coopetというサービスを使うという最終目標があるからこうなるんだろうが、スクレイピングするだけならoctoparseなり使えばプログラミングなんかせんだろ。

11: hkdn 2025/07/14 13:30

プログラミングを生業にしていなければもっと生成AIの世界を楽しめたのかもしれない。現実は一人当たりでやるべき量が増えただけ。

12: takashiski 2025/07/14 13:31

箇条書きの代わりにレベルが一つ下の見出し使っても、いい感じに解釈してくれるんだ。それはそれとしてLLMに直接やらせるとめっちゃ遅いよね。どんくらい時間使ってどんくらいトークン使ってるんだろ

13: magi00 2025/07/14 13:47

RPAでAPI叩いて実行するのをプログラミングじゃないと言い張られてもサービスのターゲットになるような初心者ついてこないんじゃない?

14: suka6411144 2025/07/14 13:56

LLMでスクレイピングするのめっちゃ無駄に思えるけどサイトの作りの変化には強そうだよな、ただ結果がはたして信用できるのかという問題はあるけど

15: Wafer 2025/07/14 14:36

エンジニア警察ですが否定のプレフィックスを付けて使うのは賢いと思います

16: tpircs 2025/07/14 14:44

「htmlファイル一つで作って」とか「powershell一つで作って」とかを伝えると色々捗る。「テトリスをhtmlファイル一つで作って」が通じるくらいなので、やりたいことが明確なら敷居は低い。

17: strawberryhunter 2025/07/14 15:03

もっと大雑把に指示をしていれば正しく作ってくれた可能性があるが、マイクロマネジメントをすると、指示した人の能力に制限されたものしか出来上がってこないという好例になっている。

18: IGA-OS 2025/07/14 15:04

Excelもスクレイピング機能持ってたりするし、ハードルが下がるね

19: hogetax 2025/07/14 16:26

うちのサイトにもデータ取りにくるやつがいるけど、ちょいちょいウソのデータ渡してるw頻度がおかしいものはプロバイダ経由で警告

20: mon0213 2025/07/14 16:26

後で見る。15年位前、散々スクレイピングは悩みました。今はメンバーの方にお願いしてる笑

21: jintrick 2025/07/14 16:43

冗長ここに極まれり。水資源の節約のためにもう一歩進めてみて欲しい。毎回この同じ作業を行うには、どうするのが効率的ですか?と聞くのだ。

22: shikiarai 2025/07/14 16:44

プログラマはもっと意味を拡張してこの人もプログラマでいい良いと思う。コードを書くのはコーダーで良い。プログラマ全体の単価は下げつつ細かい実装に対応できるコーダーの単価を上げて……としていきたいわ

23: clapon 2025/07/14 18:56

LLMが取ってくるデータってどこまで信頼できるのかなあ? せっかくAIを使うなら、スクレイピングする仕組みの作り方を教わって構築したほうがよさそう

24: anonruru 2025/07/14 19:50

PDFに書いてある表のデータをJSONとかに変換してもらおうと頼んだら普通に幻視起こしてるデータをお出ししてきたので、やはりクリティカルなデータは目視確認必須。それ以前のやり取りではちゃんと読めてたのにな。

25: kotoripiyopiyo 2025/07/14 20:03

これやったけど、数字が一部嘘なんだよね…目視でのチェックが必要になった

26: kn012078 2025/07/14 20:37

私も冬は毎日山の天気見てる民なのでとても助かる。春先はどこがストップスノーなのか分かれば最強だと思う

27: prograti 2025/07/14 22:31

最新の気象データはCSVでダウンロードできるけどこれじゃダメ?https://www.data.jma.go.jp/stats/data/mdrr/docs/csv_dl_readme.html

28: nishik-t 2025/07/14 22:39

スクレイピングねえ。頼むから1秒置きで全ページを毎日取得とか負荷がかかる方法で取るのはやめてほしい。酷い仕様のスクレイピングが来るたびに夜中だろうが起こされる人の事も考えて。もしAPIがあるならそれ使って

29: secseek 2025/07/14 23:26

岡崎市図書館みたいなことにならないようにだけ祈っております

30: atsushieno 2025/07/14 23:59

世の中「非デザイナーの私がデザインなしで適当なテンプレートでWebサイトを作りました」みたいな事例にあふれていて、プログラマーも特別視する理由は何も無い。エンジニアもクリエイターもそば屋も同じ。

31: rakugoman 2025/07/15 02:02

スクレイピングと聞くとアレルギー反応を起こすエンジニアがチラホラ

32: jnkfkt 2025/07/15 05:07

映画祭のサイトを参照して作品リストを作らせようとして「静的ページしか読めません」と却下され、部門別の一覧から各作品ページのデータも拾ってと指示したら「Python勉強しましょう」と言われた俺⋯。いい方法ない?

33: tel30 2025/07/15 05:53

非エンジニアコント

34: hasiduki 2025/07/15 09:14

俺もエンジン作れない!!!!!!!!

35: s-yata 2025/07/15 09:23

なんとなくでも動く便利さと,なんとなくでも動いてしまう怖さが,うまいことミックスされている.非エンジニアにとっては「できた!」という達成感,エンジニアにとっては「本当にこれでいいのか?」という不安感.

36: llgenll 2025/07/15 10:59

そもそもスプレッドシートには、指定ページのHTML要素解析してデータ取得する機能がある。AIが間違った値を持ってくることを考慮すると、スプレッドシートの機能使ったほうがよさそう。