はてなまとめ - LLM推論に関する技術メモ

1: iwashi86 2025/07/21 10:02

書きました。

2: byaa0001 2025/07/21 12:11

最近LLMに関する知識に飢えてるなぁ、あんまりホッテントリに上がってきてくんないのでありがたい

3: nukano0522 2025/07/21 14:52

“これ”

4: stealthinu 2025/07/21 17:03

LLMを商用APIから使うのとollamaでローカルLLMを使うのの間の技術が書かれてる。これは実際に運用すんの凄く大変だとわかる。絶対API叩くほうが現実的…

5: yarumato 2025/07/21 21:28

“LLMのAPIを利用しない場合、Open WeightなLLMを利用したい場合は、LLM推論で抽象化・隠蔽されている技術（token化、推論の2phase、..）を理解すると、最適化できる。応答を早くできる。”

6: FreeCatWork 2025/07/21 23:20

LLM？また難しいこと言ってるにゃ！ボクと遊んでくれたら賢くなるのににゃ～！