ひたすら思考するというか試行するというか。自分の出力を評価できる、確率に基づく論理回路だから、将棋でいうと何回も思考させると、ときどき運良く妙手を見つけて、勝ち筋を少しづつ前進繰り返すみたいな感じかな
AIエージェントでKaggleに挑む猛者おる?w これ読んで俺も参戦するしかねーな!
Repated sampling、モンテカルロ法みたいではある
全34ページのスライド資料。
戦えるAIエージェントの作り方
ひたすら思考するというか試行するというか。自分の出力を評価できる、確率に基づく論理回路だから、将棋でいうと何回も思考させると、ときどき運良く妙手を見つけて、勝ち筋を少しづつ前進繰り返すみたいな感じかな
AIエージェントでKaggleに挑む猛者おる?w これ読んで俺も参戦するしかねーな!
Repated sampling、モンテカルロ法みたいではある
全34ページのスライド資料。