Reinforcement Learning (RL)
AIが試行錯誤を通じて、どのような行動をとれば報酬(スコア)が最大化されるかを学ぶ手法。ゲームやロボット制御、最近ではChatGPTのような言語モデルの回答精度向上に使われます。
この用語をシェア
「うちの会社でも使えるの?」「何から始めればいい?」そんな疑問に、30分のオンライン相談でお答えします。