最適な行動を選択するように学習するエージェント (IMAGE) Okinawa Institute of Science and Technology (OIST) Graduate University Caption エージェント(行動する人や動物やロボット)は報酬信号を使った強化学習によって最適な行動を選択するよう学習する。エージェントは、感覚的観察を用いて環境に関する予測を行う。 Credit Hanら, 2024年 Usage Restrictions Credit must be given to the creator. License CC BY Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.