東 俊一 氏の講演一覧
14:00
- 14:15
フードデリバリーサービスの動的モデル化と配達員の報酬最適化
Dynamic Modeling and Reward Optimization of Food Delivery Services
14:15
- 14:30
経路積分に基づく直接方策改善法を用いた多目的強化学習
Multi-objective Reinforcement Learning by Path Integral Policy Improvement