微分可能メモリを用いた方策勾配法の安定化手法
| dc.contributor.advisor | 今井, 倫太 / 教授 | |
| dc.contributor.author | SENO, TAKUMA / 妹尾, 卓磨 | |
| dc.date.accessioned | 2019-11-25T00:02:02Z | |
| dc.date.available | 2019-11-25T00:02:02Z | |
| dc.date.issued | 2019-09-21 | |
| dc.description | 修士(工学), 2019, 開放環境科学専攻 | |
| dc.identifier.uri | /sigma_local/handle/10721/12010 | |
| dc.language | ja | |
| dc.publisher | 慶應義塾大学理工学研究科 | |
| dc.subject | 深層強化学習 | ja |
| dc.subject | 方策勾配法 | ja |
| dc.subject | メモリ | ja |
| dc.subject | Deep Reinforcement Learning | en |
| dc.subject | Policy Gradients | en |
| dc.subject | Memory | en |
| dc.title | 微分可能メモリを用いた方策勾配法の安定化手法 | ja |
| dc.title.alternative | Stabilizing Policy Gradients via Differentiable Memory | en |
| dc.type | 学位論文 |
