Yusuke Blog
home
Profile
Articles
Books
お問い合わせ
検索
⌘
K
dynamic-programming
2026年4月4日
ベルマン方程式の導出を数式ベースで理解する
逐次最適化問題から Bellman 方程式がなぜ出てくるのかを、価値関数・最適性原理・縮小写像まで順を追って解説する
#mathematics
#reinforcement-learning
#dynamic-programming