reinforcement-learning

2026年4月5日

強化学習におけるモンテカルロ法とTD法を数学で理解する

価値関数、Bellman方程式、モンテカルロ法、TD(0)、n-step TD、TD(λ) を数式ベースで整理し、偏り・分散・収束の違いを解説する

#reinforcement-learning#mathematics#machine-learning

2026年4月4日

ベルマン方程式の導出を数式ベースで理解する

逐次最適化問題から Bellman 方程式がなぜ出てくるのかを、価値関数・最適性原理・縮小写像まで順を追って解説する

#mathematics#reinforcement-learning#dynamic-programming

2026年3月24日

マクロ経済学への強化学習の応用

Bellman方程式、MDP、近似動的計画法を軸に、マクロ経済学への強化学習応用を数理的に解説する

#economics#macroeconomics#reinforcement-learning