2026年4月5日
価値関数、Bellman方程式、モンテカルロ法、TD(0)、n-step TD、TD(λ) を数式ベースで整理し、偏り・分散・収束の違いを解説する
2026年4月4日
逐次最適化問題から Bellman 方程式がなぜ出てくるのかを、価値関数・最適性原理・縮小写像まで順を追って解説する
2026年3月24日
Bellman方程式、MDP、近似動的計画法を軸に、マクロ経済学への強化学習応用を数理的に解説する