HELLO CYBERNETICS

深層学習、機械学習、強化学習、信号処理、制御工学、量子計算などをテーマに扱っていきます

人工知能-強化学習

強化学習に出てくるベルマン方程式を理解しよう

はじめに ベルマン方程式の概要 最適制御と評価関数 最適制御 評価関数 価値関数 ベルマンの最適性原理 ベルマン方程式 価値関数の離散化 状態の時間発展再訪 ベルマン方程式 まとめ 最後に

強化学習の基本:マルコフ決定過程ってなんぞ?

はじめに 環境とエージェント 環境 マルコフ過程 本当のマルコフ過程 マルコフ決定過程 本当のマルコフ決定過程 強化学習の話をちょっとだけ 最後に

【ここまで分かれば概要を理解できる】強化学習問題の基本的考え方

強化学習の基本、行動価値関数について

深層学習と並ぶ人工知能の巨塔、強化学習とは一体何か