"機械学習","信号解析","ディープラーニング"の勉強

読者です 読者をやめる 読者になる 読者になる

HELLO CYBERNETICS

深層学習、機械学習、強化学習、信号処理、制御工学などをテーマに扱っていきます

強化学習の基本、行動価値関数について

  •  強化学習での行動評価
    • 学習の仕方の違い(上記の記事の軽いおさらい)
      • 教師あり学習と教示
      • 強化学習と評価
    • 評価をするための行動価値関数
      • 知識利用と探査
  • 行動価値関数
    • 行動価値関数の考え方
      • 報酬の標本平均
      • 漸化式への変形
    • 行動価値関数更新の解釈と拡張
      • 行動価値関数の更新式
      • 指数減衰加重平均更新式
      • オプティミックス初期値
  • 最後に
続きを読む

深層学習と並ぶ人工知能の巨塔、強化学習とは一体何か

  •  学習の種類
    • 教師あり学習
    • 教師なし学習
    • 半教師あり学習
    • 強化学習
      • ハッキリとした答えがわからない 
      • 良さそうか悪そうかの判断方法自体もわからない
      • 問題設定は遥かに複雑
  •  強化学習を理解する特殊例
    • 強化学習の難しさと課題点
    • n本腕バンディット問題
      • 問題の状況
      • 行動の価値
      • 知識利用と探査
    • 行動価値関数と行動の決定
      • Q関数
      • 貪欲法による行動の選択
      • ソフトマックス行動選択
  • 最後に
    • 行動価値関数に関する続編記事
    • 強化学習を学ぶための書籍
    • 2016年NIPSでも強化学習は話題だった 
続きを読む

自己啓発本やビジネス本を食わず嫌いしていた私が【7つの習慣】を読んで

  •  自己啓発本やビジネス本を避けていた理由
    • 自分を騙し騙し変化させる気がしていた
    • 胡散臭さが漂っている
    • 意識高い系という言葉
    • 実際には悪いイメージとは真逆のものであった
  • 7つの習慣
    • 本の紹介 
      • 小手先のテクニックではなく、人間の生き方の根本
      • 人と関わる全ての人におすすめ
      • 最初は通読すること、後で索引的に使う
    • 読書は短い時間で他者の人生経験を得られる
      • 人の時間を借りる
      • 実践する
  • 他の本
    • 人を動かす 
    • 影響力の武器  
    • リーダーになる人に知っておいてほしいこと
続きを読む

またもやTensorFlowが強化!!深層学習ライブラリ「sonnet」の登場【使ってみた記事紹介を追加】

  •  新たなライブラリsonnet
    • sonnetとは
      • DeepMind社製であること
      • TensorFlowと共に使える
  • TensorFlow
    • TensorFlowの役割
    • TensorFlowの追加ライブラリ
      • Keras
      • TensorFlow-Fold
      • edward
      • sonnet
  • sonnet使ってみた記事まとめ
    • 多分日本語最速で出た使ってみた記事
    • インストールから丁寧に
    • コードに対するコメントが豊富で参考になる記事
続きを読む