fortis活動日誌
ごくごく平凡なプログラマーの備忘録みたいなもの 間違ったこと書いてあったりすると思うのでその時はそっと教えてください。
2016年2月19日金曜日
Q学習
今回は強化学習の一つであるQ学習を実装してみました。 以下ソースコードです。 こんな感じで実行すると各マスのQ(s,a)の最大値が表示されます。
0 件のコメント:
コメントを投稿
次の投稿
前の投稿
ホーム
登録:
コメントの投稿 (Atom)
0 件のコメント:
コメントを投稿