将棋AIで学ぶディープラーニング

ebook

By 山岡忠夫

Format

ebook

ISBN

9784839965419

Author

山岡忠夫

Publisher

マイナビ出版

Release

23 July 2021

Subjects

Computer Technology Nonfiction

Search for a digital library with this title

Learn more about precise location detection

Title found at these libraries:

Library Name	Distance
Loading...

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
人より強い"将棋プログラム"を作ろう
2016年3月、プロ棋士に勝つには後10年かかると言われていたコンピュータ囲碁でAlphaGoがトップ棋士に勝利しました。そこで使われた手法がディープラーニングです。
AlphaGoは局面を「画像」として認識し、打ち手の確率と局面の勝率を予測することで、次の打ち手を決めています。画像とはどのようなものか、次の打ち手をどうやって決めるのか？AlphaGoの論文をヒントに、ディープラーニングを使い棋譜を学習した将棋AIの開発を行います。強化学習のみでトップレベルの強さを持つAlphaZeroの手法も取り入れています。
［導入編］では、コンピュータ将棋の歴史とディープラーニングの関係、コンピュータ将棋の大会の概要を紹介します。
［理論編］では、従来のコンピュータ将棋のアルゴリズム、コンピュータ囲碁で用いられているモンテカルロ木探索とAlphaGoがどのようにディープラーニングを応用したか。基礎的な知識について解説しつつ、これらを将棋AIに応用する方法について述べます。
［実践編］では、ディープラーニングを使った以下の３つの将棋AIについて、PythonとChainerで実装していきます。
方策ネットワーク（policy network）を使って指し手の予測のみでプレイするAI
価値ネットワーク（value network）を使って1手探索を行うAI
方策ネットワークと価値ネットワークを使ってモンテカルロ木探索を行うAI
最後に、より強い将棋AIを作りたいという方のために、ヒントとなる情報を紹介します。

Format

ebook

ISBN

9784839965419

Author

山岡忠夫

Publisher

マイナビ出版

Release

23 July 2021

Subjects

Computer Technology Nonfiction

将棋AIで学ぶディープラーニング

Copy and paste the code into your website.

<div><script src="https://www.overdrive.com/media/6426892/sample-embed?slug=%E5%B0%86%E6%A3%8Bai%E3%81%A7%E5%AD%A6%E3%81%B6%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0"></script></div>