2018年9月11日
私達は、Unity を人工知能(AI)研究の主要なプラットフォームにするための取り組みを熱心に進めています。ここ数週間のうちに私達は、複数の研究者グループが Unity の可能性に気付き利用していることを知りました。OpenAI が Unity を使用してロボットの手の「握る」タスクのトレーニングを行っているほか、カリフォルニア大学バークレー校のあるグループは好奇心ベースの新しい学習アプローチの実験に Unity を使用しています。本日は、私達の「AI 研究コミュニティを支える」使命を果たすための一歩として、更なる改良とリソースの公開をお知らせできること...
2018年6月26日
ML-Agents ツールキット(v0.4) の新しいバージョンがリリースされました。そのエキサイティングな新機能のひとつが、好奇心に基づく内発的報酬を使用してエージェントのトレーニングを行う機能です。
この機能については多くの説明が必要となるため、追加の記事をお届けすることにしました。この機能によって、(報酬が疎な場合に)エージェントにより効率的に環境を探索させるための動機付けが簡単に行えるようになりました。これは、「エージェントが自分自身に与える報酬」を使用して行われます。この報酬は、エージェントが自分自身の行動の結果に対してどの程度「驚いた」か(...
2018年6月18日
ML-Agents ツールキットの最新版、v0.4 が公開されました。このキットには数多くの機能が含まれており、きっと皆様に喜んでいただけると思います。
このキットには、ビルドされた実行ファイルによってではなくエディターから直接環境のトレーニングを行えるオプションが搭載されています。これにより、イテレーション時間が大幅に短縮されます。また、難易度の高い新しい環境のセットが公開されたほか、アルゴリズムの改良により、これまでエージェントにとって非常に困難(場合によってはまったく不可能)だったタスク解決の学習がより行いやすくなっています。新バージョンは Gi...
2018年3月15日
ML-Agents チームの提供するツールキットの最新版、v0.3が公開されました。
ML-Agents v0.3 はこれまでの ML-Agents チームからのリリースの中で最大級のものです。これに含まれる主要な機能の多くは、コミュニティの皆様からのフィードバックを基に開発されたものです。今回の新機能の主な目的は、模倣学習、マルチブレイントレーニング、オンデマンド意思決定、メモリ強化エージェントの追加によって、ML-Agents の能力を拡張することです。また、Docker イメージの追加、API セマンティクスの修正、そしてドキュメンテーションの大...
2017年12月8日
Unity の機械学習チームより、Unity Machine Learning Agents Toolkit – v0.2 ベータ版の新バージョンのリリースをお知らせします!このリリースでは、あらゆる面でツールキットを改良しました([1]Unity SDK と Python API の両方に新機能を追加[2]新しいサンプル環境(開発のベースとして使用可能)[3]デフォルトの強化学習アルゴリズム(PPO)の改良、多数のバグ修正、その他の小さな改良)。本記事では大きな追加要素のいくつかを取り上げますが、完全なリストは GitHub のリリースノートでご確認い...
2017年8月22日
Unity AI に関するブログシリーズ第 2 回となる本記事では、前回に引き続きコンテクスチュアルバンディット問題を完全な強化学習問題へ拡張する方法を解説します。その一環として、学習された Q 関数(特定の環境下における特定のアクション実行の長期的価値を予測するもの)によって行動するエージェントの使用方法を示したデモもご提供します。この例では、簡単なグリッドと Q 関数の表のみを使用します。幸運なことに、このベーシックなコンセプトがほぼ全てのゲームに当てはまります。Q 学習のデモは、こちらのリンクからお試しにいただけます。以下本文では、Q 学習の仕組み...