を書いた。pole_balancing.jar棒を上に立てたままうまくバランスを保つ方法を自動的に獲得できる。最終的には、100000ステップ(シミュレーション内の時間では、1ステップ0.02秒なので、30分くらい)バランスを保てるようになる。もっと学習時間を長くすれば…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。