Course description

Kursus ini memberikan pengenalan komprehensif tentang Reinforcement Learning (RL), sebuah pendekatan AI yang memungkinkan agent belajar dari interaksinya dengan lingkungan. Anda akan mulai dengan memahami konsep dasar RL dan Q-Learning, kemudian belajar bagaimana membuat agent sederhana menggunakan OpenAI Gym. Kursus ini juga mencakup Value Iteration dan Policy Iteration, dua metode yang esensial dalam RL, serta penggunaan SARSA untuk modeling decision making. Pada akhir kursus, Anda akan membuat agent yang dapat bermain Tic-Tac-Toe dengan strategi reinforcement learning. Kursus ini dirancang untuk pemula yang ingin mendapatkan pemahaman kuat tentang dasar-dasar RL dan penerapannya dalam dunia nyata.

What will i learn?

  • Memahami konsep dasar Reinforcement Learning dan Q-Learning
  • Mampu membuat agent sederhana menggunakan OpenAI Gym
  • Mengimplementasikan Value Iteration dan Policy Iteration.
  • Menggunakan SARSA untuk pengambilan keputusan dalam RL
  • Membuat agent yang mampu bermain Tic-Tac-Toe menggunakan Reinforcement Learning.

Requirements

  • Pengetahuan dasar Python.
  • Pemahaman dasar tentang machine learning akan membantu, tetapi tidak wajib.
  • Keinginan untuk mempelajari cara membuat agent AI dan mengimplementasikan reinforcement learning.

Frequently asked question

Reinforcement Learning adalah metode machine learning di mana agent belajar membuat keputusan berdasarkan feedback dari interaksinya dengan lingkungan.

Tidak, kursus ini dirancang untuk pemula dan akan memperkenalkan konsep-konsep fundamental RL dari awal.

Q-Learning adalah algoritma off-policy yang menggunakan nilai Q optimal, sedangkan SARSA adalah algoritma on-policy yang mempertimbangkan tindakan yang dipilih oleh policy agent saat ini.

Ya, Anda akan belajar bagaimana membuat agent yang dapat bermain Tic-Tac-Toe menggunakan konsep RL yang diajarkan dalam kursus ini.

OpenAI Gym adalah toolkit yang menyediakan berbagai lingkungan simulasi untuk mengembangkan dan menguji algoritma reinforcement learning.

ITS Academic

Free

Lectures

0

Skill level

Beginner

Expiry period

Lifetime

Related courses