Manusia Dikalahkan Kecerdasan Buatan dalam Permainan Pac-Man

Dythia Novianty Suara.Com
Jum'at, 16 Juni 2017 | 17:29 WIB
Manusia Dikalahkan Kecerdasan Buatan dalam Permainan Pac-Man
Permainan video game Pac-Man. [Shutterstock]
Follow Suara.com untuk mendapatkan informasi terkini. Klik WhatsApp Channel & Google News

Suara.com - Akhirnya, skor sempurna untuk permainan klasik arcade Ms Pac-Man telah tercapai, meski bukan oleh manusia. Maluuba, tim pembelajaran mendalam yang diakuisisi oleh Microsoft pada bulan Januari, telah menciptakan sebuah sistem AI.

Sistem AI (Artificial Intellegence) ini belajar bagaimana mencapai nilai titik maksimum game 999.900 pada Atari 2600. Sistem tersebut menggunakan kombinasi unik dari pembelajaran penguatan dengan metode membagi dan mengalikan.

Periset AI memiliki kecenderungan yang terdokumentasi untuk menggunakan video game dalam menguji pembelajaran mesin. Mereka memiliki kemampuan lebih baik dalam meniru kekacauan dunia nyata dalam lingkungan yang terkendali versus permainan statis seperti catur.

Pada tahun 2015, AI DeepMind dari Google dapat mempelajari bagaimana menguasai 49 game Atari dengan menggunakan pembelajaran penguatan, yang memberikan umpan balik positif atau negatif setiap kali AI mencoba memecahkan masalah.

Baca Juga: Kecerdasan Buatan Google, AlphaGo Diputuskan Pensiun

Meskipun AI telah menaklukkan banyak permainan retro, Pac-Man tetap sulit dipahami selama bertahun-tahun. Permainan ini sulit diprediksi.

Ternyata itu menjadi sesuatu yang terus diuji manusia. Banyak yang mencoba meraih nilai tertinggi dan hanya mendekati 266.330 versi Atari 2600.

Jumlah 999.900 sulit dicapai dan sejauh ini hanya bisa dicapai oleh manusia dengan cara yang curang.

Maluuba menggunakan AI untuk mengalahkan permainan dengan memecahnya menjadi pekerjaan yang harusnya ditugaskan ke lebih dari 150 agen. Tim kemudian mengajarkan AI menggunakan apa yang mereka sebut Hybrid Reward Architecture, kombinasi pembelajaran penguatan dengan metode membagi dan mengalikan.

"Ada interaksi yang bagus ini. Antara apa yang harus mereka lakukan, dan di satu sisi, bekerja sama berdasarkan preferensi semua agen, tapi pada saat bersamaan setiap agen hanya memperhatikan satu masalah saja. Ini menguntungkan keseluruhannya," kata Harm Van Seijen, seorang peneliti dengan Maluuba.

Baca Juga: Kecerdasan Buatan AlphaGo Taklukkan Juara Dunia asal Cina

Maluuba mengatakan bahwa versi Hybrid Reward Architecture of AI learning ini memiliki aplikasi praktis dan ekspansif, seperti mampu membantu memprediksi prospek penjualan perusahaan, atau membuat kemajuan dalam pemrosesan bahasa alami. Tonton Microsoft menjelaskan metodenya di atas. [The Verge]

BERITA TERKAIT

REKOMENDASI

TERKINI