DARPA Mencari AI yang Belajar Sepanjang Waktu

Illustration: iStockphoto
Awal bulan ini, sebuah pesawat ulang-alik self-driving di Las Vegas dengan sabar menunggu saat sebuah truk pengiriman dilepas, lalu mundur lagi, lalu mundur ke dalamnya. Tidak merepotkan bagi pengembang roboshuttle Navya, ini terjadi dalam beberapa jam setelah upacara peresmian pesawat ulang alik tersebut. Masalah sebenarnya adalah bahwa pesawat ulang-alik tidak dapat belajar dari kejadian seperti yang manusia inginkan: segera dan tanpa melupakan bagaimana melakukan hal lain dalam prosesnya.

Badan Penelitian Lanjutan Proyek Pertahanan A.S. (DARPA) sedang mencari cara untuk mengubah cara kerja AI melalui sebuah program yang disebutnya L2M, atau Lifelong Learning Machines. Agensi sedang mencari sistem yang belajar terus menerus, beradaptasi dengan tugas baru, dan tahu apa yang harus dipelajari dan kapan. "Kami ingin kerasnya otomatisasi dengan fleksibilitas manusia," kata direktur program Hava T. Siegelmann. Program senilai US $ 65 juta telah memilih 16 kelompok untuk proyek 4 tahun, namun menurut Siegelmann masih ada kesempatan untuk mengusulkan 12 atau 18 bulan proyek.

Masalah besar AI berasal dari struktur yang digunakan saat ini. Jaringan syaraf tiruan adalah sistem yang dapat beradaptasi yang kemampuannya untuk belajar berasal dari berbagai kekuatan koneksi antara neuron buatannya. Saat ini jaringan ini dilatih pada serangkaian data-gambar mobil dan orang-orang misalnya. Kekuatan koneksi jaringan kemudian diperbaiki, dan sistem keluar ke dunia untuk melakukan hal itu.

Masalahnya datang ketika AI menemukan sesuatu yang tidak pernah dilatih untuk dikenali. Tanpa pelatihan ulang, sistem akan membuat kesalahan yang sama berulang-ulang. Tapi saat ini, AI tidak bisa benar-benar dilatih ulang di tempat kerja. Mencoba melakukannya dengan sistem hari ini mengarah pada fenomena yang disebut "bencana lupa," Siegelmann menjelaskan di Konferensi Komputasi Reboot IEEE. Ini adalah situasi dimana belajar item baru mengganggu pengetahuan tentang semua hal lain yang sudah diketahui sistem.

Bahkan manusia mengalami beberapa penurunan kinerja saat mereka menemukan sesuatu yang baru, namun kita bisa pulih saat masih melakukan fungsi. Jika Anda meningkatkan permainan bola basket dengan kecepatan 30 sentimeter, pemain akan kehilangan sebagian besar waktu pada awalnya, namun saat mereka terus bermain, mereka akan belajar mencetak gol pada ketinggian baru. Anda tidak perlu menarik mereka keluar dari lapangan dan mengajari mereka seluruh permainan lagi.

16 hibah utama masuk ke dua kelompok. Satu set akan memiliki empat tahun untuk mengembangkan sistem yang dapat terus belajar, menyesuaikan diri dengan tugas dan situasi baru, dan memahami masukan sesuai dengan misi sistem apa yang (disebut "persepsi berbasis sasaran). Satu set lainnya akan memiliki empat tahun untuk mengidentifikasi mekanisme baru pembelajaran seumur hidup - dari biologi atau sains fisik - dan mentransfer mekanisme tersebut ke algoritma yang meningkatkan AI.

Siegelmann mengatakan ada peluang di kedua wilayah tersebut untuk eksplorasi jangka pendek. "Ini cara yang baik untuk mulai bekerja" dengan DARPA, katanya. Dan itu bisa menjadi dasar program masa depan. Hubungi Siegelmann di sini jika Anda pikir Anda punya ide yang sesuai.

Referensi : spectrum.ieee.org

No comments:

Powered by Blogger.