Pangunahin Makabago Ang Artipisyal na Artipisyal ng Google na 'Alpha Go Zero' Pinindot Lamang I-reset Sa Paano Matuto

Ang Artipisyal na Artipisyal ng Google na 'Alpha Go Zero' Pinindot Lamang I-reset Sa Paano Matuto

Ang Iyong Horoscope Para Bukas

Tandaan (malabo) kung paano mo natutunan ang maglakad, magsalita, sumakay ng bisikleta, o magmaneho? Ito ay magulo at puno ng mga pagkakamali, ngunit ang mga kasanayang natutunan mo sa ganoong paraan ay nanatili. Sa labas ng mga sistema ng pamumuhay, mahirap na mag-istraktura ng sapat na sapat na mga algorithm upang kunin ang 'karanasan sa totoong buhay' at bumuo ng malagkit, madaling ibagay na pag-uugali para sa artipisyal na katalinuhan.

Kaya, ginawa lang ito ng Alpha Go Zero.

Nagsisimula ito mula sa isang blangkong slate at nalalaman lamang para sa kanyang sarili, mula lamang sa paglalaro sa sarili, at walang anumang kaalaman ng tao, o anumang data ng tao, o mga tampok, o halimbawa, o interbensyon mula sa mga tao. Natuklasan nito kung paano laruin ang laro ng Go mula sa mga unang prinsipyo, 'sabi ng propesor ng DeepMind na si David Silver.

Ang AI ay mayroong maraming mga pag-ulit, ang bawat isa ay mas matalino at may kakayahang kaysa sa nauna. Ang nakaraang bersyon ay gumamit ng isang malaking database ng nakaraang mga laro sa tabi ng isang bungkos ng mga algorithm na itinuro ito patungo sa panalo. Ang pamamaraang iyon ay humantong sa pagkatalo ng naghahari na kampeon sa mundo na propesyonal na manlalaro ng Go. Sa poker, pinulasan ng AI Libraryatus ang nangungunang mga manlalaro ng poker sa buong mundo ng halos $ 2 milyon, din sa pamamagitan ng pag-aaral sa pamamagitan ng pag-play sa sarili sa halip na data ng laro ng tao.

Ngayon, sa pinakabagong bersyon ng Alpha Go, itinuro ang artipisyal na programa ng katalinuhan mismo kung paano laruin ang Go - nang walang background ng tao.

Pagpapatakbo ng milyun-milyong mga simulation ng laro laban sa sarili nito, tumagal ng 40 araw upang malaman ito - mula sa simula - kung paano talunin ang bersyon ng kampeon ng World na ito mismo. Totoong nagbabago ng laro iyon, hindi lamang para sa Go, kundi pati na rin sa kung paano natuklasan ang bagong kaalaman. Gaano katumpak o kumpleto ang iyong kadalubhasaan sa domain? Mayroon marami higit pa upang matuklasan, kung ano ang sinasabi sa atin ng kamangha-manghang eksperimentong ito sa pag-aaral sa Alpha Go Zero.

'Ang ideya ng Alpha Go ay hindi upang lumabas at talunin ang mga tao, ngunit talagang matuklasan kung ano ang ibig sabihin ng paggawa ng agham - para sa isang programa upang malaman mula sa sarili nito kung ano ang kaalaman,' ayon sa Silver sa isang post sa YouTube tungkol sa ang nakamit.

Tinawag ito ng koponan ng Alpha Go Zero Deep Mind na unang-prinsipyo, 'tabula rasa' (blangkong slate) na pag-aaral.

'Kung makakamit mo tabula rasa natutunan, mayroon kang isang ahente na maaaring mailipat mula sa laro ng Pumunta sa anumang iba pang domain, at ang mga detalye ng larong naroroon ka, nakakuha ka ng isang algorithm na napakalawak na maaari itong mailapat kahit saan, 'sabi niya . Ito ay isang nakakapukaw na ideya kapag pinahaba mo ang konsepto. Isipin lamang kung ano ang maaari nating gawin sa isang hanay ng mga malakas, pag-aaral ng mga algorithm na maaaring sistematikong matugunan ang mahihirap na problema at matuto nang mas mabilis kaysa sa kolektibong kaalaman ng ating sibilisasyon. . . sa mga araw, hindi mga dekada.

Sa ngayon, ang malaking aalisin ay, 'ang mga algorithm ay higit na mahalaga kaysa alinman sa computing o data na magagamit,' sabi ni Silver. Ang nag-iisa lamang na ito ay isang game-changer kung paano namin lalapitin ang pagpapalawak ng kilalang mundo. Habang ang Alpha Go ay tumatakbo sa humigit-kumulang na $ 25 milyon sa hardware - hindi ito eksaktong isang magaan na sistema - alam mo na ang mga guro ng AI ay matagal nang nagtatrabaho sa paglikha ng mas malinis, mas mahusay na mga hanay ng data. Ngayon, maraming malalaking hanay ng data ang itinuturing na masyadong maingay - puno ng masamang data - upang tumpak na sanayin ang isang artipisyal na intelihensiya. Kung natututo ang AI mula sa data, at ang data ay hindi maganda, hindi ito natututo. Malaking problema.

Paano kung hindi mo kailangan ng malinis na data, ngunit karanasan lamang, at maaaring sanayin ng artipisyal na talino ang sarili nito?

Iyon ang kapanapanabik na tagumpay sa Alpha Go Zero. Kahit na ito ay nasa angkop na lugar, batay sa panuntunan na mundo ng mga laro, mayroon itong malaking implikasyon sa bawat industriya na nagtatrabaho mula sa mga pisikal na panuntunan - isipin ang kimika, trapiko, biology, parmakolohiya, paglalakbay, logistik, at pagmamanupaktura. Kung maaari nating idisenyo ang mga panuntunan na nababaluktot maaari silang gumana mula sa mas malawak na karanasan, at nakadirekta na palagi silang lumilikha ng mas malakas na kasanayan - tulad ng Alpha Go Zero - kung gayon posible na makamit ang artipisyal na intelihensiya na mga masterminds system. Ang mga system na ito ay hindi mangangailangan ng labas ng data, walang mga problema sa paglilinis ng data, at hindi nangangailangan ng paghina ng tao-sa-loop. Bahagi iyon kung bakit ang kumpanya ng magulang ng Google, ang Alphabet, ay tumaya sa kumpanya sa artipisyal na katalinuhan at namumuhunan sa artipisyal na intelihensiya sa isang mabilis na rate. (Namumuhunan din ang Amazon sa artipisyal na katalinuhan, tulad ng pinakabagong AI acquisition BodyLabs.)

Sinabi ng propesor ng Deep Mind na si David Silver, 'ang katotohanan na nakakita kami ng isang programa na nakamit ang isang mataas na antas na pagganap ... ay nangangahulugang ngayon maaari na tayong magsimula upang harapin ang ilan sa mga pinaka-mapaghamong at nakakaapekto na mga problema para sa sangkatauhan.'

Ang post na ito ay na-update upang linawin na ang AI Libraryatus ay natalo kamakailan ang nangungunang mga manlalaro ng poker gamit ang isang diskarte na nagsasangkot sa pag-play sa sarili kaysa sa data na ipinasok ng tao.