Wystarczyło 40 dni, by program AlphaGo Zero (grając sam ze sobą) opanował poziom zaawansowania w go nieosiągalny dotąd dla nikogo.
Słyszeliście pewnie o AlphaGo – to oparty na sztucznej inteligencji program zespołu DeepMind, który opanował sztukę gry w go do tego stopnia, że bez większych problemów wygrał pojedynki z arcymistrzami uznawanymi za najlepszych z najlepszych. Jeśli byliście pod wrażeniem, to musicie wiedzieć, że znalazł się wreszcie jego pogromca – nazywa się… AlphaGo Zero.
AlphaGo Zero również jest programem bazującym na sztucznej inteligencji, ale nieco innego rodzaju. O ile bowiem ten pierwszy uczył się najlepszych ruchów i strategii poprzez toczenie pojedynków z ludzkimi przeciwnikami, tak AlphaGo Zero uczył się sam (tzw. reinforcement learning). Rozgrywał sam ze sobą partię za partią (początkowo nie znał żadnych ruchów – wyłącznie podstawowe zasady gry – ale z czasem uczył się tego, jakie najszybciej i najskuteczniej doprowadzą go do zwycięstwa).
Tak samouczący się program już po 3 godzinach zaczął grać jak ludzki amator (robiąc jeszcze bardzo proste błędy), a po 19 godzinach miał już wiedzę na temat bardziej zaawansowanych strategii. Po trzech dniach treningu był w stanie pokonać wersję AlphaGo z 2015 roku (tę, która pokonała arcymistrza Lee Sedola) i to wynikiem 100:1. Po trzech tygodniach zrównał się poziomem z wersją, która pokonała wszystkich najlepszych zawodników („Master”). I wreszcie po 40 dniach zdołał wygrać ze wspomnianym „Masterem”.
Krótko mówiąc: nie trzeba było czekać półtora miesiąca, by program-samouk stał się najlepszym zawodnikiem w go na świecie – lepszym od rozwijanego od lat AlphaGo i ludzkich zawodników z wieloletnim doświadczeniem. Taka sztuczna inteligencja, która nie musi ograniczać się do ludzkiej wiedzy, może pomóc w rozwiązaniu problemów, z którymi do tej pory ludzkość sobie nie poradziła. Taki jest potencjał.
Źródło: DeepMind Blog
Komentarze
13Na początku 21 wieku ludzkość popadła w samozachwyt, stworzyliśmy "SI". Cyfrową świadomość która...
Cos mi się wydaje ze przy tak szybkim procesie, prędzej czy później jakiś zryty dupek dla czystej zabawy odpali taki proces... Tak żeby zobaczyć co się stanie... Wtedy reprezentacje szybkich postępów w nauce sinika AI będziemy mieli szanse zobaczyć w rzeczywistym świecie... Musk ma racje bijąc na alarm...
Potrzebne są reguły, nadzór i zabezpieczenia. Ale te są mało realne. Wkrótce byle kto będzie mógł odpalać swoje małe testy silników AI…
Albo to może po prostu ponury piątek jest….