1996an, Deep Blue IBMko superkonputagailuaren eta Garry Kasparov xake txapeldunaren arteko lehiaketa izan zen. Lehenengo horretan, gizakia gailendu zen, sei partidatik hiru irabaziz, bi berdinduz eta bat galduz. Urtebete geroago, aldiz, konputagailuak irabazi zuen.
Orain dela egun batzuk, Go ekialdeko jokoan, Googlek sustatutako AlphaGo programa informatikoak Lee Sedol, munduko hiru jokalari onenetariko bat, gainditu zuen. Kasu biek oso antzekoak dirudite: bai xakea, bai go, estrategia eta taula jokoak dira; jokalari bien piezak txandaka eta oso arau zehatzen arabera mugitzen dira; eta informazioa, hau da, pieza guztien kokapena, beti dago ikusgai. Baina “ziber-eraso” bakoitzaren garapena oso desberdina izan da.
Deep Blueren kasuan, IBMk urte batzuk eman zituen segundoko 200 milioi jokaldi ebaluatzeko gai den konputagailu eta programa bat diseinatzeko. Hardwarea eta softwarea sistema propio horretarako diseinatu ziren, xakean jokatzea beste gaitasunik ez duen sistemarako, hain zuzen ere. Jokaldi bakoitzean aztertu egin ahal diren mugimendu posible guztiak, eman ahal diren erantzun guztiak, erantzun horiei eman ahal zaizkien erantzunak... Eta azkenean, denen artean, irabazteko aukerarik handiena duena aukeratzen du. Horrelako “indar gordinean” oinarritutako prozedurek “Montecarlo” algoritmo izena hartzen dute. Ez dago estrategiarik; konputazio ahalmen gordina besterik ez. Aukeran dauden milaka milioika egoera posibleetatik egokiena hartu eta horra joateko egin beharreko urratsak egiten dira.
Izan ere, Kasparoven kexa bat izan zen mugimendu batzuetan sumatu zuela bazirela estrategia edo sormena, gizakiren bat egon zela mugimendu horien atzean. IBMk ez du inoiz onartu hori.
Ikasitako ereduak
AlphaGoren kasua desberdina da. “Montecarlo” algoritmo “ahul” bat aukeratu zuten programarako, beste estrategia batzuetan gehiago oinarrituz, ikasteko gaitasuna ematen dioten prozeduretan hain zuzen ere.
AlphaGok sare neuronal artifizialetan oinarritutako “Black Box” algoritmoak erabiltzen ditu. Asko sinplifikatuz (gauza oso konplexua baita), algoritmo horietan, behin oinarrizko programa bat diseinatuta, ikasketa fase bat hasten da: zenbait adibiderekin elikatu (30 miloi partida inguru) eta sareak identifikatu eta gorde egiten ditu agertzen diren ereduak, eta jokaldi berriak agertzen direnean patroi horiekin lotzen ditu. Bigarren fasean, AlphaGo beste Go software batzuen kontra egin zuen lehia prozesua errepikatuz. Eta, bukatzeko, bere buruaren kontra lehiatu zen. Hau da, konputazio indar handia duen arren, ez da hainbeste oinarritzen horretan, ikasi dituen patroietan baizik. Ikasitakoarekin kontrastatzen ditu posizioak, eta horren arabera ikasitako estrategiak jarraitzen ditu. Lehenengo aldiz, “estrategia”, “sormena” eta “oldarkortasuna” moduko hitzak agertu dira makina baten jokoa definitzerakoan. Ez da gauza makala Inteligentzia Artifizialaren garapenean.
Gizakiok erabakiak hartzen ditugunean, geure eskarmentuan oinarritzen gara gehienbat, batzuetan era kontziente batean eta beste batzuetan ez. Makina hau ere eskarmentuan oinarritzen da, eta bera bakarrik ikasteko gai da, bai gizakietatik bai beste makina batzuetatik ere.
Eta Musean egiten duena?
Badaude musean jokatzeko programak ere, nahiko sinpleak oraindik. Mus eta beste karta joko batzuen kasuan, gauzak konplexuagoak dira, daukagun informazio bakarra geure kartak baitira, ez dakigu bestearen kartak zeintzuk diren. Gainera, mus edo poker moduko jokoetan, bikotearen eta beste jokalarien alde emozionalak ere garrantzi handia dauka, eta hori ebaluatzea zailagoa da.
Beraz, badakizue, muserako ordezko bat behar duzuenean, oraingoz hezur eta mamikoarekin konformatu beharko zarete.
Gehiago jakiteko:
● Los algoritmos de caja negra de AlphaGo, Francis Villatoro, @emulenews, naukas.com
http://goo.gl/lbVpOa
● Las consecuencias en IA del torneo AlphaGo vs Lee Sedol (4-1, Francis Villatoro, @emulenews, naukas.com
http://goo.gl/uIETGe
● How the Computer Beat the Go Master, Christof Koch, Scientific American
http://goo.gl/3wja9S