Egy tudományos körökben egyre népszerűbbé váló teória szerint az emberi intelligencia egyetlen algoritmusból sarjadt ki. Az elméletet számos kísérlet támasztja alá, amelyek arra utalnak, hogy az agy ugyanazon része, amely a fülön át érkező hangokat dolgozza fel, a szem által érzékelt képeket is tudja kezelni. Ez a parallel funkcionalitás ugyan csak az agy fejlődésének kezdeti szakaszában lehetséges, mégis azt sugallja, hogy velőnk eredendően „svájci bicskaként” – általános rendeltetésű, univerzális gépezetként – működik, amely képes a különféle feladatoknak megfelelően újrahangolni magát.
Andrew Ng, a Stanfordi Egyetem számítástechnika tanszékének professzora hét évvel ezelőtt találkozott először ezzel az elmélettel. Az ötlet újra felkeltette érdeklődését a mesterséges intelligenciák (MI) kutatása iránt, és alapvető hatással volt a karrierje alakulására. „Életemben először végre úgy éreztem, van rá esély, hogy még ebben az emberöltőben, ha csak egy apró-kicsi lépéssel is, de közelebb kerüljünk az MI-ről szőtt álmaink beteljesüléséhez” – vallotta be a kutató.
Az elme társadalma és az egy algoritmus elmélete
A mesterséges intelligencia kutatás hőskorában még az volt az uralkodó nézet, hogy az emberi értelem több ezer egyszerű ágensből született, amelyek afféle szimfonikus zenekarként, egymással együtt dolgozva működtek – ez hívta Marvin Minsky, az MIT világhírű számítógéptudósa, az MI-kutatás egyik vezéralakja az „Elme Társadalmának”. Minsky és követői erre a feltevésre alapozva próbálták megépíteni koruk gondolkozó gépeit: úgy gondolták, több ezer egyedi számítástechnikai modult kell létrehozniuk és végül összerakni belőlük a „nagy egészet”. Az egyik ágens – vagy algoritmus – magát a nyelvet utánozza, egy másik a beszéd irányítását végzi és így tovább. Leküzdhetetlen feladatnak látszott.
Andrew már kölyökkorában arról álmodozott, hogy ha felnő, embermódra gondolkodó gépeket fog építeni, de egyetemistaként, amikor rájött, hol tart valójában az MI-kutatás, csalódottan letett erről a tervéről. Később, már professzorkorában, a tanítványait is óva intette attól, hogy hozzá hasonlóan csalfa ábrándokat kergessenek. Aztán egyszer csak beleszaladt az „egy algoritmus” hipotézisébe, amit akkoriban egy MI-fejlesztéssel foglalkozó vállalkozó és amatőr neurológus Jeff Hawkins népszerűsített, és újra életre kelt az álma.
De nem csak az övé. Ng a komputertudomány egyik új és izgalmas területének vezéralakjává vált: a Deep Learningnek nevezett iskoláé, amelynek célja, hogy olyan gépeket építsen, amelyek az emberi agyhoz hasonló módon dolgozzák fel az információkat. Egy mozgalomé, amely az akadémia falai közül kiszabadulva, az olyan vállalatóriások érdeklődését is felkeltette, mint a Google és az Apple. Nem véletlen, hogy a tudós jelenleg a keresőcég más kutatóival együtt azon fáradozik, hogy létrehozza minden idők talán legambiciózusabb mesterséges intelligencia projektjét, a „Google Brain”-t.
Jettsonék kedvenc háztartási alkalmazottja
A kezdeményezés célja, hogy az MI-kutatás történetében példátlan módon, egyesítse a számítástechnika vívmányait a neurológia eredményeivel. „Úgy tapasztaltam, hogy meglepően nagy szakadék tátong a mérnökök és a tudósok között” – fejtegette Ng. A Stanfordi Egyetem professzora szerint ennek a szembenállásnak egyszerű oka van: miközben a mérnökök olyan MI-rendszereket akarnak építeni, amelyek működnek, a kutatók továbbra is azon kotlanak, hogy megértsék az agy rendkívül bonyolult működését. A neurológia sokáig képtelen volt arra, hogy olyan adatokkal lássa el a komputerkutatókat, amelyek segítségével tökéletesíthették volna a gépeiket.
Mindennek a tetejébe a tudósok egy része úgy érezte, hogy az agykutatás az ő kizárólagos domíniumuk – semmi szükség rá, hogy mindenféle jöttment informatikusok belekontárkodjanak a munkájukba. „Így csak kevés valódi együttműködés jöhetett létre” – húzta alá Bruno Olshausen számítógépes neurológus, a Berkeley Redwood Elméleti Neurológiai Központjának igazgatója.
A vége az lett, hogy az MI-fejlesztők meg sem próbálták lekoppintani az agy működését, inkább más lehetőségek után néztek, és olyan „látszólag okos” rendszereket építettek, amelyek intellektus kapacitásukat tekintve inkább hasonlítottak egy Roomba porszívóra, mint Jetsonék dolgos robotcselédjére, Rosie-ra.
Most végre Ng-nek és a hozzá hasonló kutatóknak köszönhetően, megváltozhat a fent vázolt helyzet. „Egyre többen gondolják úgy, hogy az fog előrukkolni a számítógépek új generációjával, akinek sikerül kiokoskodnia, hogyan végzi a számítási feladatait az agy” – mondta Dr. Thomas Insel, a National Institute of Mental Health igazgatója.
Gyerekmódra okosodó algoritmusok
A Deep Learning az első lépés ennek a feladatnak a megoldása felé. A kifejezés gyakorlatilag mesterséges ideghálózatok építését takarja – olyan hálózatokét, amelyek képesek utánozni az emberi agy viselkedését. Ezek a többrétegű számítástechnikai hálózatok az emberi idegrendszerhez hasonló módon gyűjtik be és reagálnak az információkra. Képesek felfogni, hogyan néznek ki, és milyen hangjuk van bizonyos objektumoknak.
Ehhez speciális, mesterséges neuronokból épített rétegekből álló rendszerek szükségesek. Az emberi látás lemásolásához például szükség van egy alaprétegre, amely képes az olyan egyszerű dolgok észlelésére, mint amilyenek például egy meghatározott forma élei; egy középső rétegre, amelynek az a feladata, hogy az éleket összerakva azonosítsa az összetett formákat; végül egy felső rétegre, amely az egyes formákat összekapcsolva, képes egzakt módon értelmezni egy objektumot.
Fontos, hogy mindezt magának a szoftvernek kell elvégeznie, bárminemű külső segítség nélkül – ellentétben a régebbi AI-modellekkel, amelyek gépi tanulási algoritmusai csak a mérnökök által előrágott képi és hangadatokat tudták megemészteni.
A Deep Learning máshogy működik, elég nagy mennyiségű adattal ellátni a rendszert „és hagyni, hogy saját maga fedezze fel a fogalmakat” – magyarázta Ng. A kutató tavaly nem mindennapi eredményt ért el: egyik algoritmusa, több millió az internetről letöltött kép végignyálazása után, önerőből megtanulta azonosítani a macskákat. Nem ismerte a „macska” kifejezést – ezt Ng-nek kellett a bitjeibe vernie – de idővel rájött, hogyan azonosítsa azokat a kis szőrös négylábúakat, akiket mi, kétlábúak csak macskaként emlegetünk.
A fenti megközelítést az a tanulási metódus ihlette, amelyet – legalábbis a tudósok feltételezése szerint – mi, emberek is használunk. Csecsemőkorunkban rengeteg időt töltünk a környezetünk tanulmányozásával, majd lassan elkezdjük feltérképezni azoknak a tárgyaknak a struktúráját, amelyekkel találkozunk; de addig, amíg egy szülő meg nem tanít minket erre, nem tudjuk meghatározott hangzósorokhoz kötni – néven nevezni – őket.
Korai lenne azt állítani, hogy Ng deep learning algoritmusai éppen olyan kifinomultak vagy sokoldalúak lennének, mint az emberi elme. De ő hisz benne, hogy idővel azzá válhatnak.
Eközben Kínában, Japánban, az EU-ban és az Ovális irodában…
Andrew Ng nem az egyetlen tudós, aki hasonló kutatásokat végez. A professzor 2011-ben indította el a Deep Learning projektet a Google-nél; a vállalat pár hónappal ezelőtt további agyakat toborzott, és felvásárolta a Torontói Egyetem egyik vezető munkatársa, a tudományos körökben csak az „idegi hálózatok keresztapjaként” emlegetett Geoffrey Hinton mesterséges intelligenciák kutatásával foglalkozó cégét.
Élesedik a verseny – időközben a Google legnagyobb kínai riválisa, a Baidu is létrehozta saját, deep learninggel foglalkozó kutatólaboratóriumát: ígéretük szerint horribilis összegeket fognak a tudományterület fejlesztésébe ölni. Ng úgy tudja, hogy a Microsoft és a Qualcomm is mozgolódik – legalábbis erre utal, hogy feltűnő érdeklődést tanúsítanak a neurológia ihlette algoritmusok programozásában jártas számítástechnikai szakemberek iránt.
Japánban is nagy a sürgés-forgás: a helyi mérnökök robotok irányítására alkalmas mesterséges ideghálózatok kifejlesztésén ügyködnek. És persze ott van Henry Markman neurológus, aki az Európai Unió és Izrael vezető szakértőivel karöltve, több ezer klinikai kísérlet adataira támaszkodva, megpróbálja újrateremteni az emberi agyat – egy szuperszámítógép belsejében.
A bökkenő csak az, hogy még mindig nem vagyunk képesek a maga teljességében megérteni az agy működését – de szerencsére a tudósok jó tempóban haladnak, és ezen a területen is egyre újabb és újabb, jelentős eredményeket tudnak felmutatni. A kínaiak jelenleg éppen egy „új elmeatlasz”, a Brainnetdome létrehozásán fáradoznak; az Egyesült Államokban pedig a közelmúltban indították el a Big Data mintájára a Big Neuroscience mozgalmat, olyan, rendkívül ambiciózus, több tudományág kiválóságainak részvételével gründolt multidiszciplináris projektekkel, mint amilyen Obama elnök nemrég bejelentett – és sokat vitatott – Brain Research Through Advancing Innovative Neurotechnologies Initiative (Haladó és Innovatív Neurotechnológiákra Épülő Agykutatási Iniciatíva), röviden-velősen BRAIN programja.
A BRAIN tervezési bizottsága éppen múlt vasárnap rendezte első fejtágítóját, a héten további összejöveteleket tartanak. A program egyik célja olyan újító technológiák kifejlesztése, amelyek képesek a milliárdnyi agyi áramkör feltérképezésére, de tudós körökben arról susmorognak, hogy az „agyasok” MI-kutatásokkal is foglalkoznak majd.A BRAIN százmillió dolláros büdzséből gazdálkodhat, a források felét a Darpa biztosítja, a maradékot pedig a National Institutes of Health és a Védelmi Minisztérium dobja össze. A pénzes ügyfelek azt remélik, hogy a projekt „új információfeldolgozási architektúrák vagy új számítástechnikai megközelítések” kidolgozását inspirálhatja.
A biológia féltve őrzött titkai
Ha sikerülne feltérképeznünk, milyen összeköttetésben állnak egymással a fejünkben percegő neuronok, „hogyan tárolják és dolgozzák fel az információkat az idegi hálózatok”, azzal nagyban hozzásegíthetnénk az Ng-hez és Olshausenhez hasonló szakembereket, hogy kiókumlálják, hogyan is kellene kinéznie egy működő mesterséges agynak. Az így nyert adatok révén táplálhatnák és fejleszthetnék az olyan Deep Learning algoritmusokat támogató technológiákat, mint a számítógépes képalkotás, a nyelvi analízis, vagy a Google, az Apple meg a hasonló cégek okostelefonjaiban alkalmazott hangfelismerő rendszerek.
„Ez az a terület, ahol elkezdhetjük felderíteni, milyen trükköket használ a biológia. Szerintem a kulcs az, hogy a biológia nagyon ügyesen el tudja rejteni a titkait – mondta Olshausen. – És nekünk még nincsenek megfelelő eszközeink ahhoz, hogy megértsük mindannak a komplexitását, ami történik.”
A mobil eszközök térhódításával párhuzamosan egyre fontosabbá válik, hogy feltörjük a neurális kódot. Eszközeink egyre kisebbé válnak, nekünk pedig módot kel találnunk rá, hogy gyorsabbá és pontosabbá tegyük őket. Minél jobban összezsugorítjuk a gépeinket működtető tranzisztorokat, annál nehezebb megoldanunk, hogy akkurátusan és hatékonyan működjenek. Ha felpörgetjük őket, több áramot fogyasztanak, és minél több áramot fogyasztanak, annál zajosabbá – pontatlanabbá – válik a rendszer.
A mérnököknek ezeket a törvényszerűségeket is a figyelembe kell venniük a tervezésnél – hívta fel a figyelmet Olshausen. Számolniuk kell a sebességgel, a mérettel, az energiahatékonysággal, hogy működőképes rendszereket hozhassanak létre. A Berkeley kutatóközpontjának igazgatója az MI-k evolúciójában látja a megoldást. „Úgy vélem, a biológia arra ösztökél minket, hogy ahelyett, hogy megkerülnénk a problémát, próbáljunk inkább megbirkózni vele…. A biológia is olyan kapcsolókat használ, amelyek természetüknél fogva zajosak, de megtalálta a módját, hogy adaptálódjón és együtt éljen ezzel a zajjal, végső soron hasznosítsa azt – érvelt Olshausen. – Ha rá tudnánk jönni, hogy a maga természetes módján hogyan kezeli a biológia a zajos számítási elemeket, akkor egy teljesen új számítástechnikai modellt hozhatnánk létre.”
Van benne spiritusz
Mint láthatjuk, Olshausen professzor afféle huszonegyedik századi Ahab kapitányként magát a számítógépes neurológia Nagy Fehér Bálnáját hajszolja, de Ng és csapata sem apróhalra megy: okos és intuitív gépeket próbálnak építeni, amelyek olyan feladatok elvégzésére képesek, amilyenekkel még soha, egyetlen komputernek sem sikerült megbirkóznia. Nem számít, milyen kifinomult algoritmusokkal zsonglőrködünk, a jelen számítógépei még nem alkalmasak arra, hogy önállóan elintézzék a hétvégi bevásárlást, vagy kiválasszák a hangulatunkhoz illő nyakkendőt, kiskosztümöt. Ehhez a jelenleginél jóval fejlettebb képi intelligenciára lenne szükségük – és persze arra, hogy az emberi memóriához hasonlóan tudják elraktározni és előhívni a megfelelő információkat. Ha ez a mutatvány sikerül, a lehetőségek végtelen tárháza nyílik meg előttünk.
„Mindenki tisztában van vele, hogy óriási kereskedelmi potenciált teremtene, ha sikerülne megoldanunk ezeket a problémákat” – húzta alá Olshausen is.
Ez az üzleti potenciál az oka annak, hogy az utóbbi időben az olyan technológiai óriások, mint a Google, az IBM, a Microsoft, az Apple és a Baidu veszett toborzásba és fegyverkezési versenybe kezdtek, hogy a legjobb gépi tanulási technológiákat állíthassák hadrendbe. Yann LeCun, a New York-i Egyetem szakértője arra számít, hogy a következő egy-két évben Deep Learning-startupok légiói sarjadnak a Szilícium-völgy termékeny, kutatók verítéke áztatta talajából, a nagyvállalatok pedig sorban állnak majd, hogy időben leszüretelhessék a tudásuk és innovációik gyümölcseit.
Persze a technológiai tudás önmagában még nem elég: jól jön, ha képzett neurológus szakember is van a közelben. „Szorosabbra kell fűznünk az együttműködésünket a neurológusokkal – jelentette ki Yu, a Baidutól, aki erősen fontolgatja, hogy felvegyen egyet. – Már most is számos projekten dolgozunk velük, de még több közös munkára lesz szükség.”
Ng álma jó úton halad a megvalósulás felé. „Bizakodással tölt el a tudat – egyelőre csak bizakodással –, hogy talán képesek leszünk megcsinálni, amit elterveztünk – jelentette ki. – Tisztán látszik, hogy még nem találtuk meg a megfelelő algoritmusokat. Évtizedekbe fog kerülni. Nem lesz könnyű dolgunk, de azt hiszem, van esélyünk rá, hogy végül sikerüljön.”