Vaikka virusvideot roboteista, jotka suorittavat parkouria ja käännöksiä, hallitsevat sosiaalista mediaa, alan asiantuntijat ehdottavat, että nämä akrobaattiset saavutukset ovat harhaanjohtavia edistyksen osoittimia. Alan johtajat Fortune Brainstorm AI -konferenssissa, joka pidettiin joulukuun alussa San Franciscossa, väittivät, että todellinen vallankumous robotiikassa ei ole fyysinen ketteryys, vaan robottien kyky “ajatella” itse, kyky, joka tuo heidät vihdoin lähemmäksi arkipäiväistä, mutta petollisen vaikeaa tehtävää, esimerkiksi oven avaamista tai portaiden kiipeämistä.
Viimeiset 70 vuotta robotiikka perustui tiettyyn paradigmaan: älykkäät ihmiset esiohjelmoivat koneita monimutkaisen matematiikan avulla suorittamaan tiettyjä tehtäviä. Tämä lähestymistapa on nyt vanhentunut, Sequoia Capitalin kumppani Stephanie Zhan ja Skild AI:n toimitusjohtaja Deepak Pathak väittivät keskustelussa Fortunen Allie Garfinklen kanssa. Alalla on meneillään valtava muutos, jossa robotit, kuten ChatGPT:n kaltaisten työkalujen takana olevat suuret kielimallit (LLM), oppivat suoraan tiedoista ja kokemuksesta sen sijaan, että seuraavat jäykkää koodia.
“Muutos on se, että robotiikassa asioita ohjasi aiemmin enemmän ihmisen älykkyys”, Pathak sanoi ja huomautti, että uuden aallon määrittelevät mallit, jotka voivat yleistää ja oppia. “Nyt on muuttunut se, että nämä mallit tai nämä robotit voivat nyt oppia tiedoista.”
Heinäkuussa 2024 Zhan kirjoitti Sequoian blogiin Pathakin syvällisistä pätevyydestä avaruudessa ja siitä, mikä erottaa hänet robotiikan toimitusjohtajana: hänen tietokonenäköistään ja syvällisistä oppimistaidoistaan. Vertailun vuoksi perinteinen robotiikka keskittyi keräämään tiettyjä tietoja robottien kouluttamiseksi tiettyihin tehtäviin. Pathak ja hänen kumppaninsa Abhinav Gupta hyödynsivät laajamittaista dataa perusmallin rakentamiseen. Alun perin pienestä intialaisesta kylästä kotoisin oleva Pathak nousi valtakunnallisiin otsikoihin hyväksymällä hänet Indian Institute of Technology Kanpuriin poistumatta maaseutukotikaupungistaan, Zhan kirjoitti. Hän oppi ohjelmoimaan kirjoittamalla koodia käsin kotona ja käytti rajoitettuja minuutteja paikallisessa kahvilassa ajaakseen ohjelmiaan. Myöhemmin hän valmistui tohtoriksi. Tekoälyssä Berkeleyssä liittyessään Facebook AI Researchiin matkalla Skildin perustajajäseneksi.
Zhanin ja Pathakin keskustelu Garfinklen kanssa käsitteli tekoälyn paradoksia, joka tunnetaan Moravecin paradoksina: mikä näyttää vaikealta, on usein helppoa, ja mikä näyttää helpolta, on uskomattoman vaikeaa.
Miksi takaiskut ovat helpompia kuin portit
Taaksepäin läpäisevä robotti vaatii olennaisesti oman kehonsa hallintaa vapaassa tilassa, fysiikan ongelman, jonka tietokoneet ovat olleet hyviä ratkaisemaan vuosikymmeniä. “On itse asiassa paljon helpompaa ohjelmoida robotti kääntymään taaksepäin kuin saada se kiipeämään portaita”, Garfinkle sanoi kahden panelistinsä kanssa.
Todellinen haaste (ja “fyysisen älyn malja”) on vuorovaikutuksessa kaoottisen todellisen maailman kanssa. Portaiden kiipeäminen tai lasin ottaminen edellyttää, että robotti käyttää jatkuvasti näkökykyään korjatakseen liikkeitään muuttuvan ympäristön mukaan. Tämä “sensorimotorinen maalaisjärki” on ihmisen yleisen älykkyyden juuri ja se este, jonka uusi “aivo”-ohjelmisto yrittää murtaa.
Sijoittajat ja johtajat näkevät tämän markkinamahdollisuutena, joka on verrattavissa generatiivisen tekoälyn viimeaikaiseen räjähdysmäiseen kasvuun. Zhan huomautti, että aivan kuten OpenAI avasi markkinat digitaaliselle tietotyölle, Pathakin Skildin kaltaiset yritykset pyrkivät avaamaan markkinat kaikelle fyysiselle työlle. Tavoitteena on luoda “yleensä älykäs ohjelmisto”, joka voi toimia minkä tahansa robottilaitteiston aivoina ja vähentää kustannuksia suuruusluokkaa.
Toisin kuin ohjelmistomaailma, robotiikassa on kuitenkin ainutlaatuinen este: tiedon puute. Vaikka LLM:itä on koulutettu Internetissä, ei ole olemassa vastaavaa tietokantaa robottien fyysisistä vuorovaikutuksista. Pathak väitti, että yritys, joka toteuttaa ensimmäisenä, voittaa luomalla “tietovauhtipyörän”, jossa kenttärobotit tuottavat dataa, jota tarvitaan järjestelmän älykkäämiseksi.
Kuluttajille, jotka ihmettelevät, milloin robotti pesee pyykkinsä, aikajana on pysähtynyt. Pathak ja Zhan ennustivat, että robotit yleistyvät ensin teollisuusympäristöissä ja “puolirakenteisissa” ympäristöissä, kuten hotelleissa ja sairaaloissa, ennen kuin ne tulevat yksityiskodin kaoottisempaan ympäristöön.
Työpaikkojen menettämisen pelosta huolimatta he väittivät, että teknologia on välttämätön tulevaisuuden “kolmeen S:n” ratkaisemiseksi: turvallisuuteen, niukkuuteen ja sosiaaliseen kehitykseen. Robotit ovat valmiita ottamaan vastaan tehtäviä, jotka vaativat tällä hetkellä ihmisiltä henkensä tai terveytensä vaarantamisen. Lisäksi, koska miljoonia avoimia työpaikkoja on tällä hetkellä täyttämättä työvoimapulan vuoksi, robotit voisivat täyttää aukon välttämättömässä hallinnollisessa työssä. Viime kädessä toivomme yhteiskunnallisesta muutoksesta, jossa vaarallisesta tai rasittavasta työstä tulee valinnaista, jolloin ihmiset voivat keskittyä tehtäviinsä, joista nauttivat.