"Se on kuin pieni lapsi, jota on valvottava": Aina päällä olevien tekoälyagenttien rajoissa

Summer Yue saattaa työskennellä Metan superälytiimin turva- ja linjaustehtävissä, mutta hänkin myöntää, ettei hän ole immuuni liialliselle itseluottamukselle, kun on kyse autonomisista tekoälyagenteista.

X maanantai -viestissä Yue kuvaili, kuinka hänen autonomiset OpenClaw AI -agenttinsa, jotka oli suunniteltu toimimaan paikallisesti Mac mini -tietokoneella, poistivat hänen koko postilaatikkonsa jättäen huomiotta ohjeet pysähtyä ja pyytää ensin vahvistusta.

“Minun piti juosta Mac Minille kuin olisin purkamassa pommia”, hän sanoi. Hän lisäsi, että se oli “aloitevirhe”. Työnkulku oli ollut käynnissä testipostilaatikossa, jota hän käytti agentin turvalliseen testaamiseen viikkoja, hän selitti, mutta todellisessa postilaatikossa agentti menetti alkuperäisen ohjeensa.

Yuen kokemus on jyrkässä ristiriidassa viruspostausten, kuten The Lobster Revolution: Why 24/7 AI Agents Just Changed Everything, kanssa, joissa Peter Diamandis väittää, että aina päällä oleva tekoäly on paljon sujuvampaa.

“Anna minun kertoa teille, miltä tuntuu pukea tätä”, Diamandis kirjoitti. “Härät aamulla ja agenttisi (nimeni on Skippy, iloisen sarkastinen ja järjettömän kykenevä) on työskennellyt kahdeksan tuntia nukkuessasi. Hän luki tuhat sivua myyntiä. Hän järjesti tiedostosi. Hän kirjoitti kolme projektisuunnitelmaa. Hän varasi matkasi. Hän tutki kysymystäsi kello 11 yöllä ja unohti sen.

“Kun Mac minini oli offline-tilassa kuudeksi tunniksi, tunsin vetäytymistä”, hän lisäsi. “Ikään kuin paras ystäväni olisi kadonnut.”

Yhdessä nämä ristiriitaiset kertomukset tekoälyagenttien voimasta vangitsevat jännitteen, joka vallitsee nykyisessä “aina päällä olevaa” tekoälyä kohti. Koska OpenClaw:n ja Claude Coden kaltaiset työkalut tekevät agenteille teknisesti mahdolliseksi toimia pitkiä aikoja, jännitys kasvaa ajatuksen ympärillä toimivasta tekoälystä, joka toimii nukkuessasi. Käytännössä varhaiset omaksujat sanovat kuitenkin, että autonomian hallinta on edelleen hauras, arvaamaton ja työvaltainen. Ihmistyön korvaamisen sijaan nykyajan agentit vaativat usein jatkuvaa valvontaa, suojakaiteita ja väliintuloa, varsinkin kun panokset menevät vähäriskisten kokeiden ulkopuolelle.

Tekoälyagentit toimivat parhaiten, kun tehtävät ovat yksinkertaisia ja riskialttiita

Shyamal Anadkat, joka työskenteli aiemmin soveltavana tekoälyinsinöörinä OpenAI:ssa, sanoi, että useimmat nykypäivän menestyneet agentit vaativat edelleen usein ihmistarkastuksia tai rajoittuvat hyvin määriteltyihin, kapeasti määriteltyihin tehtäviin, vaikka hän korosti, että tämä muuttuu mittaus- ja arviointitekniikoiden kehittyessä.

“Järjestelmä, joka on 95% tarkka yksittäisissä vaiheissa, muuttuu kaoottiseksi 20-vaiheisessa itsenäisessä työnkulussa”, Anadkat sanoi. “Pitkän aikavälin suunnittelu on edelleen heikkoa.” Tämän seurauksena agentit voivat toimia hyvin lyhyissä tehtäväketjuissa, mutta heillä on tapana hajota, kun heitä pyydetään hallitsemaan monimutkaisia, monipäiväisiä projekteja. Muisti on toinen tärkeä rajoitus: “Monissa agenteissa muisti on olematon tai hauras. Tarvitaan järjestelmiä, jotka voivat ylläpitää johdonmukaista mallia kontekstistaan, prioriteeteistaan ja toimintarajoitteistaan.”

Tämä ei tarkoita, että tekoälyagenttien lupaus on vain savua ja peilejä, sanoo Yoav Shoham, Googlen entinen päätutkija, Stanfordin emeritusprofessori ja AI21 Labsin perustaja. Mutta se tarkoittaa, että on olemassa vaara, että ihmiset menevät edellä. Hän selitti, että nykyiset tekoälyagentit toimivat parhaiten, kun tehtävä on vähäriskinen, epämääräisesti määritelty ja halpa tehdä virheitä.

“Kehittäjät pitävät leluista, ja meillä on tämä lelu, joka voi tehdä upeita asioita”, hän kertoi Fortunelle. “Niin kauan kuin heidän tekemänsä toiminta on melko yksinkertaista ja siinä on alhainen riski ja korkea virhetoleranssi, se on hyvä.” Jos esimerkiksi haluat, että agenttisi lukee 10 000 verkkosivustoa ja tekee tuloksilla jotain mielenkiintoista antaakseen sinulle hyödyllisiä tietoja yhdessä yössä.

Mutta kriittisten yritysten työnkulkujen kohdalla rima on paljon korkeampi. Yritykset tarvitsevat järjestelmiä, jotka ovat todennettavissa, toistettavissa ja kustannustehokkaita – vaatimukset, jotka heikentävät nopeasti täysin itsenäisten, aina päällä olevien agenttien “aseta ja unohda” -lupauksen. Hyvin strukturoiduilla aloilla, kuten koodauksessa tai matematiikassa, syvempi automaatio on jo mahdollista. Mutta useimmissa todellisissa liiketoimintaprosesseissa, Shoham sanoo, agenttien luotettavuuteen vaadittava työ on usein suurempi kuin hyöty.

Bret Greenstein, konsulttiyrityksen West Monroen tekoälyjohtaja, totesi, että OpenClawin kaltaiset työkalut tuntuvat samanlaisilta käännekohdilta kuin generatiivisen tekoälyn tapauksessa, kun ChatGPT julkaistiin vuonna 2022: Se on ensimmäistä kertaa tehnyt idean tekoälyagenteista saataville. Silti se ei ole 24/7 “taikaluoti”.

Mahdollisuus delegoida tekoälyagentti tuntuu tehokkaalta

Silti ei ole epäilystäkään siitä, että kyky delegoida tosielämän tehtäviä tekoälyagentille on erittäin houkutteleva käyttäjille, Greenstein korosti. Hän viittasi omaan kokemukseensa, kun hän antoi tekoälyagentille arkipäiväisen tehtävän poimia hänen vaatteensa kemiallista pesua varten ja katsella sitä hiljaa suorittavan työn alusta loppuun.

“OpenClaw on konfiguroitu tavalla, jonka ei pitäisi olla turvallista useimmille ihmisille”, Greenstein sanoi. “Hän ei vieläkään näytä tarpeeksi kypsältä ollakseen luotettava osa elämäämme.” Jotta tekoäly olisi tervetullut jokapäiväiseen elämään tai liiketoimintaan, hän lisäsi, että sen on ansaittava luottamus ajan myötä, aivan kuten luottamus syntyy sosiaalisesti.

Siitä huolimatta kysyntä on jo selvä. Greenstein korosti ensimmäisiä OpenClawille omistettuja alan kokouksia, nopeaa ilmestymistä, jota hän kuvaili epätavalliseksi näin nuorelle työkalulle. “Tämä osoittaa, että ihmiset ovat nälkäisiä tekoälylle, joka on todella hyödyllinen”, hän sanoi: järjestelmät, jotka ylittävät kysymyksiin vastaamisen ja ryhtyvät toimiin.

Pilvipohjaisen sisällönhallinta- ja yhteistyöyhtiö Boxin toimitusjohtaja Aaron Levie kutsui tekoälyagenttien kanssa nyt tapahtuvaa “pieniä välähdyksiä” siitä, mitä tulevaisuudessa voi tapahtua.

“Jotkut välähdykset eivät lopulta ilmene, toisista tulee vain standardi”, hän selitti ja huomautti, että kaksi vuotta sitten tekoälyyritys Cognition esitteli yhden ensimmäisistä agenteista nimeltä Devin, joka integroitui Slackiin delegoimaan tehtäviä, korjaamaan virheitä, analysoimaan dataa ja tarkistamaan koodia. Tuolloin sitä pidettiin vielä futuristisena, mutta nykyään “kukaan ei ole hämmentynyt siitä, että se on normaali käytäntö”, hän sanoi. “Voit vain käyttää Slack Claude Codea aloittaaksesi työskentelyn; täysin hullulta tuntunut idea on nyt pohjimmiltaan standardi mille tahansa modernille suunnittelutiimille.”

Mutta vaikka tekoälyagentit alkavat automatisoida erittäin hyvin tiettyjä, erillisiä tehtäviä, he ovat edelleen huonoja käsittelemään laajempaa, kontekstiraskasta työtä, joka muodostaa useimmat työt, Levie korosti. Tekoälyagentit voivat täysin automatisoida jotkin tehtävät, mutta kamppailevat muiden kanssa, mukaan lukien suhteiden hallinta ja osallistuminen kokouksiin.

“Kun kuulet tekoälylaboratorion sanovan, että aiomme automatisoida kaiken tietotyön 24 kuukaudessa, se on yleensä hyvin kapea määritelmä työlle”, hän sanoi. “Määritelmä sille, mitä agentti voi tehdä, ei ole sama määritelmä siitä, mitä työtä palkataan taloudessa.”

Luottamustekijällä on merkitystä, kun asiat voivat mennä pieleen

Avinash Vootkuri, suuren Fortune 500 -jälleenmyyjän datatutkija, sanoi, että useimmat yritysten tekoälyagentit tarvitsevat ehdottomasti lapsenvahtia ja voivat toistaiseksi työskennellä vain yritysympäristöissä, joissa on tiukasti rajoitettu autonomia ja laajat suojakaiteet. “Paljon on vaakalaudalla”, hän selitti.

Hän esimerkiksi kuvaili yrityksen kyberturvallisuuden agenttijärjestelmän luomista, jossa tekoälyagentit eivät vain laukaise hälytyksiä ja odota ihmisen tarkastusta, vaan tutkivat niitä aktiivisesti. Sen sijaan, että valtaavat analyytikot tuhansilla varoituksilla, agentit keräävät todisteita reaaliajassa – tekemällä kyselyjä uhkien tiedustelutietokannoista, analysoimalla käyttäytymismalleja ja suodattamalla pois vääriä positiivisia tuloksia – ennen kuin päättävät, oikeuttaako tilanne eskaloitumisen.

Järjestelmä perustuu tiukasti rajoitettuun autonomiaan ja laajoihin turvaesteisiin, mikä vähentää ihmisen työtaakkaa ilman valvontaa.

Kyberturvallisuuden alalla hän selitti, että jos agentti tekee virheen, seuraukset ovat välittömät ja vakavat. “Tekoäly estää lailliset asiakkaat (aiheuttaa valtavia tulonmenetyksiä) tai sallii kehittyneen uhkatoimijan pääsyn verkkoon”, hän sanoi. “Se on ehdottoman tärkeää, jos asiat menevät pieleen.”

Breeanna Whiteheadin, joka johtaa tekoälyoperaatioiden konsulttiyritystä, jossa hän rakentaa tekoälypohjaisia järjestelmiä johtajille ja perustajille, mukaan toimiala on “luottamuksen kalibrointivaiheessa”.

Tekoälyagentit voivat tehdä enemmän kuin useimmat ihmiset antavat heille, mutta vähemmän kuin mainonta antaa ymmärtää.

“Todellinen taito ei ole agentin kouluttaminen, vaan siirron suunnittelu”, hän selitti. “Useimmat ihmiset luottavat agenteihin liikaa ja päätyvät siivoamaan sotkua tai hallitsemaan jokaista tulosta ja ihmettelevät, miksi tekoäly vaikuttaa enemmän työltä vähemmyyden sijaan.” Ajatuksena on hänen mukaansa suunnitella selkeitä luovutuspisteitä, joissa jotain voidaan delegoida kokonaan, jokin muu saada nopean arvion, kun taas toinen tehtävä jätetään vain ihmisten suoritettavaksi.

Toistaiseksi unelma voi olla vaikeaselkoinen, kun työskentelet tekoälyagenttien kanssa

Toistaiseksi tekoälyagenttien kanssa työskentely voi olla vähemmän tekemistä työskentelyn aikana nukkumisen kanssa kuin puoli valveilla pysymisen kanssa. OpenClawin kaltaiset työkalut voivat toimia tuntikausia kerrallaan, mutta monille varhaisille käyttäjille tämä autonomia liittyy uudenlaiseen valppauteen: lokien tarkistamiseen, tulosten tarkistamiseen ja puuttumiseen ennen kuin jokin menee pieleen.

Tämä dynamiikka tallentui äskettäiseen virusviestiin nimeltä Token Anxiety, jossa sijoittaja Nikunj Kothari kuvaili ystävää, joka lähti juhlista aikaisin, ei siksi, että hän oli väsynyt, vaan koska hän halusi palata agenttiensa luo. “Kukaan ei kyseenalaista sitä enää”, Kothari kirjoitti. “Puolet huoneesta ajattelee samoin. Toinen puoli luultavasti tarkkailee agenttien edistymistä. Juhlissa.”

Unelma tekoälystä, joka toimii nukkuessasi, voi olla totta. Mutta toistaiseksi se pitää monet ihmiset hereillä.

Macy’silla on “mukavat ja tyylikkäät” Adidas-lenkkarit myynnissä vain 35 dollarilla

Bitcoin sijoittui lisää kipua viikoittaisen sulkemisen jälkeen tämän kriittisen tason alapuolelle

Standard Chartered -osakkeet johtavat FTSE 100 -pankkitoiminnan kasvuun. Nämä tulokset osoittavat miksi

“Se on kuin pieni lapsi, jota on valvottava”: Aina päällä olevien tekoälyagenttien rajoissa | Onni

Check out our other content

Macy’silla on “mukavat ja tyylikkäät” Adidas-lenkkarit myynnissä vain 35 dollarilla

Bitcoin sijoittui lisää kipua viikoittaisen sulkemisen jälkeen tämän kriittisen tason alapuolelle

Standard Chartered -osakkeet johtavat FTSE 100 -pankkitoiminnan kasvuun. Nämä tulokset osoittavat miksi

Olympiajuoksija Mo Farahilla on viesti kamppailevalle sukupolvelle Z: “Olin ihmiskaupan uhri, mutta en koskaan antanut periksi” | Onni

Sam Altman puolustautuu tekoälyn massiivisesta sähkönkäytöstä: “Ihmisen kouluttaminen vaatii paljon energiaa” | Onni

Stablecoins voisi vihdoin tuoda rajat ylittävät maksut digitaaliseen aikakauteen, väittää XTransferin toimitusjohtaja Bill Deng | Onni

Google-hakuhistoriaasi voidaan käyttää sinua vastaan oikeudessa. Onko se perustuslain vastaista? | Onni

Huoli USA:n velasta painaa Trumpin suunnitelmaa nostaa Pentagonin budjetti 1,5 biljoonaan dollariin, mikä korostaa tämän lain suurvalta-asemaa | Onni

Kuinka Meksiko voitti “El Menchon”: tyttöystävän jäljittäminen ja Yhdysvaltain tiedustelupalvelun ratkaiseva apu | Onni

Suosituimmat artikkelit

5000 punnan säästö? Tässä on tapa yrittää muuttaa se maksimaaliseksi passiiviseksi tuloksi

5 000 puntaa ostaa 2 439 osaketta tästä FTSE 250 passiivisen tulon helmistä

MetaMaskin pitkänlainen merkki voi saapua “odotettua aikaisemmin”, sanoo toimitusjohtaja

Wayfair myy 1 123 dollarin terassisetin vain 430 dollarilla varhaisena Black Friday -tarjouksena

Tutkia

Pikalinkit