Onko sinulla vaikeuksia saada tekoälyagentteja töihin? Tämä Googlen tutkimus voi auttaa

Tervetuloa Eye on AI -ohjelmaan. Tässä painoksessa… Presidentti Trump tähtää osavaltion tekoälymääräyksiin uudella toimeenpanomääräyksellä… OpenAI paljastaa uuden kuvantamislaitteen, joka ottaa kiinni Googlen Nano Bananain… Google DeepMind kouluttaa tehokkaamman agentin virtuaalimaailmoja varten… ja tekoälyn turvallisuusluokitusraportti ei tarjoa paljon mukavuutta.

Hei. Vuoden 2025 piti olla tekoälyagenttien vuosi. Mutta kun vuosi lähenee loppuaan, on selvää, että teknologiatoimittajien ennusteet olivat liian optimistisia. Kyllä, jotkut yritykset ovat alkaneet käyttää tekoälyagentteja. Mutta useimmat eivät tee sitä vielä, etenkään koko yrityksen laajuisissa käyttöönotoissa. McKinseyn “State of AI” -kysely viime kuussa paljasti, että useimmat yritykset eivät olleet vielä alkaneet käyttää tekoälyagentteja, kun taas 40 prosenttia sanoi kokeilleensa. Alle neljäsosa ilmoitti käyttäneensä tekoälyagentteja laajassa mittakaavassa ainakin yhdessä käyttötapauksessa; ja kun konsulttiyritys kysyi ihmisiltä, käyttävätkö he tekoälyä tietyissä toiminnoissa, kuten markkinoinnissa ja myynnissä tai henkilöstöresursseissa, tulokset olivat vielä huonommat. Korkein 10 % vastaajista sanoi, että heillä oli tekoälyagentit “täysin skaalautuneina” tai “skaalautumassa” millä tahansa näistä alueista. Toiminto, joka käytti eniten eskaloituja agentteja, oli IT (jossa agentteja käytetään usein automaattisesti palvelulippujen ratkaisemiseen tai ohjelmistojen asentamiseen työntekijöille), ja jopa täällä vain 2 % ilmoitti, että heillä on “täysin skaalatut” agentit, ja lisäksi 8% sanoi heidän “eskaloituvan”.

Suuri osa ongelmasta on, että tekoälyagenteille on vaikea suunnitella työnkulkuja, joiden avulla he voivat tuottaa luotettavia tuloksia. Jopa nykypäivän tehokkaimmat tekoälymallit joutuvat oudolle rajalle: ne pystyvät suorittamaan tiettyjä tehtäviä työnkulussa yhtä hyvin kuin ihmiset, mutta eivät pysty suorittamaan muita. Monimutkaiset tehtävät, joihin kuuluu tietojen kerääminen useista lähteistä ja ohjelmistotyökalujen käyttäminen useissa vaiheissa, ovat erityinen haaste. Mitä pidempi työnkulku, sitä suurempi on riski, että virhe jossakin prosessin ensimmäisistä vaiheista kärjistyy ja aiheuttaa epäonnistuneen tuloksen. Lisäksi tehokkaammat tekoälymallit voivat olla kalliita käyttää mittakaavassa, varsinkin jos työnkulussa agentin on tehtävä paljon suunnittelua ja perusteluja. Monet yritykset ovat yrittäneet ratkaista nämä ongelmat suunnittelemalla “monen agentin työnkulkuja”, joissa eri agentit aktivoidaan ja jokaiselle on määritetty vain yksi erillinen vaihe työnkulussa, toisinaan yhden agentin käyttäminen toisen agentin työn tarkistamiseen. Tämä voi parantaa suorituskykyä, mutta se voi myös olla kallista, joskus liian kallista, jotta työnkulkua kannattaa automatisoida.

Ovatko kaksi tekoälyagenttia aina parempia kuin yksi?

Nyt Googlen tiimi on tehnyt tutkimusta, jonka tarkoituksena on antaa yrityksille hyvä rubriikki päättää, milloin on parasta käyttää yhtä agenttia usean agentin työnkulun luomisen sijaan ja millaiset usean agentin työnkulut voisivat olla parhaita tiettyyn tehtävään.

Tutkijat suorittivat 180 kontrolloitua koetta käyttämällä Googlen, OpenAI:n ja Anthropicin tekoälymalleja. Hän testasi niitä neljää eri agentti-AI-vertailua vastaan, jotka kattavat erilaisia tavoitteita: tiedon hakeminen useilta verkkosivustoilta; suunnittelu Minecraft-peliympäristössä; työkalujen suunnittelu ja käyttö yleisten liiketoimintatehtävien suorittamiseen, kuten sähköposteihin vastaaminen, kokousten ajoittaminen ja projektinhallintaohjelmistojen käyttö; ja rahoitusagentin vertailukohta. Tämä taloudellinen testi edellyttää, että edustajat hakevat tietoja SEC-ilmoituksista ja suorittavat perusanalyysin, kuten vertaamaan todellisia tuloksia johdon ennusteisiin edelliseltä vuosineljännekseltä, määrittämään, kuinka tietystä tuotesegmentistä saadut tulot ovat muuttuneet ajan kuluessa, tai määrittämään, kuinka paljon rahaa yrityksellä voi olla vapaana yritysjärjestelyihin.

Viime vuonna yksimielisyys oli, että usean agentin työnkulku tuottaa luotettavampia tuloksia. (Olen aiemmin kirjoittanut tästä näkemyksestä, jota joidenkin yritysten, kuten Prosuksen, kokemukset ovat tukeneet täällä Eye on AI -sivustolla.) Mutta Googlen tutkijat havaitsivat sen sijaan, että perinteisen viisauden kestävyys riippui suurelta osin tehtävästä.

Yksittäiset agentit toimivat paremmin peräkkäisissä vaiheissa, huonommin rinnakkaisissa

Jos tehtävä oli peräkkäinen, kuten useiden Minecraftin vertailutehtävien tapauksessa, niin kävi ilmi, että niin kauan kuin yksi tekoälyagentti pystyi suorittamaan tehtävän tarkasti vähintään 45% ajasta (mikä on mielestäni melko alhainen palkki), silloin oli parempi ottaa käyttöön vain yksi agentti. Useiden agenttien käyttäminen missä tahansa kokoonpanossa heikensi kokonaissuorituskykyä huomattavasti 39–70 %. Syynä tutkijoiden mukaan on se, että jos yrityksellä olisi rajoitettu token-budjetti koko tehtävän suorittamiseen, useiden agenttien vaatimukset, jotka yrittävät selvittää, kuinka erilaisia työkaluja käytetään, ylittäisivät nopeasti budjetin.

Mutta jos tehtävä sisälsi vaiheita, jotka voidaan suorittaa rinnakkain, kuten monien talousanalyysitehtävien tapauksessa, niin monen agentin järjestelmillä oli suuria etuja. Lisäksi tutkijat havaitsivat, että sillä, miten agentit on määritetty toimimaan toistensa kanssa, on myös suuri ero. Talousanalyysitehtävissä parhaan tuloksen tuotti keskitetty moniagenttijärjestelmä, jossa yksi koordinoiva agentti ohjaa ja valvoo useiden aliagenttien toimintaa ja kaikkia viestintävirtoja koordinaattorille ja koordinaattorilta. Tämä järjestelmä toimi 80 % paremmin kuin yksittäinen agentti. Samaan aikaan riippumaton moniagenttijärjestelmä, jossa ei ole koordinaattoria ja jokaiselle agentille on yksinkertaisesti osoitettu rajoitettu rooli, jota se täyttää rinnakkain, oli vain 57 % parempi kuin yksi agentti.

Tämän kaltaisen tutkimuksen pitäisi auttaa yrityksiä löytämään parhaat tavat perustaa tekoälyagentteja ja antaa teknologian vihdoin alkaa lunastaa viime vuoden lupaukset. Tekoälyagenttiteknologiaa myyville on parempi myöhään kuin ei milloinkaan. Tekoälyagentteja käyttävissä yrityksissä työskentelevien ihmisten on katsottava, mikä vaikutus näillä agenteilla on työmarkkinoille. Se on tarina, jota seuraamme tarkasti, kun lähestymme vuotta 2026.

Se sanoi, tässä on lisää AI-uutisia.

Jeremy Kahnjeremy.kahn@fortune.com@jeremyakahn

Tämä tarina ilmestyi alun perin Fortune.com-sivustolla

Ihmiset todella vihaavat tekoälyä, mutta eivät niin paljon kuin Iran tai demokraatit | Onni

Asiantuntijakauppias näyttää “yksinkertaisen matematiikan” laskeakseen Bitcoinin hintatason

Amazon myy 28-osaisen laatikostosarjan 14 dollarilla aloittaakseen kevätsiivouksen

Onko sinulla vaikeuksia saada tekoälyagentteja töihin? Tämä Googlen tutkimus voi auttaa | Onni

Check out our other content

Ihmiset todella vihaavat tekoälyä, mutta eivät niin paljon kuin Iran tai demokraatit | Onni

Asiantuntijakauppias näyttää “yksinkertaisen matematiikan” laskeakseen Bitcoinin hintatason

Amazon myy 28-osaisen laatikostosarjan 14 dollarilla aloittaakseen kevätsiivouksen

Ihmiset todella vihaavat tekoälyä, mutta eivät niin paljon kuin Iran tai demokraatit | Onni

Bitcoin vakauttaa lyhyesti lähetetyn tariffipiiskan jälkeen alle 65 000 dollarin | Onni

“Maa” Joe McDonald, 60-luvun pasifistinen ikoni, kuoli Parkinsonin komplikaatioihin 84-vuotiaana | Onni

Fortune Tech: OpenAI:n robotiikkajohtaja poistuu | Onni

Ekonomisti Dambisa Moyo sanoo, että toimitusjohtajilla on oltava rooli kuluttajaluokan ylläpitämisessä, kun tekoäly poistaa työpaikkoja | Onni

Huoli öljystä ja sota Irania vastaan iski Aasian osakkeisiin, ja Korean KOSPI kärsi eniten | Onni

Suosituimmat artikkelit

Iran valitsee Khamenein pojan seuraavaksi korkeimmaksi johtajaksi, Fars sanoo | Onni

Miksi tämä FTSE 250 -osake on noussut 15 %?

Tästä syystä Bitcoinin reaktio Fedin politiikkaan muuttuu laskevaksi jokaisen FOMC-päivityksen jälkeen

Huippuanalyytikko päivittää kultaennustetta, koska arvon pudotus alle 4 000 herättää pelkoja

Tutkia

Pikalinkit