Kasvava osuus amerikkalaisista toimistotyöntekijöistä, jotka ovat kokeilleet tekoälyä päivittäisessä työssään, ovat luultavasti epäilleet työnsä pitkäaikaista vakautta.
Mutta huolimatta kaikista tekoälyn parannuksista viime vuosina, teknologia pystyy edelleen saavuttamaan vain alhaisia tasoja tietyissä työtehtävissä MIT:n julkaisemien tuoreiden tietojen mukaan. Silloinkin saatat silti tehdä suuria virheitä.
Työntekijät, jotka ovat huolissaan pian tekoälyn korvaamisesta, saavat todennäköisesti lohtua MIT:n uudesta tutkimuksesta, joka kehystää tarinan tekoälyyn perustuvista työnhakuista vähemmän nopeatempoiseksi toimintaelokuvaksi, vaan pikemminkin hitaasti palavaksi ajatuspalaksi.
Torstaina julkaistun alustavan tutkimuksen mukaan tekoäly on vähitellen paranemassa erilaisten tehtävien suorittamisessa eri ammateissa. Mutta useimmissa tapauksissa tällä hetkellä saatavilla olevien mallien suorituskyky on samanlainen kuin pettyneellä harjoittelijalla: ne täyttävät minimaaliset vertailuarvot, mutta yleensä vaikeuksia tuottaa laadukasta työtä ilman, että ihmiskäsi jalostaa tuotantoa.
Baarin puhdistus
MIT-tutkijat käyttivät 41 erilaista LLM:tä, mukaan lukien Claude-, Gemini- ja ChatGPT-versiot, analysoidakseen suorituskykyä yli 11 000 ensisijaisesti tekstipohjaisessa tehtävässä eri työtehtävissä, jotka Department of Labor on listannut. Niiden tulokset arvioivat sitten ihmiset, joilla oli todellista työkokemusta näiltä aloilta. Tavoitteena oli nähdä, kuinka usein tekoälytyöntekijän vaihto voi tuottaa tuloksen, jonka esimies pitää hyväksyttävänä ilman inhimillistä editointia, ja arvioida sitten sen laatua.
Tutkijat havaitsivat, että tekoäly on vuosien mittaan muuttunut luotettavammaksi monentyyppisissä töissä, mutta se jää silti alle, kun riskejä tai standardeja nostetaan. MIT-tutkimuksessa käytettiin asteikkoa 1-9 arvioimaan tekoälyn suorituskykyä, ja arvo 7 määriteltiin “minimillisesti riittäväksi”, mikä tarkoittaa, että työ on hyödyllinen sellaisenaan eikä vaadi muutoksia. Vuoden 2025 loppuun mennessä tekoälymallit saivat seitsemän pistettä noin 65 prosentissa tehtävistä.
Mikä tärkeintä yrityksille, jotka harkitsevat osan työvoimastaan korvaamista tekoälyllä, MIT:n tiedot viittaavat siihen, että tekoäly kamppailee monimutkaisempien tehtävien suorittamisessa. Riippumatta siitä, kuinka paljon aikaa tekoälymallilla oli tehtävän suorittamiseen, onnistumisen todennäköisyys, kun se arvioitiin laatupisteellä 9 tai “yli”, ei koskaan ylittänyt 50 prosenttia. Toisin sanoen, kun työ vaatii useita vaiheita, luovuutta tai tarkkuutta, tekoälyn korvaaminen epäonnistuu todennäköisemmin kuin onnistuu.
Tutkimus on linjassa joidenkin näkökohtien kanssa nykyisessä kertomuksessa tekoälyn käyttöönotosta amerikkalaisissa yrityksissä. Tekoälyä käyttävät yritykset automatisoivat todennäköisemmin rutiinitehtävät ja -roolit lähdettyään lähtötason tehtäviin, kun taas jotkut erittäin tekniset taidot, erityisesti digitaaliset, on itse asiassa liitetty palkkapalkkioihin.
Tämä näkyi MIT:n tiedoissa, jotka havaitsivat alhaisemmat keskimääräiset onnistumisprosentit asiantunteville rooleille laki- ja IT-töissä, kun taas tekoälymallien avulla oli yleensä helpompi käsitellä rakennus- ja kunnossapitoammatteihin liittyviä tekstipohjaisia tehtäviä.
Yritykset, jotka ovat kokeilleet joidenkin työtaakan osien täysin automatisoimista, ovat kohdanneet kasvavia vaikeuksia. Viime vuonna Deloitte teki kaksi raporttia valtion asiakkaille Australiassa ja Kanadassa, ja molempien havaittiin olevan täynnä valheita. Median, kuten CNET ja Sports Illustrated, on havaittu käyttävän tekoälyä luomaan epätarkkoja tarinoita keksityillä sivuriveillä. Asianajajat ovat myös luottaneet tekoälyyn laatiessaan esityksiään, ja yksi asianajotoimisto pyysi julkisesti anteeksi viime vuonna sen jälkeen, kun kävi ilmi, että tekoälyn tuottamia haasteita oli esiintynyt konkurssihakemuksessa yhdessä sen tapauksista.
Anekdoottiset todisteet ja MIT:n tiedot viittaavat siihen, että tekoäly vaatii edelleen ihmiskäden maksimoidakseen sen hyödyt, vaikka tekniikka kehittyykin nopeasti. MIT-tutkijat arvioivat, että tekoälyn onnistumisprosentti analysoiduissa tehtävissä kasvoi jopa 11 prosenttiyksikköä joka vuosi tehokkaampien mallien ansiosta.
Vuoteen 2029 mennessä kirjoittajat arvioivat, että useimmat tekoälymallit pystyvät suorittamaan 80–95 prosenttia tekstipohjaisista tehtävistä minimiin riittävällä vertailuarvolla.
Vielä ei tiedetä, pystyykö tekoäly koskaan skaalautumaan kohti erinomaista tai jopa täydellistä suorituskykyä.
“Laajalle levinnyt automaatio, erityisesti aloilla, joilla on alhainen virhetoleranssi, saattaa silti olla kaukana”, tutkijat kirjoittivat.