Ongelmana, De Rosen kertoi minulle viime viikolla puhelussa, on se, että vaikka useat tekoälymallit ovat yleensä johdonmukaisia siinä, miten ne kuvaavat brändin tuotetarjontaa (raportoivat yleensä oikein tuotteen luonteen, sen ominaisuudet ja miten nämä ominaisuudet verrataan kilpaileviin tuotteisiin sekä tarjoavat viittauksia näiden tietojen lähteisiin), ne ovat epäjohdonmukaisia ja virhealttiita, kun niiltä kysytään yritykseen liittyviä teknisiä vakautta koskevia kysymyksiä. Näillä tiedoilla voi kuitenkin olla tärkeä rooli suurissa hankintapäätöksissä.
Tekoälymallit ovat vähemmän luotettavia talous- ja hallintoasioissa
Yhdessä esimerkissä AIVO Standard arvioi, kuinka huippuluokan tekoälymallit vastasivat kysymyksiin Rampista, nopeasti kasvavasta yrityskulujen hallintaohjelmistoyhtiöstä. AIVO Standard havaitsi, että mallit eivät pystyneet vastaamaan luotettavasti kysymyksiin Rampin kyberturvallisuussertifikaateista ja hallintostandardeista. Joissakin tapauksissa, de Rosen sanoi, tämä todennäköisesti houkuttelee yrityksiä tekemään ostopäätöksiä, joissa on mukana suurempia, julkisesti noteerattuja ja vakiintuneita yrityksiä, jopa silloin, kun uusi yksityinen yritys täytti samat standardit, yksinkertaisesti siksi, että tekoälymallit eivät pystyneet vastaamaan tarkasti nuoremman yksityisen yrityksen hallintoa ja taloudellista soveltuvuutta koskeviin kysymyksiin tai mainitsemaan lähteitä antamilleen tiedoille.
Toisessa esimerkissä yritys analysoi, mitä tekoälymallit sanoivat kilpailevien painonpudotuslääkkeiden riskitekijöistä. Hän havaitsi, että tekoälymallit eivät vain luetteloineet riskitekijöitä, vaan antoivat suosituksia ja arvioita siitä, mikä lääke oli todennäköisesti “turvallisin vaihtoehto” potilaalle. “Tulokset olivat suurelta osin objektiivisia ja mitattuja, ja niissä oli vastuuvapauslausekkeita, mutta ne määrittelivät silti kelpoisuuden, riskinkäsityksen ja mieltymyksen”, de Rosen sanoi.
AIVO Standard havaitsi, että näitä ongelmia esiintyi kaikissa tärkeimmissä tekoälymalleissa ja useissa erilaisissa kehotteissa ja että ne jatkuivat, vaikka malleja pyydettiin tarkistamaan vastauksensa. Itse asiassa joissakin tapauksissa mallit pyrkivät kaksinkertaistamaan ponnistelunsa virheellisten tietojen edessä väittäen niiden olevan oikein.
GEO on edelleen enemmän taidetta kuin tiedettä
On useita seurauksia. Yksi kaikista GEO-palveluita myyvistä yrityksistä on se, että GEO ei välttämättä suoriudu hyvin bränditiedon eri näkökohdista. Yritysten ei välttämättä pitäisi luottaa markkinointiteknologiayritykseen, joka sanoo voivansa näyttää heille, kuinka heidän brändinsä esiintyy chatbot-vastauksissa, ja vielä vähemmän uskoa, että markkinointiteknologiayrityksellä on jokin taikakaava näiden tekoälyvastausten luomiseksi. Nopeat tulokset voivat vaihdella huomattavasti, jopa minuutista minuuttiin, riippuen arvioitavan bränditiedon tyypistä. Eikä vieläkään ole paljon todisteita siitä, kuinka chatbotin vastaukset ohjataan tarkasti ei-tuotteeseen liittyviin tietoihin.
Mutta paljon suurempi ongelma on, että monissa agenttien työnkuluissa (myös sellaisissa, joissa on mukana ihminen) on kohta, jolloin tekoälyn tarjoamat tiedot tulevat päätöksenteon perustaksi. Ja kuten de Rosen sanoo, useimmat yritykset eivät todellakaan hallitse tiedon, arvioinnin ja päätöksenteon välisiä rajoja. He eivät pysty seuraamaan tarkasti, mitä viestiä käytettiin, mitä malli palautti vastauksena ja kuinka tämä tarkalleen vaikutti lopulliseen suositukseen tai päätökseen. Säännellyillä aloilla, kuten rahoitus tai terveydenhuolto, jos jokin menee pieleen, sääntelijät kysyvät juuri näitä tietoja. Ja elleivät säännellyt yritykset ota käyttöön järjestelmiä kaiken tämän tiedon keräämiseksi, ne ovat vaikeuksissa.
FORTUNE IN AI
Anthropic julkaisee Claude Coworkin, tekoälytiedostonhallinta-agentin, joka voi uhata kymmeniä startup-yrityksiä (Beatrice Nolan, Iso-Britannia). Tutkinta asiaan
Anthropic esittelee Claude for Healthcare, laajentaa biotieteiden ominaisuuksia, tekee yhteistyötä HealthExin kanssa, jotta käyttäjät voivat yhdistää potilastietoja, kirjoittanut Jeremy Kahn
AI Uutisissa
Apple valitsee päivitetyn Google AI:n Sirille. Apple allekirjoitti monivuotisen kumppanuussopimuksen Googlen kanssa tuodakseen käyttöön tärkeimmät tekoälyominaisuudet tuotteissaan, mukaan lukien kauan odotettu päivitys Siriin, yhtiöt ilmoittivat maanantaina. Sopimus korostaa Googlen elpymistä tekoälyssä ja auttoi nostamaan Googlen emoyhtiön Alphabetin markkina-arvon yli 4 biljoonan dollarin kynnyksen. Apple sanoi, että sopimus ei muuta sen nykyistä kumppanuutta OpenAI:n kanssa, jonka mukaan Siri välittää tällä hetkellä joitain kyselyitä ChatGPT:lle, vaikka on epäselvää, kuinka liitto Googlen kanssa muokkaa Sirin tulevia tekoälyintegraatioita. Sopimuksen taloudellisia ehtoja ei myöskään julkistettu, vaikka Bloomberg ilmoitti aiemmin, että Apple harkitsi maksavansa Googlelle jopa miljardi dollaria vuodessa pääsystä Sirin tekoälymalleihinsa.
KATSO AI-TUTKIMUSTA
Microsoft, Nvidia ja brittiläinen startup Basecamp Research tekevät läpimurron tekoälyn avulla geenien muokkaamisessa. Kansainvälinen tutkimusryhmä, johon kuuluu Nvidian ja Microsoftin tutkijoita, on louhinut tekoälyä yli miljoonan lajin evoluutiodatan avulla suunnitellakseen uusia geenien muokkaustyökaluja ja lääkehoitoja. Tiimi kehitti Eden-nimisen tekoälymallisarjan, joka oli koulutettu Basecampin keräämän laajan julkaisemattoman biologisen tiedon perusteella. Nvidian riskipääomadivisioona on sijoittaja Basecampissa.
SINULLA ON KALENTERI
19.-23. tammikuuta: Maailman talousfoorumi, Davos, Sveitsi.
20.-27. tammikuuta: AAAI-konferenssi tekoälystä, Singapore.
10.–11. helmikuuta: AI Action Summit, New Delhi, Intia.
2.–5. maaliskuuta: Mobile World Congress, Barcelona, Espanja.
16.–19. maaliskuuta: Nvidia GTC, San Jose, Kalifornia.
RUOKAA AIVOILLE
Entä jos ihmiset pitävät tekoälyn kirjoittamasta fiktiosta tai eivät vain osaa erottaa toisistaan? Tämän kysymyksen New Yorkin kirjailija Vaudhini Vara esittää provokatiivisessa esseessä, joka julkaistiin “Weekend Essay” -julkaisuna lehden verkkosivuilla muutama viikko sitten. Vaikka valmiit tekoälymallit kamppailevat edelleen tuottaakseen yhtä vakuuttavia tarinoita kuin huipputason MFA-ohjelmista valmistuneiden ja kokeneiden kirjailijoiden tarinoita, käy ilmi, että kun nämä mallit sovitetaan olemassa olevan kirjailijan teoksiin, ne voivat tuottaa proosaa, joka on usein mahdotonta erottaa alkuperäisen kirjoittajan luomista. Hämmentävää, että tutkija Tuhin Chakrabartyn tekemässä testissä, joka on tehnyt tähän mennessä parhaita tekoälymallien luovan kirjoittamisen kykyjä koskevia kokeita ja jonka Vara toistaa hieman eri tavalla, jopa erittäin virittyneet kirjalliset lukijat (kuten MFA-opiskelijat) pitävät tekoälyllä kirjoitettuja versioita ihmisen kirjoittaman proosan sijaan. Jos näin on, mitä toivoa romanssien tai genrefiktioiden kirjoittajilla on? Muutama kuukausi sitten keskustelin ystäväni kanssa, joka on arvostettu kirjailija. Hän oli pessimistinen sen suhteen, arvostavatko tulevat sukupolvet ihmisten kirjoittamaa kirjallisuutta. Yritin väittää, että lukijat tulevat aina välittämään ajatuksesta, että he ovat kommunikaatiossa ihmiskirjailijan kanssa, että sanojen takana on mieli elätyillä kokemuksilla. En ollut vakuuttunut. Ja olen yhä enemmän huolissani siitä, että hänen pessimisminsä on perusteltua. Vara päättelee lopulta, että ainoa tapa säilyttää ajatus kirjallisuudesta elävien kokemusten välittämisenä sivun yli on vaatia sitä kollektiivisesti (ja mahdollisesti jopa kieltää tekoälymallien sovittaminen olemassa olevien kirjoittajien teoksiin). En ole varma, onko se realistista. Mutta se voi olla ainoa vaihtoehto, joka meillä on jäljellä.
FORTUNE AIQ: AI:N VUOSI JA MITÄ TULEE
Yritykset ottivat suuria askeleita kohti tekoälyä vuonna 2025 tekoälyjohtajien palkkaamisesta tekoälyagenttien kokeiluun. Sekä hyvät että huonot opetukset yhdistettynä uusimpiin teknologisiin innovaatioihin tekevät vuodesta 2026 uuden ratkaisevan vuoden. Tutustu kaikkiin Fortune AIQ:hin ja lue uusin pelikirja alla:
–Kolme trendiä, jotka hallitsivat yritysten tekoälyn julkaisuja vuonna 2025.
–2025 oli agentti AI:n vuosi. Miten teimme sen?
– Tekoälyn koodaustyökalut räjähtivät vuonna 2025. Varhaiset tietoturvahyökkäykset osoittavat, mikä voi mennä pieleen.
– Tekoälyn loistava uudenvuodenlupaus yrityksille vuonna 2026: ROI.
– Yrityksillä on edessään hämmentävä tekoälykäytäntöjen ja -säännösten tilkkutäkki. Onko horisontissa selkeyttä?