Tervetuloa Eye on AI -ohjelmaan. Tässä painoksessa… Anthropic voittaa yritysasiakkaita, mutta kuinka sen omat insinöörit käyttävät Claude AI -malleja… OpenAI:n toimitusjohtaja Sam Altman julistaa “koodin punaiseksi”… Apple käynnistää tekoälytyönsä uudelleen… Entinen OpenAI:n päätutkija Ilya Sutskever sanoo, että se on “takaisin tutkimuksen aikakauteen”, koska LLM:t eivät hidasta tekoälyn omaksumista?
Kuinka tekoäly muuttaa koodausta?
Nyt takaisin Claudeen ja koodaukseen. Maaliskuussa Dario Amodei nousi otsikoihin sanoessaan, että vuoden loppuun mennessä 90 % yritysten ohjelmistokoodista olisi tekoälyn kirjoittamia. Monet pilkkasivat tuota ennustetta, ja itse asiassa Amodei on sittemmin perääntynyt lausunnosta hieman sanoen, ettei hän koskaan tarkoittanut vihjata, etteikö silmukassa olisi vielä ihmistä ennen koodin käyttöönottoa. Hän sanoi myös, että hänen ennusteensa ei ollut kaukana Anthropicista, mutta hän käytti siihen paljon löyhempää prosenttialuetta sanoessaan lokakuussa, että nykyään “70, 80, 90 % koodista” vaikuttaa hänen yrityksensä tekoälyyn.
No, Anthropicilla on joukko tutkijoita, jotka tutkivat tekoälytekniikan “sosiaalisia vaikutuksia”. Ja saadakseen käsityksen siitä, kuinka tekoäly muuttaa ohjelmistokehityksen luonnetta, se tutki, kuinka 132 sen omaa insinööriä ja tutkijaa käyttävät Claudea. Tutkimuksessa käytettiin sekä kvalitatiivisia työntekijöiden haastatteluja että heidän Clauden käyttötietojensa tarkastelua. Voit lukea Anthropicin blogia tutkimuksesta täältä, mutta meillä on ensimmäinen katsaus siihen, mitä he löysivät:
Antrooppiset ohjelmoijat ilmoittivat käyttävänsä Claudea noin 60 prosentissa työtehtävistään. Yli puolet insinööreistä sanoi, että he voivat “delegoida kokonaan” tyhjästä 20 prosenttiin työstään Claudelle, koska he tunsivat silti tarpeen tarkistaa ja todentaa Clauden tulokset. Clauden yleisimmät käyttötarkoitukset olivat olemassa olevan koodin virheenkorjaus, insinöörien auttaminen ymmärtämään, mitä koodikannan osia he tekivät, ja vähemmässä määrin uusien ohjelmistoominaisuuksien käyttöönotto. Claudea käytettiin paljon harvemmin korkean tason ohjelmistojen suunnittelu- ja suunnittelutehtäviin, datatieteen tehtäviin ja etupään kehittämiseen.
Vastauksena kysymyksiini siitä, oliko Anthropicin tutkimus ristiriidassa Amodein aikaisempien lausuntojen kanssa, Anthropicin tiedottaja huomautti tutkimuksen pienen otoskoon. “Tämä ei heijasta yhteistä kyselyä insinööreille koko yrityksessä”, tiedottaja sanoi. Anthropic huomautti myös, että tutkimuksessa ei ollut “koodin kirjoittamista” erottuvana tehtävänä, joten tutkimus ei pystynyt tarjoamaan tarkkaa vertailua Amodein lausuntoihin. Siinä sanottiin, että kaikki insinöörit määrittelivät ajatuksen automatisoinnista ja koodaustehtävien “täysin delegoimisesta” Claudelle eri tavalla, mikä edelleen hämärsi Amodein kommentteja.
Mielestäni on kuitenkin kuvaavaa, että Anthropicin insinöörit ja tutkijat eivät olleet täysin valmiita uskomaan monia tärkeitä tehtäviä Claudelle. Haastatteluissa he sanoivat, että heillä oli tapana antaa Claudelle tehtäviä, joista he olivat melko varmoja, että ne eivät olleet monimutkaisia, jotka olivat toistuvia tai tylsiä, joissa Clauden työ voitiin helposti todentaa, ja erityisesti “jos koodin laatu ei ole kriittinen”. Se vaikuttaa jokseenkin tuhoisalta arviolta Clauden nykyisistä kyvyistä.
Toisaalta insinöörit sanoivat, että ilman Claudea noin 27 prosenttia heidän nyt tekemästään työstä ei yksinkertaisesti olisi tehty aiemmin. Tämä sisälsi tekoälyn käyttämisen vuorovaikutteisten kojetaulujen luomiseen, joita he eivät yksinkertaisesti olisi vaivautuneet luomaan aiemmin, ja työkalujen luomista pienten koodikorjausten tekemiseen, joita he eivät ehkä ole vaivautuneet korjaamaan aiemmin. Käyttötiedoissa havaittiin myös, että 8,6 % Claude Coden tehtävistä oli Anthropicin luokittelua “paperileikkauksen korjauksiksi”.
Ei vain hylätä, vaan myös devalvoi? Mielipiteet jakautuivat.
Raportin mielenkiintoisimmat havainnot olivat se, kuinka Clauden käyttö sai insinöörit tuntemaan työtään. Monet olivat iloisia siitä, että Claude antoi heille mahdollisuuden hoitaa entistä laajempia ohjelmistokehitystehtäviä. Ja jotkut sanoivat, että Clauden käyttäminen vapautti heidät ajattelemaan korkeamman tason taitoja, esimerkiksi tuotesuunnittelukonseptien ja käyttäjäkokemuksen syvemmin pohtimista sen sijaan, että keskittyisivät suunnittelun toteuttamisen alkeisiin.
Mutta jotkut olivat huolissaan omien koodaustaitojensa menettämisestä. “Olen nyt riippuvainen tekoälystä, joka kertoo minulle, kuinka käyttää uusia työkaluja, ja siksi minulla ei ole kokemusta. Keskustellessani muiden tiimitovereiden kanssa muistan asiat heti, sen sijaan, että minun on nyt kysyttävä tekoälyltä”, sanoi eräs insinööri. Eräs vanhempi insinööri oli erityisen huolissaan siitä, mitä tämä tekisi nuoremmille koodaajille. “Uskon, että vaatisi paljon harkittuja ponnistuksia jatkaakseni omien kykyjeni kehittämistä sen sijaan, että hyväksyisin sokeasti mallin tuotoksia”, sanoi vanhempi kehittäjä. Jotkut insinöörit ilmoittivat harjoittaneensa tehtäviä ilman Claudea erityisesti taitojen menettämisen torjumiseksi.
Ja insinöörit olivat eri mieltä siitä, ryöstikö Clauden käyttö heiltä merkityksen ja tyytyväisyyden, jonka he saivat työstä. “Se on minulle erään aikakauden loppu: olen ohjelmoinut 25 vuotta ja tunne, että olen pätevä tässä taidossa, on kriittinen osa uratyytyväisyyttäni”, sanoi yksi. Toinen kertoi, että “päivän viettäminen Clauden yllyttämiseen ei ole kovin hauskaa tai tyydyttävää”. Mutta toiset olivat ristiriitaisempia. Yksi heistä totesi, että he menettivät manuaalisen koodauksen “Zen flow -tilan”, mutta he “luovusivat siitä mielellään” Clauden heille antaman lisääntyneen tuottavuuden vuoksi. Ainakin yksi sanoi tuntevansa tyytyväisyyttä työssään. “Ajattelin, että nautin todella koodin kirjoittamisesta ja sen sijaan nautin vain siitä, mitä saan koodin kirjoittamisesta”, tämä henkilö sanoi.
Anthropic ansaitsee tunnustuksen siitä, että se on avoin siitä, mitä se tietää siitä, miten sen omat tuotteet vaikuttavat sen työvoimaan, ja raportoi tuloksista, vaikka ne olisivat ristiriidassa sen toimitusjohtajan kanssa. Anthropic-tutkimuksen nostamat ongelmat, jotka liittyvät osaamisen hallintaan ja tekoälyn vaikutukseen ihmisten työssään saamaan merkitykseen, ovat kysymyksiä, jotka kohtaavat pian yhä useammat ihmiset kaikilla toimialoilla.
FORTUNE IN AI
Viisi vuotta myöhemmin Google DeepMindin AlphaFold näyttää, miksi tiede voi olla tekoälyn tappajasovellus, kirjoittanut Jeremy Kahn
Ainutlaatuinen: Beatrice Nolanin Gravis Robotics kerää 23 miljoonaa dollaria rakennustyövoimapulan korjaamiseksi tekoälykäyttöisillä koneilla
Tekoälyterapiasovelluksen luoja sulki sen päätettyään sen olevan liian vaarallinen. Tästä syystä luulet, että AI-chatbotit eivät ole turvallisia mielenterveydelle: Sage Lazzaro
Nvidian talousjohtaja myöntää, että Eva Roytburg ei ole allekirjoittanut 100 miljardin dollarin OpenAI-megasopimusta (kaksi kuukautta sen jälkeen, kun hän auttoi polttoainetta tekoälyn palautumiseen)
Tekoälyn startup-arvot kaksinkertaistuvat ja kolminkertaistuvat muutamassa kuukaudessa, kun peräkkäiset rahoituskierrokset ruokkivat vaikuttavaa kiihtynyttä kasvua, Allie Garfinkle
Jim Edwardsin mukaan sisäpiiriläiset sanovat, että tekoälyn tulevaisuus on pienempi ja halvempi kuin luulet
AI Uutisissa AI-TUTKIMUKSESTA
Takaisin piirustuspöydälle. Oli aika, ei kauan sitten, jolloin olisi ollut vaikea löytää ketään, joka olisi yhtä innokas kannattaja AGI-hypoteesia, että “mittakaava on kaikki mitä tarvitset” kuin Ilja Sutskever. (Lyhyesti sanottuna tämä oli ajatus, että pelkästään suurempien ja suurempien Transformeriin perustuvien kielimallien rakentaminen ja niiden syöttäminen yhä enemmän dataan ja niiden kouluttaminen yhä suurempiin laskentaklustereihin tuottaisi lopulta ihmistason yleistä tekoälyä ja sen lisäksi superälyä, joka on suurempi kuin koko ihmiskunnan kollektiivinen viisaus.) Niinpä oli yllättävää nähdä entinen OpenAI:n päätieteilijä D-patelde-sota istumassa alas sotaan. “Dwarkesh” podcast, joka käynnistettiin viime viikolla ja kuulla hänen sanovan, että hän on nyt vakuuttunut siitä, että LLM:t eivät koskaan tarjoa ihmistason älykkyyttä. Sutskever sanoo nyt olevansa vakuuttunut siitä, että LLM:t eivät koskaan pysty yleistämään hyvin aloille, jotka eivät olleet nimenomaisesti heidän koulutustiedoissaan, mikä tarkoittaa, että heidän on vaikea kehittää todella uutta tietoa. Hän totesi myös, että LLM-koulutus on erittäin tehotonta: se vaatii tuhansia tai miljoonia esimerkkejä jostakin ja toistuvaa palautetta arvioijilta, kun taas ihmiset voivat yleensä oppia jotain vain kourallisen esimerkin avulla ja voivat myös tehdä analogioita alueelta toiselle. Tämän seurauksena Sutskever, joka johtaa nyt omaa AI-startuppiaan, Safe Superintelligenceä, kertoo Patelille, että olemme “takaisin tutkimuksen aikakaudella” etsimässä uusia tapoja suunnitella hermoverkkoja, jotka saavuttavat alan Pyhän Graalin. AGI. Sutskever sanoi, että hänellä on joitain intuitiota tämän saavuttamiseksi, mutta kaupallisista syistä hän ei aio jakaa niitä “Dwarkeshissa”. Huolimatta hänen hiljaisuudestaan näistä liikesalaisuuksista, podcast on kuuntelemisen arvoinen. Voit kuunnella sen kaiken täältä. (Varoitus, se on pitkä. Haluat ehkä antaa sen suosikki tekoälyllesi yhteenvedon tekemiseksi.)
SINULLA ON KALENTERI
2.–7. joulukuuta: NeurIPS, San Diego
8.–9. joulukuuta: Fortune Brainstorm AI San Francisco. Osallistumispyyntö tästä.
6. tammikuuta: Fortune Brainstorm Tech CES -illallinen. Osallistumispyyntö tästä.
19.-23. tammikuuta: Maailman talousfoorumi, Davos, Sveitsi.
10.–11. helmikuuta: AI Action Summit, New Delhi, Intia.
RUOKAA AIVOILLE
Hidastuuko tekoälyn käyttöönotto? Näin väittää The Economist -lehden artikkeli, jossa viitataan äskettäin julkaistuihin lukuihin. Uudet US Census Bureaun tiedot osoittavat, että työllisyyspainotettu tekoälyn käyttö työpaikalla on pudonnut Yhdysvalloissa noin 11 prosenttiin, ja käyttöönotto on laskenut erityisesti suurissa yrityksissä, ja käyttöönotto on odottamattoman heikkoa kolme vuotta generatiivisen tekoälyn nousun jälkeen. Muut datajoukot viittaavat samaan jäähtymiseen: Stanfordin tutkijat havaitsevat, että käyttö laski 46 prosentista 37 prosenttiin kesä-syyskuussa, kun taas Ramp raportoi, että tekoälyn käyttöönotto vuoden 2025 alussa nousi 40 prosenttiin ennen kuin se tasaantui, mikä viittaa siihen, että vauhti on tasaantunut. Tämä hidastuminen on tärkeää, koska suuret teknologiayritykset aikovat käyttää 5 biljoonaa dollaria tekoälyinfrastruktuuriin tulevina vuosina ja tarvitsevat noin 650 miljardia dollaria vuosituloja (lähinnä yrityksiltä) perustellakseen sen. Selitykset tekoälyn käyttöönoton hitaalle tahdille vaihtelevat makrotaloudellisesta epävarmuudesta organisaation dynamiikkaan, mukaan lukien johtajien epäilykset nykyisten mallien kyvystä tuottaa merkittäviä tuottavuuden lisäyksiä. Artikkelissa väitetään, että ellei käyttöönotto nopeudu, tekoälyn taloudelliset hyödyt ovat hitaampia ja epätasaisempia kuin sijoittajat odottavat, mikä tekee nykyisistä valtavista pääomamenoista vaikeasti perusteltavissa.