Anthropic vuoti vahingossa suositun koodaustyökalunsa Claude Coden lähdekoodin.
Vuoto tapahtui vain muutama päivä sen jälkeen, kun Fortune ilmoitti, että yritys oli vahingossa julkistanut lähes 3 000 tiedostoa, mukaan lukien luonnos blogitekstistä, joka esitteli tehokkaan tulevaisuuden mallin, joka sisältää ennennäkemättömiä kyberturvallisuusriskejä. Malli tunnetaan sisäisesti nimellä “Mythos” ja “Capybara”, Fortunen hankkiman vuotaneen blogikirjoituksen mukaan.
Lähdekoodivuoto paljasti noin 500 000 koodiriviä noin 1 900 tiedostossa. Kun Anthropiciin otettiin yhteyttä kommentoidakseen, hän vahvisti, että “jotkin sisäinen lähdekoodi” oli vuotanut “Claude Code -versiossa”.
Tiedottaja sanoi: “Mitään arkaluontoista asiakasdataa tai valtuustietoja ei ollut mukana tai paljastettu. Tämä oli inhimillisen virheen aiheuttama julkaisupakkausongelma, ei tietoturvaloukkaus. Toteutamme toimenpiteitä estääksemme tämän toistumisen.”
Viimeisin tietomurto on mahdollisesti vahingollisempi Anthropicille kuin edellinen vahingossa paljastunut blogiluonnos sen tulevasta mallista. Vaikka viimeisin tietoturvaloukkaus ei paljastanut itse Claude-mallin painoarvoa, se antoi teknisesti taitaville ihmisille mahdollisuuden poimia lisää sisäistä tietoa yrityksen koodikannasta, kertoo kyberturvallisuusammattilainen Fortune, jota pyydettiin tarkistamaan tietomurto.
Claude Code on kenties Anthropicin suosituin tuote, ja suurissa yrityksissä sen käyttöönottoprosentit ovat nousseet pilviin. Ainakin osa Claude Coden ominaisuuksista ei tule tuotteen voimanlähteenä olevasta laajasta taustalla olevasta kielimallista, vaan ohjelmiston “valjaista”, joka ympäröi taustalla olevaa tekoälymallia ja kertoo muille ohjelmistotyökalujen käyttämisestä ja tarjoaa tärkeitä esteitä ja ohjeita, jotka ohjaavat sen toimintaa. Se on tämän agenttivaljaiden lähdekoodi, joka on nyt vuotanut nettiin.
Vuodon ansiosta kilpailija voi mahdollisesti muuttaa Claude Coden agenttivaljaiden toimintaa ja käyttää tätä tietoa omien tuotteidensa parantamiseen. Jotkut kehittäjät saattavat myös pyrkiä luomaan avoimen lähdekoodin versioita Claude Coden agenttivaljaista vuotaneen koodin perusteella.
LayerX Securityn vanhempi AI-tietoturvatutkija Roy Pazin mukaan vuotanut koodi tarjosi myös lisää todisteita siitä, että Anthropicilla on uusi sisäisesti nimeltään Capybara malli, jonka lanseeraamista yhtiö valmistelee aktiivisesti. Paz sanoi, että yritys julkaisee todennäköisesti “nopean” ja “hitaisen” version uudesta mallista, joka perustuu mallin ilmeisen laajempaan kontekstiikkunaan, ja että se on markkinoiden edistynein malli.
Tällä hetkellä Anthropic markkinoi kutakin malliaan kolmessa eri koossa. Suuremmat, tehokkaammat malliversiot on merkitty nimellä Opus; Hieman nopeammat ja halvemmat, mutta vähemmän suorituskykyiset versiot ovat Sonnet-merkkisiä; ja pienimmät, halvimmat ja nopeimmat ovat nimeltään Haiku. Fortunen viime viikolla hankkimassa blogiluonnoksessa Anthropic kuvailee Capybaraa uuden tason malliksi, joka on vielä suurempi ja tehokkaampi kuin Opus, mutta myös kalliimpi.
Viimeisin vuoto, joka julkaistiin ensimmäisen kerran julkaisussa Virhe näyttää olevan “inhimillinen virhe”, kun joku käytti oikotietä, joka ohitti normaalit vapautussuojat, Paz sanoi. Anthropic kertoi Fortunelle, että normaaleja vapautustakeita ei kierretty.
“Yleensä suurilla yrityksillä on tiukat prosessit ja useita tarkistuksia ennen kuin koodi saapuu tuotantoon, kuten holvissa, jonka avaaminen vaatii useita avaimia”, hän kertoi Fortunelle. “Anthropicilla näyttää siltä, että prosessi ei ollut paikallaan ja yksi virheellinen määritys tai virheellinen napsautus paljasti yhtäkkiä koko lähdekoodin.”
Paz esitti myös kysymyksiä siitä, kuinka työkalu voisi mahdollisesti muodostaa yhteyden Anthropicin sisäisiin järjestelmiin. Hän sanoi, että suurin huolenaihe ei ehkä ole suora pääsy taustamalleihin, vaan se, että vuotanut koodi saattaa paljastaa ei-julkisia yksityiskohtia järjestelmien toiminnasta, kuten API:t ja sisäiset prosessit. Hän lisäsi, että tämäntyyppinen tieto voisi auttaa kehittyneitä toimijoita ymmärtämään paremmin Anthropicin mallien arkkitehtuuria ja niiden toteutusta, mikä puolestaan voi antaa tietoa yrityksistä kiertää olemassa olevia suojatoimia.
Anthropicin nykyinen tehokkain malli, Claude 4.6 Opus, on jo luokiteltu vaaralliseksi malliksi kyberturvallisuusriskeissä. Anthropic on sanonut, että sen nykyiset Opus-mallit pystyvät tunnistamaan itsenäisesti ohjelmistojen nollapäivän haavoittuvuuksia. Vaikka nämä ominaisuudet on tarkoitettu auttamaan yrityksiä havaitsemaan ja korjaamaan puutteita, hakkerit, mukaan lukien kansallisvaltiot, voivat myös aseistaa niitä löytääkseen ja hyödyntääkseen haavoittuvuuksia.
Tämä ei ole ensimmäinen kerta, kun Anthropic on vahingossa vuotanut tietoja suositusta Claude Code -työkalustaan. Helmikuussa 2025 Claude Coden aikaisempi versio paljasti vahingossa alkuperäisen koodinsa samanlaisessa rikkomuksessa. Näyttely osoitti, kuinka työkalu toimi kulissien takana ja miten se liittyi Anthropicin sisäisiin järjestelmiin. Anthropic poisti myöhemmin ohjelmiston ja julkisen koodin.
TOIMITTAJAN HUOMAUTUS: Tämä artikkeli on päivitetty sisältämään Anthropicin lisäkommentteja ja joidenkin teknisten yksityiskohtien selvennyksiä yhdestä lähteestä.