Thursday, March 5, 2026

OpenAI pyrkii osoittamaan, ettei se jää kilpailijoidensa taakse GPT-5.2 |:n lanseerauksella Onni

LiiketoimintaOpenAI pyrkii osoittamaan, ettei se jää kilpailijoidensa taakse GPT-5.2 |:n lanseerauksella Onni

Googlen ja Anthropicin lisääntyvän kilpailupaineen alaisena OpenAI on julkistanut uuden tekoälymallin, GPT-5.2:n, jonka se sanoo ylittävän kaikki nykyiset mallit huomattavasti useissa eri tehtävissä.

Uusi malli, joka lanseerataan alle kuukausi sen jälkeen, kun OpenAI julkisti edeltäjänsä, GPT-5.1, suoriutui erityisen hyvin monimutkaisten ammatillisten tehtävien benchmark-testissä useissa “tietotöissä” (lakista kirjanpitoon ja talouteen) sekä koodaukseen ja matemaattiseen päättelyyn liittyvissä arvioinneissa OpenAI:n julkaisemien tietojen mukaan.

Fidji Simo, InstaCartin entinen toimitusjohtaja ja nyt OpenAI:n sovellusten toimitusjohtaja, kertoi toimittajille, että mallia ei pitäisi nähdä suorana vastauksena Googlen viime kuussa lanseeratulle Gemini 3 Pro AI -mallille. Tämä julkaisu sai OpenAI:n toimitusjohtajan Sam Altmanin antamaan “punaisen koodin”, mikä viivästytti useiden aloitteiden käynnistämistä, jotta henkilöstöä ja laskentaresursseja voitaisiin keskittää sen ydintuotteen, ChatGPT:n, parantamiseen.

“Sanoisin, että (Code Red) auttaa tämän mallin julkaisussa, mutta se ei ole syy, miksi se tulee ulos tällä viikolla, vaan se on ollut työn alla jo jonkin aikaa”, hän sanoi.

Hän sanoi, että yritys oli rakentanut GPT-5.2:ta “monien kuukausien ajan”. “Emme pystyneet muuttamaan näitä malleja vain viikossa. Se on suuren työn tulos”, hän sanoi. Malli tunnettiin sisäisesti koodinimellä “Garlic” The Information -lehdessä julkaistun artikkelin mukaan. Päivää ennen mallin julkaisua Altman kiusoitti sen tulevaa lanseerausta julkaisemalla sosiaalisessa mediassa videoleikkeen, jossa hän keitti ruuan, jossa oli paljon valkosipulia.

OpenAI:n johtajat sanoivat, että malli oli ollut “Alpha-asiakkaiden” käsissä ja auttanut testaamaan sen suorituskykyä “useita viikkoja”, mikä tarkoittaisi, että malli valmistui ennen Altmanin “koodi punaista” -ilmoitusta.

Näihin testaajiin kuuluivat laillinen tekoälyn startup Harvey, muistiinpanosovellus Notion ja tiedostonhallintaohjelmistoyritys Box sekä Shopify ja Zoom.

OpenAI sanoi, että nämä asiakkaat havaitsivat, että GPT-5.2 osoitti “huippuluokan” kykyä käyttää muita ohjelmistotyökaluja tehtävien suorittamiseen sekä erinomaista koodin kirjoittamisessa ja virheenkorjauksessa.

Koodauksesta on tullut yksi kilpailukykyisimmistä käyttötapauksista tekoälymallien toteuttamiseen yrityksissä. Vaikka OpenAI:lla oli etumatka tällä alalla, Anthropicin Claude-malli on osoittautunut erityisen suosituksi yritysten keskuudessa, ylittäen OpenAI:n markkinaosuuden joillakin luvuilla. OpenAI epäilemättä toivoo saavansa asiakkaat palaamaan malleihinsa koodaamaan GPT-5.2:lla.

Simo sanoi, että “Code Red” auttoi OpenAI:ta keskittymään ChatGPT:n parantamiseen. “Code Red on todella signaali yritykselle, että haluamme yhdistää resursseja tietyllä alueella, ja se on tapa todella määritellä prioriteetit ja määritellä asioita, jotka voidaan priorisoida”, hän sanoi. “Olemme siis lisänneet ChatGPT:hen yleisesti kohdistettuja resursseja.”

Yhtiö sanoi myös, että sen uusi malli tarjoaa aiempia parempia “turvallisia loppuja”, jotka se määrittelee antamaan käyttäjille hyödyllisiä vastauksia sanomatta asioita, jotka voivat edistää tai pahentaa mielenterveyskriisejä.

“Mitä tulee turvallisuuteen, vertailuarvojen kautta katsottuna, parannamme käytännössä kaikilla turvallisuuden ulottuvuuksilla, olipa kyseessä itsensä vahingoittaminen, erilaiset mielenterveydet tai henkinen riippuvuus”, Simo sanoi. “Olemme erittäin ylpeitä täällä tekemästämme työstä. Se on meille ykkösprioriteetti ja julkaisemme malleja vasta, kun olemme varmoja siitä, että turvallisuusprotokollia on noudatettu ja olemme ylpeitä työstämme.”

Uuden mallin lanseeraus tapahtui samana päivänä, kun yritystä vastaan ​​nostettiin uusi oikeusjuttu, jonka mukaan ChatGPT:n vuorovaikutus psykologisia ongelmia omaavan käyttäjän kanssa oli vaikuttanut murhaan-itsemurhaan Connecticutissa. Yhtiöllä on myös muita oikeudenkäyntejä, joiden mukaan ChatGPT osallistui ihmisten itsemurhiin. Yritys kutsui Connecticutin murhaa-itsemurhaa “uskomattoman sydäntäsärkeväksi” ja sanoi jatkavansa “ChatGPT:n koulutuksen parantamista tunnistaakseen henkisen tai emotionaalisen ahdistuksen merkkejä ja reagoidakseen niihin, lieventää keskusteluja ja ohjata ihmisiä kohti todellista tukea”.

GPT-5.2:n suorituskyky parani huomattavasti useissa yritysasiakkaita kiinnostavissa vertailuissa. Täytti tai ylitti asiantuntijan suorituksen monissa vaikeissa ammattitehtävissä, OpenAI:n GDPval-vertailulla mitattuna, 70,9 % ajasta. Tämä vastaa vain 38,8 % ajasta GPT-5:lle, OpenAI-mallille, joka julkaistiin elokuussa. 59,6 % Anthropicin Claude Opus 4.5:lle; ja 53,3 % Googlen Gemini 3 Prolle.

Ohjelmistokehitysvertailussa SWE-Bench Pro, GPT-5.2 sai 55,6 %, mikä on lähes 5 prosenttiyksikköä parempi kuin edeltäjänsä, GPT-5.1, ja yli 12 % parempi kuin Gemini 3 Pro.

Aidan Clark, OpenAI:n tutkimuksen (koulutuksen) varapuheenjohtaja, kieltäytyi vastaamasta kysymyksiin tarkalleen, mitä koulutusmenetelmiä oli käytetty GPT-5.2:n suorituskyvyn parantamiseen, vaikka hän sanoi, että yritys oli tehnyt kaikkialla parannuksia, mukaan lukien esikoulutus, ensimmäinen askel tekoälymallin luomisessa.

Kun Google lanseerasi Gemini 3 Pro -mallinsa viime kuussa, sen tutkijat sanoivat myös, että yritys oli tehnyt parannuksia sekä ennen harjoittelua että sen jälkeen. Tämä yllätti joitain alan toimijoista, jotka uskoivat, että tekoälyyritykset olivat suurelta osin käyttäneet kykynsä saada merkittäviä parannuksia mallinrakennuksen esikoulutusvaiheesta, ja spekuloitiin, että OpenAI saattoi jäädä yllättäen Googlen edistymisestä tällä alalla.

Check out our other content

Check out other tags:

Suosituimmat artikkelit