OpenAI lanseerasi tänään uuden lippulaivakuvausmallin, joka pyrkii torjumaan viimeaikaiset huolenaiheet siitä, että se on jäämässä jälkeen kilpailijoistaan sekä kuluttajien että yritysten ajattelutavan vangitsemisessa.
Uusi kuvantamismalli mahdollistaa tarkemman kuvankäsittelyn ja voi tuottaa kuvia jopa neljä kertaa nopeammin kuin OpenAI:n edellinen kuvantamisäly, yritys kertoi blogikirjoituksessaan. Hän sanoi, että uusi malli sekä uusi ChatGPT:n kuvantamisominaisuus on suunniteltu tekemään kuvien luomisesta “ilahduttavaa”.
OpenAI:n blogiviestin mukaan uudet ChatGPT-kuvat tulevat tänään kaikille ChatGPT-käyttäjille ja API-käyttäjille maailmanlaajuisesti. Yhtiö sanoi, että se toimii kaikissa malleissa, joten käyttäjien ei tarvitse valita tiettyä mallia pudotusvalikosta käyttääkseen sitä.
“Uskomme, että olemme vielä alussa sen suhteen, mitä kuvantaminen voi mahdollistaa”, yritys sanoi blogiviestissä. “Tämänpäiväinen päivitys on tärkeä askel eteenpäin, ja lisää on tulossa, yksityiskohtaisemmista muokkauksista monipuolisempiin ja yksityiskohtaisempiin tuloksiin kaikilla kielillä.”
Vaikka se saattaa tuntua joululahjalta uskollisille ChatGPT-käyttäjille, OpenAI:n henkilökunta on ollut kiireisiä tonttuja, jotka ovat vastanneet Joulupukin (eli toimitusjohtajan) Sam Altmanin kiitospäivän jälkeiseen “Code Red” -muistioon, jonka tarkoituksena oli saada yritys parantamaan ChatGPT:tä seuraavien kahdeksan viikon aikana kilpailijoiden, erityisesti Googlen, tiukassa kilpailussa.
Googlen Gemini-malli oli vahvistunut sen jälkeen, kun sen kuvantamismalli, Nano Banana, lanseerattiin elokuussa. Googlen mukaan kuukausittaisten aktiivisten käyttäjien määrä kasvoi heinäkuun 450 miljoonasta 650 miljoonaan lokakuussa.
Yrityksen uusin versio, Nano Banana Pro, levisi virukselle sen julkaisun jälkeen 20. marraskuuta, kiitos mallin uuden kyvyn käsitellä tekstiä siististi kuvissa (joka oli ollut hankala ongelma vuosia). Käyttäjiä kiehtoi myös Nano Banana Pron kyky tuottaa järkeviä kaavioita ja infografioita sekä se, että sen avulla ihmiset pystyivät muokkaamaan kuviaan sen sijaan, että ne olisivat luoneet ne uudelleen tyhjästä.
Viime viikolla OpenAI julkaisi tekstimallistaan uusimman version, GPT-5.2; Siitä lähtien alan tarkkailijat ovat odottaneet, julkaiseeko yritys uuden imagomallin ennen uutta vuotta. Mutta onko se tarpeeksi hyvä ohittamaan Googlen?
Fidji Simo, OpenAI:n sovellusten toimitusjohtaja, kirjoitti Substack-viestissä, että ChatGPT:n chat-käyttöliittymää ei alun perin suunniteltu menemään tekstiä pidemmälle, joten uuteen kuvamalliin liittyy “omistettu sisääntulopiste” ChatGPT:hen kuville, jotka toimivat enemmän kuin “luova studio”, joka on saatavilla sivupalkissa mobiilisovelluksen kautta ja verkossa.
“Uusien kuvien katselu- ja muokkausnäyttöjen avulla on helppo luoda kuvia, jotka vastaavat visioitasi tai jotka ovat saaneet inspiraationsa trendivihjeistä ja esiasetetuista suodattimista”, hän kirjoitti. “Lisäksi uusi mallimme on nopeampi ja parempi seuraamaan yksityiskohtaisia ohjeita tarkempiin muokkauksiin ja luoviin muutoksiin.” Malli voi pitää keskeiset elementit, kuten valaistuksen, sommittelun ja samankaltaisuuden yhtenäisinä käyttäjien syöttämien ja mallin tuottamien välillä, “joten tulokset ovat paljon lähempänä sitä, mitä kuvittelet”, hän lisäsi.
Silti Nano Banana Prolla voi silti olla varhaisen henkisen sitoutumisen etu. Äskettäisessä Fortunen haastattelussa Allie Miller, tekoälyneuvoja ja sijoittaja, puhui kuinka hän osallistui äskettäin Mark Cubanin isännöimään Shark Tank -tyyppiseen tapahtumaan ja oli järkyttynyt siitä, mitä tapahtui, kun kuubalainen lausui sanat “Nano Banana”.
Hän toivoi, että maininta Googlen omituisesta tekoälykuvageneraattorista saattaisi aiheuttaa hämmennystä tuhansien ihmisten keskuudessa, joita Miller kuvasi enimmäkseen uusiksi tekoälylle. Sen sijaan yleisö nyökkäsi tunnustuksena.
Kuten ChatGPT itse, hän selitti, “on tiettyjä tekoälytyökaluja tai malleja, joista alat kuulla yhä uudelleen ja uudelleen ja jotka saavat suuren hetken popkulttuurissa.”
Nähtäväksi jää, pystyvätkö OpenAI:n tontut tekemään uusista ChatGPT-kuvistaan yhtä vastustamattomia kuin kauden halutuimmat lelut. Mutta hetki, joka tulee yrityksen Code Redin keskellä, korostaa laajempaa todellisuutta: Vaikka mallien laadulla on edelleen merkitystä tekoälykilpailussa, se on yhä enemmän taistelua kuluttajien sydämistä ja mielistä.