(Kuva Radowan Nakif Rehan Unsplashista)
(Toimittajan huomautus: Tämän vierasviestin on kirjoittanut Marcelo Calbucci, pitkäaikainen Seattlen startup- ja teknologiayhteisön johtaja.)
Tässä kuussa tein Seattlessa toimivan Foundationsin varhaisen vaiheen perustajien kanssa kyselyn heidän tekoälytyökalujen ja -agenttien käytöstä. Tiedoissa oli yllätyksiä (eikä odotettuun suuntaan) ja puhumisen arvoisia trendejä.
Otoskoko edustaa 22 startupia, joissa kussakin on yhdestä viiteen ohjelmistosuunnittelijaa, yhteensä 42 henkilöä. Tästä kohortista on arvokasta ymmärtää se, että ne ovat tekoälystä peräisin olevia startup-yrityksiä, alkaen ajasta, jolloin tekoäly pystyi koodaamaan. Tämä antaa meille välähdyksen teknologiayritysten tulevaisuudesta.
Ensimmäinen kysymys, jonka esitin kyselyssä, koski tekoälyn kirjoittaman tuotantokoodin prosenttiosuutta. Kirjoitin tämän kysymyksen nimenomaisesti sulkeakseni pois yksikkötestit, skriptit, asiakirjat ja muut esineet, jotka eivät liity yrityksen perusarvolupaukseen. Jos tiedät yhden asian tekoälykoodauksesta, se on se, että se tuottaa suuria määriä yksikkötestejä, readme-tiedostoja ja komentosarjoja. Mikään näistä ei liity koodiin, joka toimittaa arvon asiakkaalle.
Tässä on yllättävä tosiasia: 22:sta startupista neljä (18 %) sanoi, että tekoäly kirjoittaa 100 % heidän koodistaan. Se on hämmästyttävää! Tämä ei tarkoita, että nämä ihmiset eivät tarkista ja pyydä tekoälyä tarkentamaan koodia. Se tarkoittaa kuitenkin, että he eivät kirjoita koodia IDE:ssä. On 11 käynnistystä (50 %), joissa tekoäly kirjoittaa 80-99 % koodista. Kun lasketaan yhteen ne neljä, joissa tekoäly kirjoittaa kaiken, 68 prosentilla startup-yrityksistä tekoäly kirjoittaa yli 80 prosenttia tuotantokoodista. Spektrin toisella puolella kolme startuppia (13,6 %) sanoi, että tekoäly kirjoittaa alle 50 % koodistaan.
Valitse aseesi
Uutisista Cursorin ilmestymisestä lehdistössä voisi luulla, että tämän ryhmän käyttö on lähes 100%. Otoksessamme 42 ohjelmoijasta 22 ainutlaatuisesta startupista “vain” 23 (54,7 %) käyttää Cursoria. Cursor-kehittäjät käyttivät keskimäärin 113,63 dollaria henkilöä kohden syyskuussa. Suosituin työkalu on kuitenkin Claude Code, jota käytti 64,3 % ohjelmoijista ja käytti syyskuussa 167,41 dollaria henkilöä kohden. Claude on ensisijainen työkalu startupeille, koska 16 22:sta (72,7 %) käyttää sitä.
Clauden ja Cursorin jälkeen on iso jyrkänne, jossa OpenAI Codex on kaukaisessa kolmanneksessa, ja seitsemän startup-yritystä käyttää sitä, edustaen 12:ta 42 ohjelmoijasta. Keskimäärin OpenAI Codexin käyttö oli 48,49 dollaria henkilöä kohden syyskuussa. Neljänneksi ja viidenneksi olivat Googlen GitHub Copilot ja Gemini CLI. Heillä oli 9,52% ja 4,76% ohjelmoijista, jotka käyttivät sitä.
Jokainen ohjelmistosuunnittelija käytti keskimäärin 182,55 dollaria edellä mainittuihin viiteen parhaaseen tekoälytyökaluun, ja jotkut startup-yritykset käyttivät yli 400 dollaria henkilöä kohden.
Perustajat mainitsivat myös, että he käyttävät erilaisia työkaluja tuotantokoodin luomiseen, mukaan lukien Lovable, Devplan, Mentat, Factory.ai, Jetbrains Junie, Warp ja Figma.
Barrikadit
Kun kysyttiin, mikä estää tekoälyn laajemman käytön koodauksessa, numero yksi valitus oli koodin laatu. Toinen este nopeammalle omaksumiselle on oppimiskäyrä saada agentti tekemään mitä haluat.
Mitä tulee turhautumiseen, tämä ryhmä ottaa esille kolme keskeistä kysymystä. Ensinnäkin tuloksen laatu, joka vaatii huomattavaa uudelleenkäsittelyä. Toiseksi odotusten ja todellisuuden välinen ristiriita sen perusteella, mitä kaikki kuulevat. Lopuksi, yleisin turhautuminen (ja olen ehdottomasti myötätuntoinen tähän) on kontekstin hallinta ja suurten koodikantojen käsittely.
Mitä seuraavaksi?
Kyselyssä kysyin heiltä aikomuksestaan jatkaa tekoälytyökalujen ja -agenttien käyttöä tuotekehityksen apuna. Tutkimuksessa kysyttiin perustajilta, aikovatko he lisätä, poistaa, lisätä tai vähentää kunkin työkalun käyttöä. Ylivoimaisesti suurin voittaja oli Codex, yhdeksän startupia (40,9 %) ilmoitti, että he eivät käytä sitä vielä, mutta aikovat käyttää sitä neljännellä vuosineljänneksellä. Kun normalisoit tiedot ottaaksesi huomioon Q4:n odotukset, Claude säilyttää johtoasemansa, mutta Codex vastaa käynnistysten määrää. Kursori ja GitHub Copilot suuntautuvat hieman alaspäin, ja kukin yksi käynnistys sanoo lopettavansa sen käytön. Lopuksi Gemini CLI:n käyttöönotto saattoi hieman lisääntyä, kun kolme startuppia väitti testaaneensa sitä viimeisellä neljänneksellä.
Toisin kuin monet muut ohjelmistosuunnittelun osa-alueet, kuten pilvipalveluntarjoajan, kielen tai tietokannan valitseminen, tekoälytyökalut ja -agentit eivät ole nollasummamarkkinoita. Tässä tutkimuksessa 68,2 % startup-yrityksistä käytti useampaa kuin yhtä tekoälytyökalua auttamaan tuotantokoodin kehittämisessä. Ilmoitetun aikeensa mukaan luku nousee 86,4 prosenttiin viimeisellä neljänneksellä.