„Reddit AMA“ „OpenAI“ generalinis direktorius Samas Altmanas pripažino, kad skaičiavimo pajėgumų trūkumas yra vienas iš pagrindinių veiksnių, neleidžiančių įmonei tiekti produktų taip dažnai, kaip norėtųsi.
„Visi šie modeliai tapo gana sudėtingi“, – rašė jis, atsakydamas į klausimą, kodėl kiti OpenAI AI modeliai užtruko taip ilgai. „Mes taip pat susiduriame su daugybe apribojimų ir sunkių sprendimų, nes skyrėme daug puikių idėjų.
Daugelis ataskaitų rodo, kad „OpenAI“ stengėsi užtikrinti pakankamai skaičiavimo infrastruktūros, kad galėtų paleisti ir mokyti generuojamuosius modelius. Tik šią savaitę „Reuters“, remdamasi šaltiniais, pranešė, kad OpenAI jau kelis mėnesius bendradarbiauja su „Broadcom“, kad sukurtų dirbtinio intelekto lustą, skirtą modeliams, kurie galėtų būti pristatyti 2026 m.
Altmanas sakė, kad iš dalies dėl įtempto pajėgumo, tikroviškai skambanti OpenAI pokalbio funkcija, skirta ChatGPT, išplėstinis balso režimas, netrukus nebus pradėtas naudoti balandžio mėnesį. Balandžio mėnesio spaudos renginyje „OpenAI“ parodė, kad „ChatGPT“ programa veikia išmaniajame telefone ir reaguoja į dalykus, pvz., drabužius, kuriuos kažkas dėvėjo, telefono kameroje.
Vėliau pranešimai atskleidė, kad demonstracinė versija buvo paskubėta pavogti dėmesį iš „Google“ I/O kūrėjų konferencijos, kuri vyko tą pačią savaitę. Daugelis „OpenAI“ nemanė, kad GPT-4o yra pasirengęs būti atskleistas – akivaizdu, kad „Advanced Voice Mode“ versija tik balsu buvo atidėta mėnesiams.
AMA Altmanas nurodė, kad kitas pagrindinis OpenAI vaizdo generatoriaus DALL-E leidimas neturi paleidimo laiko juostos. („Mes dar neturime išleidimo plano“, – sakė jis.) Tuo tarpu „Sora“, „OpenAI“ vaizdo įrašų kūrimo įrankis, buvo sulaikytas dėl „reikia patobulinti modelį, sutvarkyti saugumą/apsimetinėjimą/kitus dalykus ir masto skaičiavimas“, – rašė Kevinas Weilas, OpenAI vyriausiasis produktų pareigūnas, taip pat dalyvavęs AMA.
Pranešama, kad „Sora“ patyrė techninių nesklandumų, dėl kurių ji prastai vertina konkurentų sistemas iš Luma, Runway ir kitų. Per The Information, pradinė sistema, pristatyta vasario mėnesį, užtruko daugiau nei 10 minučių apdorojimo laiko, kad būtų sukurtas 1 minutės trukmės vaizdo klipas.
Spalio mėnesį vienas iš Soros vadovų Timas Brooksas išvyko į „Google“.
Vėliau AMA Altmanas sakė, kad „OpenAI“ vis dar svarsto galimybę „kada nors“ leisti „NSWF“ turinį ChatGPT („mes visiškai tikime, kad su suaugusiais vartotojais elgiamasi kaip su suaugusiais“, – rašė jis), ir kad pagrindinis bendrovės prioritetas yra tobulinti savo o1 seriją. „samprotavimo“ modeliai ir jų įpėdiniai. „OpenAI“ šią savaitę Londone vykusioje „DevDay“ konferencijoje peržiūrėjo daugybę funkcijų, kurios bus pristatytos į o1, įskaitant vaizdo supratimą.
„Vėliau šiais metais turime keletą labai gerų leidimų“, – rašė Altmanas. „Tačiau nieko, ką pavadinsime GPT-5“.