OpenAI a prezentat primul său AI „gânditor”, o1
Datorită acestei noi metode de antrenament, modelul ar trebui să fie mai precis. Turek a remarcat că o1 este mai puțin predispus la „halucinare” (adică să creeze răspunsuri imaginare false), dar problema nu a fost încă pe deplin rezolvată.
Așa a rezolvat noua paradigmă vechea problemă de programare a „jocului șarpelor”:
Principala diferență dintre o1 și GPT-4o este capacitatea sa de a rezolva sarcini complexe, cum ar fi scrierea codului și rezolvarea problemelor matematice, iar o1 poate explica pașii de rezolvare. De exemplu, o1 a fost capabil să rezolve 83% din problemele Olimpiadei Internaționale de Matematică, în timp ce GPT-4o a fost capabil să rezolve doar 13% dintre ele.
Internetul nu este încă disponibil
Deși o1 este puternic în rezolvarea problemelor complexe, nu este la fel de bun ca GPT-4o în multe alte domenii. De exemplu, nu sunt exacte când vine vorba de cunoștințe reale și nu au capacitatea de a naviga pe internet sau de a procesa fișiere și imagini predefinite. În ciuda acestui fapt, OpenAI consideră că o1 reprezintă un nivel complet nou în dezvoltarea AI. Numele modelului o1 înseamnă „resetează contorul înapoi la 1”.
Când modelul a fost testat în competiții de programare online CodeforceA depășit 89% dintre participanți. OpenAI susține că următoarea iterație a acestui model va obține deja rezultate similare pentru studenții doctoranzi în rezolvarea sarcinilor experimentale complexe din fizică, chimie și biologie.
Iluzia „gândirii”.
Deși o1 poate rezolva probleme complexe, nu „gândește” așa cum fac oamenii, scrie el Margine. Interfața formularului este concepută pentru a arăta cum să rezolvi o problemă pas cu pas, folosind expresii precum „Mă gândesc la asta” sau „Încă examinez procesul de soluționare”. Potrivit dezvoltatorilor modelului, acesta creează iluzia gândirii umane, deși OpenAI nu a comparat încă această inteligență artificială cu gândirea la nivel uman.
Cu toate acestea, OpenAI vede modelele de gândire ca un pas important către AI pentru gândirea la nivel uman. Potrivit lui McGraw, compania s-a concentrat câteva luni pe dezvoltarea abilității de a gândi, deoarece aceasta este cheia rezolvării problemelor complexe. Deși în prezent o1 este încă lent și costisitor, cercetătorii văd un potențial mare în domenii precum medicina și inginerie. Cu toate acestea, dezvoltarea O1 este încă în fazele sale incipiente.
„Creator. Amator de cafea. Iubitor de internet. Organizator. Geek de cultură pop. Fan de televiziune. Mândru foodaholic.”