GPT-5: noutăți, performanță și alternative open‑source

La începutul lunii august 2025, OpenAI a lansat noua generație de modele
GPT-5, marcând un pas major în evoluția sistemelor de inteligență
artificială. Deși compania nu consideră că a atins încă o inteligență generală (AGI),
GPT-5 reprezintă o îmbinare ingenioasă între eficiență și capacitate de raționare
profundă. În această postare analizăm modul în care funcționează
noul sistem unificat, ce îmbunătățiri aduce față de GPT‑4, cum se poziționează
față de modelele concurente și care sunt alternativele open‑source disponibile.

Sistem unificat: bază rapidă, gândire profundă și router în timp real

GPT-5 nu este un singur model, ci un sistem compus din trei elemente: un model
rapid pentru răspunsuri simple, un model profund de raționare (GPT-5 thinking)
pentru sarcini complexe și un router care selectează dinamic modelul potrivit
pentru fiecare solicitare. Această arhitectură permite obținerea
unui echilibru între viteză și calitate și vine însoțită de patru versiuni ale
modelului: GPT-5 (complet), GPT-5 Pro, GPT-5 Mini și GPT-5 Nano. Variantă Pro
pune accent pe raționament extins cu cost și latență mai ridicate, în timp ce
Mini și Nano sacrifică profunzimea pentru viteză și cost redus.

Capacități îmbunătățite și ferestre de context mari

Una dintre cele mai remarcabile îmbunătățiri este fereastra de context de
400 k tokeni (aproximativ 600 de pagini A4), care permite modelului
să proceseze documente lungi, cod extins sau conversații îndelungate fără a pierde
coerența. API‑ul acceptă până la 272 k tokeni de intrare și 128 k
tokeni de ieșire. Pe lângă această memorie sporită,
GPT-5 folosește o tehnică de safe‑completions care reduce halucinațiile și
răspunsurile sycophantice (modelul fiind mai puțin predispus să spună ceea ce crede
că utilizatorul vrea să audă), de la 14,5 % la sub 6 %.
Studiile interne arată că greșelile de factualitate sunt cu 45 % mai puține
față de GPT‑4o în modul de navigare și cu 80 % mai puține față de modelul o3
în modul „thinking”. Acest lucru face GPT-5 o opțiune mai sigură
pentru aplicații critice precum consultanța medicală sau juridică.

Scriere, codare și raționament multimodal

În testele oficiale, GPT-5 depășește GPT‑4 la majoritatea sarcinilor academice și
profesionale: scor AIME de 94,6 %, performanță pe benchmark‑ul SWE‑bench de
74,9 %, punctaj Aider Polyglot de 88 % și MMMU de 84,2 %.
Modelul excelează în „vibe coding” – generarea de aplicații complete din descrieri
pe mai multe pagini – și a demonstrat în prezentări live că poate scrie sute de
linii de cod pentru simulări fizice complexe. Acest nou
nivel de competență se reflectă și în domeniul medical, unde scorurile pe
HealthBench Hard au crescut la 46,2 %, iar în modul „thinking”
modelul poate examina studii clinice, poate furniza rezumate și poate sugera
pași următori.

Funcții noi: personalități presetate și integrare cu aplicații

ChatGPT a devenit mai ușor de personalizat: utilizatorii pot alege din patru
personalități presetate (cinic, robot, ascultător și tocilar) pentru a adapta
tonul conversației. Mai important pentru productivitate,
GPT-5 poate accesa aplicații precum Gmail și Google Calendar pentru a programa
întâlniri, a verifica e‑mailuri sau a lua notițe, devenind un adevărat asistent
personal. Modul „thinking” activează rețele neuronale
suplimentare pentru raționamente complexe, iar routerul decide automat când să
folosească această putere pentru a rezolva probleme dificile.

Structură de prețuri și disponibilitate

GPT-5 rămâne disponibil prin abonamentele ChatGPT Plus (20 $/lună) și Pro
(200 $/lună), însă tarifele API diferă în funcție de variantă. Modelul complet
costă aproximativ 1,25 $ per milion de tokeni de intrare și
10 $ per milion de tokeni de ieșire, în timp ce
variantele Mini și Nano sunt mult mai accesibile, cu prețuri pornind de la
0,05 $ / 0,40 $ pentru intrare/ieșire. Astfel, companiile pot
ajusta costurile în funcție de complexitatea sarcinilor.

Tabel comparativ cu alte modele

Pentru a înțelege mai bine poziționarea GPT-5 față de alte modele, tabelul de mai
jos sintetizează câteva valori cheie din studiile de referință și din analiza
Artificial Analysis. Fereastra de context, viteza, scorurile MMLU și costurile
demonstrează că, deși GPT-5 conduce la nivel de performanță, deschiderea și costul
accesibil al unor modele open‑source reduc rapid diferența.

Model	MMLU	Context (k tokeni)	Viteză (tokeni/s)	Preț intrare/ieșire	Licență
GPT-5 (high)	0,871	400	126,3	1,25 $/10 $	Proprietar
gpt‑oss‑20B	0,736	131	298,7	0,05 $/0,20 $	Apache 2.0
gpt‑oss‑120B	0,793	131	250,8	0,15 $/0,60 $	Apache 2.0
Llama 4 Maverick	0,809	1 000	166,1	0,23 $/0,85 $	Comunitate (Llama 4)
Gemini 2.5 Pro	0,862	1 000	143	1,25 $/10 $	Proprietar
Claude 4 Sonnet Thinking	0,842	200	60,9	3 $/15 $	Proprietar

Alternative open‑source: gpt‑oss, Mixtral și Qwen3

Deși GPT-5 stabilește un nou standard de performanță, modelele open‑source sunt
din ce în ce mai competitive și democratizează accesul la AI. gpt‑oss‑20B și
gpt‑oss‑120B sunt primele modele open‑weight lansate de OpenAI; ele folosesc
structura mixture‑of‑experts cu doar 3,6 B, respectiv 5,1 B parametri
activi per token, pot rula pe laptopuri cu 16 GB RAM și ajung aproape de
performanța modelului propriu o4‑mini. Prețurile extrem de
reduse le fac atractive pentru dezvoltatorii care doresc să dețină control deplin
asupra datelor și codului.

Printre cele mai performante modele open‑source se numără
Mixtral 8×22B de la Mistral AI, o arhitectură cu 141 B parametri totali
din care doar 39 B sunt activi, ce oferă o fereastră de context de 64 k tokeni
și suport pentru mai multe limbi europene. Modelul este
optimizat pentru matematică și programare și este licențiat sub Apache 2.0.

Un alt proiect remarcabil este Qwen3, care include două modele
mixture‑of‑experts (235 B/22 B și 30 B/3 B) și mai multe modele dense.
Acestea oferă ferestre de context de 32 k sau 128 k tokeni și permit
alternarea între modurile de gândire și non‑gândire pentru controlul bugetului de
raționament. Qwen3 suportă 119 limbi
și are un set de date de antrenare de aproximativ 36 trilioane de tokeni,
fiind distribuit sub licență Apache 2.0.

Concluzie

GPT-5 reprezintă o nouă etapă în evoluția chatboților, combinând ferestre de
context vaste, reducerea halucinațiilor și integrarea cu aplicații utile pentru a
livra răspunsuri mai fiabile și mai relevante. Prin sistemul său unificat, OpenAI
permite adaptarea dinamică a resurselor în funcție de complexitatea întrebărilor,
iar versiunile Mini și Nano democratizează accesul la capabilități avansate prin
costuri reduse. Cu toate acestea, comunitatea open‑source răspunde rapid prin
modele precum gpt‑oss, Mixtral și Qwen3, care oferă performanțe impresionante
la prețuri mici sau gratuit și permit utilizatorilor să-și păstreze controlul
asupra datelor. Astfel, în timp ce GPT-5 stabilește un nou nivel de performanță,
concurența deschisă promite o diversitate de opțiuni pentru dezvoltatori și
întreprinderi.

Sistem unificat: bază rapidă, gândire profundă și router în timp real

Capacități îmbunătățite și ferestre de context mari

Scriere, codare și raționament multimodal

Funcții noi: personalități presetate și integrare cu aplicații

Structură de prețuri și disponibilitate

Tabel comparativ cu alte modele

Alternative open‑source: gpt‑oss, Mixtral și Qwen3

Concluzie

Related Posts