De ce contextul One Million Token al Gemini 1.5 este un schimbător de joc

Cuprins

Recomandări cheie

Google Gemini 1.5 introduce o fereastră de context de un milion de simboluri, depășind concurenți precum Claude și ChatGPT.
O fereastră de context mai mare îmbunătățește performanța unui model AI și reduce erorile, dar este posibil să nu garanteze succesul general.
Fereastra de context mai mare a Gemini 1.5 ar putea îmbunătăți considerabil acuratețea, reduce erorile și poate îmbunătăți înțelegerea.

Google Gemini 1.5 vine acum cu o fereastră de context uriașă de un milion de token, depășind concurența directă în ChatGPT, Claude și alți chatbot AI.

Sună ca o actualizare masivă și i-ar putea deosebi pe Gemeni. Este puțin dificil să-i înțelegi întreaga amploare, dar fereastra enormă de context a Gemenii ar putea schimba jocul.

Ce este o fereastră de context?

În timp ce răspund la întrebările dvs., cum ar fi explicarea unui concept sau rezumatul unui text, modelele AI au o limită asupra numărului de date pe care le pot lua în considerare pentru a genera un răspuns. Limita dimensiunii textului pe care o poate lua în considerare se numește fereastră de context.

Iată un alt mod de a-l privi. Să presupunem că mergi la un magazin alimentar pentru a obține alimente fără lista de cumpărături. Limita câte produse alimentare vă amintiți când faceți cumpărături este fereastra de context. Cu cât vă amintiți mai multe produse alimentare, cu atât sunt mai mari șansele de a nu vă da peste cap planurile de cumpărături. În mod similar, cu cât fereastra de context a unui model AI este mai mare, cu atât sunt mai mari șansele ca modelul să-și amintească tot ceea ce are nevoie pentru a vă oferi cele mai bune rezultate.

9 site-uri pentru a găsi muzică fără drepturi de autor pentru videoclipurile dvs

La momentul redactării acestui articol, fereastra de context de 200.000 a lui Anthropic Claude 2.1 este cea mai mare fereastră de context dintre orice model AI disponibil în general. Acesta este urmat de GPT-4 Turbo cu o fereastră de context de 128k. Google Gemini 1.5 aduce o fereastră de context de un milion, de patru ori mai mare decât orice pe piață. Acest lucru duce la marea întrebare: care este marea problemă cu o fereastră de context de un milion de simboluri?

De ce fereastra de context a Gemini 1.5 este o mare problemă

Smartmockup-uri

Pentru a o pune într-o perspectivă mai clară, fereastra de context de 200.000 a lui Claude AI înseamnă că poate digera o carte de aproximativ 150.000 de cuvinte și poate oferi răspunsuri la aceasta. Asta e masiv. Dar Gemini 1.5 de la Google ar putea digera 700.000 de cuvinte dintr-o dată!

Când introduceți un bloc de text mare în chatbot-uri AI precum ChatGPT sau Gemini, acesta încearcă să digere cât mai mult text posibil, dar cât de mult poate digera depinde de fereastra sa de context. Deci, dacă aveți o conversație care se desfășoară în 100.000 de cuvinte pe un model care poate gestiona doar 28.000 și apoi începeți să puneți întrebări care necesită cunoștințe complete despre întreaga conversație de 100.000 de cuvinte, o configurați pentru a eșua.

Imaginați-vă că vizionați doar 20 de minute dintr-un film de o oră, dar vi se cere să explicați întregul film. Cât de bune ar fi rezultatele tale? Fie refuzi să răspunzi, fie pur și simplu inventezi lucruri, ceea ce este exact ceea ce ar face un chatbot AI, ceea ce duce la halucinații AI.

Construiește-ți propriul Mini PaaS cu aceste 7 software-uri

Acum, dacă te gândești că nu ai fost niciodată nevoit să introduci 100.000 de cuvinte într-un chatbot, asta nu este toată considerația. Fereastra de context transcende doar textul pe care îl alimentați unui model AI într-o singură solicitare. Modelele AI iau în considerare întreaga conversație pe care ați avut-o în timpul unei sesiuni de chat pentru a vă asigura că răspunsurile lor sunt cât mai relevante posibil.

Deci, chiar dacă nu îi hrăniți o carte de 100.000 de cuvinte, conversațiile dvs. dus-întors și răspunsurile pe care le oferă, toate se adaugă la calculul ferestrei de context. Te întrebi de ce ChatGPT sau Gemenii de la Google continuă să uite lucrurile pe care le-ai spus mai devreme într-o conversație? Probabil că a rămas fără spațiu în fereastră de context și a început să uite lucruri.

O fereastră de context mai mare este deosebit de importantă pentru sarcinile care necesită o înțelegere profundă a contextului, cum ar fi rezumarea articolelor lungi, răspunsul la întrebări complexe sau menținerea unei narațiuni coerente în textul generat. Vrei să scrii un roman de 50.000 de cuvinte care să aibă o narațiune consistentă? Doriți un model care să poată „viziona” și să răspundă la întrebări pe un fișier video de o oră? Ai nevoie de o fereastră de context mai mare!

Pe scurt, fereastra de context mai mare a Gemini 1.5 poate îmbunătăți semnificativ performanța modelului său AI, reducând halucinațiile și crescând semnificativ acuratețea și capacitatea de a urma mai bine instrucțiunile.

Va fi Gemini 1.5 la înălțimea așteptărilor?

Dacă totul decurge conform planului, Gemini 1.5 ar putea depăși cele mai bune modele AI de pe piață. Cu toate acestea, având în vedere numeroasele eșecuri ale Google în construirea unui model AI stabil, este important să greșim prudență. Creșterea ferestrei de context a unui model nu face automat modelul mai bun.

Cele mai bune imprimante wireless

Am folosit fereastra de context de 200.000 a lui Claude 2.1 de luni de zile de la lansare și un lucru este clar pentru mine — o fereastră de context mai mare poate într-adevăr îmbunătăți sensibilitatea contextului, dar problemele cu performanța modelului de bază pot face ca contextul mai mare să fie o problemă a acestuia. proprii.

Google Gemini 1.5 ne va oferi un schimbător de joc? Rețelele sociale sunt în prezent pline de recenzii strălucitoare despre Gemini 1.5 de la utilizatorii cu acces timpuriu. Cu toate acestea, majoritatea recenziilor de 5 stele provin din cazuri de utilizare grăbite sau simplificate. Un loc bun pentru a verifica cum ar funcționa Gemini 1.5 în sălbăticie este în interiorul Google Raport tehnic Gemini 1.5 [PDF]. Raportul arată că, chiar și în timpul „testării controlate”, modelul nu a putut prelua toate detaliile minuscule ale documentelor în limitele dimensiunii ferestrei sale de context.

O fereastră de context de un milion de simboluri este într-adevăr o performanță tehnică impresionantă, dar fără a putea prelua detaliile unui document în mod fiabil, atunci o fereastră de context mai mare are o valoare practică mică și ar putea chiar deveni o cauză a scăderii acurateții și a halucinațiilor.