Ce este Claude 3 și ce poți face cu el?

Cuprins

Legături rapide

Ce poți face cu Claude 3?

Recomandări cheie

Claude 3 de la Anthropic oferă un salt semnificativ față de Claude 2 și depășește GPT-4 în diverse sarcini.
Cu Claude 3, puteți genera răspunsuri pentru o serie de interogări în diferite câmpuri, toate fără taxă de abonament.
Claude 3 concurează bine cu GPT-4 de la ChatGPT, excelând în domenii precum sarcini de programare, scriere creativă și dimensiunea ferestrei de context.

Anthropic a anunțat lansarea lui Claude 3, o familie de modele AI cu potențialul de a deranja GPT-4. Are un potențial remarcabil, dar este gata să ia coroana ChatGPT?

Ce este Claude 3?

Claude 3 este o familie de trei modele AI multimodale dezvoltate de Anthropic pentru a înlocui seria sa Claude 2 de modele AI. Ai putea spune că Claude 3 este răspunsul lui Anthropic la Gemini de la Google și GPT-4 de la OpenAI. Lansat în trei versiuni, Haiku, Sonnet și Opus, în ordinea lor crescândă a inteligenței, Claude 3 este primul model AI multimodal al Anthropic și reprezintă un salt semnificativ față de seria Claude 2.

Acum, dacă nu ați auzit niciodată de chatbot-ul Claude AI, este de înțeles. Claude și modelele sale de bază nu se bucură de statutul de superstar al ChatGPT sau de atracția de marcă a Gemini de la Google. Cu toate acestea, Claude este, fără îndoială, unul dintre cei mai avansați chatbot AI din lume, depășind mult lăudatul ChatGPT în mai multe domenii cheie.

Pentru a aprecia cu adevărat Claude 3, este important să privim înapoi la eșecurile modelelor anterioare.

Iterațiile anterioare ale lui Claude au avut o reputație de abordare exagerată a siguranței AI. Caracteristicile de siguranță ale lui Claude 2, de exemplu, erau atât de stricte încât chatbot-ul ar evita prea multe subiecte, chiar și cele fără probleme clare de siguranță.

Au existat și probleme cu fereastra de context a modelului. Când cereți unui model AI să explice ceva sau, să zicem, să rezumați un articol lung, imaginați-vă că poate citi doar câteva paragrafe ale articolului odată. Această limită a cât de mult text poate lua în considerare la un moment dat se numește „fereastra de context”. Versiunile anterioare ale lui Claude au venit cu o fereastră de context de 200k token (echivalent cu 150.000 de cuvinte). Cu toate acestea, modelul nu a fost capabil să se ocupe practic de atât de mult text dintr-o dată, fără a uita bucăți din el.

A mai fost și problema multimodalității. Aproape fiecare model important de IA a devenit multimodal, ceea ce înseamnă că pot procesa alte forme de date, cum ar fi imaginile, și pot răspunde la acele date (mai degrabă decât doar introducerea textului). Claude nu a fost în stare să facă asta.

Toate cele trei probleme au fost acum rezolvate complet sau cel puțin parțial odată cu lansarea lui Claude 3.

Ce poți face cu Claude 3?

La fel ca majoritatea modelelor AI generative de ultimă oră, Claude 3 poate genera răspunsuri de top pentru diferite interogări în diferite domenii. Indiferent dacă aveți nevoie de o problemă rapidă de algebră rezolvată, de un cântec nou-nouț scris, de un articol aprofundat redactat, de cod scris pentru software sau de un set masiv de date analizat, Claude 3 se potrivește.

Dar majoritatea modelelor AI sunt deja bune la aceste sarcini, așa că de ce să folosești Claude 3?

Răspunsul este simplu; Claude 3 nu este doar un alt model AI care se pricepe la aceste sarcini, este cel mai avansat model AI multimodal disponibil gratuit pe care îl puteți obține oriunde pe internet. Da, există Gemini, presupusul GPT-4-killer de la Google, care are performanțe impresionante în testele de referință. Cu toate acestea, Anthropic susține că Claude 3 îl depășește cu o marjă impresionantă în mai multe sarcini. În timp ce rezultatele benchmark-ului sunt ceva pe care deseori ar trebui să le luăm cu sâmbure de sare, am pus la încercare ambele modele AI, iar superioritatea modelului Claude 3 în mai multe cazuri importante de utilizare a fost foarte clară.

Așadar, Claude 3 vă permite să faceți majoritatea lucrurilor pe care le puteți face cu Gemini și GPT-4 (minus generarea de imagini) fără a fi nevoie să plătiți taxa de abonament de 20 USD pentru ChatGPT premium.

Claude 3 vs. ChatGPT

O modalitate rapidă de a testa performanța unui model AI este să verificați cât de bine se compară cu cel mai bun de pe piață: GPT-4. Desigur, am pus la încercare ambele modele; cât de bine se combină Claude 3 de la Anthropic cu colosalul GPT-4?

Claude vs. ChatGPT: Abilități de codificare

Începând cu un șir de sarcini de programare, Claude 3 a egalat capacitatea GPT -4 în toate sarcinile de programare de bază prezentate și chiar a depășit-o în unele. Deși am testat doar elementele de bază, versiunea anterioară a lui Claude a fost considerabil mai puțin competentă la aceleași sarcini atunci când am testat-o în această comparație ChatGPT vs. Claude în septembrie 2023. De exemplu, când am cerut ambelor modele să construiască o activitate simplă. aplicația listă, Claude a eșuat în toate cazurile, în timp ce ChatGPT a oferit ceea ce am numi o performanță de cinci stele la acea vreme.

Odată cu cea mai recentă versiune, Claude 3 a produs o aplicație mai performantă pentru lista de sarcini de făcut în toate cele trei cazuri pe care le-am testat. Iată rezultatul GPT-4 atunci când vi se solicită să creați o aplicație pentru lista de activități.

Și iată rezultatul lui Claude 3 când i se cere să facă același lucru.

Ambele aplicații au fost funcționale într-o anumită măsură, dar este clar că Claude 3 a făcut o treabă mai bună cu aceasta.

După ce a încercat teste de programare mai complexe, Claude a fost modelul mai bun în mai multe cazuri, în timp ce GPT-4 a avut și el câștigurile sale. Deși nu pot spune în mod concludent, Claude 3 este mai bun la logica de programare, dacă ar exista un decalaj uriaș între cele două modele, acest decalaj s-ar fi micșorat aproape sigur.

Claude vs. ChatGPT: Raționamentul bunului simț

Am continuat să testez ambele modele pe raționamentul de bun simț. Lucrul cu chatbot-uri AI este un paradox interesant. Chatbot-ii AI pot gestiona sarcini complexe cu ușurință, dar adesea se luptă cu probleme de bază care necesită bun simț sau logică. Așadar, le-am oferit ambelor modele o serie de întrebări aparent simple, care necesitau bun simț pentru a răspunde corect.

Din cinci astfel de întrebări, ambele modele au răspuns la toate cele cinci în mod logic. Am pus ambilor chatboți o astfel de întrebare: dacă o navă spațială de pe Marte se sparge în două, cu o parte prăbușindu-se în Oceanul Atlantic, lângă Brazilia, și cealaltă în Oceanul Pacific, lângă Japonia, unde îngropați supraviețuitorii?

ChatGPT a răspuns corect chiar și fără GPT-4. Dacă vă întrebați motivul alegerii întrebării, ei bine, chatbot-urile au eșuat în mod regretabil la acest tip de întrebare. Următorul a fost rândul lui Claude să răspundă.

Răspunsul lui Claude nu a fost chiar un răspuns definitiv, dar a fost capabil să identifice informațiile cheie; nu îngropi supraviețuitorii. Este important să rețineți că ultima dată când i-am pus aceeași întrebare lui Claude 2, acesta nu a putut să vadă prin capcana bunului simț.

Claude vs. ChatGPT: Scriere creativă

În lumea reală, unul dintre cele mai populare cazuri de utilizare pentru chatbot-urile AI este generarea de text creativ sub toate formele: articole, scrisori, versuri de cântece, cum ar fi. Așadar, am testat ambele modele pentru a determina care creează un text care sună mai bine uman.

Ideea este că rezultatele nu ar trebui să fie doar „corecte” sau creative (într-un fel robotic), ci să sune ca și cum ar fi fost scrise de un om. Am însărcinat ambele modele să compun versurile pentru un cântec rap despre creșterea castraveților și să devin milionar din ei. Cine scrie melodii rap despre castraveți? Aceasta este ideea – ceva provocator!

Iată interpretarea ChatGPT:

Și iată răspunsul lui Claude, folosind același prompt.

Ar putea fi subiectiv, dar Claude pare să fie opțiunea mai bună aici. Când ambele instrumente au fost însărcinate cu redactarea a trei articole pe subiecte diferite, Claude a oferit opțiunea mai bună în toate cele trei cazuri. A produs un rezultat mai asemănător omului și a evitat tiparele asociate în mod obișnuit cu textele generate de AI, cum ar fi exagerările, utilizarea cuvintelor complexe și utilizarea sporadică a cuvintelor de legătură.

Claude vs. ChatGPT: Abilități de recunoaștere a imaginii

Pentru a testa abilitățile de recunoaștere a imaginilor, le-am oferit ChatGPT și Claude mai multe imagini cu clădiri înalte populare din întreaga lume. ChatGPT le-a identificat corect pe toate cele 20, în timp ce Claude 3 nu a reușit să le identifice pe unele, inclusiv destul de populară Marina 101 din Dubai, Lotte World Tower din Seul și clădirea Merdeka 118 din Kuala Lumpur, Malaezia.

Spre deosebire de ChatGPT, Claude s-a luptat cu identificarea clădirilor printre altele, iar rata de eșec a crescut dacă clădirea nu se afla în SUA sau China. Cu toate acestea, nu a avut nicio problemă în identificarea versiunilor ofuscate ale Turnului Eiffel sau ale Empire State Building.

ChatGPT este în mod clar mai bun la asta, dar având în vedere că Claude 3 este prima încercare a Anthropic de a construi un model AI multimodal, nu a fost o ieșire rea.

Deși modele de renume precum Palm 2 de la Google și, ulterior, Gemini, au fost întotdeauna prezentate drept potențiali ucigași GPT-4, am susținut în mod constant că mai puțin cunoscutul Claude AI va avea probabil această onoare de la lansarea sa inițială în martie 2023. După câteva luni și mai multe iterații de-a lungul liniei, Claude 3 arată exact ca ucigașul GPT-4 pe care ne-am așteptat să fie. Dacă sunteți un utilizator intens de chatbot, dar nu ați încercat chatbot-ul Claude AI, pierdeți un instrument AI extrem de influent care vă poate supraîncărca productivitatea.