ChatGPT-4 vs ChatGPT-3.5 Implicit vs. ChatGPT-3.5 Legacy: Diferențele testate

Se așteaptă ca ChatGPT 4.0 să facă valuri mari în universul chatbot. Dar este cu adevărat superior predecesorului său? Să verificăm.

ChatGPT a fost doar vârful viitorului aisberg al automatizării, Google, Microsoft și multe alte companii care au început AI-ul urmând exemplul.

Pentru început, am găsit câțiva chatboți precum ChatGPT, dintre care mulți nu aparțin tehnologiei mari.

Dar numiți-o puterea marketingului; ChatGPT este încă regele domnitor al tuturor astfel de roboți AI. Poate face multe lucruri, inclusiv matematică, poezie și postări pe blog, iar oamenii chiar folosesc acest lucru pentru a depune procese.

DoNotPay lucrează la utilizarea GPT-4 pentru a genera „procese cu un singur clic” pentru a da în judecată robocallers pentru 1.500 USD. Imaginați-vă că primiți un apel, faceți clic pe un buton, apelul este transcris și este generat un proces de 1.000 de cuvinte. GPT-3.5 nu a fost suficient de bun, dar GPT-4 se descurcă extrem de bine: pic.twitter.com/gplf79kaqG

– Joshua Browder (@jbrowder1) 14 martie 2023

Are zeci de profesioniști care își fac griji că setul lor de abilități va fi inutil în viitorul apropiat.

Cu toate acestea, am citit o postare Linkedin care spunea:

AI nu te va înlocui, dar o persoană care folosește AI poate.

Așadar, ținând degetele încrucișate, să fim educați despre cea mai recentă actualizare ChatGPT și să vedem cum diferă de versiunile sale anterioare.

ChatGPT: Moștenire, Implicit și Actualizare

Deci, există trei versiuni disponibile pentru utilizatorii plătiți: Legacy (3.5), Default (3.5) și recenta actualizare ChatGPT (4).

Deși vom aprofunda puțin despre capacitățile lor, iată ce are de spus OpenAI despre diferențe:

Sursa: OpenAI

Deci, în timp ce utilizatorii gratuiti au doar Legacy 3.5 cu care să se joace, abonamentul premium le oferă pe toate trei pentru a încerca și a se mulțumi cu ceea ce utilizatorii cred că este cel mai bun.

Pentru a rezuma imaginea precedentă, planurile plătite vizează obținerea de rezultate mai precise la o viteză decentă. Cu toate acestea, distincțiile sunt evidente doar dacă indicațiile sunt complicate și necesită creativitate.

ParametruChatGPT 4ChatGPT 3,5Bar Scor examen Top 10%Bottom 10%AI2 Reasoning Challenge (ARC)96.3%85.2%Python Coding Score67%48.1%Visual InterpretationDaNuContextPeste 25k cuvinteLessSursa: OpenAI

În plus, ChatGPT 4 poate accepta intrări vizuale.

Ei bine, destule definiții din manuale. Să ne murdărim mâinile și să evaluăm acești candidați pe câmpul de luptă din viața reală.

Secțiunile ulterioare sunt pline de imagini care pot părea neclare. Într-un astfel de caz, faceți clic dreapta pe orice imagine și selectați Deschideți într-o filă nouă pentru a vizualiza corect.

Matematică

Fiind absolvent de inginerie, nu mă pot abține să le arunc niște probleme de bază. Să începem ușor cu ecuațiile algebrice.

  Cum să remediați tabelele corupte în MySQL

Etapa I

Mulți dintre noi am văzut aceste ecuații ax2+bx+c=0, unde trebuie să rezolvăm pentru X. Aici, am dat acest prompt simplu, Rezolvare pentru x: x2 + x – 6 = 0

În timp ce toate au avut aceleași rădăcini (X= -3,2), Legacy și Update au fost mai asemănătoare în utilizarea formulei în mod direct (cum va face orice student) pentru a afla rezultatul.

Cu toate acestea, versiunea implicită 3.5 a explicat două metode, inclusiv factorizarea, pe care, în mod normal, orice student calificat le folosește atunci când i se oferă astfel de ecuații banale.

Etapa II

Apoi, îi solicit să rezolve o ecuație cubică ușor complexă: x^3 -12x^2 + 48x – 64 = 0.

Acest lucru a dovedit cu adevărat de ce ChatGPT 4 este „actualizarea”.

Iată răspunsurile:

Toată această exagerare și ChatGPT Legacy și Default nu au putut rezolva o ecuație cubică generică. Cu toate acestea, Legacy s-a descurcat puțin mai bine și a găsit două rădăcini corect, în timp ce Default a eșuat cu toate.

Actualizarea a fost câștigătorul clar în etapa a doua și a rezolvat perfect ecuația, găsind toate cele trei rădăcini cu o explicație frumoasă.

Raționament logic

Putem presupune cu siguranță că majoritatea problemelor elementare de matematică au soluții de dicționar. Dacă cunoașteți teorema sau formula, introduceți valorile și obțineți rezultatele.

Iar ChatGPT, fiind AI, poate rezolva rapid astfel de interogări. Cu toate acestea, raționamentul logic este un teritoriu diferit, cu șanse mari ca IA să cadă.

Etapa I

Le-am dat clasicul:

A este mai vechi decât B.
C este mai vechi decât A.
B este mai vechi decât C.
Este a treia afirmație adevărată sau falsă dacă primele două afirmații sunt adevărate?

Și toate versiunile ChatGPT au afirmat corect că a treia afirmație este falsă.

Apoi, am folosit nume în locul alfabetului, iar rezultatele s-ar putea să vă surprindă:

Deci, Default 3.5 și-a continuat performanța sub normală și a fost confundat cu această variantă modestă. Totuși, Legacy și Update au funcționat optim.

Etapa II

S-ar putea să fi observat până acum scopul acestei etape I și a II-a este de a găsi punctul de diferență, în care complexitatea unui prompt dat deosebește Actualizarea de celelalte două.

Aici, promptul a fost un simplu puzzle logic:

Într-o dimineață după răsăritul soarelui, Rohit stătea cu fața unui stâlp. Umbra stâlpului căzu exact în dreapta lui. În ce direcție se îndrepta?
A. Nord
b. Vest
c. Sud
d. Est

Acesta l-a împins pe Legacy să dea un răspuns inexact, în timp ce Default a răspuns cu clarificări vagi ducând la o concluzie greșită.

Doar Actualizarea a strălucit cu răspunsul corect, cu afirmații ușor de urmărit.

Scrisori

Depunerea de procese poate fi dificilă, dar uneori nu se ajunge la asta dacă poți redacta o primă notificare izbitoare.

Iată, am mers cu această solicitare: scrie o scrisoare lui Tim cook pentru a-mi preda măr pentru că nu am răspuns la unul dintre tweet-urile mele.

  Realitate augmentată (AR): tendințe, cadre și instrumente

Amuzant, da! Dar să vedem ce poate face AI din asta.

Legacy 3.5 a primit imediat promptul ca un robo-slav și a scos o scrisoare care poate face din mine un excelent subiect de batjocură dacă a ajuns vreodată la destinația dorită.

Nici Default nu a fost bun. Totuși, m-a închis așa cum i-ar face un bătrân morocănos unui copil de cinci ani.

În timp ce argumentele prezentate au fost precise, acest lucru a încheiat distracția chiar acolo cu puțină învățare.

Deși acesta a fost un prompt destul de simplu, a avut nevoie de puțină gândire și creativitate. Și aici și-a prezentat cazul fratele mai mare, Update:

În primul rând, aceasta a fost redactată aproape perfect. În al doilea rând, mi-a salvat o căutare pe Google pentru adresa sediului Apple (deși ar trebui să verificăm astfel de intrări).

În al treilea rând, a fost scris frumos, cu un ton oficial și o notă plină de umor. În plus, intenția era clară în rândul subiectului în sine.

Și totuși, scrisoarea a transmis sentimentul unui fan Apple nemulțumit.

Deci, acest lucru face ChatGPT cu 4 (aka Actualizarea) mile înaintea vechilor săi veri. Este înfricoșător de inteligent și are câteva semne de bun simț, ceea ce îl face mai mult decât un chatbot plictisitor.

Poezie

Odată cu lansarea ChatGPT, poezia, m-am gândit, ar putea fi punctul ei slab.

La urma urmei, este nevoie de emoții, creativitate și mult efort pentru ca un om să creeze ceva care rezonează cu adevărat cu cititorii săi.

Mai simplu spus, poezia este artă în cea mai bună formă și mi-am dorit în secret ca AI să eșueze. Dar asta s-a întâmplat înainte ca colegul meu de muncă să ne lovească puternic pe toți în canalul Slack al tipstrick.ro cu o creație ChatGPT care a fost înainte de această actualizare 4.0.

Etapa I

Iată promptul pe care l-am dat candidaților noștri: „exprimați poetic de ce sau de ce nu servirea burgerilor, împreună cu meniul lor actual, poate beneficia lanțul de pizza dominos. Păstrează-l mai puțin de 100 de cuvinte.”

Poți observa diferența?

Versiunea implicită a fost una ultra-scurtă, de doar 32 de cuvinte și nu a putut utiliza lățimea de bandă disponibilă pentru a-și prezenta creativitatea.

The Legacy, deși a folosit maximul de cuvinte dintre cele trei, concluzionează că efortul de a servi pizza alături nu este riscant și va avea ca rezultat un succes sigur în orice caz, ceea ce nu este în întregime adevărat.

Poezia Actualizarii a fost de doar 53 de cuvinte, irosind aproape jumătate din numărul de cuvinte alocat. Totuși, a fost clar despre recompense și potențiale capcane și nu a putut ajunge la niciun rezultat, care este, cred, mai uman decât restul.

Etapa II

Apoi, le-am rugat pe toți să „explice poezia unui copil de cinci ani”.

Interesant, Legacy nu a putut lua contextul conversației și a explicat „Poezia” la propriu. Implicit a luat contextul și l-a rezumat într-un paragraf care este încă decent.

  Duceți cercetarea la următorul nivel cu Atlas.ti

Continuând tendința, ChatGPT 4 și-a simplificat creativitatea, păstrând în același timp aroma poetică vie.

ChatGPT Premium vs. ChatGPT gratuit

Gratuit, fiind gratuit, nu are viteză și acuratețe și nu se potrivește cu ChatGPT 4, dar nici nu este complet inutil.

Pentru a-l compara pe un teren egal, i-am trimis aceleași solicitări cu care am testat Legacy, Default și Update.

🔵 Matematică: a rezolvat ecuațiile pătratice, dar a dat răspunsuri greșite pentru cubic. (cum ar fi Legacy și Default)

🔵 Raționament logic: a trecut prima etapă cu alfabete și nume, dar a eșuat cu a doua (cum ar fi Legacy).

🔵 Scrisori: Nu am scris scrisoarea și am considerat promptul neetic și nepotrivit. (ca implicit)

🔵 Poezie: a generat poezie în peste 30 de cuvinte și a explicat-o decent. (similar cu implicit).

Deci, putem concluziona că nici versiunea gratuită nu este rea. De fapt, este la egalitate cu Default 3.5 și chiar mai bine în unele aspecte.

Citește și: Îndemnuri puternice pentru a-ți îmbunătăți experiența ChatGPT

Calea de urmat

Zvonurile despre AI care înlocuiește locurile de muncă în viitor nu sunt complet greșite.

În primul rând, automatizarea a făcut acest lucru în industria de producție, iar acum își întinde aripi peste tot.

Personal, este mult mai rapid decât mine în rezolvarea ecuațiilor cubice, în crearea de poezii sau în scris scrisori. Cu toate acestea, faptul că rareori spune NU unui prompt și cu greu învață din greșelile sale se îndreaptă spre noi, oamenii.

Pentru a reitera, AI nu ne va înlocui, dar cineva care folosește AI poate.

Aici, la tipstrick.ro, echipa noastră de marketing folosește ChatGPT în moduri interesante. De exemplu, recent am atins pragul de 100 de milioane de vizionări, iar CEO-ul nostru s-a gândit să-l returneze publicului printr-un giveaway.

Și bănuiesc că băieții din marketing aveau nevoie de un titlu pentru a atrage atenția cititorului. Deci, au dat o solicitare și au cerut ChatGPT să sugereze câteva variante, precum aceasta:

În plus, îl folosim pentru rezumarea conținutului, verificarea gramaticii, sugerarea de titluri pentru articole noi și altele.

În concluzie, există multe modalități de a beneficia și de a avansa în fața stereotipurilor care văd AI ca pe o gunoială inutilă.

Singurul lucru de reținut este că trebuie să existe cineva (uman) care să judece munca AI, deoarece poate fi (grosnic) inexactă și înșelătoare.

Actualizarea este cu adevărat ceva!

În scurta mea întâlnire, ChatGPT 4 s-a simțit mai creativ, înțelegător și realist. Totuși, aceasta este o mașină și poate oferi răspunsuri greșite cu încredere.

Dar ceea ce este uimitor este nivelul de upgrade pe care OpenAI l-a făcut acestui proiect în doar câteva luni.

Și abia aștept să văd magia cu care următoarea actualizare ne poate deruta!

PS: Nu doar o fereastră de chat; valorifică-și puterea cu aceste cele mai bune extensii ChatGPT Chrome. Și te-ai gândit vreodată să integrezi ChatGPT cu Siri?