03/28/2024

Ghid complet pentru a detecta plagiatul AI Chatbot

Chatboții AI precum ChatGPT nu se limitează doar la a vă răspunde la întrebări. Ei pot scrie e-mailuri asemănătoare oamenilor, scrisori de intenție, eseuri, poezii, postări pe blog și multe altele.

Scrisul AI este ca un cameleon – se poate combina cu orice alt tip de scriere atât de bine încât ai fi greu să faci diferența.

Din păcate, acest lucru ne face incredibil de dificil pentru noi, oamenii, să detectăm când un AI a scris ceva în loc de o persoană. Sigur, am putea să luăm cu toții sfatul lui Sherlock Holmes și să „eliminăm imposibilul”, dar cine are timp pentru asta?

Dacă vă spun că paragraful de mai sus este scris de un AI? Da, i-am cerut YouWrite să scrie o introducere rapidă pentru această postare, care este ceea ce a venit. Destul de convingător nu? Asta e problema, e prea convingător că oricine o poate prezenta ca pe propria sa lucrare pentru a beneficia de ea.

AI nu doar reformulează conținutul; ei învață subiectul și îl prezintă într-un limbaj natural folosind RLHF. Aceasta înseamnă că conținutul generat nu se va simți robotizat de citit și nici nu poate fi comparat cu datele disponibile online pentru a detecta plagiatul.

Prinderea conținutului generat de inteligență artificială nu este ușoară și nu vă voi oferi speranțe false că îl puteți surprinde cu o acuratețe de 100%. Cu toate acestea, cu puțină muncă de detectiv și puțin ajutor din partea instrumentelor de detectare a scrierii AI, puteți surprinde majoritatea lucrărilor AI.

Mai jos veți găsi modalități manuale de a detecta plagiatul AI și unele instrumente automate.

Detectați manual plagiatul AI 🕵️

ChatGPT nici măcar nu este o mare problemă când vine vorba de plagiatul AI. Există multe instrumente alternative care se bazează pe aceeași tehnologie GPT-3 și sunt construite pentru scriere. Acestea sunt foarte avansate și special concepute pentru a crea conținut asemănător omului care este greu de prins.

Instrumentele de detectare automată sunt puțin lovite sau greșite, în funcție de tipul, lungimea și complexitatea conținutului. Deci, cel puțin în prezent, conectarea manuală a punctelor pentru a ne da seama dacă textul este generat sau nu de AI este cea mai bună modalitate.

Mai jos am enumerat câteva indicii comune pe care le puteți căuta pentru a captura conținut generat de AI.

#1. Informații învechite

ChatGPT și alte IA bazate pe GPT-3 și-au redus cunoștințele la sfârșitul anului 2021. Chiar dacă unii roboți AI au un motor de căutare încorporat pentru a căuta cele mai recente informații, ei încă se bazează pe date vechi pentru a scrie conținut lung, cum ar fi eseuri sau postări pe blog.

  Cum să personalizați gesturile de glisare pe Gmail

Dacă observați că articolul vorbește în mod constant despre date învechite, în special înainte de 2021, atunci ar putea fi generat de AI.

În captura de ecran de mai jos, l-am rugat pe YouWrite să-mi vorbească despre recenta Cupă Mondială FIFA și asta a venit.

Vorbește despre Cupa Mondială 2018 în loc de cea recentă din 2022. Chiar dacă instrumentul este actualizat pentru a vorbi despre evenimente recente precum Cupa Mondială din 2022, pentru a scrie postări lungi, încă folosește datele învechite pe care este construit.

#2. Folosește aceeași structură de propoziție pentru descrieri

În timp ce scrie descrieri ale mai multor produse/aplicații, AI folosește de obicei aceeași structură de propoziții pe care o editează pentru a se potrivi cu descrierea unui produs. Descrierile încep de obicei cu același cuvânt, cum ar fi The, It, A sau numele produsului. Descrierile au, de asemenea, un focus dedicat pe care îl repetă.

De exemplu, mai jos, am cerut ChatGPT să-mi spună despre „site-uri web de locuri de muncă pentru introducerea datelor”. Puteți vedea că toate descrierile încep cu „A” și au un accent strict.

Am pus și YouChat aceeași întrebare și a făcut același lucru și a repetat numele fiecărui site web la început, iar descrierile în sine arată ca o versiune reformulată a fiecăruia.

Dacă textul pe care îl analizați are o descriere a ceva similar în natură, este o modalitate excelentă de a surprinde scrisul AI.

#3. Folosește propoziții scurte

Pentru majoritatea scrierilor, AI va folosi propoziții cu o singură linie, cu o singură virgulă cel mult. Poate că încearcă să minimizeze șansele de eroare, dar evită să scrie propoziții lungi care ar putea necesita utilizarea de două puncte, punct și virgulă sau linii orizontale grele.

Știu că acesta nu este cel mai bun indiciu pentru a prinde AI scris, dar merită luat în considerare pentru a-ți demonstra suspiciunea.

#4. Poate oferi informații incorecte

Pentru întrebările complexe care implică de obicei un fel de instrucție, AI poate să nu înțeleagă intenția și să furnizeze informații incorecte. Nu vorbesc aici despre informații învechite, ci doar îți spun cu încredere informații greșite atunci când nu înțeleg subiectul.

De exemplu, i-am cerut YouWrite să-mi spună „cum să rootez un telefon Android fără PC”. Încă mi-a arătat metode care implică utilizarea unui PC la un moment dat în instruire.

#5. Nu adaugă o opinie personală

Când vorbești despre ceva, AI vorbește doar despre fapte cunoscute. Spre deosebire de oameni, nu va vorbi despre experiența sa personală cu el. Deși AI-urile pot fi instruite să creeze un text practic, ei tind să evite să o facă în mod implicit.

Dacă observați că articolul vorbește doar despre fapte cunoscute, este o șansă bună să fie scris de un AI. De exemplu, în timp ce vorbește despre o aplicație, aceasta va vorbi despre caracteristicile acesteia în loc de cât de fluidă este navigarea sau despre cum să folosești aplicația.

  10 resurse bune pentru a învăța Blockchain și pentru a obține certificare

#6. Scurte explicații

Deoarece IA sunt limitate de cunoștințele disponibile în prezent, ele tind să scrie explicații și descrieri scurte. Din experiența mea, dacă vorbesc despre un anumit subiect – cum ar fi Android rooting – păstrează explicația în maximum 2-3 paragrafe. Și pentru lucruri precum aplicații sau produse, descrierea de obicei nu depășește 1 paragraf.

Oamenii pot scrie în profunzime despre ceva, inclusiv despre caracteristici, limitări, experiență personală, prețuri etc. Pe de altă parte, AI se concentrează de obicei pe caracteristicile principale sau pe punctele evidențiate, așa că articolul este și el scurt. Dacă instructorul solicită mai multe detalii, șansa de informații incorecte crește semnificativ.

#7. Verificați istoria scriitorului

În calitate de profesor sau webmaster, dacă aveți acces la lucrările sau sarcinile anterioare ale scriitorului, ar putea fi o idee bună să o comparați cu articolul despre care sunteți suspicios. Este foarte puțin probabil ca scriitorul să aibă un stil de scriere similar cu un AI. Chiar dacă AI poate schimba tonurile de scriere, dar stilurile pe care le alege sunt mai degrabă generice și nu vă poate copia tonul.

Luând exemplul paragrafului generat de AI din introducerea acestei postări. Oricine a citit postările mele anterioare poate vedea cu ușurință că stilul meu de scris este complet diferit în comparație cu acesta.

Poți doar să citești 2-3 lucrări anterioare ale scriitorului și să vezi dacă se potrivește cu stilul de scriere al scrierii suspecte.

Instrumente pentru a detecta plagiatul AI

Există o mulțime de instrumente disponibile care pot detecta conținutul scris prin inteligență artificială. Cu toate acestea, acuratețea lor este diferită una de cealaltă și poate eșua în funcție de tipul de conținut și de lungime.

Am testat aceste instrumente folosind diferite tipuri de conținut generate de ChatGPT, GPT-3 Playground, WriteSonic, Rytr și YouWrite. Au reușit să detecteze toate tipurile de conținut generate de ChatGPT și GPT-3 Playground.

Deși au avut rezultate mixte pentru instrumentele de scriere dedicate, în mod interesant, toți nu au reușit să detecteze YouWrite, presupun că se datorează faptului că YouWrite face greșeli asemănătoare omului cu scopul de a evita detectarea.

Vă voi recomanda să utilizați aceste instrumente împreună cu verificarea manuală a conținutului. Mai întâi, analizați conținutul cu unul dintre aceste instrumente și apoi verificați manual dacă există indicii pentru a confirma suspiciunea în continuare.

Mai jos le enumer pe cele care au oferit cele mai bune rezultate și sunt cele mai ușor de utilizat:

Notă: Pentru demonstrație, voi folosi textul generat de la WriteSonic despre „Beneficiile Mango”.

#1. Conținut la scară

Am găsit că detectorul de conținut AI de la Content At Scale este cel mai precis pentru majoritatea testelor pe care le-am efectuat. Vă permite să scanați până la 2500 de caractere per scanare și face o predicție procentuală care arată densitatea conținutului real sau fals.

  40 de întrebări și răspunsuri frecvente la interviu REST API [2023]

Conținutul care este fals în proporție de peste 60% este sigur să presupunem că este scris de conținut AI, cel puțin cea mai mare parte a acestuia. În captura de ecran de mai jos, puteți vedea că 96% conținut este fals, pe care l-am generat complet cu AI.

#2. GPTZero

Dacă doriți să vedeți exact ce conținut este generat de AI, atunci GPTZero este o opțiune bună. GPTZero nu punctează conținut. În schimb, evidențiază conținutul exact care este probabil generat de AI.

Deși arată scoruri de perplexitate și burstiness pentru a vă face o idee despre aleatorietatea textului, mai important, acceptă 5000 de caractere per scanare și poate încărca și fișiere. Scanarea conținutului mare ajută foarte mult la îmbunătățirea acurateței.

#3. Detector de ieșire GPT-2

Creatorii ChatGPT oferă și un bot pentru a-și detecta propria muncă. Deoarece GPT-2 și GPT-3 sunt diferite doar în ceea ce privește datele totale utilizate pentru antrenament, acest detector GPT-2 funcționează bine și pentru IA bazate pe GPT-3.

Nu există limită pentru cât de mult conținut poate scana, așa că este perfect pentru detectarea conținutului foarte lung generat de AI. De asemenea, mi s-a părut bine acuratețea, în special pentru conținutul generat de ChatGPT. Cu toate acestea, este puțin pierdut în predicții, așa că luați în considerare rezultatele sale numai atunci când arată peste 50% din conținut ca fiind fals.

#4. Detector de conținut Writer AI

Rezultatele Writer AI Content Detector sunt discutabile atunci când detectează conținut din instrumentele de scriere AI, dar funcționează excelent pentru conținutul generat de ChatGPT. Puteți scana 1500 de caractere per scanare și chiar adăugați adresa URL a conținutului dacă este deja publicat.

Pentru textul meu de testare generat de AI, a spus că 94% din conținut este generat de oameni, ceea ce este destul de neregulat în comparație cu alte instrumente. Cu toate acestea, merită folosit pentru a detecta conținutul ChatGPT, mai ales dacă este deja publicat.

#5. Schiță și obiectiv

Un instrument de detectare a scrierii AI simplu, dar puternic. Din experiența mea, Draft & Goal a oferit rezultate similare Content At Scale, dar nu are o limită de număr de cuvinte, astfel încât să puteți scana scrieri lungi. Cu toate acestea, timpul său de scanare crește în funcție de cât de mult conținut scanați.

Pentru textul meu exemplu, se spune că 94% din text este generat de AI.

Gândurile mele 💭

Personal, cred că ajutorul AI este de fapt o modalitate excelentă de a elimina blocajul scriitorului, de a obține toate informațiile într-un singur loc și de a găsi inspirație. Cu toate acestea, nu ar trebui să înlocuiască niciodată scrisul uman, deoarece AI se limitează la cunoștințele deja cunoscute.

De asemenea, puteți explora unele dintre cele mai bune instrumente de verificare a plagiatului pentru a preveni copierea.

x