Ce, Cum și De ce [+ 5 Learning Resources]

Testarea ipotezelor este o metodă utilizată de mulți analiști din sectorul privat și guvernamental pentru a face afirmații sau presupuneri probabile despre datele populației.

Dacă ați avut de-a face cu sau ați studiat datele populației, trebuie să fi întâlnit acest instrument vital de testare a ipotezelor.

Multe metode pot fi folosite pentru a face ipoteze, dar nu toate oferă o precizie mai mare.

Și dacă nu ești sigur de datele tale, dar vrei totuși să le folosești, ar putea fi riscant pentru organizația ta.

Testarea ipotezelor este o strategie bună pentru a obține un nivel mai ridicat de precizie. A fost esențial în analiza populației.

În acest articol, voi discuta ce este testarea ipotezelor, cum funcționează, beneficiile și cazurile de utilizare.

Așa că, fără alte prelungiri, să începem!

Ce este testarea ipotezelor?

Testarea ipotezelor este o metodă de inferență statistică utilizată de analiști pentru a testa dacă datele disponibile privind populația susțin suficient o anumită ipoteză și pentru a face ipoteze din aceasta.

Prin această metodă, analiștii pot evalua cu ușurință o ipoteză și pot determina cât de precisă se bazează ipoteza pe datele disponibile.

Cu cuvinte simple, este un proces de testare bazat pe statistici inferențiale care vă permite să ajungeți la un verdict despre datele populației pe baza datelor eșantionului colectat.

În general, este aproape imposibil pentru analiști să găsească proprietăți sau orice parametru anume al întregii populații. Dar prin testarea ipotezelor, puteți face o predicție și o decizie informată pe baza datelor eșantionului și a acurateței acestora.

Tipuri de testare a ipotezelor

Diferitele tipuri de testare a ipotezelor sunt:

  • Ipoteza nulă: statisticile arată că datele eșantionului sunt abrupte și nu există nicio corelație între cele două variabile din datele eșantionului dat.
  • Ipoteza alternativă: Demonstrează teza primară și se opune ipotezei nule. Este principala forță motrice în procesul de testare, deoarece arată o corelație între două variabile în datele eșantionului.
  • Ipoteza non-direcțională: Acest tip de testare a ipotezelor servește ca o ipoteză cu două cozi. Acesta arată că nu există nicio direcție între două variabile în datele eșantionului și că valoarea adevărată nu este aceeași cu valoarea prezisă.
  • Ipoteza direcțională: Ipoteza direcțională descrie o relație între două variabile. Aici, o variabilă dintr-un eșantion de date poate influența celelalte variabile.
  • Ipoteza statistică: îi ajută pe analiști să evalueze dacă datele și valoarea satisfac o anumită ipoteză. Este foarte util în a face afirmații și ipoteze cu privire la rezultatul unui parametru de populație eșantion.

În continuare, să discutăm despre metodele de testare a ipotezelor.

Metode de testare a ipotezelor

Pentru a evalua dacă o anumită ipoteză este adevărată sau nu, ca analist, veți avea nevoie de o mulțime de dovezi plauzibile pentru a concluziona. În acest proces de testare, înainte de începerea evaluării este stabilită o ipoteză nulă și alternativă.

Testarea ipotezelor nu implică doar o singură metodă, ci multe pentru a evalua dacă datele eșantionului sunt favorabile. În calitate de analist, trebuie să luați în considerare datele și dimensiunea eșantionului și să alegeți metoda de testare a ipotezelor care vi se potrivește.

  Ce este „HDR fals” și ar trebui să cumpărați Blu-ray HDR?

Testare de normalitate

Este o metodă standard de testare a ipotezelor pentru analiza distribuției regulate în datele eșantionului. În timpul procesului de testare, se verifică dacă punctele de date grupate în jurul mediei sunt sub sau deasupra mediei.

În această testare statistică, șansa ca punctele să treacă peste sau sub medie este la fel de probabilă. Se formează o curbă clopot și este distribuită egal pe ambele părți ale mediei.

Testarea Z-Test

Este un alt tip de testare a ipotezelor utilizat atunci când datele populației sunt distribuite în mod normal. Acesta testează că media a doi parametri separați ai populației sunt diferiți atunci când varianța datelor vă cunoașteți.

În timpul analizei datelor privind populația, este foarte probabil să utilizați acest tip atunci când dimensiunea eșantionului de date este mai mare de treizeci. Mai mult, teorema limită centrală este un alt motiv care face ca Z-Test să fie potrivit, deoarece teorema afirmă că atunci când dimensiunile eșantioanelor cresc, eșantioanele sunt distribuite în mod normal.

Testarea T-Test

Testarea ipotezei T-Test va fi folosită de dvs. atunci când dimensiunea eșantionului este limitată și este de obicei distribuită. În general, atunci când dimensiunea eșantionului este sub 30 și abaterea standard a parametrului nu vă este cunoscută, se aplică în principal.

Când faceți un T-Test, îl faceți pentru a calcula intervalele de încredere ale datelor specifice populației.

Testul Chi-Pătrat

Testul chi-pătrat este un proces popular de testare a ipotezelor care este adesea folosit pentru a evalua potrivirea și integritatea unei distribuții de date.

Sursa: wikipedia.org

Cu toate acestea, principalul motiv pentru care veți utiliza acest tip de ipoteză este atunci când doriți să testați varianța populației față de o varianță a populației cu o valoare presupusă sau cunoscută. Sunt efectuate diferite teste Chi-Pătrat, dar cel mai comun tip este testul Chi-Pătrat de varianță și independență.

Testarea ANOVA

Abreviată ca Analysis of Variance, este o metodă de testare statistică care ajută la compararea seturilor de date a două eșantioane. Cu toate acestea, vă permite să comparați mai mult de două mijloace simultan.

De asemenea, explică o variabilă dependentă și o variabilă independentă a datelor eșantionului. Utilizarea ANOVA este destul de similară cu utilizarea Z-Test și T-Test, dar ultimele două sunt limitate la doar două mijloace.

Cum funcționează testarea ipotezelor?

Fiecare analist care utilizează testarea ipotezelor utilizează date aleatorii ale eșantionului pentru analiză și măsurare. În timpul testării, datele eșantionului aleatoriu sunt utilizate pentru a testa ipoteza nulă și ipoteza alternativă.

După cum am discutat mai devreme, ipoteza nulă și ipoteza alternativă se exclud în întregime reciproc, iar în timpul rezultatului testării, doar una poate fi adevărată.

Cu toate acestea, există unele cazuri când ipoteza nulă este respinsă; ipoteza alternativă nu este întotdeauna adevărată.

Sursa: Analytics Steps

Valoarea p: În timp ce procesul de testare începe, este implicată valoarea p sau valoarea probabilității și arată dacă rezultatul este semnificativ sau nu. Nu numai că, dar valoarea p arată și probabilitatea apariției unei erori în respingerea sau neînchiderea unei ipoteze nule în timpul testării. Valoarea p rezultată este fie 0, fie 1, care este apoi comparată cu nivelul de semnificație sau nivelul alfa.

  Creați o listă de activități și vizualizați progresul în timp al zilei, lunii și anului

Nivelul de semnificație definește aici riscul acceptabil în timp ce respinge o ipoteză nulă în timpul testării. Este important de reținut că rezultatul testului de ipoteză poate duce la două tipuri de erori:

  • Eroarea de tip 1 apare atunci când rezultatul testului respinge ipoteza nulă, chiar dacă este adevărată.
  • Eroarea de tip 2 apare atunci când ipoteza nulă este acceptată de rezultatul eșantionului, în ciuda faptului că este falsă.

Toate valorile care provoacă respingerea ipotezei nule sunt stocate în regiunea critică. Și este valoarea critică care separă regiunile critice de altele.

Pași pentru a efectua testarea ipotezelor

Sursa: Mediu

Testarea ipotezelor implică în principal patru pași:

  • Definiți ipoteze: În primul pas, treaba dumneavoastră ca analist este să definiți cele două ipoteze, astfel încât doar una să fie adevărată. Ipoteza nulă va indica că nu există nicio diferență în IMC mediu, în timp ce ipoteza alternativă va indica că există o diferență semnificativă în IMC mediu.
  • Plan: În pasul următor, va trebui să proiectați un plan de analiză despre cum puteți analiza datele eșantionului. Este vital să faceți eșantionare și să colectați datele eșantionului pentru a vă asigura că sunt concepute pentru a vă testa ipoteza.
  • Analizați datele eșantionului: După ce ați decis cum veți evalua datele, este timpul să începeți procesul. Va trebui să analizați datele eșantionului fizic, astfel încât să nu existe redundanță. În timp ce analizați datele, ar trebui să verificați dacă eșantioanele sunt independente unele de altele și că ambele dimensiuni ale eșantionului sunt suficient de mari.
  • Calculați statisticile testului: în această etapă, va trebui să calculați statisticile testului și să găsiți valoarea p. Valoarea p va fi determinată presupunând că ipoteza nulă este adevărată.
  • Evaluați rezultatul: în pasul final, va trebui să evaluați rezultatul testului de ipoteză. Aici, veți decide dacă respingeți ipoteza nulă sau declarați plauzibilitatea acesteia pe baza datelor eșantionului.

Acum, vom explora beneficiile testării ipotezelor.

Beneficiile testării ipotezelor

Avantajele testării ipotezelor sunt:

  • Vă ajută să analizați puterea revendicării dvs. cu privire la o decizie de date.
  • În calitate de analist, vă permite să creați un mediu de încredere pentru a decide asupra datelor eșantionului.
  • Vă permite să determinați dacă eșantionul de date implicat în testarea ipotezelor este semnificativ statistic.
  • Este benefic pentru evaluarea fiabilității și validității rezultatelor testelor în orice proces sistematic de testare.

Vă ajută să extrapolați datele dintr-o etapă de eșantion la o populație mai mare, în funcție de cerință.

Cazuri de utilizare ale testării ipotezelor

Testarea ipotezelor este utilizată în diferite sectoare pentru a ghici corectitudinea datelor eșantionului. Câteva exemple din lumea reală de testare a ipotezelor sunt:

#1. Studii clinice

Testarea ipotezelor este utilizată pe scară largă în timpul studiilor clinice, deoarece ajută profesioniștii medicali să decidă dacă un nou medicament, tratament sau procedură va fi eficient sau nu pe baza datelor din eșantion.

Un medic poate crede că un tratament ar putea atenua nivelul de potasiu la unii pacienți. Medicul poate măsura nivelul de potasiu al unui grup de pacienți înainte de a face tratamentul și poate verifica din nou nivelul.

În continuare, medicul efectuează testarea ipotezelor unde H0: Udupă = Uînainte și denotă că nivelul de potasiu este același ca înainte după aplicarea tratamentului. O altă ipoteză indică Ha: Udupă < Ubefore, adică nivelul de potasiu a scăzut după aplicarea tratamentului.

Deci, dacă valoarea p este mai mică decât nivelul de semnificație, atunci medicul poate concluziona că tratamentul poate scădea nivelul de potasiu.

  Cum să setați o dată de expirare atunci când partajați fișiere pe Google Drive

#2. de fabricație

Testarea ipotezelor este utilizată în fabricile de producție pentru a ajuta supraveghetorii să decidă dacă noua metodă sau tehnică este eficientă sau nu.

De exemplu, unele unități de producție pot utiliza testarea ipotezelor pentru a afla dacă noua metodă le ajută să reducă numărul de produse defecte per lot. Să presupunem că numărul de produse defecte este de 300 pe lot.

Producătorul trebuie să determine media pentru numărul total de produse defecte produse înainte și după utilizarea metodei. Aceștia pot efectua testarea ipotezelor și pot folosi ipotezele H0: Udupă = Uînainte, unde media produselor defecte produse după aplicarea unei noi metode este aceeași ca înainte.

O altă ipoteză arată că HA: Uafter nu este egal cu Ubefore, adică numărul total de produse defecte produse după aplicarea noii metode nu este același.

După test, când valoarea p este mai mică decât nivelul de semnificație, atunci unitatea de producție poate concluziona că numărul de produse defecte produse s-a modificat.

#3. Agricultură

Testarea ipotezelor este adesea folosită pentru a afla dacă îngrășământul sau pesticidul provoacă creșterea și imunitatea plantelor. Biologii pot folosi testele pentru a demonstra că o anumită plantă poate crește mai mult de 15 inci după aplicarea noului îngrășământ.

Biologul ar putea aplica îngrășământul timp de o lună pentru a colecta date de probă. Când biologul efectuează un test, o ipoteză este H0 U=15 inci, ceea ce indică faptul că îngrășământul nu provoacă nicio îmbunătățire a creșterii medii a plantei.

O altă ipoteză arată HA: U> 15 inci, ceea ce înseamnă că îngrășămintele provoacă îmbunătățirea creșterii medii a plantei. După ce a testat când valoarea p este mai mică decât nivelul de semnificație, biologul poate dovedi acum că îngrășămintele provoacă o creștere mai mare decât înainte.

Resurse de învățare

#1. Statistici: o introducere pas cu pas de la Udemy

Udemy oferă un curs de statistică în care veți învăța o introducere pas cu pas în statistici, care acoperă testarea ipotezelor. Acest curs conține exemple și lecții de la un fost cercetător de date Google pentru a vă ajuta să stăpâniți intervalele de încredere, testele de ipoteze și multe altele.

#2. Statistici esențiale pentru analiza datelor de către Udemy

Acest curs Udemy despre statistici esențiale pentru analiza datelor vă va ajuta să învățați statistici cu proiecte din lumea reală, activități distractive, teste de ipoteze, distribuții de probabilitate, analize de regresie și multe altele.

#3. Statistici pentru știința datelor și analiza de afaceri

Acest curs de statistică pentru știința datelor și analiza de afaceri este oferit de Udemy, care vă va ajuta să învățați testarea ipotezelor. Acesta acoperă diferite subiecte de statistică, permițând cercetătorilor de date și analiștilor de afaceri să le învețe și să le stăpânească. Acesta acoperă statistici inferenţiale şi descriptive împreună cu analiza de regresie.

#4. Testarea ipotezelor de Jim Frost

Această carte este disponibilă pe Amazon și este un ghid intuitiv pentru a ajuta analiștii să ia decizii bazate pe date.

Acesta acoperă modul de funcționare a testelor de ipoteză, de ce aveți nevoie de ele, cum să utilizați eficient intervalele de încredere, valorile p, nivelurile de semnificație și multe alte subiecte.

#5. Testarea ipotezelor de Scott Hartshorn

Această carte este unică cu exemplele sale vizuale și este cea mai bună pentru începătorii care caută un ghid rapid pentru testarea ipotezelor.

Vă va prezenta semnificația statisticilor, a tipurilor și a modului de funcționare a acestora. Nu are nevoie să aveți cunoștințe anterioare aprofundate de statistică, dar explică totul intuitiv.

Cuvântul final

Testarea ipotezelor ajută la verificarea unei ipoteze și apoi la dezvoltarea datelor statistice pe baza evaluării. Este utilizat în multe sectoare, de la producție și agricultură până la studii clinice și IT. Această metodă nu este doar precisă, dar vă ajută și să luați decizii bazate pe date pentru organizația dvs.

Apoi, verificați resursele de învățare pentru a deveni analist de afaceri.