Un ghid introductiv pentru datele din seria temporală

„Timpul” este o variabilă crucială atunci când vine vorba de acumularea de date. În analiza seriilor temporale, timpul este un element important al datelor.

Ce sunt datele din seria temporală?

Datele din serii temporale se referă la o serie de puncte de date care sunt ordonate în timp. Introduce o dependență de ordine între un set de observații. Seriile temporale sunt omniprezente în lumea actuală bazată pe date. Deoarece fiecare eveniment urmează săgeata timpului, suntem într-o interacțiune constantă cu o varietate de date din serii temporale.

Se presupune, în general, că serii de timp sunt generate la intervale regulate de timp și sunt denumite serii de timp regulate. Cu toate acestea, datele din cadrul acelei serii temporale nu trebuie să fie generate la intervale regulate. Astfel de cazuri includ serii temporale neregulate în care datele urmează o secvență în faze temporal. Aceasta înseamnă că măsurătorile ar putea să nu aibă loc la intervale regulate. Cu toate acestea, datele pot fi generate la intervale de timp discrete sau ca o rafală. Retragerile de la bancomate sau depunerile în cont sunt exemple de serii temporale neregulate.

Din punct de vedere tehnic, într-o serie de timp, una sau mai multe variabile se modifică într-o anumită perioadă de timp. Dacă o singură variabilă variază în timp, aceasta este denumită serie temporală univariată. De exemplu, luați în considerare un senzor care măsoară temperatura unei camere în fiecare secundă. Aici, doar o valoare de temperatură unidimensională este generată în fiecare moment (adică, secundă). Dimpotrivă, atunci când mai multe variabile se modifică în timp, aceasta se numește o serie de timp multivariată. De exemplu, luați în considerare economia băncilor. În astfel de cazuri, serii cronologice multivariate sunt utilizate pentru a înțelege modul în care modificările politicii la o variabilă, cum ar fi rata repo, pot afecta alte variabile (adică, plata împrumuturilor pentru băncile comerciale).

Datele din seria cronologică își găsesc aplicația în fiecare disciplină, de la finanțe, geologie, meteorologie, producție până la calcul, IoT, științe fizice și sociale. Este folosit pentru a urmări schimbările meteorologice, rata natalității, rata mortalității, fluctuațiile pieței, performanța rețelei și multe alte aplicații. Unele dintre principalele sale cazuri de utilizare includ monitorizarea, prognoza și detectarea anomaliilor. De exemplu, prognoza în serie de timp joacă un rol critic în determinarea popularității sistemelor de management al bazelor de date. Figura de mai jos arată popularitatea în creștere a DBMS de-a lungul anilor (2019-2021) într-un complot de serie cronologică.

https://www.influxdata.com/time-series-database/

Componentele cheie ale serii temporale

Factorii care influențează valorile unei observații dintr-o serie de timp sunt tratați ca componente cheie. Cele trei categorii de componente includ:

  • Tendință sau mișcări pe termen lung
  • Mișcări pe termen scurt
  • Variații sezoniere
  • Variații ciclice
  • Mișcări aleatorii sau neregulate
  • Tendinţă

    Tendința datelor de a crește sau de a scădea pe o perioadă lungă de timp este denumită tendință sau componentă pe termen lung. Cu toate acestea, este important de reținut că mișcarea în sus sau în jos nu trebuie să fie neapărat în aceeași direcție într-un interval de timp dat.

    Tendințele pot fie să crească, fie să scadă sau să rămână stabile pe diferite secțiuni de timp. Totuși, tendința generală trebuie să echivaleze întotdeauna cu un model ascendent, descendent sau stabil. Astfel de tendințe de mișcare sunt evidente în exemple precum productivitatea agricolă, rata mortalității, dispozitivele fabricate, numărul de fabrici etc.

    Tendință liniară și neliniară

    Trasarea valorilor seriilor temporale în funcție de timp pe un grafic dezvăluie tipul de tendință bazat pe modelul de grupare a datelor. Dacă grupul de date este mai mult sau mai puțin în jurul unei linii drepte, atunci tendința este denumită tendință liniară. În caz contrar, modelul cluster de date arată o tendință neliniară, deoarece raportul de schimbare între două variabile nu este stabil sau constant. Prin urmare, astfel de tendințe sunt numite și corelații curbilinii.

    Mișcări pe termen scurt

    Într-o serie de timp, aceste componente tind să se repete într-o perioadă de timp. Au explozii scurte neregulate și afectează variabilele studiate. Cele două tipuri de categorii în cadrul mișcării pe termen scurt includ:

    Variații sezoniere

    Aceste versiuni funcționează regulat și periodic pe o perioadă mai mică de un an. Ei tind să aibă un model similar sau aproape același pe parcursul unei perioade de 12 luni. Astfel de variații devin parte dintr-o serie de timp dacă datele sunt înregistrate în mod regulat, adică pe oră, zilnic, săptămânal, lunar sau trimestrial.

      9 Browsere Anti Detect/Multilogin de încercat

    Variațiile sezoniere sunt fie create de om, fie apar în mod natural. Diferitele anotimpuri sau condițiile climatice joacă un rol critic în astfel de variații. De exemplu, producția de culturi se bazează în întregime pe anotimpuri. În mod similar, piața pentru o umbrelă sau o pelerină de ploaie depinde de sezonul ploios, în timp ce vânzarea de răcitoare și unități de AC atinge vârfuri în timpul sezonului de vară.

    Convențiile create de om includ festivaluri, petreceri și ocazii precum căsătoriile. Astfel de evenimente pe termen scurt se repetă an de an.

    Variații ciclice

    Variațiile seriilor temporale care tind să opereze pe o perioadă mai mare de un an sunt denumite variații ciclice. Pentru o afacere, o perioadă completă este considerată „Cicul de afaceri”. Creșterea sau scăderea performanței afacerii depinde de diverși factori, cum ar fi structura economică, managementul afacerii și alte forțe care interacționează. Aceste variații ciclice ale afacerii pot fi regulate, dar nu periodice. În general, întreprinderile trec printr-un proces ciclic în patru etape, care cuprinde prosperitate, recesiune, depresie și renaștere.

    Astfel de variații ciclice sunt parte integrantă a unui model de serie de timp, deoarece dezvoltarea afacerii se bazează în mare măsură pe „punctele de date secvențiale” generate.

    Mișcări aleatorii sau neregulate

    Componentele aleatoare provoacă o variație semnificativă a variabilei sub observație. Acestea sunt fluctuații pur neregulate, fără niciun model stabilit. Forțele sunt de natură neprevăzută, imprevizibilă și neregulată – de exemplu, cutremure, inundații, foamete și alte dezastre.

    Evenimentele aleatoare descrise mai sus sunt analizate folosind datele din seria temporală sursă pentru a aborda mai bine astfel de scenarii din viața reală care pot apărea în viitor.

    Tipuri de serii temporale

    Datele din seria temporală pot fi împărțite în patru tipuri, deterministe, nedeterministe, staționare și nestaționare. Să aruncăm o privire asupra fiecărui tip în detaliu.

    #1. Seria temporală deterministă

    O serie temporală deterministă poate fi descrisă cu o expresie analitică. Nu implică aspecte aleatorii sau probabilistice. Din punct de vedere matematic, poate fi exprimat exact pentru toate intervalele de timp în termeni de expansiune a seriei Taylor. Acest lucru este posibil dacă toate derivatele sale sunt cunoscute la un moment arbitrar în timp. Aceste derivate specifică în mod explicit trecutul și viitorul la acel moment. Dacă toate condițiile sunt îndeplinite, este posibil să se prezică cu exactitate comportamentul său viitor și să se analizeze modul în care s-a comportat în trecut.

    #2. Serii temporale nedeterministe

    O serie temporală nedeterministă are asociat un aspect aleatoriu care împiedică descrierea sa explicită. Prin urmare, expresiile analitice nu sunt soluții suficient de fezabile pentru a exprima o astfel de serie de timp. O serie temporală poate fi nedeterministă din următoarele motive:

  • Informațiile necesare pentru a-l descrie nu sunt disponibile în întregime. Deși datele ar putea fi prezente în principiu, nu pot fi tratate ca cuantificabile în mod explicit.
  • Procesul de generare a datelor este de natură aleatorie.
  • Datorită factorului aleatoriu, seria temporală nedeterministă se supune legilor probabilistice. Prin urmare, datele sunt abordate în termeni statistici – ceea ce înseamnă că datele sunt definite prin distribuții de probabilitate și medii de diferite forme. Aceasta include mijloacele și măsurile de dispersie, adică variațiile.

    #3. Serii de timp staționare

    Într-o serie de timp staționară, proprietățile statistice precum media, varianța și altele nu se bazează pe aspectul de timp. O serie de timp staționară este mai ușor de prezis, deoarece se poate afirma cu certitudine că proprietățile sale statistice vor rămâne aceleași așa cum au fost observate în trecut. Prin urmare, diverse metode de prognoză statistică se bazează pe argumentul că seria temporală este aproape staționară. Aceasta implică faptul că seriile temporale pot fi considerate staționare în aproximare prin aplicarea unor transformări matematice simple.

    #4. Serii temporale non-staționare

    Într-o serie non-staționară, proprietățile statistice variază în timp. Prin urmare, seriile temporale cu tendințe, sau sezonalitate, se încadrează în categoria nestaționară, deoarece tendința și sezonalitatea pot afecta valoarea seriei temporale la diferite intervale de timp. Serii temporale non-staționare descriu date imprevizibile, împiedicând modelarea sau prognozarea acestora.

    https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

    Analiza și prognoza serii temporale

    Analiza și prognoza serii cronologice sunt instrumente utile pentru observarea, analizarea și studiul evoluției și dinamicii proceselor vitale și a obiectelor de diferite tipuri. Să ne uităm la fiecare mai în profunzime.

    Analiza serii temporale

    Analiza seriilor temporale este definită ca un proces de analiză a datelor colectate pe o perioadă de timp. Aici, analiștii de date înregistrează datele la intervale constante pe o perioadă de timp fixă. Rata de observare a datelor, adică intervalul de timp, poate varia de la secunde la ani.

    Datele din seria temporală descriu variabilele supuse inspecției, deoarece oferă o analiză detaliată a modelului fluctuant pe o anumită perioadă de timp. Parametrii necesari pentru analiză pot varia în diferite domenii și discipline. Unele dintre exemple pot include:

    • Instrumente științifice – Date înregistrate pe zi
    • Site comercial – vizite ale clienților pe zi
    • Bursa de valori – Valorile acțiunilor pe săptămână
    • Sezon – zile ploioase pe an
      Cum să găsiți subtitrări pentru un fișier media

    Pentru a asigura consecvența și fiabilitatea, analiza serii de timp operează pe cantități mari de puncte de date. O dimensiune bună a eșantionului este o reprezentare subtilă a autenticității unui trend sau model descoperit.

    În plus, analiza seriilor de timp este potrivită și pentru prezicerea evenimentelor viitoare pe baza datelor înregistrate în trecut.

    Prognoza serii temporale

    Analiza seriilor temporale permite organizațiilor să identifice cauza principală a fluctuațiilor tendințelor în timp. Cu datele la îndemână, întreprinderile pot studia și cerceta în continuare pentru a înțelege mai bine cum să abordeze tendințele necunoscute și să prezică evenimentele viitoare. Companiile folosesc în general tehnici de vizualizare a datelor pentru a determina astfel de anomalii în date.

    Prognoza serii temporale se învârte în jurul a doi factori esențiali:

  • Anticipați evenimentele viitoare pe baza comportamentului datelor din trecut.
  • Să presupunem că tendințele viitoare vor avea asemănări cu modelul de date din trecut.
  • În prognoză, obiectivul principal este de a prezice în esență modul în care punctele de date vor continua să rămână aceleași sau să varieze în viitor. Iată câteva exemple din diferite sectoare industriale pentru a înțelege mai bine nuanțele analizei și previziunilor în serie de timp.

    • Bursa de valori – Prognoza prețului acțiunilor de închidere în fiecare zi.
    • Vânzări – Preziceți vânzările de produse pentru un magazin în fiecare zi.
    • Prețuri – Prognoza prețului mediu al combustibilului în fiecare zi.

    Unele dintre tehnicile statistice comune utilizate pentru prognoza seriilor temporale includ media mobilă simplă (SMA), netezirea exponențială (SES), media mobilă integrată autoregresivă (ARIMA) și rețeaua neuronală (NN).

    Date de serie temporală în cloud

    Pentru a dezvălui valoarea datelor din seria temporală, întreprinderile ar trebui să poată stoca și interoga rapid datele. Companiile de pe piața de capital se bazează pe volume mari de date istorice și de streaming pentru a utiliza analize de date în timp real și pentru a lua decizii de afaceri cu impact. Acest lucru poate implica predicția vulnerabilității la prețul acțiunilor, determinarea cerințelor nete de capital sau prognozarea ratelor de schimb. Pentru a oferi flexibilitate și a procesa datele fără probleme, multe firme optează pentru migrarea bazelor lor de date în serie de timp în cloud.

    Odată cu migrarea bazelor de date în serie de timp în cloud, organizațiile pot obține acces la resurse nelimitate la cerere. Permite firmelor să utilizeze sute de nuclee pentru a-și îndeplini sarcina care maximizează debitul rețelei fără probleme de latență.

    Bazele de date în serii de timp din infrastructura cloud sunt potrivite pentru sarcinile de lucru care necesită calcul intensiv. Aceasta include efectuarea de calcule de risc ca răspuns la tendințele pieței în timp real. Firmele financiare pot elimina cheltuielile generale ale centrului de date și se pot concentra în utilizarea resurselor pentru a îmbunătăți productivitatea sarcinilor lor de lucru.

    Furnizorii de cloud, cum ar fi AWS, oferă Amazon Timestream, un serviciu de baze de date cu serii de timp care permite încărcarea, stocarea și analiza ușoară a seturilor de date ale serii de timp. Ele oferă spațiu de stocare pentru a gestiona sarcinile de lucru care necesită tranzacții, instrumente de analiză în timp real și funcționalitate de transmitere a datelor pentru a prezenta evenimentele pe măsură ce apar.

    Prin urmare, infrastructura cloud amplifică și scalează beneficiile datelor din seria temporală.

    Aplicații ale seriilor temporale

    Modelele serii temporale servesc două scopuri,

  • Înțelegeți factorii de bază care au produs un anumit tipar de date.
  • Pe baza analizei, potriviți un model de prognozat și monitorizat.
  • Să ne uităm la unele dintre cazurile de utilizare ale aplicațiilor de date din seria temporală.

    #1. Serii temporale în domeniul financiar și al afacerilor

    Toate deciziile financiare, de afaceri și de investiții sunt luate pe baza tendințelor actuale ale pieței și a previziunilor cererii. Datele din seria temporală sunt utilizate pentru a explica, corela și prezice piața financiară dinamică. Experții financiari pot examina datele financiare pentru a oferi previziuni pentru aplicațiile care ajută la diminuarea riscurilor, stabilizarea prețurilor și tranzacționării.

    Analiza seriilor temporale joacă un rol cheie în analiza financiară. Este folosit în predicția ratei dobânzii, prognoza volatilității pe piețele de valori și multe altele. Părțile interesate de afaceri și factorii de decizie pot lua decizii informate cu privire la producție, achiziții, alocarea resurselor și pot optimiza operațiunile lor de afaceri.

    Această analiză este utilizată în mod eficient în sectorul investițional pentru a monitoriza ratele de securitate și fluctuațiile acestora în timp. Prețul securității poate fi observat și pe termen scurt (adică, date de înregistrare pe oră sau pe zi) sau pe termen lung (adică, observație întinsă pe luni sau ani). Analiza seriilor cronologice este un instrument util pentru a urmări modul în care o valoare, un activ sau o variabilă economică funcționează pe o perioadă lungă de timp.

    #2. Serii temporale în domeniul medical

    Asistența medicală devine rapid ca un domeniu bazat pe date. Pe lângă analiza financiară și de afaceri, domeniul medical folosește foarte mult analiza seriilor de timp.

      Top 15 site-uri pentru drepturi de autor și imagini fără drepturi de autor

    Luați în considerare un scenariu care necesită o sinergie de date din seria temporală, proceduri aliniate din punct de vedere medical și tehnici de extragere a datelor în timpul tratării pacienților cu cancer. Un astfel de cadru hibrid poate fi folosit pentru a valorifica funcționalitățile de extracție a caracteristicilor din datele din seria de timp colectate (adică imaginile cu raze X ale pacientului) pentru a urmări progresul pacientului și răspunsul la tratamentele furnizate de fraternitatea medicală.

    În sectorul sănătății, deducerea inferențelor din datele din seria temporală în continuă schimbare este de o valoare critică. În plus, practicile medicale avansate cer ca dosarele pacientului să fie conectate în timp pentru o mai bună vizibilitate a sănătății pacientului. De asemenea, parametrii de sănătate ai pacientului trebuie înregistrați cu precizie la intervale regulate pentru a avea o imagine mai clară asupra stării de sănătate a pacientului.

    Odată cu instrumentele medicale avansate care ies în prim-plan, analiza seriilor de timp s-a impus în domeniul sănătății. Luați în considerare exemplele de mai jos,

    • Dispozitive ECG: Dispozitive inventate pentru monitorizarea stărilor cardiace prin înregistrarea pulsurilor electrice ale inimii.
    • Dispozitive EEG: Dispozitive utilizate pentru cuantificarea activității electrice din creier.

    Astfel de dispozitive le-au permis medicilor să exercite analiza serii de timp pentru un diagnostic medical mai rapid, eficient și precis.

    În plus, odată cu apariția dispozitivelor IoT, cum ar fi senzorii portabili și dispozitivele portabile de asistență medicală, oamenii pot acum să efectueze măsurători regulate ale variabilelor de sănătate în timp, cu intrări minime. Acest lucru duce la o colectare consecventă de date de date medicale dependente de timp atât pentru persoanele bolnave, cât și pentru cele sănătoase.

    #3. Serii temporale în astronomie

    Astronomia și astrofizica sunt cele două discipline moderne în care datele din seria temporală sunt valorificate în mod semnificativ.

    În mod fundamental, astronomia implică trasarea traiectoriilor obiectelor cosmice și a corpurilor cerești și efectuarea de măsurători precise pentru a înțelege mai bine universul dincolo de atmosfera terestră. Datorită acestei cerințe, experții în astronomie sunt competenți în manipularea datelor din seria temporală în timp ce calibrează și configurează instrumente complexe și studiază obiectele astronomice de interes.

    Datele din seria temporală au fost mult timp asociate cu domeniul astronomiei. În anul 800 î.Hr., datele serii temporale ale petelor solare au fost colectate la intervale regulate. De atunci, analiza serii de timp a fost folosită pentru

    • Descoperiți stele îndepărtate pe baza distanțelor stelare,
    • Observați evenimente cosmice, cum ar fi supernove, pentru a înțelege mai bine originea universului nostru.

    Datele din seria temporală, în acest caz, se referă la lungimile de undă și intensitățile luminii emise de stele, corpuri cerești sau obiecte. Astronomii monitorizează în mod constant astfel de date în flux live pentru a detecta evenimentele cosmice în timp real, pe măsură ce apar.

    În ultima vreme, au apărut domenii de cercetare precum astroinformatica și astrostatistica, care îmbină diverse discipline, cum ar fi data mining, învățarea automată, inteligența computațională și statistica. În aceste domenii noi de cercetare, rolul datelor din seria temporală este de a detecta și clasifica obiectele astronomice rapid și eficient.

    #4. Serii temporale în prognoza vremii

    Aristotel a studiat pe larg tiparele vremii pentru a înțelege mai bine cauzele și efectele observate în schimbările meteorologice din antichitate. Pe măsură ce au trecut zilele, oamenii de știință au început să înregistreze date legate de vreme pe instrumente precum „barometru” pentru a calcula variabilele atmosferice. Datele au fost colectate la intervale regulate și păstrate în diferite locații.

    Cu timpul, în cele din urmă, prognozele meteo au început să apară în ziare. Avansați rapid până la ziua și vârsta de astăzi, stații omniprezente de prognoză meteo sunt instalate în diferite zone geografice din întreaga lume pentru a colecta variabile meteo precise.

    Astfel de stații au dispozitive funcționale avansate care sunt interconectate pentru a colecta și corela datele meteo din diferite locații. Datele corelate sunt folosite pentru a prognoza condițiile meteorologice la fiecare moment în funcție de cerințe.

    #5. Serii temporale în dezvoltarea afacerilor

    Datele din seria temporală permit companiilor să ia decizii de afaceri. Acest lucru se realizează pe măsură ce procesul analizează datele din trecut pentru a deriva evenimente viitoare și a arunca lumină asupra posibilităților probabile. Modelul de date din trecut este utilizat pentru a deriva următorii parametri:

    • Creșterea afacerii: pentru a evalua performanța generală financiară și a afacerii și pentru a măsura creșterea, datele din seria temporală sunt cel mai potrivit și mai fiabil activ.
    • Estimarea tendinței: pentru a estima tendințele emergente pot fi utilizate diverse metode de serie de timp. Luați în considerare, de exemplu, aceste metode analizează observațiile datelor pe o perioadă de timp pentru a reflecta asupra creșterii sau scăderii vânzărilor unui anumit dispozitiv electronic.
    • Dezvăluie modele sezoniere: punctele de date înregistrate ar putea dezvălui fluctuații și modele sezoniere care ar putea ajuta la prognozarea datelor. Informațiile de date obținute joacă un rol cheie pentru piețele în care prețurile produselor fluctuează sezonier. Astfel de date pot ajuta întreprinderile la o mai bună planificare și dezvoltare a produselor.

    Concluzie 👨‍🏫

    Pe scurt, datele din serii de timp pot fi privite ca caracteristici ale punctelor complexe de date colectate pe o perioadă constantă de timp. Analiza, modelarea și prognoza serii cronologice au devenit o parte integrantă a vieții noastre de zi cu zi odată cu apariția gadgeturilor IoT, a aparatelor inteligente pentru casă și a dispozitivelor portabile. În plus, datele din seria cronologică își găsesc aplicarea în diverse domenii, inclusiv asistența medicală, astrofizică, economie, inginerie, afaceri și multe altele.