Introducere
Python Pandas reprezintă un instrument esențial pentru gestionarea și explorarea datelor în Python. Această bibliotecă facilitează lucrul cu structuri de date tabelare, cum ar fi DataFrame-urile și Serii, punând la dispoziție o multitudine de funcții pentru crearea, modificarea și analizarea datelor. Actualizarea rândurilor și coloanelor este o operațiune fundamentală în analiza datelor, iar Pandas oferă modalități simple și eficiente de a o realiza. În acest articol, vom examina diferitele tehnici de modificare a rândurilor și coloanelor în Pandas, incluzând schimbarea selectivă a celulelor, adăugarea și eliminarea rândurilor și coloanelor.
Schimbarea valorilor celulelor
Pentru a modifica o anumită celulă într-un DataFrame, puteți folosi următoarea structură:
dataframe.loc[indice_linie, nume_coloana] = valoare_noua
În această structură:
indice_linie
reprezintă indicele rândului celulei pe care o modificăm.nume_coloana
este denumirea sau indicele coloanei celulei pe care o modificăm.valoare_noua
reprezintă noua valoare pe care o atribuim celulei.
Exemplu:
Să presupunem că avem un DataFrame numit df
cu următoarele date:
nume vârsta 0 Ana 25 1 Ion 30 2 Maria 22
Pentru a modifica vârsta Mariei la 23, utilizăm următorul cod:
df.loc[2, 'vârsta'] = 23
DataFrame-ul modificat va arăta în acest fel:
nume vârsta 0 Ana 25 1 Ion 30 2 Maria 23
Modificarea rândurilor
Putem modifica un singur rând sau mai multe rânduri dintr-un DataFrame folosind metoda loc
. Pentru a modifica un rând, specificăm indicele rândului în argumentul loc
. Pentru a modifica mai multe rânduri, indicăm o listă sau o secvență de indici.
Exemplu:
Să presupunem că dorim să modificăm vârsta Anei și a Mariei la 24, respectiv 25. Utilizăm următorul cod:
df.loc[[0, 2], 'vârsta'] = [24, 25]
DataFrame-ul actualizat va arăta astfel:
nume vârsta 0 Ana 24 1 Ion 30 2 Maria 25
Adăugarea rândurilor
Putem adăuga un nou rând la un DataFrame folosind metoda loc
cu un indice care nu există încă. Alternativ, putem utiliza metoda append
pentru a adăuga un nou DataFrame sau o serie ca rând la DataFrame-ul existent.
Exemplu:
Să presupunem că adăugăm un rând nou cu numele „Andrei” și vârsta 26. Folosim următorul cod:
df.loc[3] = ['Andrei', 26]
DataFrame-ul actualizat va avea următorul aspect:
nume vârsta 0 Ana 24 1 Ion 30 2 Maria 25 3 Andrei 26
Ștergerea rândurilor
Pentru a elimina un rând sau mai multe rânduri dintr-un DataFrame, folosim metoda drop
. Pentru a șterge un singur rând, specificăm indicele rândului în argumentul drop
. Pentru a șterge mai multe rânduri, oferim o listă sau o secvență de indici.
Exemplu:
Să presupunem că vrem să eliminăm rândul cu indicele 1. Folosim acest cod:
df.drop(1, inplace=True)
DataFrame-ul modificat va arăta în acest mod:
nume vârsta 0 Ana 24 2 Maria 25 3 Andrei 26
Modificarea coloanelor
Pentru a modifica o coloană specifică într-un DataFrame, folosim următorul format:
dataframe[nume_coloana] = serie_noua
Unde:
nume_coloana
reprezintă numele sau indicele coloanei pe care dorim să o modificăm.serie_noua
este o nouă serie care conține valorile pe care dorim să le setăm în coloană.
Exemplu:
Să presupunem că avem o serie nouă numită vârstele
cu următoarele valori:
vârstele = pd.Series([25, 32, 26, 30])
Pentru a actualiza coloana „vârsta” din DataFrame-ul df
cu datele din seria vârstele
, utilizăm următorul cod:
df['vârsta'] = vârstele
DataFrame-ul modificat va fi:
nume vârsta 0 Ana 25 1 Ion 32 2 Maria 26 3 Andrei 30
Adăugarea coloanelor
Putem adăuga o nouă coloană la un DataFrame folosind operatorul de atribuire (=) cu numele sau indicele coloanei ca cheie. De asemenea, putem utiliza metoda assign
pentru a adăuga o nouă coloană sau mai multe la DataFrame-ul existent.
Exemplu:
Să presupunem că adăugăm o nouă coloană numită „hobby” cu următoarele valori:
hobby = pd.Series(['cititul', 'scrisul', 'muzica', 'sportul'])
Pentru a adăuga coloana „hobby” la DataFrame-ul df
, folosim următorul cod:
df['hobby'] = hobby
DataFrame-ul actualizat va arăta astfel:
nume vârsta hobby 0 Ana 25 cititul 1 Ion 32 scrisul 2 Maria 26 muzica 3 Andrei 30 sportul
Ștergerea coloanelor
Putem elimina o coloană sau mai multe coloane dintr-un DataFrame utilizând metoda drop
. Pentru a șterge o singură coloană, specificăm numele sau indicele acesteia în argumentul drop
. Pentru a șterge mai multe coloane, specificăm o listă de nume sau indici.
Exemplu:
Să presupunem că eliminăm coloana „hobby”. Folosim următorul cod:
df.drop('hobby', axis=1, inplace=True)
DataFrame-ul modificat va arăta așa:
nume vârsta 0 Ana 25 1 Ion 32 2 Maria 26 3 Andrei 30
Concluzie
Modificarea rândurilor și coloanelor în Pandas este o operațiune fundamentală în analiza datelor. Pandas oferă o varietate de metode eficiente și flexibile pentru a realiza acest lucru, permițând modificarea și actualizarea datelor cu ușurință. În acest articol, am analizat diferitele modalități de modificare a rândurilor și coloanelor, inclusiv schimbarea selectivă a celulelor, adăugarea și eliminarea rândurilor și coloanelor. Înțelegerea și utilizarea corectă a acestor metode vă vor permite să gestionați și să transformați datele eficient, pentru a obține informații valoroase din analizele efectuate.
Întrebări frecvente (FAQ)
1. Cum pot modifica o anumită celulă într-un DataFrame Pandas?
– Utilizând dataframe.loc[indice_linie, nume_coloana] = valoare_noua
2. Cum pot modifica un rând anume într-un DataFrame Pandas?
– Utilizând dataframe.loc[indice_linie] = serie_noua
3. Cum pot modifica mai multe rânduri într-un DataFrame Pandas?
– Utilizând dataframe.loc[[indice1, indice2, ...]] = serie_noua
4. Cum pot adăuga un rând nou la un DataFrame Pandas?
– Utilizând dataframe.loc[indice_nou] = serie_noua
sau dataframe.append(dataframe_nou)