Cum să actualizați rândurile și coloanele folosind Python Pandas

Introducere

Python Pandas reprezintă un instrument esențial pentru gestionarea și explorarea datelor în Python. Această bibliotecă facilitează lucrul cu structuri de date tabelare, cum ar fi DataFrame-urile și Serii, punând la dispoziție o multitudine de funcții pentru crearea, modificarea și analizarea datelor. Actualizarea rândurilor și coloanelor este o operațiune fundamentală în analiza datelor, iar Pandas oferă modalități simple și eficiente de a o realiza. În acest articol, vom examina diferitele tehnici de modificare a rândurilor și coloanelor în Pandas, incluzând schimbarea selectivă a celulelor, adăugarea și eliminarea rândurilor și coloanelor.

Schimbarea valorilor celulelor

Pentru a modifica o anumită celulă într-un DataFrame, puteți folosi următoarea structură:

dataframe.loc[indice_linie, nume_coloana] = valoare_noua

În această structură:

  • indice_linie reprezintă indicele rândului celulei pe care o modificăm.
  • nume_coloana este denumirea sau indicele coloanei celulei pe care o modificăm.
  • valoare_noua reprezintă noua valoare pe care o atribuim celulei.

Exemplu:

Să presupunem că avem un DataFrame numit df cu următoarele date:

   nume  vârsta
0  Ana    25
1  Ion    30
2  Maria   22

Pentru a modifica vârsta Mariei la 23, utilizăm următorul cod:

df.loc[2, 'vârsta'] = 23

DataFrame-ul modificat va arăta în acest fel:

   nume  vârsta
0  Ana    25
1  Ion    30
2  Maria   23

Modificarea rândurilor

Putem modifica un singur rând sau mai multe rânduri dintr-un DataFrame folosind metoda loc. Pentru a modifica un rând, specificăm indicele rândului în argumentul loc. Pentru a modifica mai multe rânduri, indicăm o listă sau o secvență de indici.

Exemplu:

Să presupunem că dorim să modificăm vârsta Anei și a Mariei la 24, respectiv 25. Utilizăm următorul cod:

df.loc[[0, 2], 'vârsta'] = [24, 25]

DataFrame-ul actualizat va arăta astfel:

   nume  vârsta
0  Ana    24
1  Ion    30
2  Maria   25

Adăugarea rândurilor

Putem adăuga un nou rând la un DataFrame folosind metoda loc cu un indice care nu există încă. Alternativ, putem utiliza metoda append pentru a adăuga un nou DataFrame sau o serie ca rând la DataFrame-ul existent.

Exemplu:

Să presupunem că adăugăm un rând nou cu numele „Andrei” și vârsta 26. Folosim următorul cod:

df.loc[3] = ['Andrei', 26]

DataFrame-ul actualizat va avea următorul aspect:

   nume  vârsta
0  Ana    24
1  Ion    30
2  Maria   25
3  Andrei  26

Ștergerea rândurilor

Pentru a elimina un rând sau mai multe rânduri dintr-un DataFrame, folosim metoda drop. Pentru a șterge un singur rând, specificăm indicele rândului în argumentul drop. Pentru a șterge mai multe rânduri, oferim o listă sau o secvență de indici.

Exemplu:

Să presupunem că vrem să eliminăm rândul cu indicele 1. Folosim acest cod:

df.drop(1, inplace=True)

DataFrame-ul modificat va arăta în acest mod:

   nume  vârsta
0  Ana    24
2  Maria   25
3  Andrei  26

Modificarea coloanelor

Pentru a modifica o coloană specifică într-un DataFrame, folosim următorul format:

dataframe[nume_coloana] = serie_noua

Unde:

  • nume_coloana reprezintă numele sau indicele coloanei pe care dorim să o modificăm.
  • serie_noua este o nouă serie care conține valorile pe care dorim să le setăm în coloană.

Exemplu:

Să presupunem că avem o serie nouă numită vârstele cu următoarele valori:

vârstele = pd.Series([25, 32, 26, 30])

Pentru a actualiza coloana „vârsta” din DataFrame-ul df cu datele din seria vârstele, utilizăm următorul cod:

df['vârsta'] = vârstele

DataFrame-ul modificat va fi:

   nume  vârsta
0  Ana    25
1  Ion    32
2  Maria   26
3  Andrei  30

Adăugarea coloanelor

Putem adăuga o nouă coloană la un DataFrame folosind operatorul de atribuire (=) cu numele sau indicele coloanei ca cheie. De asemenea, putem utiliza metoda assign pentru a adăuga o nouă coloană sau mai multe la DataFrame-ul existent.

Exemplu:

Să presupunem că adăugăm o nouă coloană numită „hobby” cu următoarele valori:

hobby = pd.Series(['cititul', 'scrisul', 'muzica', 'sportul'])

Pentru a adăuga coloana „hobby” la DataFrame-ul df, folosim următorul cod:

df['hobby'] = hobby

DataFrame-ul actualizat va arăta astfel:

   nume  vârsta    hobby
0  Ana    25  cititul
1  Ion    32  scrisul
2  Maria   26   muzica
3  Andrei  30  sportul

Ștergerea coloanelor

Putem elimina o coloană sau mai multe coloane dintr-un DataFrame utilizând metoda drop. Pentru a șterge o singură coloană, specificăm numele sau indicele acesteia în argumentul drop. Pentru a șterge mai multe coloane, specificăm o listă de nume sau indici.

Exemplu:

Să presupunem că eliminăm coloana „hobby”. Folosim următorul cod:

df.drop('hobby', axis=1, inplace=True)

DataFrame-ul modificat va arăta așa:

   nume  vârsta
0  Ana    25
1  Ion    32
2  Maria   26
3  Andrei  30

Concluzie

Modificarea rândurilor și coloanelor în Pandas este o operațiune fundamentală în analiza datelor. Pandas oferă o varietate de metode eficiente și flexibile pentru a realiza acest lucru, permițând modificarea și actualizarea datelor cu ușurință. În acest articol, am analizat diferitele modalități de modificare a rândurilor și coloanelor, inclusiv schimbarea selectivă a celulelor, adăugarea și eliminarea rândurilor și coloanelor. Înțelegerea și utilizarea corectă a acestor metode vă vor permite să gestionați și să transformați datele eficient, pentru a obține informații valoroase din analizele efectuate.

Întrebări frecvente (FAQ)

1. Cum pot modifica o anumită celulă într-un DataFrame Pandas?
– Utilizând dataframe.loc[indice_linie, nume_coloana] = valoare_noua

2. Cum pot modifica un rând anume într-un DataFrame Pandas?
– Utilizând dataframe.loc[indice_linie] = serie_noua

3. Cum pot modifica mai multe rânduri într-un DataFrame Pandas?
– Utilizând dataframe.loc[[indice1, indice2, ...]] = serie_noua

4. Cum pot adăuga un rând nou la un DataFrame Pandas?
– Utilizând dataframe.loc[indice_nou] = serie_noua sau dataframe.append(dataframe_nou)