Pandas on avoimen lähdekoodin Python-kirjasto, jota käytetään pääasiassa tietojen käsittelyyn ja analysointiin. Se on rakennettu NumPy-kirjaston päälle ja tarjoaa korkean suorituskyvyn, helppokäyttöisiä tietorakenteita ja data-analyysityökaluja Python-ohjelmointikielelle.

Tässä artikkelissa opit suorittamaan 6 perustoimintoa Pandalla.

Pandaesimerkkien käyttö

Voit suorittaa tämän artikkelin esimerkit käyttämällä laskennallisia muistikirjoja, kuten Jupyter muistikirja, Google Colab, jne. Voit myös suorittaa esimerkit syöttämällä koodin suoraan Python-tulkkiin interaktiivisessa tilassa.

Jos haluat tarkastella koko tässä artikkelissa käytettyä lähdekoodia, pääset Python-muistikirjatiedostoon tästä GitHub-arkisto.

1. Kuinka tuoda Pandat pd-muodossa ja tulostaa versionumero

Sinun on käytettävä tuonti avainsana tuodaksesi minkä tahansa kirjaston Pythonissa. Pandat tuodaan tyypillisesti alle pd alias. Tällä lähestymistavalla voit viitata Pandas-pakettiin nimellä pd sijasta pandat.

tuo pandat pd-muodossa
tulosta (pd.__version__)
instagram viewer

Lähtö:

1.2.4

2. Sarjan luominen Pandasissa

Pandas Series on yksiulotteinen taulukko, joka sisältää kaiken tyyppisiä tietoja. Se on kuin sarake taulukossa. Voit luoda sarjan käyttämällä numpy-taulukoita, numpy-funktioita, luetteloita, sanakirjoja, skalaariarvoja jne.

Sarjojen arvot on merkitty niiden indeksinumeroilla. Oletusarvoisesti ensimmäisen arvon indeksi on 0, toisen arvon indeksi 1 ja niin edelleen. Jotta voit nimetä omia tarrojasi, sinun on käytettävä indeksi Perustelu.

Kuinka luoda tyhjä sarja

s = pd. Sarja (dtype='float64')
s

Lähtö:

Sarja([], dtype: float64)

Yllä olevassa esimerkissä tyhjä sarja, jossa on kellua tietotyyppi luodaan.

Kuinka luoda sarja NumPy-taulukon avulla

tuo pandat pd-muodossa
tuonti numpy as np
d = np.array([1, 2, 3, 4, 5])
s = pd. Sarja (d)
s

Lähtö:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Aiheeseen liittyvä: NumPy-toiminnot aloittelijoille

Sarjan luominen käyttämällä luetteloa

d = [1, 2, 3, 4, 5]
s = pd. Sarja (d)
s

Lähtö:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Kuinka luoda sarja indeksillä

Jotta voit luoda sarjan indeksillä, sinun on käytettävä indeksi Perustelu. Indeksien lukumäärän on oltava yhtä suuri kuin sarjan elementtien lukumäärä.

d = [1, 2, 3, 4, 5]
s = pd. Sarja (d, index=["yksi", "kaksi", "kolme", ​​"neljä", "viisi"])
s

Lähtö:

yksi 1
kaksi 2
kolme 3
neljä 4
viisi 5
dtype: int64

Sarjan luominen sanakirjan avulla

Sanakirjan avaimista tulee sarjan nimilappuja.

d = {"yksi": 1,
"kaksi": 2,
"kolme": 3,
"neljä": 4,
"viisi": 5}
s = pd. Sarja (d)
s

Lähtö:

yksi 1
kaksi 2
kolme 3
neljä 4
viisi 5
dtype: int64

Sarjan luominen skalaariarvon avulla

Jos haluat luoda sarjan käyttämällä skalaariarvoa, sinun on annettava indeksi Perustelu.

s = pd. Sarja (1, indeksi = ["a", "b", "c", "d"])
s

Lähtö:

a 1
b 1
c 1
d 1
dtype: int64

3. Tietokehyksen luominen Pandasissa

DataFrame on kaksiulotteinen tietorakenne, jossa tiedot on kohdistettu rivien ja sarakkeiden muodossa. DataFrame voidaan luoda käyttämällä sanakirjoja, listoja, sanakirjaluetteloita, numpy-taulukoita jne. Todellisessa maailmassa DataFrame-kehykset luodaan käyttämällä olemassa olevaa tallennustilaa, kuten CSV-tiedostoja, excel-tiedostoja, SQL-tietokantoja jne.

DataFrame-objekti tukee useita attribuutteja ja menetelmiä. Jos haluat tietää niistä lisää, voit tutustua niiden viralliseen dokumentaatioon panda-tietokehys.

Kuinka luoda tyhjä datakehys

df = pd. Datakehys()
tulostaa (df)

Lähtö:

Tyhjä DataFrame
Sarakkeet: []
Indeksi: []

Kuinka luoda DataFrame käyttämällä luetteloa

listObj = ["MUO", "teknologia", "yksinkertaistettu"]
df = pd. DataFrame (listObj)
tulostaa (df)

Lähtö:

 0
0 MUO
1 tekniikka
2 yksinkertaistettu

Kuinka luoda DataFrame käyttämällä sanakirjaa ndarray/Lists

batmanData = {'Elokuvan nimi': ['Batman alkaa', 'The Dark Knight', 'The Dark Knight Rises'],
'Julkaisuvuosi': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
tulostaa (df)

Lähtö:

 Elokuvan nimi Julkaisuvuosi
0 Batman alkaa 2005
1 Pimeyden ritari 2008
2 The Dark Knight Rises 2012

Kuinka luoda DataFrame käyttämällä luetteloluetteloa

data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, sarakkeet = ['nimi', 'rullan nro'])
tulostaa (df)

Lähtö:

 Nimirulla nro.
0 Alex 601
1 Bob 602
2 Kataliini 603

Kuinka luoda DataFrame käyttämällä sanakirjaluetteloa

data = [{'Nimi': 'Alex', 'Roll No.': 601},
{'Nimi': 'Bob', 'Roll No.': 602},
{'Nimi': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (data)
tulostaa (df)

Lähtö:

 Nimirulla nro.
0 Alex 601
1 Bob 602
2 Kataliini 603

Aiheeseen liittyvä: Kuinka muuntaa luettelo sanakirjaksi Pythonissa

DataFrame-kehyksen luominen zip()-funktiolla

Käytä postinumero() toiminto luetteloiden yhdistämiseksi Pythonissa.

Nimi = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = lista (zip (nimi, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Nimi', 'Roll No.'])
tulostaa (df)

Lähtö:

 Nimirulla nro.
0 Alex 601
1 Bob 602
2 Kataliini 603

4. CSV-tietojen lukeminen Pandasissa

CSV (Comma-Separated Values) -tiedosto on eroteltu tekstitiedosto, joka käyttää pilkkua arvojen erottamiseen. Voit lukea CSV-tiedoston käyttämällä read_csv() menetelmä pandoissa. Jos haluat tulostaa koko DataFramen, käytä to_string() menetelmä.

Tässä ja seuraavissa esimerkeissä tämä CSV-tiedosto käytetään toimintojen suorittamiseen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.to_string())

Lähtö:

5. Tietokehysten analysoiminen head(), tail()- ja info()-menetelmillä

Kuinka tarkastella tietoja käyttämällä head()-menetelmää

The pää() menetelmä on yksi parhaista tavoista saada nopea yleiskuva DataFramesta. Tämä menetelmä palauttaa otsikon ja määritetyn määrän rivejä alkaen ylhäältä.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulostaa (df.head (10))

Lähtö:

Jos et määritä rivien määrää, ensimmäiset 5 riviä palautetaan.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.head())

Lähtö:

Kuinka tarkastella tietoja tail()-menetelmällä

The häntä () menetelmä palauttaa otsikon ja määritetyn määrän rivejä alhaalta alkaen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.tail (10))

Lähtö:

Jos et määritä rivien määrää, viimeiset 5 riviä palautetaan.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.tail())

Lähtö:

Kuinka saada tietoa tiedoista

The tiedot() menetelmät palauttavat lyhyen yhteenvedon DataFrame-kehyksestä, joka sisältää indeksin dtype ja sarakkeen dtypes, ei-nolla-arvot ja muistin käytön.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.info())

Lähtö:

6. Kuinka lukea JSON-tietoja Pandasissa

JSON (JavaScript Okohde Notation) on kevyt tiedonsiirtomuoto. Voit lukea JSON-tiedoston käyttämällä read_json() menetelmä pandoissa. Jos haluat tulostaa koko DataFramen, käytä to_string() menetelmä.

Alla olevassa esimerkissä tämä JSON-tiedosto käytetään toimintojen suorittamiseen.

Aiheeseen liittyvä: Mikä on JSON? Maallikon yleiskatsaus

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
tulosta (df.to_string())

Lähtö:

Päivitä Python-tietosi sisäänrakennetuilla funktioilla ja menetelmillä

Toiminnot auttavat lyhentämään koodia ja parantamaan sen tehokkuutta. Toiminnot ja menetelmät, kuten vähentää(), jakaa(), luetella(), eval(), pyöristää(), jne. voi tehdä koodistasi vankan ja helposti ymmärrettävän. Sisäänrakennetuista toiminnoista ja menetelmistä on aina hyvä tietää, koska ne voivat yksinkertaistaa ohjelmointitehtäviäsi suuresti.

JaaTweetSähköposti
20 Python-funktiota, jotka sinun pitäisi tietää

Python Standard Library sisältää monia toimintoja, jotka auttavat ohjelmointitehtävissäsi. Opi hyödyllisimmistä ja luo tehokkaampi koodi.

Lue Seuraava

Liittyvät aiheet
  • Ohjelmointi
  • Python
  • Verkkokehitys
  • Ohjelmointi
  • Tietojen analysointi
Kirjailijasta
Yuvraj Chandra (69 artikkelia julkaistu)

Yuvraj on tietojenkäsittelytieteen perustutkinto-opiskelija Delhin yliopistossa Intiassa. Hän on intohimoinen Full Stack -verkkokehityksestä. Kun hän ei kirjoita, hän tutkii eri tekniikoiden syvyyttä.

Lisää Yuvraj Chandralta

tilaa uutiskirjeemme

Liity uutiskirjeemme saadaksesi teknisiä vinkkejä, arvosteluja, ilmaisia ​​e-kirjoja ja eksklusiivisia tarjouksia!

Klikkaa tästä tilataksesi