Pandas on avoimen lähdekoodin Python-kirjasto, jota käytetään pääasiassa tietojen käsittelyyn ja analysointiin. Se on rakennettu NumPy-kirjaston päälle ja tarjoaa korkean suorituskyvyn, helppokäyttöisiä tietorakenteita ja data-analyysityökaluja Python-ohjelmointikielelle.
Tässä artikkelissa opit suorittamaan 6 perustoimintoa Pandalla.
Pandaesimerkkien käyttö
Voit suorittaa tämän artikkelin esimerkit käyttämällä laskennallisia muistikirjoja, kuten Jupyter muistikirja, Google Colab, jne. Voit myös suorittaa esimerkit syöttämällä koodin suoraan Python-tulkkiin interaktiivisessa tilassa.
Jos haluat tarkastella koko tässä artikkelissa käytettyä lähdekoodia, pääset Python-muistikirjatiedostoon tästä GitHub-arkisto.
1. Kuinka tuoda Pandat pd-muodossa ja tulostaa versionumero
Sinun on käytettävä tuonti avainsana tuodaksesi minkä tahansa kirjaston Pythonissa. Pandat tuodaan tyypillisesti alle pd alias. Tällä lähestymistavalla voit viitata Pandas-pakettiin nimellä pd sijasta pandat.
tuo pandat pd-muodossa
tulosta (pd.__version__)
Lähtö:
1.2.4
2. Sarjan luominen Pandasissa
Pandas Series on yksiulotteinen taulukko, joka sisältää kaiken tyyppisiä tietoja. Se on kuin sarake taulukossa. Voit luoda sarjan käyttämällä numpy-taulukoita, numpy-funktioita, luetteloita, sanakirjoja, skalaariarvoja jne.
Sarjojen arvot on merkitty niiden indeksinumeroilla. Oletusarvoisesti ensimmäisen arvon indeksi on 0, toisen arvon indeksi 1 ja niin edelleen. Jotta voit nimetä omia tarrojasi, sinun on käytettävä indeksi Perustelu.
Kuinka luoda tyhjä sarja
s = pd. Sarja (dtype='float64')
s
Lähtö:
Sarja([], dtype: float64)
Yllä olevassa esimerkissä tyhjä sarja, jossa on kellua tietotyyppi luodaan.
Kuinka luoda sarja NumPy-taulukon avulla
tuo pandat pd-muodossa
tuonti numpy as np
d = np.array([1, 2, 3, 4, 5])
s = pd. Sarja (d)
s
Lähtö:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Aiheeseen liittyvä: NumPy-toiminnot aloittelijoille
Sarjan luominen käyttämällä luetteloa
d = [1, 2, 3, 4, 5]
s = pd. Sarja (d)
s
Lähtö:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Kuinka luoda sarja indeksillä
Jotta voit luoda sarjan indeksillä, sinun on käytettävä indeksi Perustelu. Indeksien lukumäärän on oltava yhtä suuri kuin sarjan elementtien lukumäärä.
d = [1, 2, 3, 4, 5]
s = pd. Sarja (d, index=["yksi", "kaksi", "kolme", "neljä", "viisi"])
s
Lähtö:
yksi 1
kaksi 2
kolme 3
neljä 4
viisi 5
dtype: int64
Sarjan luominen sanakirjan avulla
Sanakirjan avaimista tulee sarjan nimilappuja.
d = {"yksi": 1,
"kaksi": 2,
"kolme": 3,
"neljä": 4,
"viisi": 5}
s = pd. Sarja (d)
s
Lähtö:
yksi 1
kaksi 2
kolme 3
neljä 4
viisi 5
dtype: int64
Sarjan luominen skalaariarvon avulla
Jos haluat luoda sarjan käyttämällä skalaariarvoa, sinun on annettava indeksi Perustelu.
s = pd. Sarja (1, indeksi = ["a", "b", "c", "d"])
s
Lähtö:
a 1
b 1
c 1
d 1
dtype: int64
3. Tietokehyksen luominen Pandasissa
DataFrame on kaksiulotteinen tietorakenne, jossa tiedot on kohdistettu rivien ja sarakkeiden muodossa. DataFrame voidaan luoda käyttämällä sanakirjoja, listoja, sanakirjaluetteloita, numpy-taulukoita jne. Todellisessa maailmassa DataFrame-kehykset luodaan käyttämällä olemassa olevaa tallennustilaa, kuten CSV-tiedostoja, excel-tiedostoja, SQL-tietokantoja jne.
DataFrame-objekti tukee useita attribuutteja ja menetelmiä. Jos haluat tietää niistä lisää, voit tutustua niiden viralliseen dokumentaatioon panda-tietokehys.
Kuinka luoda tyhjä datakehys
df = pd. Datakehys()
tulostaa (df)
Lähtö:
Tyhjä DataFrame
Sarakkeet: []
Indeksi: []
Kuinka luoda DataFrame käyttämällä luetteloa
listObj = ["MUO", "teknologia", "yksinkertaistettu"]
df = pd. DataFrame (listObj)
tulostaa (df)
Lähtö:
0
0 MUO
1 tekniikka
2 yksinkertaistettu
Kuinka luoda DataFrame käyttämällä sanakirjaa ndarray/Lists
batmanData = {'Elokuvan nimi': ['Batman alkaa', 'The Dark Knight', 'The Dark Knight Rises'],
'Julkaisuvuosi': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
tulostaa (df)
Lähtö:
Elokuvan nimi Julkaisuvuosi
0 Batman alkaa 2005
1 Pimeyden ritari 2008
2 The Dark Knight Rises 2012
Kuinka luoda DataFrame käyttämällä luetteloluetteloa
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, sarakkeet = ['nimi', 'rullan nro'])
tulostaa (df)
Lähtö:
Nimirulla nro.
0 Alex 601
1 Bob 602
2 Kataliini 603
Kuinka luoda DataFrame käyttämällä sanakirjaluetteloa
data = [{'Nimi': 'Alex', 'Roll No.': 601},
{'Nimi': 'Bob', 'Roll No.': 602},
{'Nimi': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (data)
tulostaa (df)
Lähtö:
Nimirulla nro.
0 Alex 601
1 Bob 602
2 Kataliini 603
Aiheeseen liittyvä: Kuinka muuntaa luettelo sanakirjaksi Pythonissa
DataFrame-kehyksen luominen zip()-funktiolla
Käytä postinumero() toiminto luetteloiden yhdistämiseksi Pythonissa.
Nimi = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = lista (zip (nimi, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Nimi', 'Roll No.'])
tulostaa (df)
Lähtö:
Nimirulla nro.
0 Alex 601
1 Bob 602
2 Kataliini 603
4. CSV-tietojen lukeminen Pandasissa
CSV (Comma-Separated Values) -tiedosto on eroteltu tekstitiedosto, joka käyttää pilkkua arvojen erottamiseen. Voit lukea CSV-tiedoston käyttämällä read_csv() menetelmä pandoissa. Jos haluat tulostaa koko DataFramen, käytä to_string() menetelmä.
Tässä ja seuraavissa esimerkeissä tämä CSV-tiedosto käytetään toimintojen suorittamiseen.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.to_string())
Lähtö:
5. Tietokehysten analysoiminen head(), tail()- ja info()-menetelmillä
Kuinka tarkastella tietoja käyttämällä head()-menetelmää
The pää() menetelmä on yksi parhaista tavoista saada nopea yleiskuva DataFramesta. Tämä menetelmä palauttaa otsikon ja määritetyn määrän rivejä alkaen ylhäältä.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulostaa (df.head (10))
Lähtö:
Jos et määritä rivien määrää, ensimmäiset 5 riviä palautetaan.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.head())
Lähtö:
Kuinka tarkastella tietoja tail()-menetelmällä
The häntä () menetelmä palauttaa otsikon ja määritetyn määrän rivejä alhaalta alkaen.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.tail (10))
Lähtö:
Jos et määritä rivien määrää, viimeiset 5 riviä palautetaan.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.tail())
Lähtö:
Kuinka saada tietoa tiedoista
The tiedot() menetelmät palauttavat lyhyen yhteenvedon DataFrame-kehyksestä, joka sisältää indeksin dtype ja sarakkeen dtypes, ei-nolla-arvot ja muistin käytön.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tulosta (df.info())
Lähtö:
6. Kuinka lukea JSON-tietoja Pandasissa
JSON (JavaScript Okohde Notation) on kevyt tiedonsiirtomuoto. Voit lukea JSON-tiedoston käyttämällä read_json() menetelmä pandoissa. Jos haluat tulostaa koko DataFramen, käytä to_string() menetelmä.
Alla olevassa esimerkissä tämä JSON-tiedosto käytetään toimintojen suorittamiseen.
Aiheeseen liittyvä: Mikä on JSON? Maallikon yleiskatsaus
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
tulosta (df.to_string())
Lähtö:
Päivitä Python-tietosi sisäänrakennetuilla funktioilla ja menetelmillä
Toiminnot auttavat lyhentämään koodia ja parantamaan sen tehokkuutta. Toiminnot ja menetelmät, kuten vähentää(), jakaa(), luetella(), eval(), pyöristää(), jne. voi tehdä koodistasi vankan ja helposti ymmärrettävän. Sisäänrakennetuista toiminnoista ja menetelmistä on aina hyvä tietää, koska ne voivat yksinkertaistaa ohjelmointitehtäviäsi suuresti.
Python Standard Library sisältää monia toimintoja, jotka auttavat ohjelmointitehtävissäsi. Opi hyödyllisimmistä ja luo tehokkaampi koodi.
Lue Seuraava
- Ohjelmointi
- Python
- Verkkokehitys
- Ohjelmointi
- Tietojen analysointi
Yuvraj on tietojenkäsittelytieteen perustutkinto-opiskelija Delhin yliopistossa Intiassa. Hän on intohimoinen Full Stack -verkkokehityksestä. Kun hän ei kirjoita, hän tutkii eri tekniikoiden syvyyttä.
tilaa uutiskirjeemme
Liity uutiskirjeemme saadaksesi teknisiä vinkkejä, arvosteluja, ilmaisia e-kirjoja ja eksklusiivisia tarjouksia!
Klikkaa tästä tilataksesi