Pivot-taulukot ovat edelleen MS Excelin arvostetuimpia ja laajimmin käytettyjä työkaluja. Olitpa tietoanalyytikko, tietosuunnittelija tai vain tavallinen käyttäjä, sinulla on todennäköisesti jo MS Excelin pehmeä paikka.

Siitä huolimatta MS Excelin työkalujen ja apuohjelmien kopiointimahdollisuudet ovat lisääntyneet, etenkin Pythonissa. Tiesitkö, että voit luoda laajoja pivot-taulukoita Pythonin DataFramesissa muutamalla koodirivillä?

Kyllä se on oikein; Jos olet kiinnostunut, näin voit tehdä sen.

Edellytykset pivot-taulukoiden luomiseen

Kuten kaikki muutkin ohjelmointikielet, myös Python tarvitsee sinun täyttävän muutamia esivaatimuksia, ennen kuin pääset koodaamaan.

Jotta saat parhaan mahdollisen kokemuksen luodessasi ensimmäistä pivot-taulukkoasi Pythonissa, tarvitset seuraavat asiat:

  • Python IDE: Useimmissa Python-koodeissa on integroitu kehitysympäristö (IDE) valmiiksi asennettuna järjestelmään. On useita Python-yhteensopivat IDE: t markkinoilla, mukaan lukien Jupyter Notebook, Spyder, PyCharm ja monet muut.
  • instagram viewer
  • Esimerkkitiedot: Tässä on esimerkkitietojoukon havainnollistamista varten. Vaihtoehtoisesti voit muokata näitä koodeja suoraan live-tietoihisi.

Datamallilinkki:Malli Superstore

Essential Libraries -kirjastojen tuonti

Koska Python toimii kolmannen osapuolen kirjastojen käsitteen parissa, sinun on tuotava Pandat kirjasto pivotien luomiseen.

Voit käyttää Pandaa tuoda Excel-tiedoston Pythoniin ja tallenna tiedot DataFrame-kehykseen. Tuo Pandat käyttämällä tuonti komento seuraavalla tavalla:

tuonti pandat kuten pd

Kuinka luoda pivoteja Pythonissa

Koska kirjasto on nyt saatavilla, sinun on tuotava Excel-tiedosto Pythoniin, joka on perusta Pythonin pivotien luomiseen ja testaamiseen. Tallenna tuodut tiedot DataFrame-kehykseen seuraavalla koodilla:

# Luo uusi DataFrame
# korvaa omalla polullasi täällä
polku = "C://Users//user/OneDrive//Desktop//"
# Voit määrittää tiedostonimen täällä
tiedosto = "Näyte - Superstore.xls"
df = pd.read_excel (polku + tiedosto)
df.pää()

Missä:

  • df: Muuttujan nimi DataFrame-tietojen tallentamiseen
  • pd: Alias ​​Pandas-kirjastolle
  • read_excel(): Pandas-toiminto lukee Excel-tiedoston Pythoniin
  • polku: Excel-tiedoston tallennuspaikka (Sample Superstore)
  • tiedosto: Tuotava tiedostonimi
  • pää(): Näyttää oletusarvoisesti DataFramen viisi ensimmäistä riviä

Yllä oleva koodi tuo Excel-tiedoston Pythoniin ja tallentaa tiedot DataFrame-kehykseen. Lopuksi, pää toiminto näyttää ensimmäiset viisi riviä tietoja.

Tämä toiminto on kätevä sen varmistamiseksi, että tiedot tuodaan oikein Pythoniin.

Mitä pivot-taulukon kenttiä Pythonissa on?

Kuten sen Excel-vastine, pivot-taulukossa on samanlainen joukko kenttiä Pythonissa. Tässä on muutamia kenttiä, joista sinun on tiedettävä:

  • Tiedot: Tietokenttä viittaa Python DataFrame -kehykseen tallennettuihin tietoihin
  • Arvot: Pivotissa käytetyt saraketiedot
  • Indeksi: Hakemistosarake (-sarakkeet) tietojen ryhmittelyä varten
  • Sarakkeet: Sarakkeet auttavat kokoamaan olemassa olevat tiedot DataFrame-kehyksessä

Tarkoitus takana Indeksitoiminnon käyttäminen

Koska indeksifunktio on pivot-taulukon ensisijainen elementti, se palauttaa tietojen perusasettelun. Toisin sanoen voit ryhmitellä tietosi indeksi toiminto.

Oletetaan, että haluat nähdä koottuja arvoja tuotteille, jotka on lueteltu kohdassa Segmentti sarakkeessa. Voit laskea ennalta määritellyn aggregaatin (keskiarvon) Pythonissa määrittämällä nimetyn sarakkeen anindex-arvona.

df.pivot_table (indeksi = "Segmentti")

Missä:

  • df:DataFrame, joka sisältää tiedot
  • pivot_table:Pivot-taulukkotoiminto Pythonissa
  • indeksi: Sisäänrakennettu toiminto sarakkeen määrittämiseksi indeksiksi
  • Segmentti: Indeksiarvona käytettävä sarake

Pythonin muuttujien nimissä kirjainkoolla on merkitystä, joten vältä siirtymistä pois tässä oppaassa luetelluista ennalta määritetyistä muuttujien nimistä.

Kuinka käyttää moniindeksiarvoja

Kun haluat käyttää useita hakemistosarakkeita, voit määrittää sarakkeiden nimet kohdassa a lista indeksitoiminnon sisällä. Sinun tarvitsee vain määrittää sarakkeiden nimet sarjassa hakasulkeet ([ ]), kuten alla:

df.pivot_table (indeksi = ["Kategoria", "Alaluokka"])

Pivot-toiminto sisentää tulosteen indeksisarakkeen. Python näyttää tarkoittaa kaikista numeerisista arvoista kutakin indeksiarvoa vastaan.

Opi rajoittamaan lähdön arvoja

Koska Python poimii oletusarvoisesti kaikki numeeriset sarakkeet, voit rajoittaa arvoja muokataksesi lopullisessa lähdössä näkyviä tuloksia. Käytä arvot toiminto määrittääksesi sarakkeet, jotka haluat nähdä.

df.pivot_table (indeksi = ["Alue", "Kategoria", "Alaluokka"], arvot = "Myynti")

Lopullisessa tulosteessa on kolme indeksisaraketta ja Myynti-sarakkeen keskiarvot on kohdistettu jokaiseen elementtiin.

Kokoonpanofunktioiden määrittäminen pivot-taulukossa

Mitä tapahtuu, kun et halua laskea keskiarvoja oletuksena? Pivot-taulukossa on paljon muita toimintoja, jotka ulottuvat yksinkertaisen keskiarvon laskemista pidemmälle.

Näin kirjoitat koodin:

df.pivot_table (indeksi = ["Kategoria"], arvot = "Myynti", aggfunc = [summa, maksimi, min, len])

Missä:

  • summa: Laskee arvojen summan
  • max: Laskee maksimiarvon
  • min: Laskee maksimiarvon
  • len: Laskee arvojen määrän

Voit myös määrittää kunkin näistä funktioista erillisiksi koodiriveiksi.

Loppusumman lisääminen pivot-taulukkoon

Mikään tietoresurssi ei ole täydellinen ilman loppusummaa. Voit laskea ja näyttää loppusummat tietosaraketta kohden käyttämällä marginaalit ja marginaalit_nimi toiminto.

df.pivot_table (indeksi = ["Kategoria"], arvot = "Myynti", aggfunc = [summa, max, min, len], margins=True, margins_name='Suursummat')

Missä:

  • marginaalit: Toiminto loppusumman laskemiseen
  • marginaalit_nimi: Määritä luokan nimi hakemistosarakkeessa (esimerkiksi kokonaissummat)

Muokkaa ja käytä lopullista koodia

Tässä viimeinen koodin lyhennelmä:

tuonti pandat kuten pd
# korvaa omalla polullasi täällä
polku = "C://Users//user/OneDrive//Desktop//"
# Voit määrittää tiedostonimen täällä
tiedosto = "Näyte - Superstore.xls"
df = pd.read_excel (polku + tiedosto)
df.pivot_table (indeksi = ["Alue", "Kategoria", "Alaluokka"], arvot = "Myynti",
aggfunc = [summa, maksimi, min, len],
marginaalit =Totta,
marginaalit_nimi='Suursummat')

Pivot-taulukoiden luominen Pythonissa

Kun käytät Pivot-taulukoita, vaihtoehdot ovat yksinkertaisesti rajattomat. Pythonin avulla voit helposti käsitellä valtavia tietoryhmiä ilman, että sinun tarvitsee huolehtia tietojen eroista ja järjestelmäviiveistä.

Koska Pythonin toiminnot eivät rajoitu vain tietojen tiivistämiseen pivoteiksi, voit yhdistää useita Excel-työkirjoja ja -arkkeja samalla kun suoritat sarjaan liittyviä toimintoja Pythonilla.

Pythonilla on aina jotain uutta horisontissa.