Python on kielenä mittaamattoman arvokas, varsinkin kun haluat työskennellä strukturoidun tiedon kanssa. Koska ihmiset tallentavat paljon tietoa Excel-tiedostoihin, on välttämätöntä yhdistää useita tiedostoja ajan ja vaivan säästämiseksi.

Python antaa sinun tehdä juuri sen; riippumatta siitä, kuinka monta Excel-tiedostoa haluat yhdistää, voit tehdä sen suhteellisen helposti. Sen kirjastojen ja kolmansien osapuolien resurssien valikoiman ansiosta voit tuoda ja käyttää Pythonin monipuolisia työkaluja tarjousten tekemiseen.

Tässä oppaassa sinun on asennettava Pandas-kirjastot ja käytettävä niitä tietojen tuomiseen Pythoniin ennen niiden yhdistämistä.

Asenna Pandas Libraries Pythoniin

Pandas on kolmannen osapuolen kirjasto, jonka voit asentaa Pythonissa. Joihinkin IDE: ihin on jo asennettu Pandat.

Jos käytät an IDE versio jonka mukana ei tule esiasennettuja Pandaja, voit olla varma, että voit asentaa sen suoraan Pythonissa.

Näin asennat Pandat:

pip asentaa pandat

Jos käytät Jupyter Notebookia, voit asentaa Pandat suoraan

instagram viewer
PIP-komento. Useimmiten, kun olet asentanut Jupyterin Anacondan kanssa, on suuret mahdollisuudet saada Pandat valmiiksi suoraan käyttöön.

Jos et voi soittaa Pandoille, voit käyttää yllä olevaa komentoa asentaaksesi ne suoraan.

Excel-tiedostojen yhdistäminen Pythonin kanssa

Ensin sinun on luotava kansio haluamaasi sijaintiin kaikilla Excel-tiedostoilla. Kun kansio on valmis, voit alkaa kirjoittaa koodia kirjastojen tuontia varten.

Käytät tässä koodissa kahta muuttujaa:

  1. Pandat: Pandas-kirjasto tarjoaa tietokehykset Excel-tiedostojen tallentamiseen.
  2. Käyttöjärjestelmä: Kirjasto on hyödyllinen tietojen lukemiseen koneen kansiosta

Tuo nämä kirjastot käyttämällä näitä komentoja:

Tuo Pandat pd-muodossa
Tuo käyttöjärjestelmä
  • Tuonti: Python-syntaksi, jota käytetään kirjastojen tuontiin Pythonissa
  • Pandat: Kirjaston nimi
  • pd: Kirjastolle annettu alias
  • Käyttöjärjestelmä: Kirjasto, jolla pääset järjestelmäkansioon

Kun olet tuonut kirjastot, luo kaksi muuttujaa syöttö- ja tulostiedostopolun tallentamiseksi. Syötetiedoston polku tarvitaan tiedostojen kansioon pääsyyn. Tulostiedoston polku on välttämätön, koska yhdistetty tiedosto viedään sinne.

Jos käytät Pythonia, muista muuttaa kenoviiva kenoviivaksi (\ kohtaan /)

input_file_path = "C:/Käyttäjät/gaurav/OneDrive/Desktop/Excel-tiedostot/"
output_file_path = "C:/Käyttäjät/gaurav/OneDrive/Desktop/"

Liitä mukaan / lopussa myös polkujen suorittamiseksi.

Kansion tiedostot ovat saatavilla luettelossa. Luo luettelo tallentaaksesi kaikki syöttökansion tiedostoviitteet käyttämällä listahakemisto toiminto alkaen OS kirjasto.

Jos et ole varma kirjaston toiminnoista, voit käyttää ohj funktio kirjaston nimellä. Voit esimerkiksi tarkistaa listdir-funktion tarkan version käyttämällä komentoa seuraavasti:

dir (OS)

Tulos koostuu kaikista käyttöjärjestelmän kirjastossa olevista toiminnoista. Listdir-funktio on yksi monista tässä kirjastossa käytettävissä olevista toiminnoista.

Luo uusi muuttuja kansion syöttötiedostojen tallentamiseksi.

excel_file_list = os.listdir (syöttötiedoston_polku)

Tulosta tämä muuttuja nähdäksesi kansioon tallennettujen tiedostojen nimet. Kaikki kansioon tallennetut tiedostot tulevat näkyviin, kun käytät tulostustoimintoa.

tulosta (excel_file_list)

Seuraavaksi sinun on lisättävä uusi tietokehys jokaisen Excel-tiedoston tallentamiseksi. Kuvittele tietokehys säiliöksi tietojen tallentamista varten. Tässä on komento tietokehyksen luomiseksi.

df = pd. Datakehys()
  • df: Muuttuja DataFramen arvon tallentamiseen
  • pd: Alias ​​varten Pandan kirjasto
  • Datakehys: Oletussyntaksi tietokehyksen lisäämiseksi

Syöttökansiossa on kolme .xlsx tiedostot tässä esimerkissä. Tiedostojen nimet ovat:

Tiedosto1_excel.xlsx
Tiedosto2_excel.xlsx
Tiedosto3_excel.xlsx

Jos haluat avata jokaisen tiedoston tästä kansiosta, sinun on suoritettava silmukka. Silmukka suoritetaan jokaiselle yllä luodun luettelon tiedostolle.

Näin voit tehdä sen:

excel_file_listissa:

Seuraavaksi on tarpeen tarkistaa tiedostojen laajennukset, koska koodi avaa vain XLSX-tiedostoja. Voit tarkistaa nämä tiedostot käyttämällä Jos lausunto.

Käytä loppuu toiminto tähän tarkoitukseen seuraavasti:

excel_file_listissa:

if excel_files.endswith(.xlsx"):

  • excel_files: Listaa kaikki tiedostoarvot
  • loppuu: Toiminto tarkistaa tiedostojen laajennuksen
  • (.xlsx"): Tämä merkkijonoarvo voi muuttua sen mukaan, mitä haluat etsiä

Nyt kun olet tunnistanut Excel-tiedostot, voit luoda uuden tietokehyksen tiedostojen lukemista ja tallentamista varten yksitellen.

excel_file_listissa:

if excel_files.endswith(.xlsx"):

df1 = pd.read_excel (syöttötiedoston_polku+excel_tiedostot)

  • df1: Uusi datakehys
  • pd: Pandan kirjasto
  • read_excel: Toiminto Excel-tiedostojen lukemiseen Pandas-kirjastossa
  • input_file_path: Sen kansion polku, johon tiedostot on tallennettu
  • excel_files: Mikä tahansa muuttuja, jota käytetään for-silmukassa

Voit aloittaa tiedostojen liittämisen käyttämällä liittää toiminto.

excel_file_listissa:

if excel_files.endswith(.xlsx"):

df1 = pd.read_excel (syöttötiedoston_polku+excel_tiedostot)
df = df.append (df1)

Lopuksi, nyt kun konsolidoitu tietokehys on valmis, voit viedä sen lähtöpaikkaan. Tässä tapauksessa viet tietokehyksen XLSX-tiedostoon.

df.to_excel (tulostustiedoston_polku+"Consolidated_file.xlsx")
  • df: Vietävä tietokehys
  • suoritua erinomaisesti: Tietojen viemiseen käytetty komento
  • output_file_path: Polku määritetty tulosteen tallentamista varten
  • Consolidated_file.xlsx: Konsolidoidun tiedoston nimi

Katsotaanpa nyt lopullista koodia:

#Pandas käytetään tietokehyksenä Excel-tiedostojen käsittelyyn
tuo pandat pd-muodossa
tuonti os

# muuta vinoviiva arvosta "\" arvoon "/", jos käytät Windows-laitteita

input_file_path = "C:/Käyttäjät/gaurav/OneDrive/Desktop/Excel-tiedostot/"
output_file_path = "C:/Käyttäjät/gaurav/OneDrive/Desktop/"

#luo luettelo tallentaaksesi kaikki syöttökansion tiedostoviitteet käyttämällä käyttöjärjestelmän kirjaston listdir-toimintoa.
#Jos haluat nähdä kirjaston sisällön (kuten listdir-funktion, voit käyttää dir-toimintoa kirjaston nimessä).
#Käytä dir (kirjaston_nimi) sisällön luetteloimiseen

excel_file_list = os.listdir (syöttötiedoston_polku)

#tulosta kaikki kansioon tallennetut tiedostot luettelon määrittämisen jälkeen
excel_file_list

#Kun jokainen tiedosto avautuu, käytä liitetoimintoa aloittaaksesi useisiin tiedostoihin tallennettujen tietojen yhdistämisen

#luo uusi, tyhjä tietokehys Excel-tiedostojen tuontia varten
df = pd. Datakehys()

#Suorita for-silmukka käydäksesi läpi jokaisen luettelon tiedoston
excel_file_listissa:
#tarkista vain .xlsx-liitetiedostot
if excel_files.endswith(.xlsx"):
#luo uusi tietokehys lukeaksesi/avaaksesi jokaisen Excel-tiedoston yllä luodusta tiedostoluettelosta
df1 = pd.read_excel (syöttötiedoston_polku+excel_tiedostot)
#liitä jokainen tiedosto alkuperäiseen tyhjään tietokehykseen
df = df.append (df1)

#siirrä lopullinen tulos Excel (xlsx) -tiedostoon tulostuspolulla
df.to_excel (tulostustiedoston_polku+"Consolidated_file.xlsx")

Pythonin käyttäminen useiden Excel-työkirjojen yhdistämiseen

Python's Pandas on erinomainen työkalu niin aloittelijoille kuin kokeneillekin käyttäjille. Kirjastoa käyttävät laajasti kehittäjät, jotka haluavat hallita Pythonin.

Vaikka olisit aloittelija, voit hyötyä valtavasti oppimalla Pandan vivahteet ja kuinka kirjastoa käytetään Pythonissa.

6 Panda-operaatiota aloittelijoille

Tutustu Pandaan näillä aloittelijoilla.

Lue Seuraava

JaaTweetSähköposti
Liittyvät aiheet
  • Ohjelmointi
  • Python
  • Microsoft Excel
  • Laskentataulukko
Kirjailijasta
Gaurav Siyal (59 artikkelia julkaistu)

Gaurav Siyalilla on kahden vuoden kirjoituskokemus, joka on kirjoittanut sarjalle digitaalisia markkinointiyrityksiä ja ohjelmistojen elinkaaridokumentteja.

Lisää Gaurav Siyalilta

tilaa uutiskirjeemme

Liity uutiskirjeemme saadaksesi teknisiä vinkkejä, arvosteluja, ilmaisia ​​e-kirjoja ja eksklusiivisia tarjouksia!

Klikkaa tästä tilataksesi