Internet Movie Database (IMDb) on suurin online-tietokanta, joka sisältää tietoa elokuvista, televisiosarjoista, kotivideoista, videopeleistä ja suoratoistosisällöstä. Online-tietokanta sisältää miljoonia tarkkoja tietueita, joita voit käyttää tietojen analysointiin.

Cinemagoer (aiemmin IMDbPY) on Python-kirjasto IMDb-elokuvatietokannan tietojen hallintaan ja hakemiseen. Voit käyttää elokuvia, ihmisiä ja yrityksiä koskevia tietoja, joita voidaan käyttää edelleen analysointiin.

Vaadittujen kirjastojen asentaminen

Sinun on asennettava elokuvan kävijä Python-kirjasto pääsyä varten IMDb tietokanta. Asenna kirjasto suorittamalla komentokehotteessa seuraava komento:

pip Asentaa elokuvan kävijä

Sinulla täytyy olla pip asennettuna järjestelmääsi asentaaksesi ulkoisia Python-kirjastoja.

Tässä projektissa käytetty koodi on saatavilla a GitHub-arkisto ja sen käyttö on ilmaista MIT-lisenssin alaisena.

IMDb-tietojen purkaminen Pythonilla

Cinemagoer-kirjasto on tuotava ennen kuin käytät sitä koodissasi.

alkaen imdb tuonti Elokuvan katsoja
ia = Cinemagoer()
instagram viewer

Yllä oleva koodi tuo cinemagoer-kirjaston ja luo esiintymän cinemagoer-luokasta.

Elokuvien haku

Voit etsiä elokuvia tietyllä (tai vastaavalla) nimellä käyttämällä search_movie() menetelmä. Jos esimerkiksi haluat etsiä elokuvia, joiden otsikko on "rock", sinun on suoritettava seuraava koodi:

alkaen imdb tuonti Elokuvan katsoja

# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()

# Haetaan elokuvia, joiden nimessä on rock
elokuvat = ia.search_movie('rock')
Tulosta(elokuvat[0])

Tämän pitäisi tulostaa ensimmäinen löytämänsä elokuva, esimerkiksi:

Voit saada elokuvan sen IMDb-tunnuksella. Voit sitten poimia lisätietoja, kuten ohjaajien nimet ja genret. Sinun täytyy selata luetteloa saada henkilökohtaista tietoa.

alkaen imdb tuonti Elokuvan katsoja

# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()

# Elokuvan saaminen IMDb-tunnuksella
elokuva = ia.get_movie('0468569')
Tulosta(elokuva)

# Elokuvan ohjaajien nimien tulostaminen
Tulosta('Ohjaajat:')

ohjaajaksi elokuvassa['ohjaajat']:
tulosta (director['nimi'])

# elokuvan genrejen tulostaminen
Tulosta('Genret:')

elokuvan genrelle['genrejä']:
Tulosta(genre)

Tulosteessa sinun pitäisi nähdä tietyn elokuvan nimi, sen ohjaaja(t) ja genre(t):

Etsitään henkilöä

Voit etsiä ihmisiä käyttämällä search_person() menetelmä. Jos esimerkiksi haluat etsiä sanalla "Heath", sinun on suoritettava seuraava koodi:

alkaen imdb tuonti Elokuvan katsoja

# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()

# Etsitään ihmisiä, joiden nimissä on Heath
henkilöt = ia.search_person('Heath')
Tulosta(henkilöt[0])

Näet ensimmäisen haun löytämän henkilön nimen:

Yritysten haku

Voit etsiä yrityksiä käyttämällä search_company() menetelmä. Jos esimerkiksi haluat etsiä sanalla "Universal", sinun on suoritettava seuraava koodi:

alkaen imdb tuonti Elokuvan katsoja

# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()

# Etsitään yrityksiä, joiden nimissä on Universal
yritykset = ia.search_company('Universaali')
Tulosta(yritykset)

Saat luettelon kaikista yrityksistä, joiden nimissä on Universal.

Voit myös hakea henkilön ja yrityksen tiedot sen tunnuksella.

alkaen imdb tuonti Elokuvan katsoja

# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()

# Henkilötietojen saaminen tunnuksella
henkilö = ia.get_person('0005132')
tulosta (person['nimi'])
tulosta (person['syntymäpäivä'])

# Yritystietojen saaminen tunnuksella
yritys = ia.get_company('0005073')
tulosta (yritys['nimi'])

Tulos näyttää henkilön tiedot ja yrityksen nimen:

Parhaiden ja alhaisimpien elokuvien löytäminen

Voit hakea 250 parhaan ja 100 parhaan elokuvan tiedot käyttämällä get_top250_movies() ja get_bottom100_movies() menetelmät vastaavasti:

alkaen imdb tuonti Elokuvan katsoja

# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()

# 250 parhaan elokuvan löytäminen
top = ia.get_top250_movies()
Tulosta(alkuun[0])

# Löytää 100 alinta elokuvaa
bottom = ia.get_bottom100_movies()
Tulosta(alhaalla[0])

Vastauksena näet parhaan elokuvan nimen ja huonoimman elokuvan nimen:

Elokuvakävijäkirjasto tarjoaa myös joitain muita menetelmiä, kuten get_top250_tv(), get_popular100_movies(), ja get_top250_intian_movies().

Tietojen analysointi on tietojen arviointia käyttämällä analyyttisiä tai tilastollisia työkaluja tiedon poimimiseen. Data-analyysin suosio kasvaa joka päivä. Sitä käyttävät nyt yritykset, markkinointiyhtiöt ja urheilujoukkueet. Data-analytiikan koko prosessi sisältää tavoitteiden määrittelyn, kysymysten esittämisen, tiedonkeruun, tietojen käsittelyn, data-analyysin ja tulosten päättämisen.

Voit saada tietojoukkoja projekteihisi käyttämällä Python-kirjastoja, kuten Cinemagoer, tai verkkoalustojen, kuten Kagglen, kautta. Pythonin ja R: n kaltaisten täydellisten kielten lisäksi voit käyttää muita työkaluja, kuten Microsoft Excel, Tableau ja Stata, tietojen analysointiin.