Internet Movie Database (IMDb) on suurin online-tietokanta, joka sisältää tietoa elokuvista, televisiosarjoista, kotivideoista, videopeleistä ja suoratoistosisällöstä. Online-tietokanta sisältää miljoonia tarkkoja tietueita, joita voit käyttää tietojen analysointiin.
Cinemagoer (aiemmin IMDbPY) on Python-kirjasto IMDb-elokuvatietokannan tietojen hallintaan ja hakemiseen. Voit käyttää elokuvia, ihmisiä ja yrityksiä koskevia tietoja, joita voidaan käyttää edelleen analysointiin.
Vaadittujen kirjastojen asentaminen
Sinun on asennettava elokuvan kävijä Python-kirjasto pääsyä varten IMDb tietokanta. Asenna kirjasto suorittamalla komentokehotteessa seuraava komento:
pip Asentaa elokuvan kävijä
Sinulla täytyy olla pip asennettuna järjestelmääsi asentaaksesi ulkoisia Python-kirjastoja.
Tässä projektissa käytetty koodi on saatavilla a GitHub-arkisto ja sen käyttö on ilmaista MIT-lisenssin alaisena.
IMDb-tietojen purkaminen Pythonilla
Cinemagoer-kirjasto on tuotava ennen kuin käytät sitä koodissasi.
alkaen imdb tuonti Elokuvan katsoja
ia = Cinemagoer()
Yllä oleva koodi tuo cinemagoer-kirjaston ja luo esiintymän cinemagoer-luokasta.
Elokuvien haku
Voit etsiä elokuvia tietyllä (tai vastaavalla) nimellä käyttämällä search_movie() menetelmä. Jos esimerkiksi haluat etsiä elokuvia, joiden otsikko on "rock", sinun on suoritettava seuraava koodi:
alkaen imdb tuonti Elokuvan katsoja
# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()
# Haetaan elokuvia, joiden nimessä on rock
elokuvat = ia.search_movie('rock')
Tulosta(elokuvat[0])
Tämän pitäisi tulostaa ensimmäinen löytämänsä elokuva, esimerkiksi:
Voit saada elokuvan sen IMDb-tunnuksella. Voit sitten poimia lisätietoja, kuten ohjaajien nimet ja genret. Sinun täytyy selata luetteloa saada henkilökohtaista tietoa.
alkaen imdb tuonti Elokuvan katsoja
# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()# Elokuvan saaminen IMDb-tunnuksella
elokuva = ia.get_movie('0468569')
Tulosta(elokuva)# Elokuvan ohjaajien nimien tulostaminen
Tulosta('Ohjaajat:')ohjaajaksi elokuvassa['ohjaajat']:
tulosta (director['nimi'])# elokuvan genrejen tulostaminen
Tulosta('Genret:')
elokuvan genrelle['genrejä']:
Tulosta(genre)
Tulosteessa sinun pitäisi nähdä tietyn elokuvan nimi, sen ohjaaja(t) ja genre(t):
Etsitään henkilöä
Voit etsiä ihmisiä käyttämällä search_person() menetelmä. Jos esimerkiksi haluat etsiä sanalla "Heath", sinun on suoritettava seuraava koodi:
alkaen imdb tuonti Elokuvan katsoja
# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()
# Etsitään ihmisiä, joiden nimissä on Heath
henkilöt = ia.search_person('Heath')
Tulosta(henkilöt[0])
Näet ensimmäisen haun löytämän henkilön nimen:
Yritysten haku
Voit etsiä yrityksiä käyttämällä search_company() menetelmä. Jos esimerkiksi haluat etsiä sanalla "Universal", sinun on suoritettava seuraava koodi:
alkaen imdb tuonti Elokuvan katsoja
# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()
# Etsitään yrityksiä, joiden nimissä on Universal
yritykset = ia.search_company('Universaali')
Tulosta(yritykset)
Saat luettelon kaikista yrityksistä, joiden nimissä on Universal.
Voit myös hakea henkilön ja yrityksen tiedot sen tunnuksella.
alkaen imdb tuonti Elokuvan katsoja
# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()# Henkilötietojen saaminen tunnuksella
henkilö = ia.get_person('0005132')
tulosta (person['nimi'])
tulosta (person['syntymäpäivä'])
# Yritystietojen saaminen tunnuksella
yritys = ia.get_company('0005073')
tulosta (yritys['nimi'])
Tulos näyttää henkilön tiedot ja yrityksen nimen:
Parhaiden ja alhaisimpien elokuvien löytäminen
Voit hakea 250 parhaan ja 100 parhaan elokuvan tiedot käyttämällä get_top250_movies() ja get_bottom100_movies() menetelmät vastaavasti:
alkaen imdb tuonti Elokuvan katsoja
# Cinemagoer-luokan esiintymän luominen
ia = Cinemagoer()# 250 parhaan elokuvan löytäminen
top = ia.get_top250_movies()
Tulosta(alkuun[0])
# Löytää 100 alinta elokuvaa
bottom = ia.get_bottom100_movies()
Tulosta(alhaalla[0])
Vastauksena näet parhaan elokuvan nimen ja huonoimman elokuvan nimen:
Elokuvakävijäkirjasto tarjoaa myös joitain muita menetelmiä, kuten get_top250_tv(), get_popular100_movies(), ja get_top250_intian_movies().
Tietojen analysointi on tietojen arviointia käyttämällä analyyttisiä tai tilastollisia työkaluja tiedon poimimiseen. Data-analyysin suosio kasvaa joka päivä. Sitä käyttävät nyt yritykset, markkinointiyhtiöt ja urheilujoukkueet. Data-analytiikan koko prosessi sisältää tavoitteiden määrittelyn, kysymysten esittämisen, tiedonkeruun, tietojen käsittelyn, data-analyysin ja tulosten päättämisen.
Voit saada tietojoukkoja projekteihisi käyttämällä Python-kirjastoja, kuten Cinemagoer, tai verkkoalustojen, kuten Kagglen, kautta. Pythonin ja R: n kaltaisten täydellisten kielten lisäksi voit käyttää muita työkaluja, kuten Microsoft Excel, Tableau ja Stata, tietojen analysointiin.