Instagram on yksi suosituimmista sosiaalisen median sivustoista, jolla on miljardeja käyttäjiä. Kaikilla opiskelijoista julkkiksiin on Instagram-tili. Instagramin julkisilla tiedoilla voi olla valtavasti arvoa yrityksille, markkinoijille ja yksityishenkilöille. Kuka tahansa voi käyttää näitä tietoja tietojen analysointiin, kohdistamiseen markkinointiin ja oivallusten luomiseen.

Pythonilla voit rakentaa automaattisen työkalun, joka poimii Instagram-tietoja.

Vaadittujen kirjastojen asentaminen

Instaloader on Python-kirjasto, jonka avulla voit poimia julkisesti saatavilla olevia tietoja Instagramista. Voit käyttää tietoja, kuten kuvia, videoita, käyttäjätunnusta, ei. viesteistä, seuraajien määrä, seuraajien määrä, bio jne. käyttämällä Instaloaderia. Huomaa, että Instaloader ei ole millään tavalla sidoksissa Instagramiin, sen valtuuttama, ylläpitämä tai tukema.

Asenna instaloader pip: n kautta suorittamalla seuraava komento:

pip Asentaa asennusohjelma

Sinulla täytyy olla pip asennettuna järjestelmääsi asentaaksesi ulkoisia Python-kirjastoja.

instagram viewer

Seuraavaksi sinun on asennettava Pandas Python -kirjasto. Pandas on Python-kirjasto, jota käytetään pääasiassa tietojen käsittelyyn ja analysointiin. Asenna se suorittamalla seuraava komento:

pip Asentaa pandat

Nyt olet valmis aloittamaan koodin määrittämisen ja tietojen hakemisen Instagramista.

Koodin määrittäminen

Instagram-tietojen hakutyökalun määrittämistä varten sinun on tuotava Instaloader Python -kirjasto ja luotava Instaloader-luokan esiintymä. Sen jälkeen sinun on annettava sen profiilin Instagram-kahva, josta haluat poimia tiedot.

Instagram Extractor Python -koodi on saatavilla a GitHub-arkisto ja sitä voi käyttää ilmaiseksi MIT-lisenssin alaisena.

tuonti asennusohjelma

# Instaloader-luokan esiintymän luominen
bot = asennusohjelma. Instaloader()

# Profiilin lataus Instagram-kahvasta
profiili = asennusohjelma. Profile.from_username (bot.context, 'Cristiano')
Tulosta(profiili)

Tämä on hyvä ensimmäinen askel tarkistaaksesi perusasiat. Sinun pitäisi nähdä merkityksellisiä tietoja ilman virheitä:

Tietojen purkaminen profiilista

Voit poimia arvokkaita julkisesti saatavilla olevia tietoja, kuten käyttäjätunnus, no. viesteistä seuraajien määrä, seuraajien määrä, kuvaus, käyttäjätunnus ja ulkoinen URL-osoite Instaloaderilla vain muutamalla koodirivillä. Sinun tarvitsee vain antaa profiilin Instagram-kahva.

tuonti asennusohjelma
tuonti pandat kuten pd

# Instaloader-luokan esiintymän luominen
bot = asennusohjelma. Instaloader()

# Profiilin lataaminen Instagram-kahvasta
profiili = asennusohjelma. Profile.from_username (bot.context, 'leomessi')
Tulosta("Käyttäjätunnus: ", profile.username)
Tulosta("Käyttäjätunnus: ", profile.userid)
Tulosta("Viestien määrä: ", profile.mediacount)
Tulosta("Seuraajien määrä: ", profile.seuraajat)
Tulosta("Seuraava määrä: ", profile.followees)
Tulosta("Bio: ", profile.biography)
Tulosta("Ulkoinen URL-osoite: ", profile.external_url)

Sinun pitäisi nähdä paljon profiilitietoja määrittämästäsi kahvasta:

Sähköpostien poimiminen Biosta

Voit poimia sähköpostiosoitteita minkä tahansa profiilin Insta-biosta käyttämällä säännöllisiä lausekkeita. Sinun on tuotava Python re kirjasto ja välitä säännöllinen lauseke sähköpostin vahvistamiseksi parametrina re.findall() menetelmä:

tuonti asennusohjelma
tuonti re
# Instaloader-luokan esiintymän luominen
bot = asennusohjelma. Instaloader()
profiili = asennusohjelma. Profile.from_username (bot.context, "varallisuus")
Tulosta("Käyttäjätunnus: ", profile.username)
Tulosta("Bio: ", profile.biography)
sähköpostit = re.findall (r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", profile.biography)
print("Sähköpostit purettu alkaen bio:")
Tulosta(sähköpostit)

Skripti tulostaa kaiken, jonka se tunnistaa sähköpostiosoitteeksi biossa:

Parhaiden hakutulosten tietojen poimiminen

Kun etsit mitä tahansa Instagramissa, saat useita tuloksia, mukaan lukien käyttäjänimiä ja hashtageja. Voit poimia suosituimmat hakutulokset käyttämällä get_profiles() ja get_hashtags() menetelmiä. Sinun tarvitsee vain antaa hakukysely asennusohjelma. TopSearchResults() menetelmä. Lisäksi voit iteroida ja tulostaa/tallentaa yksittäisiä tuloksia.

tuonti asennusohjelma

# Instaloader-luokan esiintymän luominen
bot = asennusohjelma. Instaloader()

# Anna hakukysely täällä
search_results = asennusohjelma. TopSearchResults (bot.context, 'musiikkia')

# Iteroidaan purettujen käyttäjänimien yli
vartenkäyttäjätunnussisäänHakutulokset.get_profiles():
Tulosta(käyttäjänimi)

# Iteroidaan purettujen hashtagejen yli
vartenHashtagsisäänHakutulokset.get_hashtags():
Tulosta(Hashtag)

Tulos sisältää kaikki vastaavat käyttäjänimet ja hashtagit:

Tilin seuraajien ja seuraajien poimiminen

Voit poimia tilin seuraajat ja ne, joita se seuraa itse, Instaloaderilla. Sinun on annettava Instagram-käyttäjätunnus ja salasana näiden tietojen hakemiseksi.

Älä koskaan käytä henkilökohtaisia ​​tilejäsi tietojen poimimiseen Instagramista, sillä se voi saada tilisi väliaikaisesti tai pysyvästi estettyä.

Kun olet luonut Instaloader-luokan esiintymän, sinun on annettava käyttäjätunnuksesi ja salasanasi. Näin robotti voi kirjautua sisään Instagramiin tililläsi ja hakea seuraajien ja seuraajien tiedot.

Seuraavaksi sinun on annettava kohdeprofiilin Instagram-kahva. The get_followers() ja get_followees() menetelmät erottavat seuraajat ja seuraajat. Voit saada seuraajien ja seuraajien käyttäjätunnukset käyttämällä seuraaja.käyttäjänimi ja seuraaja.käyttäjänimi ominaisuuksia vastaavasti.

Jos haluat tallentaa tulokset CSV-tiedostoon, sinun on ensin muutettava tiedot Pandas DataFrame -objektiksi. Käytä pd. Datakehys() menetelmä listaobjektin muuntamiseksi DataFrame-kehykseksi.

Lopuksi voit viedä DataFrame-objektin CSV-tiedostoon käyttämällä to_csv() menetelmä. Sinun täytyy läpäistä tiedostonimi.csv tämän menetelmän parametrina saadaksesi viedyt tiedot CSV-tiedostomuodossa.

Vain tilin omistajat voivat nähdä kaikki seuraajat ja seuraajat. Et voi poimia kaikkia seuraajien ja seuraajien tietoja tällä tai millään muulla menetelmällä.

# Kirjastojen tuonti
tuonti asennusohjelma
tuonti pandat kuten pd

# Instaloader-luokan esiintymän luominen
bot = asennusohjelma. Instaloader()
bot.login (käyttäjä="Sinun käyttäjä nimesi", passwd="Salasanasi")

# Profiilin lataaminen Instagram-kahvasta
profiili = asennusohjelma. Profile.from_username (bot.context, 'Your_target_account_insta_handle')

# Haetaan kaikkien seuraajien käyttäjänimet
seuraajat = [seuraaja.käyttäjänimi seuraajalle profiilissa.get_followers()]

# Tietojen muuntaminen DataFrame-kehykseksi
followers_df = pd. DataFrame (seuraajat)

# Tallenna tulokset CSV-tiedostoon
followers_df.to_csv('seuraajat.csv', index=False)

# Haetaan kaikkien seuraavien käyttäjänimiä
follows = [seuraavan käyttäjänimi profiilissa.get_followees()]

# Tietojen muuntaminen DataFrame-kehykseksi
seuraavat_df = pd. DataFrame (seuraavat)

# Tallenna tulokset CSV-tiedostoon
followings_df.to_csv('seuraavat.csv', index=False)

Lataa viestejä Instagram-tililtä

Jälleen kerran, jotta voit ladata viestejä miltä tahansa tililtä, ​​sinun on annettava käyttäjätunnus ja salasana. Näin robotti voi kirjautua sisään Instagramiin tililläsi. Voit hakea kaikki viestien tiedot käyttämällä get_posts() menetelmä. Ja voit iteroida ja ladata kaikki yksittäiset viestit käyttämällä download_post() menetelmä.

# Kirjastojen tuonti
tuonti asennusohjelma
tuonti pandat kuten pd

# Luo Instaloader-luokan esiintymä
bot = asennusohjelma. Instaloader()
bot.login (käyttäjä="Sinun käyttäjä nimesi",passwd="Salasanasi")

# Profiilin lataaminen Instagram-kahvasta
profiili = asennusohjelma. Profile.from_username (bot.context, 'Your_target_account_insta_handle')

# Haetaan kaikki objektin viestit
posts = profile.get_posts()

# Kaikkien yksittäisten viestien iterointi ja lataaminen
hakemistossa, post in enumerate (viestit, 1):
bot.download_post (post, target=f"{profiili.käyttäjänimi_{index}")

Raaputa verkkoa Pythonilla

Tietojen kaapiminen tai verkkokaappaus on yksi yleisimmistä tavoista poimia hyödyllistä tietoa verkosta. Voit käyttää keräämiäsi tietoja markkinointiin, sisällöntuotantoon tai päätöksentekoon.

Python on ensisijainen kieli tietojen kaapimiseen. Kirjastot, kuten BeautifulSoup, Scrapy ja Pandas, yksinkertaistavat tietojen poiminta, analysointia ja visualisointia.