Kuvittele varhainen aamu, jossa siemailet kuumaa kupillista tuoretta kahvia ja tietokoneesi lukee sinulle uusimmat otsikot – kaikki yksinään. Eikö kuulosta hämmästyttävältä?
Pythonilla voit rakentaa oman, henkilökohtaisen uutislukijasi, joka lukee puolestasi kaikki suosituimmat otsikot sekä otteet kustakin otsikosta. Kyllä se on oikein. Käyttämällä oikeita kirjastoja voit saada Pythonin suorittamaan kaikki aamurutiinisi ilman, että sinun tarvitsee lukea jokaista sanaa itse.
Näin voit kirjoittaa tämän koodin ja muokata sitä suosikkiuutissivustollesi.
Koodin suorittamisen edellytykset
Ennen kuin hyppäät sisään ja alat kirjoittaa koodia, sinun on täytettävä muutama ennakkoehto. Nämä ovat joitain hyvin perusvaatimuksia, jotka voivat tehdä Pythonin käytöstä helpompaa ja tehokkaampaa.
- Python: Pythonin uusimman version asentaminen olisi hyvä päätös. Voit asentaa minkä tahansa Python IDE: n saadaksesi parhaat tulokset.
- Uutissivusto/Internet-yhteys: Koska Python-koodi lukee suosikkisivustosi tärkeimmät otsikot, sinun on varmistettava, että pääset verkkosivustolle tätä koodia suoritettaessa.
Koko koodi on kirjoitettu suosittuun Jupyter Notebookiin Python IDE tätä ohjetta varten. Lisäksi India Todayn uutissivusto on koodattu esimerkkikoodiin.
Jos haluat ladata Jupyter Notebookin, voit joko käyttää sitä osana anaconda-pakettia tai ladata erillisen version järjestelmääsi.
Ladata:Anaconda | Jupyter muistikirja
Pidemättä puhetta, syvennytään koodiin.
Koodin kirjoittaminen Pythonissa
Aloittaaksesi sinun on tuotava muutama Python-kirjasto, joista jokainen palvelee eri tarkoituksia.
tuo win32com.client nimellä wincl
osoitteesta urllib.request import urlopen nimellä ureq
bs4:stä tuonti BeautifulSoup keitona
sp = wincl. Lähetys ("SAPI.spVoice")
Missä:
- win32com.client: Tämä kirjasto on vuorovaikutuksessa Windows-laitteiden kanssa ja suorittaa Python-ohjelmia saumattomasti.
- urllib.request: Tämä kirjasto käsittelee URL-arvoja pyyntömoduulista.
- bs4: BS4-kirjasto sisältää Beautiful Soup -toiminnon, joka kaappaa tietoja verkkosivustoilta Pythonilla.
- sp = wincl. Lähetys ("SAPI.spVoice"): Aktivoi äänikomennot Windowsissa.
Tämä koodi toimii vain Windowsissa, koska kutsut win32.com.client-kirjastoa.
Seuraavaksi sinun on määritettävä verkkosivuston URL-osoite (linkki). url muuttuja, joka on tallennettu Pythonin muistiin.
url = https://www.indiatoday.in/top-stories
Luo uusi muuttuva asiakasohjelma tallentaaksesi URL-avauskomennon.
asiakas = ureq (url)
tulostaa (asiakas)
missä:
- asiakas: Uusi muuttuja.
- ureq: Python-funktio, joka on tuotu tiedostosta urllib.request, joka avaa tallennetun URL-osoitteen.
Koska olet avannut URL-osoitteen muistissa, on aika tarkistaa, salliiko kyseinen verkkosivusto suojaamattomia yhteyksiä Pythonin kautta. Voit tulostaa asiakasmuuttujan ja tarkistaa tulosteen.
Print-komennolla on kaksi vaihtoehtoa:
- HTTP-virhe: Kun verkkosivusto on suojattu, et voi kaapia sisältöä Pythonilla.
- Koodikatkelma: Jos koodinpätkä palautetaan verkkosivuston suorittamisen jälkeen, oleta, että voit helposti vetää otsikot.
Kun olet määrittänyt uutissivuston URL-osoitteen URL-komennolla, on aika tuoda HTML-koodi muuttujaan.
page_html = client.read()
tulosta (sivu_html)
Sinun on tulostettava Pythoniin tuotu verkkosivuston HTML-koodi varotoimenpiteenä. Voit jopa yhdistää tämän koodin alla olevaan verkkosivustokoodiin Tarkastaa vaihtoehto.
Ennen koodin muuntamista sinun on suljettava verkkosivusto Pythonin muistista sulkemiskomennolla.
client.close()
Koska HTML-koodi on tuotu Python-muuttujaan, sinun on muunnettava se Python-luettavaan muotoon, jotta voit käyttää löytö ja löydä kaikki komennot etsiä avainsanoja.
Voit muuntaa HTML-koodin antamalla seuraavan komennon:
page_soup = keitto (sivu_html, "html.parser")
Missä:
- page_soup: Uusi muuttuja.
- keitto: Alias varten Kaunis keittomoduuli.
- page_html: Muuttuja, joka sisältää verkkosivuston HTML-koodin.
- html_parser: Oletussyntaksi HTML-koodin muuntamiseen.
Kun koodi on valmis käytettäväksi, on aika tutkia verkkosivuston HTML-koodia ja alkaa etsiä otsikon avainsanoja.
Voit tehdä tämän napsauttamalla hiiren kakkospainikkeella mitä tahansa verkkosivuston kohtaa ja napsauttamalla Tarkista. Tämä avaa kyseisen verkkosivuston HTML-koodin.
Vieritä verkkosivuston koodiikkunaa, kunnes löydät otsikot tallentavat säilön tagit.
Nämä sisältyvät katso-sisältö tunnisteet India Today -sivustolla. Jokaisen uutissivuston säilöt vaihtelevat, mutta sinun pitäisi pystyä selaamaan koodia suhteellisen helposti.
artikkelit = page_soup.find("div", { "luokka": "näytä sisältö" })
Lopuksi sinun on kaapattava alitunnisteet, jotka sisältävät tärkeimmät otsikot, jotka Python lukee sinulle.
artikkelit = artikkelit.findAll("div", {"luokka": "luokkaluettelo"})
Näkymän sisältösäilö sisältää useita otsikoita, otsikoidesi ulkokuori.
Jotta voit kaapata kunkin otsikon yhteydessä luetellut H2-tunnisteet ja katkelmat, sinun on suoritettava silmukka.
i = 1
x: lle artikkeleissa:
otsikko = x.find("h2").teksti
para = x.find("p").teksti
tulosta (i, otsikko, "
", "
", kohta,"
", "
")
sp. Puhu (otsikko)
sp. Puhu (para)
i=i+1
Missä:
- minä: Uusi laskurimuuttuja, joka kasvaa automaattisesti.
- otsikko: Uusi muuttuja otsikon tallentamiseksi (h2).
- kohta: Uusi muuttuja, joka sisältää kuhunkin H2:een liittyvät kappaleet.
- Tulosta: Otsikon ja kohdan otsikko tulostetaan Python-käyttöliittymään.
- sp. Puhu (otsikko): Python lukee jokaisen tallennetun otsikon.
- sp. Puhu (para): Python lukee jokaisen tallennetun kappaleen katkelman.
- i = i+1: Tämä komento lisää automaattisesti jokaiseen Python-käyttöliittymässä näkyvään otsikkoon liittyvää sarjanumeroa.
Pythonin Beautiful Soup -moduulin käyttäminen päivittäisten uutisten lukemiseen
Joka kerta kun suoritat koodin, tuoreet otsikot uutissivustolta ladataan ennen kuin ne luetaan ääneen. Python suorittaa koodin aina, kun suoritat koodijoukon, mikä pitää sinut ajan tasalla verkkosivustolla tehdyistä muutoksista.
Python näyttää ja lukee edelleen vanhemmat otsikot, kunnes päivität koodin ja suoritat sen uudelleen.
Pythonin käyttäminen päivittäisten otsikoidesi lukemiseen on helppoa
Python, avoimen lähdekoodin kielenä, tarjoaa joukon työkaluja, kuten Beautiful Soup, Selenium ja muita kehyksiä – sekä aloittelijoille että edistyneille käyttäjille.
Python tekee siitä helppoa, jos haluat saada päivittäiset uutiset puheella. Tämän tietyn kielen oppiminen voi myös auttaa sinua tulemaan paremmaksi ohjelmoijaksi kaikilla aloilla.
Tarvitsetpa Python-työkaluja datatieteeseen, koneoppimiseen, verkkokehitykseen tai mihin tahansa siltä väliltä, tämä luettelo kattaa sinut.
Lue Seuraava
- Ohjelmointi
- Python
- Uutiset
- Tietokonevinkkejä
- Ohjelmointi
Gaurav Siyalilla on kahden vuoden kirjoituskokemus, joka on kirjoittanut sarjalle digitaalisia markkinointiyrityksiä ja ohjelmistojen elinkaaridokumentteja.
tilaa uutiskirjeemme
Liity uutiskirjeemme saadaksesi teknisiä vinkkejä, arvosteluja, ilmaisia e-kirjoja ja eksklusiivisia tarjouksia!
Klikkaa tästä tilataksesi