Mainos
Kun kyse on online-tietokannoista ja tiedoista, jotka löytyvät ns.näkymätön verkko 12 parasta hakukonetta näkymättömän Webin tutkimiseksiGoogle tai Bing ei voi etsiä kaikkea. Näet näkymättömän verkon tutkimiseksi sinun on käytettävä näitä erityisiä hakukoneita. Lue lisää ”En ole tyypillinen käyttäjäsi. Olen varma, että vietän hiukan liikaa aikastani seulomalla online-tietokantoja sellaisissa paikoissa kuin Kansallisarkisto ja CIA FOIA huone, mutta minun ei tarvitse sanoa, että mikään ei innosta minua enemmän kuin silloin, kun löydän HTML-pohjaisen taulukon, joka on täynnä näennäisesti monimutkaisia ja kytkemättä olevia määriä tiedot.
Tosiasia on, että taulukot ovat tärkeiden totuuksien kultakaivos. Tietoja kerätään usein armeijoista, jotka keräävät tiedonkeruun ja saappaat ovat maassa. Sinulla on Yhdysvaltojen väestönlaskennan ihmisiä, jotka matkustavat koko maata kotitaloutta ja perhettä koskevia tietoja. Sinulla on voittoa tavoittelemattomia ympäristöryhmiä, jotka keräävät kaikenlaisia mielenkiintoisia tietoja ympäristöstä, pilaantumisesta, ilmaston lämpenemisestä ja muusta. Ja jos olet tekemisissä paranormaalin tai ufologian kanssa, siellä on myös jatkuvasti päivitettäviä taulukoita oudon esineiden havaitsemisesta taivaalla meidän yläpuolella.
Ironista kyllä, luulet, että mikä tahansa maailman hallitus olisi kiinnostunut tietämään, millaisia vieraita veneitä on havaittu taivaalla minkä tahansa maan päällä, mutta ilmeisesti ei - ainakaan ei Yhdysvalloissa. joka tapauksessa. Amerikassa käsityöläisten epätavallisten havaintojen kokoelma on siirretty amatööriharrastajajoukkueille, jotka parveilevat uusiin UFO-havaintoihin kuten koirat liekkiin. Mielenkiintoni näihin havaintoihin ei juurikaan johdu vieraiden kiehtomisesta muilta planeetoilta tulevilta muukalaisilta tai käsityöläisiltä, vaan tieteellisestä kiinnostuksesta kuvioiden kanssa - missä ja miksi useammat ihmiset näkevät asioita taivaalla ja voivatko nämä havainnot heijastaa jotain todella todellista ja paljon enemmän maanläheistä, joka todella menee päällä.
Tutkimaan UFO-harrastajatiimien keräämiä tietomääriä olen itse kehittänyt tavan tuoda suuria HTML-taulukoita tietoja Google-laskentataulukkoon, ja sitten manipuloida ja analysoida näitä tietoja kerätäkseen ja löytääkseen merkityksellistä ja tärkeää tiedot. Tässä artikkelissa aion näyttää sinulle, kuinka tehdä sama.
Tärkeitä HTML-tietoja Google-laskentataulukossa
Tässä esimerkissä aion näyttää, kuinka tuodaan tietoja, jotka voidaan tallentaa mihin tahansa Internet-sivuston taulukkoon, Google-taulukkoosi. Ajattele sitä valtavaa tietomäärää, jota Internetissä on tänään saatavana HTML-taulukkojen muodossa. Pelkällä Wikipedialla on tietoja taulukoista aiheista, kuten ilmaston lämpeneminen, Yhdysvaltain väestölaskentatoimistolla on tonnia väestötiedot, ja hiukan Googling antaa sinulle paljon enemmän.
Esimerkissäni aloitan kansallisen UFO-raporttikeskuksen tietokannasta, joka todella näyttää siltä, että se voisi olla kyselytyyppinen syväverkkoinen tietokanta, mutta jos noudatat URL-jäsentely, se on oikeastaan puoliksi monimutkainen verkkopohjainen raportointijärjestelmä, joka koostuu staattisista verkkosivuista ja staattisista HTML-taulukoista - juuri sitä mitä me haluamme etsiessään tietoja tuonti.
NUForc.org on yksi niistä organisaatioista, joka toimii yhtenä suurimmista UFO-havaintojen raportointikeskuksista. Se ei ole ainoa, mutta se on tarpeeksi suuri, jotta voidaan löytää uusia tietojoukkoja nykyisillä havainnoilla joka kuukausi. Voit tarkastella tietoja lajiteltuina kriteerien, kuten valtion tai päivämäärän mukaan, ja kukin niistä toimitetaan staattisen sivun muodossa. Jos lajitlet päivämäärän perusteella ja napsautat sitten viimeisintä päivämäärää, näet, että siellä olevassa taulukossa on staattinen verkkosivu, joka on nimetty päivämäärämuodon mukaan.
Joten, meillä on nyt malli, jolla poistetaan säännöllisesti viimeisimmät havaintotiedot tästä HTML-pohjaisesta tietokannasta. Ainoa mitä sinun täytyy tehdä, on tuoda ensimmäinen taulukko, tunnistaa viimeisin merkintä (ylin) Viimeisin päivitys ja rakenna sitten lähettämispäivämäärä URL-linkin luomiseen viimeisimmän HTML-tietotaulukon kohdalle olemassa. Tämän tekeminen vaatii vain pari ImportHTML-toiminnon esiintymää ja sitten muutama luova tekstikäsittelytoimintojen käyttö. Kun olet valmis, sinulla on yksi tyylikkäimmistä ja itse päivityksellisistä raporttitaulukoista. Aloitetaan.
Taulukoiden tuominen ja tietojen manipulointi
Ensimmäinen askel on tietysti uuden taulukon luominen.
Joten miten HTML-tauluja tuodaan? Tarvitset vain URL-osoitteen, johon taulukko on tallennettu, ja sivun taulukon numero - yleensä ensimmäinen lueteltu on 1, toinen on 2 ja niin edelleen. Koska tiedän ensimmäisen taulukon URL-osoitteen, jossa luetellaan päivämäärät ja lueteltujen havaintojen lukumäärä, on mahdollista tuoda kirjoittamalla seuraava toiminto soluun A1.
= ImportHTML ( ” http://www.nuforc.org/webreports/ndxpost.html?”&H2,”table”,1)
H2: lla on toiminto “= tunti (nyt ()), Joten taulukko päivittyy tunnin välein. Tämä on todennäköisesti äärimmäistä tiedoille, jotka päivittävät tätä harvoin, joten voisin luultavasti päästä eroon tekemästä sitä päivittäin. Joka tapauksessa yllä oleva ImportHTML-toiminto tuo taulukon alla olevan kuvan mukaisesti.
Sinun on tehtävä hiukan tietojen käsittelyä tällä sivulla, ennen kuin voit koota toisen taulukon URL-osoitteen kaikkien UFO-havaintojen kanssa. Mutta mene eteenpäin ja luo toinen arkki työkirjaan.
Ennen kuin yrität rakentaa kyseistä toista arkkia, on aika purkaa postituspäivämäärä ensimmäisestä taulukosta, jotta linkki toiseen taulukkoon muodostettaisiin. Ongelmana on, että päivämäärä tuodaan päivämäärämuodossa, ei merkkijonona. Joten ensin on käytettävä TEKSTI-toimintoa muuntaaksesi raportin postituspäivämäärä merkkijonoksi:
= teksti (A2, ”kk / pv / vv”)
Seuraavassa oikealla olevassa solussa sinun on käytettävä SPLIT-toimintoa “/” -erottajan kanssa, jotta päivämäärä voidaan jakaa kuukauteen, vuorokauteen ja vuoteen.
= jaettu (D2, ”/”)
Hyvältä näyttää! Jokainen numero on kuitenkin pakotettava kaksinumeroiseksi. Voit tehdä tämän heti niiden alapuolella olevissa soluissa käyttämällä TEKSTI-komentoa uudelleen.
= teksti (E2, ”00 ″)
Muoto “00” (ne ovat nollia) pakottaa kaksi numeroa tai “0” paikanvaraajaksi.
Nyt olet valmis rakentamaan koko URL-osoitteen uusimpaan HTML-taulukkoon uusista havainnoista. Voit tehdä tämän käyttämällä CONCATENATE-toimintoa ja liittämällä yhteen kaikki ensimmäisestä taulukosta juuri poimitut tietobitit.
= Concatenate ( ” http://www.nuforc.org/webreports/ndxp”,G3,E3,F3,”.html”)
Nyt uudessa yllä luomassa taulukossa (tyhjä arkki) aiot tehdä uuden "importhtml" -toiminnon, mutta tällä kertaa ensimmäiselle URL-linkin parametri, joten siirryt takaisin ensimmäiseen laskentataulukkoon ja napsautat solua, jonka juuri luomasi URL-linkki on.
Toinen parametri on ”taulukko” ja viimeinen on ”1” (koska havaintotaulukko on ensimmäinen ja ainoa sivulla). Paina Enter, ja nyt olet juuri tuonut koko havaintojen määrän, joka on lähetetty kyseisenä päivänä.
Joten luulet todennäköisesti, että tämä on mukava uutuus teko ja kaikki - tarkoitan, kun kaikki, mitä olet tehnyt, poistetaan olemassa olevat tiedot Internet-taulukosta ja siirtäneet ne toiseen taulukkoon, vaikkakin yksityisenä Google-dokumenteissasi tili. Kyllä se on totta. Nyt kun se on omassa yksityisessä Google Docs -tilissäsi, sinulla on kuitenkin hyppysissäsi työkalut ja toiminnot, joiden avulla voit analysoida tietoja paremmin ja alkaa löytää uskomattomia yhteyksiä.
Pivot-raporttien käyttäminen tuotujen tietojen analysoinnissa
Äskettäin kirjoitin artikkelin käytöstä Pivot-raportit Google-laskentataulukossa Ryhdy asiantuntijaanalyytikkona yön yli Google-laskentataulukkoraporttityökalujen avullaTiesitkö, että yksi suurimmista välineistä kaikkien tietojen analysoimiseksi on oikeastaan Google Spreadsheet? Syynä tähän ei ole vain se, että se voi tehdä melkein kaiken mitä haluat. Lue lisää suorittaa kaikenlaisia hienoja tietoanalyysikohteita. No, voit tehdä saman uskomattoman data-analyysin akrobatiaa Internetistä tuomiesi tietojen kanssa - antaa sinulle mahdollisuuden löytää mielenkiintoisia yhteyksiä, joita mahdollisesti kukaan muu ei ole aiemmin paljastanut sinä.
Esimerkiksi viimeisten havaintojen taulukosta voin päättää käyttää kääntöraporttia tarkastellaksesi lukumäärää erilaiset yksilölliset muodot, jotka ilmoitetaan kussakin tilassa verrattuna havaintojen kokonaismäärään kyseisessä tilassa osavaltio. Lopuksi suodatin myös kaiken, joka mainitsee ”muukalaiset” kommenttiosassa, jotta toivottavasti kitkataan joitain siipimutterimerkinnöistä.
Tämä paljastaa todella joitain melko mielenkiintoisia asioita heti lepakkosta, kuten se, että Kaliforniassa on selvästi korkein - muiden valtioiden ilmoitettujen havaintojen lukumäärä, samoin kuin suurin käsityömuotojen ilmoittamisaste maa. Se osoittaa myös, että Massachusetts, Florida ja Illinois ovat suuria iskuja myös UFO-havaintoosastolla (ainakin viimeisimmissä tiedoissa).
Toinen hieno asia Google Spreadsheetissä on laaja valikoima kaavioita, mukaan lukien geokartta, jonka avulla voit aseta datan "kuumia kohtia" graafiseen muotoon, joka todella erottuu ja tekee nämä yhteydet datan sisällä varsin hyvin ilmeinen.
Jos ajattelet sitä, tämä on todella vain jäävuoren huippu. Jos voit nyt tuoda tietoja tietotaulukoista millä tahansa Internet-sivulla, mieti vain mahdollisuuksia. Hanki viimeisimmät varastoluvut tai viimeisimmät kymmenen suosituinta kirjaa ja kirjailijaa New York Timesin bestseller-listalla, tai maailman myydyimmät autot. Siellä on HTML-taulukoita melkein mistä tahansa aiheesta, jonka voit kuvitella, ja monissa tapauksissa kyseisiä taulukoita päivitetään usein.
ImportHtml antaa sinun mahdollisuuden kytkeä Google-laskentataulukko Internetiin ja syöttää siellä olemassa olevia tietoja. Siitä voi tulla oma henkilökohtainen tietokeskuksesi, jonka avulla voit manipuloida ja hierontaa muotoon, jonka kanssa voit todella työskennellä. Se on vain yksi erittäin hieno asia, jota rakastaa Google Spreadsheetissä.
Oletko koskaan tuonut tietoja laskentataulukoihisi? Millaisia mielenkiintoisia asioita löysit tiedoista? Kuinka käytit tietoja? Jaa kokemuksiasi ja ideoitasi alla olevassa kommenttiosassa!
Kuvapisteet: Liiketoimintakaavio
Ryanilla on BSc-tutkinto sähkötekniikasta. Hän on työskennellyt 13 vuotta automaatiotekniikassa, 5 vuotta IT: ssä ja on nyt sovellusinsinööri. MakeUseOfin entinen toimitusjohtaja, hänet puhutaan kansallisissa konferensseissa datan visualisoinnista ja hänet on esitelty kansallisessa televisiossa ja radiossa.