Etsitkö ilmaista dataa harjoitellaksesi data-analytiikkataitojasi? Tässä on joitain suosituimpia verkkosivustoja, jotka kannattaa tarkistaa.

Olitpa sitten tekemässä markkinatutkimusta, rakentamassa portfoliotasi analyytikkona tai etsimässä oivalluksia laajentaaksesi markkina-aluettasi, arvokkaat ja luotettavat tiedot ovat välttämättömiä tietoisen päätöksenteon kannalta.

Ilmaisen, luotettavan ja helposti saatavilla olevan tiedon etsiminen Internetistä sisältää kuitenkin haasteita. Tämä artikkeli tekee tiedonhakutehtävästäsi vähemmän haastavaa esittelemällä sinulle joitakin suosituimmista verkkosivustoista, joilla pääset käyttämään ilmaista dataa.

Google Trends on Googlen kehittämä ilmainen palvelu, joka tarjoaa käyttäjille suodattamattomia näytteitä Googlelle tehdyistä hakupyynnöistä. Vaikka tämä palvelu näyttää aikasarjatiedot vuodesta 2004 nykypäivään sekä globaalissa että kaupunkitason mittakaavassa, se ei näytä hakukoneiden käyttäjien henkilötietoja.

Voit myös rajoittaa dataa keskittymään luokkiin, kieliin, kokonaisuuksiin tai

trendikkäitä hakuja Googlessa Google Trendsin avulla. Esimerkkejä saatavilla olevista tiedoista ovat mm päivittäiset hakutrendit ja reaaliaikaiset hakutrendit, jotka näyttävät tiedot viimeisen seitsemän päivän ajalta.

FiveThirtyEight on datajournalismisivusto, joka sisältää tietoa kyselyanalyysistä, urheilusta, popkulttuurista, politiikasta, tieteestä ja taloudellisista tapahtumista.

Hienoa verkkosivustossa on, että voit ladata tiedot heidän verkkosivustoltaan tai heidän verkkosivustoltaan virallinen GitHub-arkisto ja käytä omaasi datan visualisointityökalut kiehtovien datajournalismin visuaalien luomiseen yleisöllesi. Muutamia esimerkkejä mielenkiintoisista saatavilla olevista tiedoista ovat mm MM-kisojen ennusteet ja 2022-23 NHL: n ennustetiedot.

BuzzFeed News on amerikkalainen tuoreet uutiset ja alkuperäinen raportointialusta, joka raportoi kaikesta journalismista, tekniikasta, viihteestä, julkkisuutisista, kulttuurista ja tee-se-itse-hackeista terveyteen ja politiikkaan.

BuzzFeed News tekee GitHubissaan tietojoukon, työkalut ja analyysit BuzzFeedin uutishuoneesta avoimen lähdekoodin, saatavilla ja saatavilla. Esimerkki sisältää mm FBI NICS -tuliaseiden taustatarkistustiedot.

Data.gov on Yhdysvaltojen hallituksen avoimen datan verkkosivusto, joka isännöi yli 250 000 julkisesti saatavilla olevaa, hyvin dokumentoitua tietojoukkoa kansainvälisiltä ja useilta liittovaltion viranomaisilta. Tämän aloitteen ideana oli luoda avoin ja läpinäkyvä hallitus.

Pääset käsiksi verkkosivustolta aiheeseen ja virastoon tai organisaatioon perustuviin tietoihin. Joitakin esimerkkejä Data.gov-sivustolta löytyvistä tiedoista on valtakunnallinen opintolainatietojärjestelmä ja sähköautojen väestötiedot.

Kaggle on Googlen hankkima julkinen dataleikkipaikka, joka tarjoaa laajan valikoiman tietojoukkoja eri aiheista. Tällä yhteisöalustalla voit jakaa koodejasi, oppia, tehdä yhteistyötä muiden data-ammattilaisten kanssa ja kehittää taitojasi. Kaggle järjestää myös datatieteen kilpailuja, joissa voit voittaa erilaisia ​​palkintoja.

Tämä opas tarjoaa a aloittelijan opas Kagglen käytön aloittamiseen datatieteessä. Esimerkkinä on Globaalit YouTube-tilastot 2023.

EarthData on NASAn tietoaloite, joka toimii maatietojen arkistona vuodesta 1994 tähän päivään. Voit saada etäsatelliittitiedoista tietoja, jotka liittyvät maapallon ilmakehää, valtameriä ja maan hydrosfääriä koskeviin tietoihin.

Voit selata erilaisia ​​​​aiheita ja käyttää tietoja, kuten äärimmäisen kuumuuden tiedot. Sinun on kuitenkin tutkittava NASAn planeettatietojärjestelmä ei-maallista dataa varten.

IMDb tarjoaa tietoja elokuvista, TV-sarjoista, kotivideoista, podcasteista, videopeleistä, suoratoistotiedoista ja julkkissisällöstä. Esimerkkinä on Ei-kaupalliset IMDb-tietojoukot.

AWS Public Dataset on verkkosivusto, joka isännöi yli 3000 tietojoukkoa, jotka on asetettu julkisesti saataville AWS-palvelujen kautta. Suurin osa täällä olevista tietojoukoista on projektipohjaisia. Muutamat sisältävät syövän genomin atlas ja Foldingathomen COVID-19-tietojoukot.

Inside Airbnb on Murray Coxin käynnistämä vahtikoirasivusto. Tämä sivusto on peräisin julkisesti saatavilla olevista tiedoista Airbnb, alusta, joka tarjoaa käyttäjille edullisia huoneita maailmanlaajuisesti. Voit käyttää tämän sivuston tietoja suorittaaksesi analytiikkaa, kuten Montrealin vuokra-analytiikka.

Google Dataset Search on Googlen luoma tietojoukkohakukone, joka isännöi yli 20 miljoonaa tietojoukkoa. Kuten heidän hakukoneensa, voit saada tietoja melkein mistä tahansa. Hyvä esimerkki on Kanadan kansalliset pitkän aikavälin vedenlaadun seurantatiedot.

UC Irvine Machine Learning Repository on 624 tietojoukon koti koneoppimisyhteisölle maailmassa. Tällä verkkosivustolla on vahva maine yhteisössä, koska tietojoukot luokitellaan niiden koneoppimistehtävien perusteella, joihin ne sopivat. Esimerkkinä on Iris-tietojoukko, kuuluisa luokitus- ja klusterointimallitietojoukko.

Datahubilla alustana on monia tietojoukkoja, jotka kattavat laajan valikoiman aiheita, kuten 10 vuoden Yhdysvaltain valtion joukkovelkakirjalainat (pitkäaikainen korko). Tietojen lisäksi ne näyttävät myös tietotyökaluja ja työkalupakkeja, jotka voivat tulla tietoammattilaisille.

Tämä on ensimmäinen verkkosivustomme, joka sisältää ainutlaatuisia terveystietoja. Global Health Observatory toimii tietovarastona, joka näyttää terveyteen liittyviä tilastoja yli 1000 indikaattorille WHO: n 194 jäsenvaltiosta. Tiedot tallennetaan, jotta voidaan seurata näiden jäsenvaltioiden edistymistä kohti kestävän kehityksen tavoitteita. Voit saada tietoja suodattamalla datan teeman, luokan, metatiedot ja indikaattorin.

Tämä alusta on todella markkinarakopohjainen. Se näyttää tutkimustietoja ja markkinatietoa, kuten viikonlopun lipputulot ja siihen liittyvät tiedot Ison-Britannian elokuvateollisuudesta.

GitHub on enemmän kuin vain miljoonien yhteistyö- ja avoimen lähdekoodin projektien koti. Alustalla on myös monia arkistoja, joiden tarkoituksena on säilyttää ilmaisia, julkisia ja avoimen lähdekoodin tietojoukkoja. Jopa BuzzFeedNewsilla on avoimen lähdekoodin GitHub-arkisto.

Muita esimerkkejä ovat Mahtava julkisten tietojoukkojen arkisto ja nostatko edes tietojoukkoa. Voit myös osallistua näihin avoimen lähdekoodin projekteihin GitHubissa.

Data.world on tietoyhteisö ja yhteistyöalusta, joka isännöi dataprojekteja ja tietojoukkoja. Vaikka muutama tietojoukko on maksettu, pääasiassa alustan tiedoista, kuten Muutos maanantain 2021/W16: kuukausittaiset lentomatkustajat Amerikassa, ovat ilmaisia, ja ne voidaan helposti ladata paikallisesti tai käyttää niiden API: n kautta.

Maailmanpankin avoin data on luettelo maailmanlaajuisista talous- ja kehitystiedoista. Voit selata ja suodattaa tietoja, kuten maailmanlaajuisia tilastoja terveellisten ruokavalioiden kustannuksista ja kohtuuhintaisuudesta indikaattorin ja maan mukaan.

Nasdaq Data Link on tarkoitettu kaikelle taloudelliselle, taloudelliselle ja vaihtoehtoiselle datalle. Voit käyttää tietoja, kuten Yhdysvaltain liittovaltion varannon tiedot laskentataulukon, kuten Excelin tai API: n kautta.

NYC Taxi and Limousine Commissionin tietoalusta tallentaa ja isännöi tietoja, kuten keltaisia ​​ja vihreitä taksimatkoja New Yorkissa. Hienoa tällä sivustolla on, että se näyttää tietoa kaikesta, nouto-/pudotuspaikasta taksialueelle ja matkan hinnoista.

Academic Torrents on tietoluettelo, joka sisältää yli 127,15 TB tutkimustietoa. Se rakennettiin, kuten sanotaan, tutkijoille ja tutkijoiden toimesta.

Tutki ja opi

Toivottavasti tämän luettelon avulla saat tietoja, jotka voivat muokata liiketoimintaympäristöäsi, edistää markkinatutkimustasi, saada kilpailuetua ja auttaa sinua rakentamaan ainutlaatuisen tietoportfolion maksutta. Joten tartu mahdollisuuksiin, tutki ja tee vähemmän haastava tiedonhakutehtävä.