Kun käytät Google Sheetsia kahden tietojoukon kanssa työskentelemiseen, saatat haluta vertailla näitä kahta määrittämällä, missä määrin toinen vaikuttaa toiseen.

Korrelaatiot voivat tarjota käsityksen siitä, onko x- ja y-tasojen välillä ennustavaa suhdetta, mutta ne eivät välttämättä osoita kausaalisuutta. Näin voit käyttää Google Sheetsia tunnistamaan korrelaatioita tiedoissasi.

Mitä korrelaatio on ja mihin sitä voi käyttää?

Kun kaksi muuttujaa korreloivat, voidaan määrittää, kuinka muuttuja vaikuttaa toiseen. Mutta on ratkaisevan tärkeää muistaa, että korrelaatio ei tarkoita tässä tapauksessa riippuvuutta; se vain osoittaa, kuinka läheisesti ja nopeasti kaksi muuttujaa vertaavat tai liittyvät toisiinsa.

Tilastolliset mittarit auttavat ymmärtämään data-analyysin taustalla olevia suuntauksia. Korrelaatio on yksi yleisimmin käytetyistä tilastollisista mittareista, ja se määrittää, kuinka läheisesti liittyvät tai riippuvaiset kaksi muuttujaa ovat.

Korrelaatiokertoimen ymmärtäminen Google Sheetsissa

instagram viewer

Google Sheetsissä korrelaatiokerroin lasketaan käyttämällä CORREL-funktiota. Korrelaatiokerroin toimii mittarina siitä, kuinka läheisesti liittyvät tietojoukot ovat. Sitä voidaan käyttää Pearsonin tulo-momenttikorrelaatiokertoimen (r) saamiseksi, jos sinulla on kaksi muuttujajoukkoa. Jos haluat tietää lisää tästä kertoimesta, voit lukea lisää tästä oppaasta osoitteesta Tilastot Leardissa.

Voidaan kohdata yksi kolmesta korrelaatiometriikasta. Jokainen mittaus määrittelee muuttujien väliset suhteet eri tavalla. Sen arvo on välillä -1 ja +1:

  • -1 tarkoittaa täydellistä negatiivista korrelaatiota: Kun korrelaatiolla on korrelaatiokerroin, joka on yhtä suuri tai pienempi kuin -0,9, sen sanotaan olevan voimakkaasti negatiivinen. Se on merkki siitä, että tiedot korreloivat. Muuttuja x kuitenkin kasvaa jatkuvasti, kun taas muuttuja y pienenee.
  • 0 tarkoittaa, ettei yhteyttä: Muuttujien ei katsota korreloivan, jos korrelaatiokerroin on suurempi kuin 0,01 mutta pienempi kuin 0,1, koska kunkin muuttujan välillä ei ole havaittavissa olevaa yhteyttä. Ne ovat toisistaan ​​riippumattomia.
  • +1 tarkoittaa täydellistä positiivista korrelaatiota: Kun korrelaation kerroin on välillä 0,9 ja 1, se katsotaan erittäin positiiviseksi. Se osoittaa, että kahden muuttujajoukon määrä on kasvanut.

Kertoimen suurin arvo saattoi olla korrelaatiokerroin 1. Kun korrelaatioarvo on 1, se tarkoittaa, että jos piirrät datan kaavion, se olisi täysin tasattu suoran luomiseksi.

Jos olet vielä hieman eksyksissä, älä huoli. Selitämme CORREL-funktion syntaksin ja sukeltamme sitten joihinkin tosielämän esimerkkeihin auttaaksemme sinua ymmärtämään sitä paremmin. Parhaiten istuvien linjojen ymmärtäminen ja kuinka tehdä trendiviivoja Google Sheetsissä auttaa sinua tässä.

CORREL-funktion syntaksi Google Sheetsissa

=KORREL(data_y, data_x) 

Jaetaan tämä osiin ja ymmärrämme paremmin, mitä jokainen lause tarkoittaa:

  • =KORREL: Tämä on Google Sheet -funktio, joka määrittää r: n (tietojoukon Pearsonin tuote-momenttikorrelaatiokerroin).
  • data_y: Tämä viittaa soluryhmään, joka sisältää riippuvat tiedot tai näiden solujen arvoalueen.
  • data x: Tämä on joko viittaus riippumattomien tietojen sisältävään solujonoon tai näiden solujen arvoalueeseen.

Jos piirtäisit datapisteiden kaavion, data_y olisi Y-akseli ja data_x X-akseli. Huomaat, että tietoalueen syöttämiseen on kaksi eri tapaa. Vaihtoehtoina ovat joko viitesolualue tai suora datasyöttö funktiossa.

Useimmissa tapauksissa viitesolualueen käyttö on edullista. Tämä johtuu siitä, että laskentataulukko sisältää jo todennäköisesti tietosi. Viitesolualueen käyttäminen voi välttää liiallisen kirjoittamisen, joka voi johtaa käyttäjän virheisiin.

CORREL-funktioesimerkkejä Google Sheetsissa

Katsotaanpa muutamia esimerkkejä ymmärtääksemme, kuinka CORREL-toimintoa käytetään Google Sheetsissa.

Esimerkki 1: Vahva positiivinen korrelaatio

Tässä ensimmäisessä esimerkissä oletetaan, että työskentelemme kiinteistöalalla. Alla olevassa laskentataulukossa on myymäsi maan hehtaariosuudet ja näiden eri maiden myytyjen yksiköiden määrä Google-taulukossasi.

  1. Jos seuraat taulukkoa, aloita näppäilemällä muuttujien tiedot laskentataulukkoon alla olevan kuvan mukaisesti:
  2. Napsauta solua C2
  3. Tyyppi =CORREL(
  4. Jatka sitten kirjoittamalla data_y, joka meidän tapauksessamme on viitattu solualue A2:A6, kirjoita sitten pilkku.
  5. Jatka kirjoittamalla data_x, johon tässä tapauksessa viitataan nimellä B2:B6.
  6. Lopeta sulkuhaarukalla alla olevan kuvan mukaisesti:
  7. Lopuksi paina Tulla sisään palauttaa solun kahden tiedon korrelaatiokertoimen C2.

Yllä olevan esimerkin avulla olet saanut korrelaatiokertoimen 0,90, mikä on vahva positiivinen korrelaatio, koska sen arvo on 0,9 ja 1 välillä. Siksi tämä osoittaa, että kun y muuttuu, myös x muuttuu olennaisesti vertailukelpoisella tavalla.

Alla on esitys esimerkkinäytetiedoistamme XY-sirontakaaviossa. Kuten näet, parhaiten sopiva viiva on lähellä kaavion datapisteitä, mikä tukee ajatusta, että luvut korreloivat voimakkaasti.

Voit oppia lisää XY-sirontakaavioiden luominen Google Sheetsissä toisessa artikkelissamme.

Esimerkki 2: Heikko negatiivinen korrelaatio

Tällä kertaa käytämme laskentataulukossamme yleisempää esimerkkiä "muuttujasta x ja y". Olemme tarkoituksella sisällyttäneet lukuja osoittamaan negatiivista korrelaatiota, jonka CORREL-funktio osoittaa alla:

Muuttujien y ja x välillä ei ole vahvaa yhteyttä, joten tuloksena saamme vähemmän merkitsevän korrelaatiokertoimen kuin edellisessä esimerkissä. Saavuttamamme tulos on -0,47. Tämä ei kuitenkaan tarkoita, etteikö korrelaatiota olisi ollenkaan. Katsotaanpa uudelleen parhaiten sopivaa riviä ymmärtääksemme sitä.

Kuten sirontakaaviosta näet, datapisteet ovat kauempana parhaiten sopivalta viivalta. Siksi korrelaatiota on vähemmän kuin ensimmäisessä esimerkissä, mutta ei yhtään. Huomaat myös, että parhaiten sopiva linja vähenee. Tämä osoittaa negatiivista korrelaatiota, yksi arvo pienenee toisen kasvaessa.

Esimerkki 3: Ei yhteyttä

Tässä on joukko täysin satunnaisia ​​lukuja. Tarkastellaanpa nopeasti uudelleen CORREL-toiminnon käyttöä:

  1. Kirjoita soluun C2 CORREL-kaava
  2. Argumenttimme ovat A2:A10 ja B2:B10
  3. Paina Enter

C2:n palautettu arvo on 0,02. Jos korrelaatiokerroin on välillä 0,01 ja 0,1, määritetään, että kyseessä olevat muuttujat eivät korreloi, koska niiden välillä ei ole havaittavissa olevaa yhteyttä. Muuttujien väliset suhteet ovat täysin riippumattomia.

Alla on esitys samasta sirontakaaviosta. Parhaan sovituksen viiva on lähes tasainen, mikä osoittaa vähän korrelaatiota kahden tietojoukon välillä.

Korreloi tietosi helposti Google Sheetsissa

Korrelaatio voi olla haastava aihe, jos et työskennellyt sen kanssa paljon lukiossa. Tämä opas kattoi kaikki perusasiat, mutta sinun on jatkettava Google Sheetsin CORREL-toiminnon käyttöä, jotta se pysyy tuoreena mielessäsi.

Tämä on tehokas toiminto, koska se auttaa välttämään hajontakaavioiden rakentamista ja voi nopeasti löytää trendejä tiedoistasi. Älä kuitenkaan pelkää lisätä kaavioita, jotta muut käyttäjät ymmärtävät paremmin laskentataulukoidesi tiedot.