Dom Odstranjivanje Pozitivna i negativna korelacija u excelu. Kako napraviti korelaciju u Excelu

Pozitivna i negativna korelacija u excelu. Kako napraviti korelaciju u Excelu

IN naučno istraživanjeČesto postoji potreba da se pronađe veza između varijabli ishoda i faktora (prinos usjeva i količina padavina, visina i težina osobe u homogenim grupama prema spolu i starosti, puls i tjelesna temperatura, itd.) .

Drugi su znakovi koji doprinose promjenama u onima koji su s njima povezani (prvi).

Koncept korelacione analize

Postoji mnogo Na osnovu gore navedenog, možemo reći da je korelaciona analiza metoda koja se koristi za testiranje hipoteze o statistički značaj dvije ili više varijabli ako ih istraživač može izmjeriti, ali ih ne može promijeniti.

Postoje i druge definicije pojma u pitanju. Korelaciona analiza je metoda obrade koja uključuje proučavanje koeficijenata korelacije između varijabli. U ovom slučaju, koeficijenti korelacije između jednog para ili više parova karakteristika se upoređuju kako bi se uspostavile statističke veze između njih. Korelaciona analiza je metoda za proučavanje statističke zavisnosti između slučajnih varijabli sa opcionim prisustvom stroge funkcionalne prirode, u kojoj se dinamika jedne slučajna varijabla dovodi do dinamike matematičko očekivanje drugi.

Koncept lažne korelacije

Prilikom provođenja korelacijske analize potrebno je uzeti u obzir da se ona može provesti u odnosu na bilo koji skup karakteristika, često apsurdnih u međusobnom odnosu. Ponekad nemaju uzročno-posledične veze jedno s drugim.

U ovom slučaju govore o lažnoj korelaciji.

Problemi korelacione analize

Na osnovu navedenih definicija možemo formulisati sledeće zadatke opisane metode: dobiti informacije o jednoj od traženih varijabli koristeći drugu; utvrditi bliskost odnosa između proučavanih varijabli.

Korelaciona analiza podrazumeva utvrđivanje odnosa između karakteristika koje se proučavaju, pa se zadaci korelacione analize mogu dopuniti sledećim:

  • identifikaciju faktora koji imaju najveći uticaj na rezultujuću karakteristiku;
  • identifikacija ranije neistraženih uzroka veza;
  • konstrukcija korelacionog modela sa njegovom parametarskom analizom;
  • proučavanje značaja komunikacijskih parametara i njihova intervalna procjena.

Veza između korelacione analize i regresije

Metoda korelacione analize često nije ograničena na pronalaženje bliskosti odnosa između proučavanih veličina. Ponekad se dopunjuje sastavljanjem regresionih jednačina, koje se dobijaju istoimenom analizom, a koje predstavljaju opis korelacione zavisnosti između rezultujuće i faktorske (faktorske) karakteristike (obeležja). Ova metoda, zajedno sa analizom koja se razmatra, čini metodu

Uslovi za korištenje metode

Efektivni faktori zavise od jednog do nekoliko faktora. Metoda korelacione analize može se koristiti ako postoji veliki broj zapažanja o vrednosti efektivnih i faktorskih indikatora (faktora), dok faktori koji se proučavaju moraju biti kvantitativni i reflektovani u konkretnim izvorima. Prvi se može odrediti normalnim zakonom - u ovom slučaju, rezultat korelacijske analize su koeficijenti korelacije Pearson, ili, ako karakteristike ne poštuju ovaj zakon, koristi se koeficijent rang korelacije Spearman.

Pravila za odabir faktora korelacione analize

Prilikom upotrebe ovu metodu potrebno je utvrditi faktore koji utiču na indikatore učinka. Oni su odabrani uzimajući u obzir činjenicu da moraju postojati uzročno-posledične veze između indikatora. U slučaju kreiranja multifaktorskog modela korelacije, biraju se oni koji imaju značajan uticaj na rezultujući indikator, a poželjno je da se u korelacioni model ne uključuju međuzavisni faktori sa koeficijentom korelacije para većim od 0,85, kao i oni za koje odnos sa rezultujućim parametrom nije linearan ili funkcionalan.

Prikaz rezultata

Rezultati korelacione analize mogu se prikazati u tekstualnom i grafičkom obliku. U prvom slučaju oni su predstavljeni kao koeficijent korelacije, u drugom - u obliku dijagrama raspršenja.

U nedostatku korelacije između parametara, tačke na dijagramu su locirane haotično, prosječni stupanj povezanosti karakterizira veći stupanj reda i manje ili više ujednačena udaljenost označenih oznaka od medijane. Jaka veza ima tendenciju da bude ravna i pri r=1 tačkasta dijagram je ravna linija. Reverzna korelacija se razlikuje u smjeru grafikona od gornjeg lijevog prema donjem desnom, direktna korelacija - od donjeg lijevog do gornjeg desnog ugla.

3D prikaz dijagrama raspršenja

Pored tradicionalnog prikaza 2D dijagrama raspršenja, sada se koristi 3D grafički prikaz korelacijske analize.

Također se koristi matrica dijagrama raspršenja koja prikazuje sve uparene dijagrame u jednoj slici u formatu matrice. Za n varijabli, matrica sadrži n redaka i n stupaca. Grafikon koji se nalazi na raskrsnici i-tog reda i j-te kolone je dijagram varijabli Xi naspram Xj. Dakle, svaki red i kolona su jedna dimenzija, jedna ćelija prikazuje dijagram raspršenja od dvije dimenzije.

Procjena nepropusnosti veze

Bliskost korelacione veze određena je koeficijentom korelacije (r): jaka - r = ±0,7 do ±1, srednja - r = ±0,3 do ±0,699, slaba - r = 0 do ±0,299. Ova klasifikacija nije stroga. Na slici je prikazan malo drugačiji dijagram.

Primjer korištenja metode korelacijske analize

Zanimljivo istraživanje je sprovedeno u Velikoj Britaniji. Posvećena je povezanosti pušenja i raka pluća, a provedena je kroz analizu korelacije. Ovo zapažanje je predstavljeno u nastavku.

Početni podaci za korelacione analize

Profesionalna grupa

mortalitet

Poljoprivrednici, šumari i ribari

Rudari i radnici u kamenolomu

Proizvođači gasa, koksa i hemikalija

Proizvođači stakla i keramike

Radnici peći, kovačnica, livnica i valjaonica

Radnici na elektrotehnici i elektronici

Inženjerske i srodne struke

Drvoprerađivačka industrija

Leatherworkers

Tekstilni radnici

Proizvođači radne odeće

Radnici u industriji hrane, pića i duhana

Proizvođači papira i štampe

Proizvođači ostalih proizvoda

Graditelji

Slikari i dekorateri

Vozači stacionarnih motora, dizalica itd.

Radnici koji nisu uključeni drugdje

Radnici transporta i veza

Radnici skladišta, skladištara, pakera i mašina za punjenje

Kancelarijski radnici

Prodavci

Sportski i rekreativni radnici

Administratori i menadžeri

Profesionalci, tehničari i umjetnici

Započinjemo analizu korelacije. Bolje je započeti s rješenjem radi jasnoće grafička metoda, za koji ćemo konstruisati dijagram raspršenja.

To pokazuje direktnu vezu. Međutim, teško je izvući nedvosmislen zaključak samo na osnovu grafičke metode. Stoga ćemo nastaviti sa analizom korelacije. U nastavku je prikazan primjer izračunavanja koeficijenta korelacije.

Pomoću softvera (u nastavku će biti opisan MS Excel kao primjer) određujemo koeficijent korelacije, koji iznosi 0,716, što znači jaku povezanost između ispitivanih parametara. Odredimo statističku pouzdanost dobijene vrijednosti koristeći odgovarajuću tabelu, za koju trebamo oduzeti 2 od 25 parova vrijednosti, kao rezultat dobijamo 23 i pomoću ove linije u tabeli nalazimo r kritično za p = 0,01 (pošto ovo su medicinski podaci, strožija zavisnost, u ostalim slučajevima je dovoljan p=0,05), što je 0,51 za ovu korelaciju. Primjer je pokazao da je izračunato r veće od kritičnog r, a vrijednost koeficijenta korelacije smatra se statistički pouzdanom.

Korištenje softvera prilikom provođenja korelacijske analize

Opisani tip statističke obrade podataka može se izvršiti korištenjem softver, posebno MS Excel. Korelacija uključuje izračunavanje sljedećih parametara pomoću funkcija:

1. Koeficijent korelacije se određuje pomoću funkcije CORREL (niz1; niz2). Niz1,2 - ćelija intervala vrijednosti rezultantnih i faktorskih varijabli.

Koeficijent linearne korelacije naziva se i Pearsonov koeficijent korelacije, i stoga, počevši od Excel 2007, možete koristiti funkciju s istim nizovima.

Grafički prikaz korelacione analize u Excel-u se vrši korišćenjem panela „Grafikoni“ sa izborom „Raspoj“.

Nakon specificiranja početnih podataka, dobijamo graf.

2. Procjena značaja koeficijenta parne korelacije pomoću Studentovog t-testa. Izračunata vrijednost t-kriterijuma se upoređuje sa tabeliranom (kritičnom) vrijednošću ovog indikatora iz odgovarajuće tablice vrijednosti parametra koji se razmatra, uzimajući u obzir navedeni nivo značajnosti i broj stupnjeva slobode. Ova procjena se vrši korištenjem funkcije STUDISCOVER(vjerovatnost; stupnjevi_slobode).

3. Matrica koeficijenata korelacije parova. Analiza se vrši pomoću alata za analizu podataka u kojem je odabrana Korelacija. Statistička procjena koeficijenata parne korelacije vrši se poređenjem apsolutna vrijednost sa tabelarnom (kritičnom) vrijednošću. Kada izračunati koeficijent parne korelacije premaši kritični, možemo reći, uzimajući u obzir dati stepen vjerovatnoće, da se nulta hipoteza o značajnosti linearne veze ne odbacuje.

Konačno

Upotreba metode korelacione analize u naučnim istraživanjima omogućava nam da utvrdimo odnos između razni faktori i indikatori učinka. Potrebno je uzeti u obzir da se iz apsurdnog para ili skupa podataka može dobiti visok koeficijent korelacije, te stoga ovaj tip analiza mora biti sprovedena na dovoljno velikom nizu podataka.

Nakon dobijanja izračunate vrijednosti r, preporučljivo je uporediti je sa kritičnim r kako bi se potvrdila statistička pouzdanost određene vrijednosti. Korelaciona analiza se može izvršiti ručno pomoću formula, ili pomoću softvera, posebno MS Excel-a. Ovdje također možete konstruirati dijagram raspršenja u svrhu vizualnog predstavljanja odnosa između proučavanih faktora korelacijske analize i rezultirajuće karakteristike.

U današnjem članku razgovaraćemo o tome kako varijable mogu biti povezane jedna s drugom. Koristeći korelaciju, možemo utvrditi postoji li veza između prve i druge varijable. Nadam se da će vam ova aktivnost biti jednako zabavna kao i prethodne!

Korelacija mjeri snagu i smjer odnosa između x i y. Slika pokazuje Razne vrste korelacije u obliku dijagrama raspršenosti uređenih parova (x, y). Tradicionalno, varijabla x se postavlja na horizontalna osa, i y - po vertikali.

Grafikon A je primjer pozitivne linearne korelacije: kako se x povećava, y također raste, i to linearno. Grafikon B pokazuje nam primjer negativne linearne korelacije, gdje kako se x povećava, y se linearno smanjuje. Na grafikonu C vidimo da ne postoji korelacija između x i y. Ove varijable ne utiču jedna na drugu ni na koji način.

Konačno, Grafikon D je primjer nelinearnih odnosa između varijabli. Kako se x povećava, y prvo opada, a zatim mijenja smjer i raste.

Ostatak članka se fokusira na linearne odnose između zavisnih i nezavisnih varijabli.

Koeficijent korelacije

Koeficijent korelacije, r, daje nam snagu i smjer odnosa između nezavisnih i zavisnih varijabli. Vrijednosti r kreću se između -1,0 i +1,0. Kada je r pozitivan, odnos između x i y je pozitivan (graf A na slici), a kada je r negativan, odnos je također negativan (grafik B). Koeficijent korelacije blizu nule ukazuje da ne postoji veza između x i y (grafikon C).

Jačina veze između x i y određena je time da li je koeficijent korelacije blizu - 1,0 ili +- 1,0. Proučite sljedeći crtež.

Grafikon A pokazuje savršenu pozitivnu korelaciju između x i y pri r = + 1,0. Grafikon B - idealna negativna korelacija između x i y pri r = - 1,0. Grafovi C i D su primjeri slabijih odnosa između zavisnih i nezavisnih varijabli.

Koeficijent korelacije, r, određuje i snagu i smjer odnosa između zavisnih i nezavisnih varijabli. Vrijednosti r se kreću od - 1,0 (jaka negativna veza) do + 1,0 (snažna pozitivna veza). Kada je r = 0 nema veze između varijabli x i y.

Možemo izračunati stvarni koeficijent korelacije koristeći sljedeću jednačinu:

Dobro dobro! Znam da ova jednadžba izgleda kao zastrašujuća zbrka čudnih simbola, ali prije nego što se uspaničimo, primijenimo na nju primjer ispitne ocjene. Recimo da želim utvrditi postoji li veza između broja sati koje student posveti proučavanju statistike i rezultata završnog ispita. Tabela u nastavku će nam pomoći da ovu jednačinu razbijemo na nekoliko jednostavnih proračuna i učinimo ih lakšim za upravljanje.

Kao što vidite, postoji vrlo jaka pozitivna korelacija između broja sati posvećenih proučavanju predmeta i ocjene na ispitu. Nastavnici će biti veoma sretni da znaju za ovo.

Koja je korist od uspostavljanja odnosa između sličnih varijabli? Odlično pitanje. Ako se utvrdi da veza postoji, možemo predvidjeti rezultate ispita na osnovu određenog broja sati provedenih u proučavanju predmeta. Jednostavno rečeno, što je jača veza, to će naše predviđanje biti tačnije.

Korišćenje Excela za izračunavanje koeficijenata korelacije

Siguran sam da ćete, kada pogledate ove strašne proračune koeficijenata korelacije, biti zaista oduševljeni saznanjem da Excel program može obaviti sav ovaj posao za vas koristeći CORREL funkciju sa sljedećim karakteristikama:

CORREL (niz 1; niz 2),

niz 1 = raspon podataka za prvu varijablu,

niz 2 = raspon podataka za drugu varijablu.

Na primjer, slika prikazuje funkciju CORREL koja se koristi za izračunavanje koeficijenta korelacije za primjer ocjene ispita.

Koeficijent korelacije (ili linearni koeficijent korelacija) označava se kao “r” (u rijetkim slučajevima kao “ρ”) i karakterizira linearna korelacija(tj. odnos koji je dat nekom vrijednošću i smjerom) dvije ili više varijabli. Vrijednost koeficijenta je između -1 i +1, odnosno korelacija može biti i pozitivna i negativna. Ako je koeficijent korelacije -1, postoji savršena negativna korelacija; ako je koeficijent korelacije +1, postoji savršena pozitivna korelacija. U drugim slučajevima postoji pozitivna korelacija, negativna korelacija ili ne postoji korelacija između dvije varijable. Koeficijent korelacije može se izračunati ručno, korištenjem besplatnih online kalkulatora ili pomoću dobrog grafičkog kalkulatora.

Koraci

Ručno izračunavanje koeficijenta korelacije

    Prikupite podatke. Prije nego počnete računati koeficijent korelacije, proučite dati par brojeva. Bolje ih je zapisati u tablicu koja se može postaviti okomito ili horizontalno. Označite svaki red ili kolonu kao "x" i "y".

    • Na primjer, data su četiri para vrijednosti (brojeva) varijabli "x" i "y". Možete kreirati sljedeću tabelu:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Izračunajte aritmetičku sredinu "x". Da biste to učinili, zbrojite sve vrijednosti "x", a zatim podijelite rezultirajući rezultat s brojem vrijednosti.

    • U našem primjeru date su četiri vrijednosti varijable "x". Da biste izračunali aritmetičku sredinu "x", dodajte ove vrijednosti, a zatim podijelite zbir sa 4. Izračuni će biti napisani ovako:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Pronađite aritmetičku sredinu "y". Da biste to učinili, trčite slične radnje, odnosno zbrojite sve vrijednosti "y", a zatim podijelite zbroj sa brojem vrijednosti.

    • U našem primjeru date su četiri vrijednosti varijable "y". Dodajte ove vrijednosti, a zatim podijelite zbir sa 4. Izračuni će biti napisani ovako:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Izračunajte standardnu ​​devijaciju "x". Nakon izračunavanja prosječnih vrijednosti "x" i "y", pronađite standardne devijacije ove varijable. Standardna devijacija se izračunava pomoću sljedeće formule:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
  4. Izračunajte standardnu ​​devijaciju "y". Slijedite korake opisane u prethodnom koraku. Koristite istu formulu, ali u nju zamijenite vrijednosti "y".

    • U našem primjeru, proračuni će biti napisani ovako:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2,58 (\displaystyle \sigma _(y)=2,58)
  5. Zapišite osnovnu formulu za izračunavanje koeficijenta korelacije. Ova formula uključuje srednje vrijednosti, standardne devijacije i broj (n) parova brojeva za obje varijable. Koeficijent korelacije se označava kao "r" (u rijetkim slučajevima kao "ρ"). Ovaj članak koristi formulu za izračunavanje Pearsonovog koeficijenta korelacije.

    • Ovdje i u drugim izvorima količine mogu biti drugačije označene. Na primjer, neke formule sadrže “ρ” i “σ”, dok druge sadrže “r” i “s”. Neki udžbenici daju druge formule, ali one su matematički analozi gornje formule.
  6. Izračunali ste srednje vrijednosti i standardne devijacije obje varijable, tako da možete koristiti formulu za izračunavanje koeficijenta korelacije. Podsjetimo da je "n" broj parova vrijednosti za obje varijable. Vrijednosti ostalih veličina izračunate su ranije.

    • U našem primjeru, proračuni će biti napisani ovako:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\desno) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\desno))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\left((\ frac (3-4)(2.58))\desno))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\desno)*\left((\frac (5-4)(2,58))\desno)+\left((\frac (5-3)(1,83))\ desno)*\left( (\frac (7-4)(2.58))\right))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4,721))\desno))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\right))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  7. Analizirajte rezultat. U našem primjeru koeficijent korelacije je 0,988. Ova vrijednost na neki način karakterizira ovaj skup parova brojeva. Obratite pažnju na znak i veličinu vrijednosti.

    • Pošto je vrijednost koeficijenta korelacije pozitivna, postoji pozitivna korelacija između varijabli “x” i “y”. To jest, kako se vrijednost “x” povećava, povećava se i vrijednost “y”.
    • Budući da je vrijednost koeficijenta korelacije vrlo blizu +1, vrijednosti varijabli "x" i "y" su međusobno jako povezane. Ako iscrtate tačke na koordinatnoj ravni, one će se nalaziti blizu određene prave linije.

    Korištenje online kalkulatora za izračunavanje koeficijenta korelacije

    1. Pronađite kalkulator na internetu da izračunate koeficijent korelacije. Ovaj koeficijent se prilično često izračunava u statistici. Ako postoji mnogo parova brojeva, gotovo je nemoguće ručno izračunati koeficijent korelacije. Stoga postoje online kalkulatori za izračunavanje koeficijenta korelacije. U tražilicu unesite "kalkulator koeficijenta korelacije" (bez navodnika).

    2. Unesite podatke. Molimo pregledajte upute na web stranici kako biste bili sigurni da ste ispravno unijeli podatke (parove brojeva). Izuzetno je važno uneti odgovarajuće parove brojeva; inače ćete dobiti netačan rezultat. Zapamtite da različite web stranice imaju različite formate unosa podataka.

      • Na primjer, na web stranici http://ncalculators.com/statistics/correlation-coefficient-calculator.htm vrijednosti varijabli “x” i “y” se unose u dvije horizontalne linije. Vrijednosti su odvojene zarezima. Odnosno, u našem primjeru vrijednosti "x" se unose ovako: 1,2,4,5, a vrijednosti "y" ovako: 1,3,5,7.
      • Na drugom sajtu, http://www.alcula.com/calculators/statistics/correlation-coefficient/, podaci se unose okomito; u ovom slučaju nemojte brkati odgovarajuće parove brojeva.
    3. Izračunajte koeficijent korelacije. Nakon unosa podataka, jednostavno kliknite na dugme “Izračunaj”, “Izračunaj” ili slično da dobijete rezultat.

      Korištenje grafičkog kalkulatora

      1. Unesite podatke. Uzmite grafički kalkulator, uđite u statistički način rada i odaberite naredbu Uredi.

        • Različiti kalkulatori zahtijevaju različite tipke da se pritisnu. Ovaj članak govori o kalkulatoru Texas Instruments TI-86.
        • Da biste prešli na režim statističkog izračunavanja, pritisnite – Stat (iznad tastera „+“). Zatim pritisnite F2 – Uredi.
      2. Izbrišite prethodno sačuvane podatke. Većina kalkulatora pohranjuje statistiku koju unesete dok je ne obrišete. Kako biste izbjegli brkanje starih podataka s novim podacima, prvo izbrišite sve pohranjene informacije.

        • Koristite tipke sa strelicama da pomjerite kursor i označite naslov "xStat". Zatim pritisnite Clear i Enter da uklonite sve vrijednosti unesene u kolonu xStat.
        • Koristite tipke sa strelicama da označite naslov "yStat". Zatim pritisnite Clear i Enter da obrišete sve vrijednosti unesene u kolonu yStat.
      3. Unesite početne podatke. Koristite tipke sa strelicama da pomaknete kursor na prvu ćeliju ispod naslova "xStat". Unesite prvu vrijednost i pritisnite Enter. “xStat (1) = __” će biti prikazano na dnu ekrana, gdje će se umjesto razmaka pojaviti unesena vrijednost. Nakon što pritisnete Enter, unesena vrijednost će se pojaviti u tabeli i kursor će se pomaknuti na sljedeći red; ovo će prikazati “xStat (2) = __” na dnu ekrana.

        • Unesite sve vrijednosti za varijablu "x".
        • Nakon što unesete sve vrijednosti za varijablu x, koristite tipke sa strelicama da se pomaknete na kolonu yStat i unesite vrijednosti za varijablu y.
        • Kada unesete sve parove brojeva, pritisnite Exit da obrišete ekran i izađete iz režima statističkog izračunavanja.
      4. Izračunajte koeficijent korelacije. Karakterizira koliko su podaci bliski određenoj liniji. Grafički kalkulator može brzo odrediti odgovarajuću liniju i izračunati koeficijent korelacije.

        • Kliknite na Stat – Calc. Na TI-86 trebate pritisnuti – –.
        • Odaberite funkciju "Linearna regresija". Na TI-86 pritisnite , koji ima oznaku "LinR". Na ekranu će se prikazati red “LinR_” sa trepćućim kursorom.
        • Sada unesite nazive dvije varijable: xStat i yStat.
          • Na TI-86 otvorite listu imena; Da biste to učinili, pritisnite – – .
          • Donja linija ekrana će prikazati dostupne varijable. Odaberite (vjerovatno ćete morati pritisnuti F1 ili F2 da biste to učinili), unesite zarez, a zatim odaberite .
          • Pritisnite Enter za obradu unesenih podataka.
      5. Analizirajte svoje rezultate. Pritiskom na Enter na ekranu će se prikazati sljedeće informacije:

        • y = a + b x (\displaystyle y=a+bx): Ovo je funkcija koja opisuje pravu liniju. Imajte na umu da funkcija nije napisana u standardnom obliku (y = kh + b).
        • a = (\displaystyle a=). Ovo je “y” koordinata tačke u kojoj linija seče Y osu.
        • b = (\displaystyle b=). Ovo je nagib linije.
        • corr = (\displaystyle (\text(corr))=). Ovo je koeficijent korelacije.
        • n = (\displaystyle n=). Ovo je broj parova brojeva koji su korišteni u proračunima.

Regresijska i korelaciona analiza su statističke metode istraživanja. Ovo su najčešći načini da se pokaže zavisnost parametra od jedne ili više nezavisnih varijabli.

U nastavku o konkretnim praktični primjeri Pogledajmo ove dvije vrlo popularne analize među ekonomistima. Navest ćemo i primjer dobijanja rezultata pri njihovom kombinovanju.

Regresiona analiza u Excelu

Pokazuje uticaj nekih vrednosti (nezavisnih, nezavisnih) na zavisnu varijablu. Na primjer, kako broj ekonomski aktivnog stanovništva zavisi od broja preduzeća, plata i drugih parametara. Ili: kako strane investicije, cijene energije itd. utiču na nivo BDP-a.

Rezultat analize vam omogućava da istaknete prioritete. I na osnovu glavnih faktora predvidjeti, planirati razvoj prioritetnih oblasti i donijeti upravljačke odluke.

Regresija se dešava:

  • linearni (y = a + bx);
  • parabolični (y = a + bx + cx 2);
  • eksponencijalni (y = a * exp(bx));
  • snaga (y = a*x^b);
  • hiperbolično (y = b/x + a);
  • logaritamski (y = b * 1n(x) + a);
  • eksponencijalni (y = a * b^x).

Pogledajmo konstrukciju kao primjer regresijski model u Excelu i interpretacija rezultata. Uzmimo linearni tip regresije.

Zadatak. Kod 6 preduzeća, prosječno mjesečno nadnica i broj zaposlenih koji su otišli. Potrebno je utvrditi zavisnost broja zaposlenih koji otpuštaju od prosječne plate.

Model linearna regresija ima sljedeći oblik:

Y = a 0 + a 1 x 1 +…+a k x k.

Gdje su a koeficijenti regresije, x su utjecajne varijable, k je broj faktora.

U našem primjeru, Y je indikator napuštanja zaposlenika. Faktor uticaja su plate (x).

Excel ima ugrađene funkcije koje vam mogu pomoći da izračunate parametre modela linearne regresije. Ali dodatak “Paket analize” će to učiniti brže.

Aktiviramo moćan analitički alat:

Kada se aktivira, dodatak će biti dostupan na kartici Podaci.

Sada uradimo samu regresijsku analizu.



Prije svega, obraćamo pažnju na R-kvadrat i koeficijente.

R-kvadrat je koeficijent determinacije. U našem primjeru – 0,755, odnosno 75,5%. To znači da izračunati parametri modela objašnjavaju 75,5% odnosa između proučavanih parametara. Što je veći koeficijent determinacije, to je model bolji. Dobro - iznad 0,8. Loše – manje od 0,5 (ovakva analiza se teško može smatrati razumnom). U našem primjeru – “nije loše”.

Koeficijent 64,1428 pokazuje koliki će biti Y ako su sve varijable u modelu koji se razmatraju jednake 0. Odnosno, na vrijednost analiziranog parametra utiču i drugi faktori koji nisu opisani u modelu.

Koeficijent -0,16285 pokazuje težinu varijable X na Y. Odnosno, prosječna mjesečna plata u okviru ovog modela utiče na broj onih koji odustaju sa ponderom od -0,16285 (ovo je mali stepen uticaja). Znak “-” ukazuje na negativan uticaj: što je veća plata, manje ljudi daje otkaz. Što je pošteno.



Analiza korelacije u Excel-u

Korelaciona analiza pomaže da se utvrdi da li postoji veza između indikatora u jednom ili dva uzorka. Na primjer, između vremena rada mašine i troškova popravki, cijene opreme i trajanja rada, visine i težine djece itd.

Ako postoji veza, da li povećanje jednog parametra dovodi do povećanja (pozitivna korelacija) ili smanjenja (negativna) drugog. Korelaciona analiza pomaže analitičaru da utvrdi da li se vrednost jednog indikatora može koristiti za predviđanje moguće značenje drugi.

Koeficijent korelacije je označen sa r. Varira od +1 do -1. Klasifikacija korelacija za različitim oblastima biće drugačiji. Kada je koeficijent 0 linearna zavisnost ne postoji između uzoraka.

Pogledajmo kako pronaći koeficijent korelacije koristeći Excel.

Za pronalaženje uparenih koeficijenata koristi se CORREL funkcija.

Cilj: Utvrditi postoji li veza između vremena rada tokarilice i troškova njenog održavanja.

Postavite kursor u bilo koju ćeliju i pritisnite dugme fx.

  1. U kategoriji “Statistički” odaberite funkciju CORREL.
  2. Argument “Niz 1” - prvi raspon vrijednosti – vrijeme rada mašine: A2:A14.
  3. Argument "Niz 2" - drugi raspon vrijednosti - cijena popravke: B2:B14. Kliknite OK.

Da biste odredili vrstu veze, potrebno je pogledati apsolutni broj koeficijenta (svako polje aktivnosti ima svoju skalu).

Za korelacione analize nekoliko parametara (više od 2) pogodnije je koristiti „Analizu podataka“ (dodatak „Paket analize“). Potrebno je da izaberete korelaciju sa liste i odredite niz. Sve.

Dobijeni koeficijenti će biti prikazani u korelacionoj matrici. Volim ovo:

Korelaciona i regresiona analiza

U praksi se ove dvije tehnike često koriste zajedno.

primjer:


Sada su podaci regresione analize postali vidljivi.

Kvantitativna karakteristika odnosa može se dobiti izračunavanjem koeficijenta korelacije.

Analiza korelacije u Excel-u

Sama funkcija ima opšti oblik CORREL(niz1, niz2). U polje "Niz1" unesite koordinate raspona ćelija jedne od vrijednosti, čiju ovisnost treba odrediti. Kao što vidite, koeficijent korelacije u obliku broja pojavljuje se u ćeliji koju smo prethodno odabrali. Otvara se prozor sa parametrima korelacione analize. Za razliku od prethodne metode, u polje „Input interval“ unosimo interval ne svake kolone posebno, već svih kolona koje učestvuju u analizi. Kao što vidite, Excel aplikacija nudi dvije metode korelacijske analize odjednom.

Grafikon korelacije u excelu

6) Prvi element konačne tabele će se pojaviti u gornjoj lijevoj ćeliji odabranog područja. Stoga se hipoteza H0 odbacuje, odnosno regresijski parametri i koeficijent korelacije nisu nasumično različiti od nule, već su statistički značajni. 7. Dobijene procjene jednačine regresije omogućavaju njeno korištenje za prognoziranje.

Kako izračunati koeficijent korelacije u Excelu

Ako je koeficijent 0, to ukazuje da ne postoji veza između vrijednosti. Da biste pronašli odnos između varijabli i y, koristite ugrađenu funkciju Microsoft Excel"CORREL". Na primjer, za "Niz1" odaberite y vrijednosti, a za "Niz2" odaberite x vrijednosti. Kao rezultat, dobit ćete koeficijent korelacije koji je izračunao program. Zatim morate izračunati razliku između svakog x i xav, i yav. U odabrane ćelije upišite formule x-x, y-. Ne zaboravite da zakačite ćelije sa prosecima. Dobijeni rezultat će biti željeni koeficijent korelacije.

Gornja formula za izračunavanje Pearsonovog koeficijenta pokazuje koliko je ovaj proces radno intenzivan ako se radi ručno. Drugo, preporučite koji se tip korelacijske analize može koristiti za različite uzorke sa velikim rasponom podataka? Kako mogu statistički dokazati da postoji značajna razlika između grupe preko 60 godina i svih ostalih?

DIY: Izračunavanje valutnih korelacija pomoću Excela

Na primjer, koristimo Microsoft Excel, ali bilo koji drugi program u kojem možete koristiti formulu korelacije će biti dobar. 7.Nakon ovoga, odaberite ćelije sa EUR/USD podacima. 9. Pritisnite Enter da izračunate koeficijent korelacije za EUR/USD i USD/JPY. Ne isplati se ažurirati brojke svaki dan (dobro, osim ako niste opsjednuti valutnim korelacijama).

Već ste naišli na potrebu da izračunate stepen povezanosti između njih statističke veličine i odrediti formulu po kojoj su u korelaciji? Da bih to učinio, koristio sam funkciju CORREL - ovdje postoje neke informacije o tome. Vraća stepen korelacije između dva raspona podataka. Teoretski, funkcija korelacije se može poboljšati pretvaranjem iz linearne u eksponencijalnu ili logaritamsku. Analiza podataka i korelacijski grafovi mogu značajno poboljšati njegovu pouzdanost.

Pretpostavimo da ćelija B2 sadrži sam koeficijent korelacije, a ćelija B3 sadrži broj kompletnih opservacija. Da li imate kancelariju na ruskom jeziku?Uzgred, našao sam i grešku - značajnost se ne računa za negativne korelacije. Ako su obje varijable metričke i imaju normalna distribucija, onda je izbor napravljen ispravno. I da li je moguće okarakterisati kriterijum sličnosti krivih koristeći samo jedan CC?Nemate sličnost „krivulja“, već sličnost dve serije koje se u principu mogu opisati krivom.



Novo na sajtu

>

Najpopularniji