Dom Usuwanie Korelacja dodatnia i ujemna w programie Excel. Jak zrobić korelację w Excelu

Korelacja dodatnia i ujemna w programie Excel. Jak zrobić korelację w Excelu

W badania naukowe Często istnieje potrzeba znalezienia powiązania między zmiennymi wynikowymi a zmiennymi czynnikowymi (plonami upraw i ilością opadów, wzrostem i wagą osoby w jednorodnych grupach pod względem płci i wieku, tętnem i temperaturą ciała itp.). .

Drugie to znaki, które przyczyniają się do zmian w tych z nimi związanych (pierwszy).

Pojęcie analizy korelacji

Jest ich wiele. Na podstawie powyższego można stwierdzić, że analiza korelacji jest metodą stosowaną w celu sprawdzenia hipotezy dot znaczenie statystyczne dwie lub więcej zmiennych, jeśli badacz może je zmierzyć, ale nie może ich zmienić.

Istnieją inne definicje omawianego pojęcia. Analiza korelacji to metoda przetwarzania polegająca na badaniu współczynników korelacji pomiędzy zmiennymi. W tym przypadku porównuje się współczynniki korelacji pomiędzy jedną parą lub wieloma parami cech w celu ustalenia statystycznych zależności między nimi. Analiza korelacji to metoda badania zależności statystycznej pomiędzy zmiennymi losowymi z opcjonalnym występowaniem o charakterze ściśle funkcjonalnym, w której dynamika jednej zmienna losowa prowadzi do dynamiki oczekiwanie matematyczne inny.

Pojęcie fałszywej korelacji

Prowadząc analizę korelacji należy wziąć pod uwagę, że można ją przeprowadzić w odniesieniu do dowolnego zbioru cech, często absurdalnych względem siebie. Czasami nie mają ze sobą żadnego związku przyczynowego.

W tym przypadku mówią o fałszywej korelacji.

Problemy analizy korelacji

W oparciu o powyższe definicje można sformułować następujące zadania opisywanej metody: uzyskanie informacji o jednej z poszukiwanych zmiennych za pomocą innej; określić bliskość związku pomiędzy badanymi zmiennymi.

Analiza korelacji polega na określeniu zależności pomiędzy badanymi cechami, dlatego też zadania analizy korelacji można uzupełnić o:

  • identyfikacja czynników mających największy wpływ na uzyskaną charakterystykę;
  • identyfikacja niezbadanych wcześniej przyczyn powiązań;
  • budowa modelu korelacji wraz z jego analizą parametryczną;
  • badanie znaczenia parametrów komunikacyjnych i ocena ich interwałów.

Związek analizy korelacji z regresją

Metoda analizy korelacji często nie ogranicza się do znalezienia bliskości zależności między badanymi wielkościami. Czasami uzupełnia się go zestawieniem równań regresji, które uzyskuje się za pomocą analizy o tej samej nazwie i które stanowią opis zależności korelacyjnej między wynikiem a cechą (cechami) czynnika (czynnika). Metoda ta wraz z analizowaną analizą stanowi metodę

Warunki stosowania metody

Czynniki skuteczne zależą od jednego do kilku czynników. Metodę analizy korelacji można zastosować w przypadku dużej liczby obserwacji dotyczących wartości wskaźników efektywnych i czynnikowych (czynników), przy czym badane czynniki muszą mieć charakter ilościowy i mieć odzwierciedlenie w konkretnych źródłach. Pierwszą można wyznaczyć na podstawie prawa normalnego – w tym przypadku wynikiem analizy korelacji są współczynniki korelacji Pearsona lub, jeżeli cechy nie spełniają tego prawa, stosuje się współczynnik korelacja rang Włócznik.

Zasady doboru czynników analizy korelacji

Podczas używania Ta metoda konieczne jest określenie czynników wpływających na wskaźniki efektywności. Dobiera się je z uwzględnieniem faktu, że pomiędzy wskaźnikami muszą istnieć związki przyczynowo-skutkowe. W przypadku tworzenia wieloczynnikowego modelu korelacji wybiera się te, które mają istotny wpływ na wynikowy wskaźnik, przy czym lepiej nie uwzględniać w modelu korelacji czynników współzależnych, których współczynnik korelacji par jest większy niż 0,85, a także tych, które dla których związek z parametrem wynikowym nie ma charakteru liniowego ani funkcjonalnego.

Wyświetlanie wyników

Wyniki analizy korelacji można przedstawić w formie tekstowej i graficznej. W pierwszym przypadku są one prezentowane jako współczynnik korelacji, w drugim – w formie diagramu punktowego.

W przypadku braku korelacji pomiędzy parametrami punkty na diagramie są rozmieszczone chaotycznie, średni stopień powiązania charakteryzuje się większym stopniem uporządkowania i charakteryzuje się mniej więcej równomierną odległością zaznaczonych znaków od mediany. Silne połączenie jest zwykle proste, a przy r=1 wykres punktowy jest linią płaską. Odwrotna korelacja różni się kierunkiem wykresu od lewego górnego do prawego dolnego rogu, korelacja bezpośrednia - od lewego dolnego rogu do prawego górnego rogu.

Reprezentacja 3D wykresu punktowego

Oprócz tradycyjnego wyświetlania wykresu punktowego 2D, obecnie używana jest graficzna reprezentacja analizy korelacji 3D.

Wykorzystywana jest również macierz wykresów rozrzutu, która wyświetla wszystkie sparowane wykresy na jednym rysunku w formacie macierzowym. Dla n zmiennych macierz zawiera n wierszy i n kolumn. Wykres znajdujący się na przecięciu i-tego wiersza i j-tej kolumny jest wykresem zmiennych Xi względem Xj. Zatem każdy wiersz i kolumna ma jeden wymiar, a pojedyncza komórka wyświetla wykres rozrzutu dwóch wymiarów.

Ocena szczelności połączenia

O bliskości powiązania korelacji decyduje współczynnik korelacji (r): silna – r = ±0,7 do ±1, średnia – r = ±0,3 do ±0,699, słaba – r = 0 do ±0,299. Klasyfikacja ta nie jest ścisła. Na rysunku przedstawiono nieco inny schemat.

Przykład zastosowania metody analizy korelacji

Ciekawe badanie przeprowadzono w Wielkiej Brytanii. Poświęcono je powiązaniu między paleniem tytoniu a rakiem płuc i przeprowadzono je na podstawie analizy korelacji. Obserwację tę przedstawiono poniżej.

Wstępne dane do analizy korelacji

Grupa profesjonalna

śmiertelność

Rolnicy, leśnicy i rybacy

Górnicy i pracownicy kamieniołomów

Producenci gazu, koksu i chemikaliów

Producenci szkła i ceramiki

Pracownicy pieców, kuźni, odlewni i walcowni

Pracownicy elektrycy i elektronicy

Zawody inżynierskie i pokrewne

Przemysł drzewny

Kaletnicy

Pracownicy tekstylni

Producenci odzieży roboczej

Pracownicy przemysłu spożywczego, napojów i tytoniowego

Producenci papieru i druku

Producenci innych produktów

Budowniczowie

Malarze i dekoratorzy

Kierowcy silników stacjonarnych, dźwigów itp.

Pracownicy nieuwzględnieni gdzie indziej

Pracownicy transportu i komunikacji

Pracownicy magazynów, magazynierzy, pakowacze i pracownicy maszyn rozlewniczych

Pracownicy biurowi

Sprzedawców

Pracownicy sportu i rekreacji

Administratorzy i menedżerowie

Profesjonaliści, technicy i artyści

Rozpoczynamy analizę korelacji. Lepiej zacząć rozwiązanie dla przejrzystości metoda graficzna, dla którego skonstruujemy diagram punktowy.

Pokazuje bezpośrednie połączenie. Trudno jednak wyciągnąć jednoznaczny wniosek na podstawie samej metody graficznej. Dlatego będziemy kontynuować analizę korelacji. Poniżej przedstawiono przykład obliczenia współczynnika korelacji.

Korzystając z oprogramowania (na przykładzie MS Excel zostanie opisany poniżej) wyznaczamy współczynnik korelacji, który wynosi 0,716, co oznacza silny związek pomiędzy badanymi parametrami. Określmy wiarygodność statystyczną otrzymanej wartości korzystając z odpowiedniej tabeli, dla której od 25 par wartości należy odjąć 2, w rezultacie otrzymamy 23 i korzystając z tej linii w tabeli znajdujemy r krytyczne dla p = 0,01 (ponieważ są to dane medyczne, zależność bardziej rygorystyczna, w pozostałych przypadkach wystarczy p=0,05), co dla tej analizy korelacji wynosi 0,51. Na przykładzie pokazano, że obliczone r jest większe od r krytycznego, a wartość współczynnika korelacji uważa się za statystycznie wiarygodną.

Korzystanie z oprogramowania przy przeprowadzaniu analizy korelacji

Opisany rodzaj przetwarzania danych statystycznych można przeprowadzić za pomocą oprogramowanie w szczególności MS Excel. Korelacja polega na obliczeniu następujących parametrów za pomocą funkcji:

1. Współczynnik korelacji wyznacza się za pomocą funkcji CORREL (tablica1; tablica2). Tablica1,2 - komórka przedziału wartości zmiennych wynikowych i czynnikowych.

Współczynnik korelacji liniowej nazywany jest także współczynnikiem korelacji Pearsona, dlatego począwszy od Excela 2007 można używać tej funkcji z tymi samymi tablicami.

Graficzne przedstawienie analizy korelacji w programie Excel odbywa się za pomocą panelu „Wykresy” z opcją „Wykres punktowy”.

Po podaniu danych początkowych otrzymujemy wykres.

2. Ocena istotności współczynnika korelacji parami za pomocą testu t-Studenta. Obliczoną wartość kryterium t porównuje się z tabelaryczną (krytyczną) wartością tego wskaźnika z odpowiedniej tabeli wartości rozpatrywanego parametru, biorąc pod uwagę określony poziom istotności i liczbę stopni swobody. Oszacowanie to przeprowadza się za pomocą funkcji STUDISCOVER(prawdopodobieństwo; stopnie_wolności).

3. Macierz współczynników korelacji par. Analizę przeprowadza się za pomocą narzędzia Analiza danych, w którym wybrana jest opcja Korelacja. Statystyczną ocenę współczynników korelacji par przeprowadza się poprzez porównanie jej wartości bezwzględnej z wartością tabelaryczną (krytyczną). Jeżeli obliczony współczynnik korelacji parami przekracza wartość krytyczną, to przy danym stopniu prawdopodobieństwa można powiedzieć, że hipoteza zerowa o istotności zależności liniowej nie zostaje odrzucona.

Wreszcie

Zastosowanie metody analizy korelacji w badaniach naukowych pozwala na określenie zależności pomiędzy różne czynniki i wskaźniki wydajności. Należy wziąć pod uwagę, że wysoki współczynnik korelacji można uzyskać z absurdalnej pary lub zbioru danych, a zatem ten typ analizę należy przeprowadzić na wystarczająco dużym zbiorze danych.

Po uzyskaniu obliczonej wartości r wskazane jest porównanie jej z r krytycznym w celu potwierdzenia wiarygodności statystycznej określonej wartości. Analizę korelacji można przeprowadzić ręcznie za pomocą wzorów lub przy użyciu oprogramowania, w szczególności MS Excel. W tym miejscu można również skonstruować diagram punktowy w celu wizualnego przedstawienia związku pomiędzy badanymi czynnikami analizy korelacji a uzyskaną charakterystyką.

W dzisiejszym artykule porozmawiamy o tym, jak zmienne mogą być ze sobą powiązane. Korzystając z korelacji, możemy określić, czy istnieje związek pomiędzy pierwszą i drugą zmienną. Mam nadzieję, że ta aktywność będzie dla Was równie przyjemna jak poprzednie!

Korelacja mierzy siłę i kierunek związku między x i y. Rysunek pokazuje Różne rodzaje korelacje w postaci wykresów punktowych par uporządkowanych (x, y). Tradycyjnie zmienna x jest umieszczana na pozioma oś i y - w pionie.

Wykres A jest przykładem dodatniej korelacji liniowej: wraz ze wzrostem x zwiększa się również y, i to liniowo. Wykres B pokazuje nam przykład ujemnej korelacji liniowej, gdzie wraz ze wzrostem x y maleje liniowo. Na wykresie C widzimy, że nie ma korelacji pomiędzy x i y. Zmienne te nie wpływają na siebie w żaden sposób.

Wreszcie wykres D jest przykładem nieliniowych zależności między zmiennymi. Gdy x rośnie, y najpierw maleje, następnie zmienia kierunek i rośnie.

Pozostała część artykułu skupia się na liniowych zależnościach pomiędzy zmiennymi zależnymi i niezależnymi.

Współczynnik korelacji

Współczynnik korelacji r określa zarówno siłę, jak i kierunek związku pomiędzy zmiennymi niezależnymi i zależnymi. Wartości r mieszczą się w przedziale od -1,0 do +1,0. Gdy r jest dodatnie, związek między x i y jest dodatni (wykres A na rysunku), a gdy r jest ujemne, związek również jest ujemny (wykres B). Współczynnik korelacji bliski zeru wskazuje, że nie ma związku pomiędzy x i y (wykres C).

O sile związku między x i y decyduje to, czy współczynnik korelacji jest bliski - 1,0, czy +- 1,0. Przestudiuj poniższy rysunek.

Wykres A pokazuje doskonałą dodatnią korelację między x i y przy r = + 1,0. Wykres B - idealna ujemna korelacja pomiędzy x i y przy r = - 1,0. Wykresy C i D są przykładami słabszych zależności pomiędzy zmiennymi zależnymi i niezależnymi.

Współczynnik korelacji r określa zarówno siłę, jak i kierunek związku pomiędzy zmiennymi zależnymi i niezależnymi. Wartości r wahają się od - 1,0 (silna negatywna zależność) do + 1,0 (silna pozytywna zależność). Gdy r = 0, nie ma związku między zmiennymi x i y.

Rzeczywisty współczynnik korelacji możemy obliczyć za pomocą następującego równania:

Dobrze, dobrze! Wiem, że to równanie wygląda jak przerażająca mieszanina dziwnych symboli, ale zanim wpadniemy w panikę, zastosujmy do niego przykład oceny z egzaminu. Załóżmy, że chcę ustalić, czy istnieje związek pomiędzy liczbą godzin, jakie student poświęca na naukę statystyki, a końcowym wynikiem egzaminu. Poniższa tabela pomoże nam rozbić to równanie na kilka prostych obliczeń i ułatwić ich wykonanie.

Jak widać, istnieje bardzo silna dodatnia korelacja między liczbą godzin poświęconych na naukę przedmiotu a oceną z egzaminu. Nauczyciele będą bardzo szczęśliwi, gdy się o tym dowiedzą.

Jaka jest korzyść z ustalenia zależności pomiędzy podobnymi zmiennymi? Świetne pytanie. Jeśli okaże się, że istnieje taka zależność, możemy przewidzieć wyniki egzaminu na podstawie określonej liczby godzin spędzonych na studiowaniu danego przedmiotu. Mówiąc najprościej, im silniejsze połączenie, tym dokładniejsze będą nasze przewidywania.

Korzystanie z programu Excel do obliczania współczynników korelacji

Jestem pewien, że kiedy spojrzysz na te okropne obliczenia współczynników korelacji, będziesz naprawdę zachwycony, gdy się o tym dowiesz programu Excela może wykonać całą tę pracę za Ciebie, korzystając z funkcji CORREL o następujących cechach:

KOREL (tablica 1; tablica 2),

tablica 1 = zakres danych dla pierwszej zmiennej,

tablica 2 = zakres danych dla drugiej zmiennej.

Na przykład rysunek przedstawia funkcję CORREL zastosowaną do obliczenia współczynnika korelacji dla przykładowej oceny z egzaminu.

Współczynnik korelacji (lub współczynnik liniowy korelacja) jest oznaczana jako „r” (w rzadkich przypadkach jako „ρ”) i charakteryzuje korelacja liniowa(to znaczy związek określony przez pewną wartość i kierunek) dwóch lub więcej zmiennych. Wartość współczynnika mieści się w przedziale od -1 do +1, co oznacza, że ​​korelacja może być zarówno dodatnia, jak i ujemna. Jeśli współczynnik korelacji wynosi -1, mamy do czynienia z doskonałą korelacją ujemną; jeśli współczynnik korelacji wynosi +1, istnieje doskonała korelacja dodatnia. W innych przypadkach istnieje korelacja dodatnia, korelacja ujemna lub brak korelacji między dwiema zmiennymi. Współczynnik korelacji można obliczyć ręcznie, korzystając z bezpłatnych kalkulatorów dostępnych online lub przy użyciu dobrego kalkulatora graficznego.

Kroki

Ręczne obliczanie współczynnika korelacji

    Zbieraj dane. Zanim zaczniesz obliczać współczynnik korelacji, przestudiuj podaną parę liczb. Lepiej zapisać je w tabeli, którą można ustawić pionowo lub poziomo. Oznacz każdy wiersz lub kolumnę jako „x” i „y”.

    • Na przykład podane są cztery pary wartości (liczb) zmiennych „x” i „y”. Możesz utworzyć następującą tabelę:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Oblicz średnią arytmetyczną „x”. Aby to zrobić, dodaj wszystkie wartości „x”, a następnie podziel wynikowy wynik przez liczbę wartości.

    • W naszym przykładzie podane są cztery wartości zmiennej „x”. Aby obliczyć średnią arytmetyczną „x”, dodaj te wartości, a następnie podziel sumę przez 4. Obliczenia zostaną zapisane w następujący sposób:
    • μ x = (1 + 2 + 4 + 5) / 4 (\ Displaystyle \ mu _ (x) = (1+2+4+5)/4)
    • μ x = 12/4 (\ displaystyle \ mu _ (x) = 12/4)
    • μ x = 3 (\ displaystyle \ mu _ (x) = 3)
  2. Znajdź średnią arytmetyczną „y”. Aby to zrobić, biegnij podobne działania, czyli zsumuj wszystkie wartości „y”, a następnie podziel sumę przez liczbę wartości.

    • W naszym przykładzie podane są cztery wartości zmiennej „y”. Dodaj te wartości, a następnie podziel sumę przez 4. Obliczenia zostaną zapisane w następujący sposób:
    • μ y = (1 + 3 + 5 + 7) / 4 (\ Displaystyle \ mu _ (y) = (1+3+5+7)/4)
    • μ y = 16/4 (\ displaystyle \ mu _ (y) = 16/4)
    • μ y = 4 (\ displaystyle \ mu _ (y) = 4)
  3. Oblicz odchylenie standardowe „x”. Po obliczeniu średnich wartości „x” i „y” znajdź odchylenia standardowe te zmienne. Odchylenie standardowe oblicza się za pomocą następującego wzoru:

    • σ x = 1 n - 1 Σ (x - μ x) 2 (\ Displaystyle \ sigma _ (x) = (\ sqrt ({\ Frac (1) (n-1)) \ Sigma (x- \ mu _ ( x))^(2))))
    • σ x = 1 4 - 1 ∗ ((1 - 3) 2 + (2 - 3) 2 + (4 - 3) 2 + (5 - 3) 2) (\ Displaystyle \ sigma _ (x) = (\ sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\ Displaystyle \ sigma _ (x) = (\ sqrt ({\ Frac (1) (3)) * (4 + 1 + 1 + 4)) ))
    • σ x = 1 3 ∗ (10) (\ Displaystyle \ sigma _ (x) = (\ sqrt ({\ Frac (1) (3)) * (10))))
    • σ x = 10 3 (\ Displaystyle \ sigma _ (x) = (\ sqrt (\ Frac (10) (3))))
    • σ x = 1, 83 (\ displaystyle \ sigma _ (x) = 1,83)
  4. Oblicz odchylenie standardowe „y”. Wykonaj kroki opisane w poprzednim kroku. Użyj tej samej formuły, ale zamień w niej wartości „y”.

    • W naszym przykładzie obliczenia zostaną zapisane w następujący sposób:
    • σ y = 1 4 - 1 ∗ ((1 - 4) 2 + (3 - 4) 2 + (5 - 4) 2 + (7 - 4) 2) (\ Displaystyle \ sigma _ (y) = (\ sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\ Displaystyle \ sigma _ (y) = (\ sqrt ({\ Frac (1) (3)) * (9 + 1 + 1 + 9)} ))
    • σ y = 1 3 ∗ (20) (\ Displaystyle \ sigma _ (y) = (\ sqrt ({\ Frac (1) (3)) * (20))))
    • σ y = 20 3 (\ Displaystyle \ sigma _ (y) = (\ sqrt (\ Frac (20) (3))))
    • σ y = 2,58 (\ displaystyle \ sigma _ (y) = 2,58)
  5. Zapisz podstawowy wzór na obliczenie współczynnika korelacji. Wzór ten obejmuje średnie, odchylenia standardowe i liczbę (n) par liczb dla obu zmiennych. Współczynnik korelacji oznacza się jako „r” (w rzadkich przypadkach jako „ρ”). W artykule wykorzystano wzór do obliczenia współczynnika korelacji Pearsona.

    • Tutaj i w innych źródłach ilości mogą być oznaczone inaczej. Na przykład niektóre formuły zawierają „ρ” i „σ”, podczas gdy inne zawierają „r” i „s”. Niektóre podręczniki podają inne wzory, ale są to matematyczne odpowiedniki powyższego wzoru.
  6. Obliczyłeś średnie i odchylenia standardowe obu zmiennych, więc możesz skorzystać ze wzoru do obliczenia współczynnika korelacji. Przypomnijmy, że „n” to liczba par wartości obu zmiennych. Wartości pozostałych wielkości zostały obliczone wcześniej.

    • W naszym przykładzie obliczenia zostaną zapisane w następujący sposób:
    • ρ = (1 n - 1) Σ (x - μ x σ x) ∗ (y - μ y σ y) (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (n-1)) \ prawo) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\prawo))
    • ρ = (1 3) ∗ (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (3)) \ prawo) *)[ (1 - 3 1, 83) ∗ (1 - 4 2, 58) + (2 - 3 1, 83) ∗ (3 - 4 2, 58) (\ Displaystyle \ lewo ({\ Frac (1-3) ( 1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2-3)(1,83))\right) *\left((\ frac (3-4)(2,58))\prawo))
      + (4 - 3 1 , 83) ∗ (5 - 4 2 , 58) + (5 - 3 1 , 83) ∗ (7 - 4 2 , 58) (\ Displaystyle + \ lewo ({\ Frac (4-3 )(1,83))\prawo)*\lewo((\frac (5-4)(2,58))\prawo)+\lewo((\frac (5-3)(1,83))\ prawo)*\lewo( (\frac (7-4)(2,58))\prawo))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (3)) \ prawo) * \ lewo ({\ Frac (6 +1+1+6)(4721))\po prawej))
    • ρ = (1 3) ∗ 2, 965 (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (3)) \ prawo) * 2,965)
    • ρ = (2, 965 3) (\ Displaystyle \ rho = \ lewo ({\ Frac (2,965) (3)) \ prawo)}
    • ρ = 0,988 (\ displaystyle \ rho = 0,988)
  7. Przeanalizuj wynik. W naszym przykładzie współczynnik korelacji wynosi 0,988. Wartość ta w jakiś sposób charakteryzuje ten zbiór par liczb. Zwróć uwagę na znak i wielkość wartości.

    • Ponieważ wartość współczynnika korelacji jest dodatnia, pomiędzy zmiennymi „x” i „y” występuje dodatnia korelacja. Oznacza to, że wraz ze wzrostem wartości „x” wzrasta również wartość „y”.
    • Ponieważ wartość współczynnika korelacji jest bardzo bliska +1, wartości zmiennych „x” i „y” są ze sobą silnie powiązane. Jeśli narysujesz punkty na płaszczyźnie współrzędnych, będą one zlokalizowane blisko określonej linii prostej.

    Korzystanie z kalkulatorów internetowych do obliczenia współczynnika korelacji

    1. Znajdź kalkulator w Internecie, aby obliczyć współczynnik korelacji. Współczynnik ten jest dość często obliczany w statystykach. Jeśli istnieje wiele par liczb, ręczne obliczenie współczynnika korelacji jest prawie niemożliwe. Dlatego istnieją kalkulatory online do obliczania współczynnika korelacji. W wyszukiwarce wpisz „kalkulator współczynnika korelacji” (bez cudzysłowu).

    2. Wprowadzanie danych. Prosimy o zapoznanie się z instrukcjami na stronie internetowej, aby upewnić się, że wprowadzone dane (pary liczb) są prawidłowe. Niezwykle ważne jest wprowadzenie odpowiednich par liczb; w przeciwnym razie otrzymasz nieprawidłowy wynik. Pamiętaj, że różne strony internetowe mają różne formaty wprowadzania danych.

      • Przykładowo na stronie http://ncalculators.com/statistics/correlation-cooperative-calculator.htm wartości zmiennych „x” i „y” wpisuje się w dwóch poziomych liniach. Wartości oddziela się przecinkami. Oznacza to, że w naszym przykładzie wartości „x” wprowadza się w następujący sposób: 1,2,4,5, a wartości „y” w następujący sposób: 1,3,5,7.
      • Na innej stronie, http://www.alcula.com/calculators/statistics/correlation-cooperative/, dane wprowadzane są pionowo; w takim przypadku nie należy mylić odpowiednich par liczb.
    3. Oblicz współczynnik korelacji. Po wprowadzeniu danych wystarczy kliknąć przycisk „Oblicz”, „Oblicz” lub podobny, aby otrzymać wynik.

      Korzystanie z kalkulatora graficznego

      1. Wprowadzanie danych. Weź kalkulator graficzny, przejdź do trybu statystycznego i wybierz polecenie Edytuj.

        • Różne kalkulatory wymagają różnych naciśnięć klawiszy. W tym artykule omówiono kalkulator TI-86 firmy Texas Instruments.
        • Aby przejść do trybu obliczeń statystycznych, naciśnij – Stat (nad klawiszem „+”). Następnie naciśnij F2 – Edytuj.
      2. Usuń poprzednio zapisane dane. Większość kalkulatorów przechowuje wprowadzone statystyki do czasu ich usunięcia. Aby uniknąć pomylenia starych danych z nowymi, należy najpierw usunąć wszelkie zapisane informacje.

        • Użyj klawiszy strzałek, aby przesunąć kursor i podświetl nagłówek „xStat”. Następnie naciśnij Clear i Enter, aby usunąć wszystkie wartości wprowadzone w kolumnie xStat.
        • Za pomocą klawiszy strzałek podświetl nagłówek „yStat”. Następnie naciśnij Clear i Enter, aby wyczyścić wszystkie wartości wprowadzone w kolumnie yStat.
      3. Wprowadź dane początkowe. Użyj klawiszy strzałek, aby przesunąć kursor do pierwszej komórki pod nagłówkiem „xStat”. Wprowadź pierwszą wartość i naciśnij Enter. Na dole ekranu wyświetli się „xStat (1) = __”, gdzie zamiast spacji pojawi się wprowadzona wartość. Po naciśnięciu Enter wprowadzona wartość pojawi się w tabeli, a kursor przesunie się do kolejnej linii; spowoduje to wyświetlenie „xStat (2) = __” u dołu ekranu.

        • Wprowadź wszystkie wartości zmiennej „x”.
        • Po wpisaniu wszystkich wartości dla zmiennej x należy za pomocą klawiszy strzałek przejść do kolumny yStat i wprowadzić wartości dla zmiennej y.
        • Po wprowadzeniu wszystkich par liczb naciśnij przycisk Exit, aby wyczyścić ekran i wyjść z trybu obliczeń statystycznych.
      4. Oblicz współczynnik korelacji. Charakteryzuje stopień bliskości danych do określonej linii. Kalkulator graficzny może szybko określić odpowiednią linię i obliczyć współczynnik korelacji.

        • Kliknij Statystyka – Oblicz. W TI-86 musisz nacisnąć – –.
        • Wybierz funkcję „Regresja liniowa”. W TI-86 naciśnij przycisk , który jest oznaczony jako „LinR”. Na ekranie wyświetli się wiersz „LinR_” z migającym kursorem.
        • Teraz wprowadź nazwy dwóch zmiennych: xStat i yStat.
          • W TI-86 otwórz listę nazwisk; W tym celu naciśnij – – .
          • W dolnej linii ekranu zostaną wyświetlone dostępne zmienne. Wybierz (w tym celu prawdopodobnie będziesz musiał nacisnąć klawisz F1 lub F2), wprowadź przecinek, a następnie wybierz .
          • Naciśnij Enter, aby przetworzyć wprowadzone dane.
      5. Przeanalizuj swoje wyniki. Po naciśnięciu Enter na ekranie zostaną wyświetlone następujące informacje:

        • y = za + b x (\ displaystyle y = a + bx): Jest to funkcja opisująca linię prostą. Należy pamiętać, że funkcja nie jest zapisana w standardowej formie (y = kh + b).
        • za = (\ displaystyle a =). Jest to współrzędna „y” punktu, w którym linia przecina oś Y.
        • b = (\ displaystyle b =). To jest nachylenie linii.
        • corr = (\ displaystyle (\ tekst (corr)) =). To jest współczynnik korelacji.
        • n = (\ displaystyle n =). Jest to liczba par liczb wykorzystanych w obliczeniach.

Analiza regresji i korelacji to metody badań statystycznych. Są to najczęstsze sposoby pokazania zależności parametru od jednej lub większej liczby zmiennych niezależnych.

Poniżej o konkretach praktyczne przykłady Przyjrzyjmy się tym dwóm bardzo popularnym wśród ekonomistów analizom. Podamy również przykład uzyskania wyników podczas ich łączenia.

Analiza regresji w Excelu

Pokazuje wpływ niektórych wartości (niezależnych, niezależnych) na zmienną zależną. Na przykład, jak liczba ludności aktywnej zawodowo zależy od liczby przedsiębiorstw, wynagrodzeń i innych parametrów. Albo: jak inwestycje zagraniczne, ceny energii itp. wpływają na poziom PKB.

Wynik analizy pozwala na wyróżnienie priorytetów. I na podstawie głównych czynników przewidywać, planować rozwój obszarów priorytetowych i podejmować decyzje zarządcze.

Regresja ma miejsce:

  • liniowy (y = a + bx);
  • paraboliczny (y = a + bx + cx 2);
  • wykładniczy (y = a * exp(bx));
  • potęga (y = a*x^b);
  • hiperboliczny (y = b/x + a);
  • logarytmiczny (y = b * 1n(x) + a);
  • wykładniczy (y = a * b^x).

Spójrzmy na konstrukcję jako przykład Model regresji w Excelu i interpretacja wyników. Weźmy regresję liniową.

Zadanie. W 6 przedsiębiorstwach średnio miesięcznie płaca i liczbę pracowników, którzy odeszli. Konieczne jest określenie zależności liczby odchodzących pracowników od przeciętnego wynagrodzenia.

Model regresja liniowa ma następującą postać:

Y = za 0 + za 1 x 1 +…+a k x k.

Gdzie a to współczynniki regresji, x to zmienne wpływające, k to liczba czynników.

W naszym przykładzie Y jest wskaźnikiem odejścia pracowników. Czynnikiem wpływającym są płace (x).

Excel ma wbudowane funkcje, które mogą pomóc w obliczeniu parametrów modelu regresji liniowej. Ale dodatek „Pakiet analityczny” zrobi to szybciej.

Aktywujemy potężne narzędzie analityczne:

Po aktywacji dodatek będzie dostępny w zakładce Dane.

Przeprowadźmy teraz samą analizę regresji.



Przede wszystkim zwracamy uwagę na R-kwadrat i współczynniki.

R-kwadrat to współczynnik determinacji. W naszym przykładzie – 0,755, czyli 75,5%. Oznacza to, że obliczone parametry modelu wyjaśniają 75,5% zależności pomiędzy badanymi parametrami. Im wyższy współczynnik determinacji, tym lepszy model. Dobry - powyżej 0,8. Źle – mniej niż 0,5 (taką analizę trudno uznać za uzasadnioną). W naszym przykładzie – „nieźle”.

Współczynnik 64,1428 pokazuje, jakie będzie Y, jeśli wszystkie zmienne w rozpatrywanym modelu będą równe 0. Oznacza to, że na wartość analizowanego parametru wpływają także inne czynniki, nie opisane w modelu.

Współczynnik -0,16285 pokazuje wagę zmiennej X na Y. Oznacza to, że przeciętne miesięczne wynagrodzenie w tym modelu wpływa na liczbę osób rezygnujących z wagi -0,16285 (jest to niewielki stopień wpływu). Znak „-” wskazuje na negatywny wpływ: im wyższa pensja, tym mniej osób odchodzi. Co jest sprawiedliwe.



Analiza korelacji w programie Excel

Analiza korelacji pomaga określić, czy istnieje związek między wskaźnikami w jednej czy dwóch próbach. Na przykład między czasem pracy maszyny a kosztem napraw, ceną sprzętu a czasem pracy, wzrostem i wagą dzieci itp.

Jeżeli istnieje związek, to czy wzrost jednego parametru powoduje wzrost (korelacja dodatnia), czy spadek (korelacja ujemna) drugiego. Analiza korelacji pomaga analitykowi określić, czy wartość jednego wskaźnika można wykorzystać do przewidywania możliwe znaczenie inny.

Współczynnik korelacji jest oznaczony przez r. Zmienia się od +1 do -1. Klasyfikacja korelacji dla różne obszary będzie inny. Gdy współczynnik wynosi 0 zależność liniowa nie istnieje pomiędzy próbkami.

Przyjrzyjmy się, jak znaleźć współczynnik korelacji za pomocą programu Excel.

Aby znaleźć sparowane współczynniki, używana jest funkcja CORREL.

Cel pracy: Ustalenie, czy istnieje związek pomiędzy czasem pracy tokarki a kosztami jej konserwacji.

Umieść kursor w dowolnej komórce i naciśnij przycisk fx.

  1. W kategorii „Statystyczne” wybierz funkcję KOREL.
  2. Argument „Tablica 1” – pierwszy zakres wartości – czas pracy maszyny: A2:A14.
  3. Argument „Tablica 2” – drugi zakres wartości – koszt naprawy: B2:B14. Kliknij OK.

Aby określić rodzaj połączenia, należy spojrzeć na bezwzględną liczbę współczynnika (każde pole działalności ma swoją skalę).

Do analizy korelacji kilku parametrów (więcej niż 2) wygodniej jest skorzystać z „Analizy danych” (dodatek „Pakiet analityczny”). Należy wybrać korelację z listy i wyznaczyć tablicę. Wszystko.

Otrzymane współczynniki zostaną wyświetlone w macierzy korelacji. Lubię to:

Analiza korelacji i regresji

W praktyce te dwie techniki są często stosowane razem.

Przykład:


Teraz stały się widoczne dane z analizy regresji.

Ilościową charakterystykę zależności można uzyskać obliczając współczynnik korelacji.

Analiza korelacji w programie Excel

Sama funkcja ma forma ogólna KOREL(tablica1, tablica2). W polu „Tablica1” należy wpisać współrzędne zakresu komórek jednej z wartości, której zależność ma zostać określona. Jak widać, współczynnik korelacji w postaci liczby pojawia się w wybranej przez nas wcześniej komórce. Otworzy się okno z parametrami analizy korelacji. W odróżnieniu od poprzedniej metody, w polu „Przedział wejściowy” wpisujemy przedział nie każdej kolumny z osobna, ale wszystkich kolumn biorących udział w analizie. Jak widać aplikacja Excel oferuje dwie metody analizy korelacji jednocześnie.

Wykres korelacji w Excelu

6) Pierwszy element stołu finałowego pojawi się w lewej górnej komórce wybranego obszaru. W związku z tym odrzuca się hipotezę H0, co oznacza, że ​​parametry regresji i współczynnik korelacji nie są losowo różne od zera, ale są istotne statystycznie. 7. Uzyskane oszacowania równania regresji pozwalają na wykorzystanie go do prognozowania.

Jak obliczyć współczynnik korelacji w programie Excel

Jeśli współczynnik wynosi 0, oznacza to, że między wartościami nie ma związku. Aby znaleźć związek między zmiennymi i y, użyj wbudowanej funkcji Microsoft Excel„KOREL”. Na przykład dla „Array1” wybierz wartości y, a dla „Array2” wybierz wartości x. W efekcie otrzymasz obliczony przez program współczynnik korelacji. Następnie musisz obliczyć różnicę między każdym x i xav oraz yav. W wybranych komórkach napisz formuły x-x, y-. Nie zapomnij przypiąć komórek średnimi. Otrzymany wynik będzie pożądanym współczynnikiem korelacji.

Powyższy wzór na obliczenie współczynnika Pearsona pokazuje, jak pracochłonny jest ten proces, jeśli jest wykonywany ręcznie. Po drugie, proszę polecić, jaki rodzaj analizy korelacji można zastosować dla różnych próbek o dużym rozproszeniu danych? Jak statystycznie udowodnić, że istnieje istotna różnica pomiędzy grupą powyżej 60. roku życia a resztą grupy?

Zrób to sam: Obliczanie korelacji walutowych za pomocą Excela

Na przykład używamy programu Microsoft Excel, ale wystarczy dowolny inny program, w którym można skorzystać ze wzoru korelacji. 7. Następnie wybierz komórki z danymi EUR/USD. 9. Naciśnij Enter, aby obliczyć współczynnik korelacji dla EUR/USD i USD/JPY. Nie warto codziennie aktualizować liczb (no chyba, że ​​masz obsesję na punkcie korelacji walutowych).

Spotkałeś się już z koniecznością obliczenia stopnia połączenia między dwoma wielkości statystyczne i określić wzór, według którego są one powiązane? Użyłem do tego funkcji CORREL - trochę informacji na ten temat znajdziesz tutaj. Zwraca stopień korelacji między dwoma zakresami danych. Teoretycznie funkcję korelacji można udoskonalić, przekształcając ją z liniowej na wykładniczą lub logarytmiczną. Analiza danych i wykresów korelacji może znacznie poprawić ich wiarygodność.

Załóżmy, że komórka B2 zawiera sam współczynnik korelacji, a komórka B3 zawiera liczbę pełnych obserwacji. Czy masz biuro rosyjskojęzyczne?Przy okazji, też znalazłem błąd - dla korelacji ujemnych nie oblicza się istotności. Jeśli obie zmienne są metryczne i mają normalna dystrybucja, to wybór został dokonany prawidłowo. A czy można scharakteryzować kryterium podobieństwa krzywych za pomocą tylko jednego CC?Nie mamy do czynienia z podobieństwem „krzywych”, ale z podobieństwem dwóch szeregów, które w zasadzie można opisać krzywą.



Nowość na stronie

>

Najbardziej popularny