տուն Հիգիենա Հարաբերակցության գործակիցի հաշվարկ excel-ում. Հարաբերակցության գործակիցը գտնելու օրինակ

Հարաբերակցության գործակիցի հաշվարկ excel-ում. Հարաբերակցության գործակիցը գտնելու օրինակ

Հարաբերակցության գործակիցը (կամ գծային գործակիցհարաբերակցություն) նշվում է որպես «r» (հազվադեպ՝ «ρ») և բնութագրում գծային հարաբերակցություն(այսինքն՝ հարաբերություն, որը տրվում է ինչ-որ արժեքով և ուղղությամբ) երկու կամ ավելի փոփոխականների։ Գործակիցի արժեքը գտնվում է -1-ի և +1-ի միջև, այսինքն՝ հարաբերակցությունը կարող է լինել և՛ դրական, և՛ բացասական: Եթե ​​հարաբերակցության գործակիցը -1 է, ապա կա կատարյալ բացասական հարաբերակցություն; եթե հարաբերակցության գործակիցը +1 է, ապա կա կատարյալ դրական հարաբերակցություն: Մնացած դեպքերում երկու փոփոխականների միջև կա դրական հարաբերակցություն, բացասական հարաբերակցություն կամ չկա հարաբերակցություն: Հարաբերակցության գործակիցը կարող է հաշվարկվել ձեռքով, օգտագործելով անվճար առցանց հաշվիչներ կամ օգտագործելով լավ գրաֆիկական հաշվիչ:

Քայլեր

Հարաբերակցության գործակիցը ձեռքով հաշվարկելը

    Հավաքել տվյալներ.Մինչ կսկսեք հաշվարկել հարաբերակցության գործակիցը, ուսումնասիրեք տրված թվերի զույգը։ Ավելի լավ է դրանք գրել աղյուսակում, որը կարող է տեղադրվել ուղղահայաց կամ հորիզոնական: Նշեք յուրաքանչյուր տող կամ սյունակ որպես «x» և «y»:

    • Օրինակ, տրված են «x» և «y» փոփոխականների չորս զույգ արժեքներ (թվեր): Դուք կարող եք ստեղծել հետևյալ աղյուսակը.
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Հաշվի՛ր «x»-ի միջին թվաբանականը։Դա անելու համար գումարեք բոլոր «x» արժեքները, այնուհետև ստացված արդյունքը բաժանեք արժեքների քանակով:

    • Մեր օրինակում տրված են «x» փոփոխականի չորս արժեք: «x»-ի միջին թվաբանականը հաշվարկելու համար գումարեք այս արժեքները, այնուհետև գումարը բաժանեք 4-ի: Հաշվարկները կգրվեն այսպես.
    • μ x = (1 + 2 + 4 + 5) / 4 (\ցուցադրման ոճ \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Գտե՛ք «y» թվաբանական միջինը։Դա անելու համար վազեք նմանատիպ գործողություններ, այսինքն՝ գումարեք «y»-ի բոլոր արժեքները, այնուհետև գումարը բաժանեք արժեքների քանակի վրա։

    • Մեր օրինակում տրված են «y» փոփոխականի չորս արժեք: Ավելացրե՛ք այս արժեքները և այնուհետև գումարը բաժանե՛ք 4-ի: Հաշվարկները կգրվեն այսպես.
    • μ y = (1 + 3 + 5 + 7) / 4 (\ցուցադրման ոճ \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\ցուցադրման ոճ \mu _(y)=4)
  3. Հաշվե՛ք «x»-ի ստանդարտ շեղումը։«x» և «y» միջին արժեքները հաշվարկելուց հետո գտեք ստանդարտ շեղումներայս փոփոխականները: Ստանդարտ շեղումը հաշվարկվում է հետևյալ բանաձևով.

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
  4. Հաշվե՛ք «y»-ի ստանդարտ շեղումը։Հետևեք նախորդ քայլում նկարագրված քայլերին: Օգտագործեք նույն բանաձևը, բայց դրա մեջ փոխարինեք «y» արժեքները:

    • Մեր օրինակում հաշվարկները կգրվեն այսպես.
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2.58 (\displaystyle \sigma _(y)=2.58)
  5. Գրեք հարաբերակցության գործակիցը հաշվարկելու հիմնական բանաձևը.Այս բանաձևը ներառում է միջին, ստանդարտ շեղումներ և թվերի (n) զույգեր երկու փոփոխականների համար: Հարաբերակցության գործակիցը նշվում է որպես «r» (հազվադեպ՝ «ρ»): Այս հոդվածը օգտագործում է բանաձև՝ հաշվարկելու Պիրսոնի հարաբերակցության գործակիցը։

    • Այստեղ և այլ աղբյուրներում քանակները կարող են տարբեր կերպ նշանակվել: Օրինակ՝ որոշ բանաձևեր պարունակում են «ρ» և «σ», իսկ մյուսները՝ «r» և «s»: Որոշ դասագրքեր տալիս են այլ բանաձևեր, բայց դրանք վերը նշված բանաձևի մաթեմատիկական անալոգներ են:
  6. Դուք հաշվարկել եք երկու փոփոխականների միջին և ստանդարտ շեղումները, այնպես որ կարող եք օգտագործել բանաձևը հարաբերակցության գործակիցը հաշվարկելու համար: Հիշեցնենք, որ «n»-ը երկու փոփոխականների համար զույգ արժեքների թիվն է: Ավելի վաղ հաշվարկվել են այլ քանակությունների արժեքները։

    • Մեր օրինակում հաշվարկները կգրվեն այսպես.
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\ցուցադրման ոճ \rho =\ձախ (\frac (1)(n-1))\աջ) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\աջ)*\left((\frac (y-\mu _(y))(\sigma _(y)))\ճիշտ))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\աջ)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\աջ)*\ձախ((\frac (1-4)(2.58))\աջ)+\left((\frac (2-3)(1.83))\աջ) *\ձախ ((\ ֆրակ (3-4) (2.58))\աջ))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\աջ)*\ձախ((\frac (5-4)(2.58))\աջ)+\ձախ((\frac (5-3)(1.83))\ աջ)*\ձախ( (\frac (7-4)(2.58))\աջ))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\աջ)*\left((\frac (6) +1+1+6)(4721))\աջ))
    • ρ = (1 3) ∗ 2, 965 (\displaystyle \rho =\left((\frac (1)(3))\աջ)*2.965)
    • ρ = (2, 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\աջ))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  7. Վերլուծեք արդյունքը.Մեր օրինակում հարաբերակցության գործակիցը 0,988 է: Այս արժեքը ինչ-որ կերպ բնութագրում է թվերի զույգերի այս շարքը: Ուշադրություն դարձրեք արժեքի նշանին և մեծությանը:

    • Քանի որ հարաբերակցության գործակիցի արժեքը դրական է, «x» և «y» փոփոխականների միջև կա դրական հարաբերակցություն: Այսինքն, քանի որ «x»-ի արժեքը մեծանում է, «y»-ի արժեքը նույնպես մեծանում է:
    • Քանի որ հարաբերակցության գործակիցի արժեքը շատ մոտ է +1-ին, «x» և «y» փոփոխականների արժեքները խիստ փոխկապակցված են: Եթե ​​կետերը գծեք կոորդինատային հարթության վրա, ապա դրանք կտեղակայվեն որոշակի ուղիղ գծի մոտ:

    Օգտագործելով առցանց հաշվիչներ հարաբերակցության գործակիցը հաշվարկելու համար

    1. Համացանցում գտեք հաշվիչ հարաբերակցության գործակիցը հաշվարկելու համար:Այս գործակիցը բավականին հաճախ է հաշվարկվում վիճակագրության մեջ։ Եթե ​​կան բազմաթիվ զույգ թվեր, ապա գրեթե անհնար է ձեռքով հաշվարկել հարաբերակցության գործակիցը։ Հետեւաբար, կան առցանց հաշվիչներ՝ հարաբերակցության գործակիցը հաշվարկելու համար։ Որոնման համակարգում մուտքագրեք «հարաբերակցության գործակիցի հաշվիչը» (առանց չակերտների):

    2. Մուտքագրեք տվյալներ:Խնդրում ենք ծանոթանալ կայքի հրահանգներին՝ համոզվելու համար, որ ճիշտ եք մուտքագրել տվյալները (թվերի զույգերը): Չափազանց կարևոր է մուտքագրել համապատասխան զույգ թվեր. հակառակ դեպքում կստանաք ոչ ճիշտ արդյունք։ Հիշեք, որ տարբեր կայքեր ունեն տվյալների մուտքագրման տարբեր ձևաչափեր:

      • Օրինակ, http://ncalculators.com/statistics/correlation-coefficient-calculator.htm կայքում «x» և «y» փոփոխականների արժեքները մուտքագրվում են երկու հորիզոնական տողերով: Արժեքները բաժանվում են ստորակետերով: Այսինքն, մեր օրինակում «x» արժեքները մուտքագրվում են այսպես՝ 1,2,4,5, իսկ «y» արժեքները՝ 1,3,5,7:
      • Մեկ այլ կայքում՝ http://www.alcula.com/calculators/statistics/correlation-coefficient/, տվյալները մուտքագրվում են ուղղահայաց. այս դեպքում մի շփոթեք համապատասխան թվերի զույգերը։
    3. Հաշվիր հարաբերակցության գործակիցը.Տվյալները մուտքագրելուց հետո պարզապես սեղմեք «Հաշվարկել», «Հաշվել» կամ նմանատիպ կոճակը՝ արդյունքը ստանալու համար:

      Օգտագործելով գրաֆիկական հաշվիչ

      1. Մուտքագրեք տվյալներ:Վերցրեք գրաֆիկական հաշվիչը, անցեք վիճակագրական ռեժիմ և ընտրեք Խմբագրել հրամանը:

        • Տարբեր հաշվիչներ պահանջում են տարբեր ստեղնաշարի սեղմումներ: Այս հոդվածում քննարկվում է Texas Instruments TI-86 հաշվիչը:
        • Վիճակագրական հաշվարկի ռեժիմին անցնելու համար սեղմեք – Stat («+» ստեղնի վերևում): Այնուհետև սեղմեք F2 - Խմբագրել:
      2. Ջնջել նախկին պահպանված տվյալները:Հաշվիչներից շատերը պահում են ձեր մուտքագրած վիճակագրությունը, մինչև դրանք ջնջեք: Հին տվյալները նոր տվյալների հետ շփոթելուց խուսափելու համար նախ ջնջեք ցանկացած պահված տեղեկություն:

        • Օգտագործեք սլաքների ստեղները՝ կուրսորը տեղափոխելու համար և ընդգծեք «xStat» վերնագիրը: Այնուհետև սեղմեք Clear և Enter՝ xStat սյունակում մուտքագրված բոլոր արժեքները հեռացնելու համար:
        • Օգտագործեք սլաքների ստեղները՝ ընդգծելու «yStat» վերնագիրը: Այնուհետև սեղմեք Clear և Enter՝ yStat սյունակում մուտքագրված բոլոր արժեքները մաքրելու համար:
      3. Մուտքագրեք նախնական տվյալները:Օգտագործեք սլաքների ստեղները՝ կուրսորը «xStat» վերնագրի տակ առաջին բջիջ տեղափոխելու համար: Մուտքագրեք առաջին արժեքը և սեղմեք Enter: «xStat (1) = __»-ը կցուցադրվի էկրանի ներքևում, որտեղ բացատի փոխարեն կհայտնվի մուտքագրված արժեքը: Enter սեղմելուց հետո մուտքագրված արժեքը կհայտնվի աղյուսակում, և կուրսորը կտեղափոխվի հաջորդ տող; սա էկրանի ներքևում կցուցադրի «xStat (2) = __»:

        • Մուտքագրեք բոլոր արժեքները «x» փոփոխականի համար:
        • x փոփոխականի բոլոր արժեքները մուտքագրելուց հետո օգտագործեք սլաքների ստեղները՝ yStat սյունակ տեղափոխելու համար և մուտքագրեք y փոփոխականի արժեքները:
        • Բոլոր զույգ թվերը մուտքագրելուց հետո սեղմեք Ելք՝ էկրանը մաքրելու և վիճակագրական հաշվարկի ռեժիմից դուրս գալու համար:
      4. Հաշվիր հարաբերակցության գործակիցը.Այն բնութագրում է, թե որքան մոտ են տվյալները որոշակի տողին: Գրաֆիկական հաշվիչը կարող է արագ որոշել համապատասխան գիծը և հաշվարկել հարաբերակցության գործակիցը:

        • Սեղմեք Stat – Calc: TI-86-ի վրա դուք պետք է սեղմեք – –:
        • Ընտրեք «Գծային ռեգրեսիա» գործառույթը: TI-86-ի վրա սեղմեք , որը պիտակավորված է «LinR»: Էկրանին կցուցադրվի «LinR_» տողը թարթող կուրսորով:
        • Այժմ մուտքագրեք երկու փոփոխականների անունները՝ xStat և yStat:
          • TI-86-ում բացեք անունների ցանկը. Դա անելու համար սեղմեք – – .
          • Էկրանի ներքևի տողում կցուցադրվեն հասանելի փոփոխականները: Ընտրեք (դա անելու համար, հավանաբար, պետք է սեղմեք F1 կամ F2), մուտքագրեք ստորակետ և ընտրեք:
          • Մուտքագրված տվյալները մշակելու համար սեղմեք Enter:
      5. Վերլուծեք ձեր արդյունքները: Enter սեղմելով՝ էկրանին կցուցադրվի հետևյալ տեղեկատվությունը.

        • y = a + b x (\ցուցադրման ոճ y=a+bx)Սա ֆունկցիա է, որը նկարագրում է ուղիղ գիծ: Խնդրում ենք նկատի ունենալ, որ գործառույթը գրված չէ ստանդարտ ձևով (y = kh + b):
        • a = (\displaystyle a=). Սա այն կետի «y» կոորդինատն է, որտեղ ուղիղը հատում է Y առանցքը:
        • b = (\displaystyle b=). Սա գծի թեքությունն է:
        • corr = (\displaystyle (\text(corr))=). Սա հարաբերակցության գործակիցն է։
        • n = (\displaystyle n=). Սա թվերի զույգերի թիվն է, որոնք օգտագործվել են հաշվարկներում:

Հաշվարկենք հարաբերակցության գործակիցը և կովարիանսը տարբեր տեսակներպատահական փոփոխականների հարաբերություններ.

Հարաբերակցության գործակից(հարաբերակցության չափանիշ Փիրսոն, անգլերեն Pearson Product Moment հարաբերակցության գործակից)որոշում է աստիճանը գծայինպատահական փոփոխականների միջև փոխհարաբերությունները:

Ինչպես հետևում է սահմանումից, հաշվարկել հարաբերակցության գործակիցըանհրաժեշտ է իմանալ X և Y պատահական փոփոխականների բաշխվածությունը: Եթե բաշխումները անհայտ են, ապա գնահատել հարաբերակցության գործակիցըօգտագործված ընտրանքի հարաբերակցության գործակիցըr (այն նաև նշանակված է որպես Rxy կամ r xy) :

որտեղ S x – ստանդարտ շեղումնմուշներ պատահական փոփոխական x, հաշվարկվում է բանաձևով.

Ինչպես երևում է հաշվարկի բանաձևից հարաբերակցություններ, հայտարարը (ստանդարտ շեղումների արտադրյալը) պարզապես նորմալացնում է համարիչը այնպես, որ հարաբերակցությունըստացվում է անչափ թիվ -1-ից մինչև 1: ՀարաբերակցությունԵվ կովարիանստրամադրել նույն տեղեկատվությունը (եթե հայտնի է ստանդարտ շեղումներ), Բայց հարաբերակցությունըավելի հարմար է օգտագործել, քանի որ դա չափազերծ մեծություն է։

Հաշվիր հարաբերակցության գործակիցըԵվ նմուշի կովարիանս MS EXCEL-ում դժվար չէ, քանի որ այդ նպատակով կան հատուկ գործառույթներ CORREL() և KOVAR(): Շատ ավելի դժվար է պարզել, թե ինչպես մեկնաբանել ստացված արժեքները, հոդվածի մեծ մասը նվիրված է դրան:

Տեսական նահանջ

Հիշեցնենք, որ հարաբերական կապանվանել վիճակագրական հարաբերություն, որը բաղկացած է նրանից, որ մեկ փոփոխականի տարբեր արժեքները համապատասխանում են տարբերին միջինարժեքները տարբեր են (X-ի արժեքի փոփոխությամբ միջին արժեքը Y-ը փոխվում է կանոնավոր կերպով): Ենթադրվում է, որ երկուսն էլ X և Y փոփոխականներն են պատահականարժեքներ և ունեն որոշակի պատահական ցրում դրանց նկատմամբ միջին արժեքը.

Նշում. Եթե ​​միայն մեկ փոփոխականը, օրինակ՝ Y-ն ունի պատահական բնույթ, իսկ մյուսի արժեքները դետերմինիստական ​​են (սահմանված է հետազոտողի կողմից), ապա կարելի է խոսել միայն ռեգրեսիայի մասին։

Այսպես, օրինակ, միջին տարեկան ջերմաստիճանի կախվածությունն ուսումնասիրելիս չի կարելի խոսել հարաբերակցություններջերմաստիճանը և դիտարկման տարին և, համապատասխանաբար, կիրառել ցուցանիշներ հարաբերակցություններդրանց համապատասխան մեկնաբանությամբ։

Հարաբերակցությունփոփոխականների միջև կարող է առաջանալ մի քանի ձևով.

  1. Փոփոխականների միջև պատճառահետևանքային կապի առկայությունը: Օրինակ, ներդրումների չափը Գիտական ​​հետազոտություն(փոփոխական X) և ստացված արտոնագրերի քանակը (Y): Առաջին փոփոխականը հայտնվում է որպես անկախ փոփոխական (գործոն), երկրորդ - կախված փոփոխական (արդյունք). Պետք է հիշել, որ քանակների կախվածությունը որոշում է դրանց միջև հարաբերակցության առկայությունը, բայց ոչ հակառակը:
  2. Խոնարհման առկայությունը ( ընդհանուր պատճառ) Օրինակ, քանի որ կազմակերպությունը մեծանում է, աշխատավարձի ֆոնդը (աշխատավարձը) և տարածքների վարձակալության արժեքը մեծանում են: Ակնհայտ է, որ սխալ է ենթադրել, որ տարածքների վարձակալությունը կախված է աշխատավարձից: Այս երկու փոփոխականները շատ դեպքերում գծայինորեն կախված են անձնակազմի թվից:
  3. Փոփոխականների փոխադարձ ազդեցությունը (երբ մեկը փոխվում է, երկրորդը փոխվում է և հակառակը): Այս մոտեցմամբ թույլատրվում է խնդրի երկու ձևակերպում. Ցանկացած փոփոխական կարող է գործել և՛ որպես անկախ փոփոխական, և՛ որպես կախյալ փոփոխական։

Այսպիսով, հարաբերակցության ցուցիչցույց է տալիս, թե որքան ուժեղ է գծային հարաբերություներկու գործոնի միջև (եթե կա մեկը), իսկ ռեգրեսիան թույլ է տալիս կանխատեսել մի գործոնը՝ հիմնվելով մյուսի վրա:

Հարաբերակցություն, ինչպես ցանկացած այլ վիճակագրական ցուցանիշ, երբ ճիշտ օգտագործումըկարող է օգտակար լինել, բայց ունի նաև օգտագործման սահմանափակումներ: Եթե ​​այն ցույց է տալիս հստակ սահմանված գծային հարաբերություն կամ լիակատար բացակայությունհարաբերություններ, ապա հարաբերակցությունըսա հրաշալի կերպով կարտացոլի: Բայց, եթե տվյալները ցույց են տալիս ոչ գծային հարաբերություն (օրինակ՝ քառակուսի), արժեքների առանձին խմբերի կամ ծայրամասերի առկայություն, ապա հաշվարկված արժեքը հարաբերակցության գործակիցըկարող է ապակողմնորոշիչ լինել (տե՛ս ֆայլի օրինակ):

Հարաբերակցություն 1-ին կամ -1-ին մոտ (այսինքն՝ բացարձակ արժեքով մոտ 1-ին) ցույց է տալիս փոփոխականների միջև ամուր գծային հարաբերություն, 0-ին մոտ արժեքը ցույց չի տալիս որևէ կապ: Դրական հարաբերակցությունընշանակում է, որ մի ցուցանիշի աճի դեպքում մյուսը միջինում ավելանում է, իսկ բացասական ցուցանիշի դեպքում՝ նվազում։

Հարաբերակցության գործակիցը հաշվարկելու համար պահանջվում է, որ համեմատվող փոփոխականները բավարարեն հետևյալ պայմանները.

  • փոփոխականների թիվը պետք է հավասար լինի երկուսի.
  • փոփոխականները պետք է լինեն քանակական (օրինակ՝ հաճախականություն, քաշ, գին): Այս փոփոխականների հաշվարկված միջինը իմաստ ունի. միջին գինըկամ հիվանդի միջին քաշը: Ի տարբերություն քանակական փոփոխականների, որակական (անվանական) փոփոխականները արժեքներ են վերցնում միայն կատեգորիաների վերջավոր շարքից (օրինակ՝ սեռը կամ արյան խումբը): Այս արժեքները պայմանականորեն կապված են թվային արժեքների հետ (օրինակ՝ իգական սեռը 1 է, իսկ արական սեռը՝ 2)։ Հասկանալի է, որ այս դեպքում հաշվարկը միջին արժեքը, որը պահանջվում է գտնել հարաբերակցություններ, սխալ է, և հետևաբար հաշվարկն ինքնին սխալ է հարաբերակցություններ;
  • փոփոխականները պետք է լինեն պատահական փոփոխականներ և ունենան .

Երկչափ տվյալները կարող են ունենալ տարբեր կառուցվածք: Նրանցից ոմանք պահանջում են որոշակի մոտեցումներ աշխատելու համար.

  • Ոչ գծային հարաբերություններով տվյալների համար հարաբերակցությունըպետք է օգտագործվի զգուշությամբ. Որոշ խնդիրների դեպքում կարող է օգտակար լինել մեկ կամ երկու փոփոխականների փոխակերպումը գծային հարաբերություն ստեղծելու համար (սա պահանջում է ոչ գծային հարաբերությունների տեսակի մասին ենթադրություն անել՝ անհրաժեշտ փոխակերպման տեսակը առաջարկելու համար):
  • Օգտագործելով սփռել հողամասերըՈրոշ տվյալներ կարող են դրսևորել անհավասար տատանումներ (ցրվածություն): Անհավասար տատանումների խնդիրն այն է, որ բարձր տատանումներ ունեցող վայրերը ոչ միայն ապահովում են նվազագույն ճշգրիտ տեղեկատվություն, այլև ամենամեծ ազդեցությունն ունեն վիճակագրությունը հաշվարկելիս: Այս խնդիրը նույնպես հաճախ լուծվում է տվյալների փոխակերպմամբ, օրինակ՝ օգտագործելով լոգարիթմներ։
  • Որոշ տվյալներ կարելի է դիտարկել որպես խմբերի բաժանված (կլաստերի), ինչը կարող է ցույց տալ բնակչությանը մասերի բաժանելու անհրաժեշտությունը:
  • Օտարը (կտրուկ շեղվող արժեք) կարող է խեղաթյուրել հարաբերակցության գործակցի հաշվարկված արժեքը: Անցյալը կարող է պայմանավորված լինել պատահականությամբ, տվյալների հավաքագրման սխալմամբ կամ իրականում արտացոլել հարաբերությունների որոշ առանձնահատկություններ: Քանի որ ծայրամասը մեծապես շեղվում է միջին արժեքից, այն մեծ ներդրում ունի ցուցանիշի հաշվարկման մեջ: Վիճակագրական ցուցանիշները հաճախ հաշվարկվում են արտանետումների հետ և առանց հաշվի առնելու:

Օգտագործելով MS EXCEL հարաբերակցությունը հաշվարկելու համար

Որպես օրինակ վերցնենք 2 փոփոխական XԵվ Յև համապատասխանաբար, նմուշբաղկացած է մի քանի զույգ արժեքներից (X i; Y i): Պարզության համար եկեք կառուցենք:

ՆշումԴիագրամների կառուցման մասին լրացուցիչ տեղեկությունների համար տե՛ս հոդվածը: Կառուցման օրինակի ֆայլում սփռել հողամասերըօգտագործվում է, քանի որ այստեղ մենք շեղվել ենք X փոփոխականի պատահական լինելու պահանջից (սա պարզեցնում է գեներացիան տարբեր տեսակներհարաբերություններ. կառուցման միտումներ և տվյալ տարածում): Իրական տվյալների համար դուք պետք է օգտագործեք Scatter աղյուսակը (տես ստորև):

Հաշվարկներ հարաբերակցություններԵկեք գծենք հարաբերություններ փոփոխականների միջև տարբեր դեպքերի համար. գծային, քառակուսիև ժամը կապի բացակայություն.

ՆշումՕրինակի ֆայլում կարող եք սահմանել գծային միտման պարամետրերը (թեքություն, Y-հատում) և ցրման աստիճանը այս միտումի գծի համեմատ: Կարող եք նաև կարգավորել քառակուսի պարամետրերը:

Կառուցման օրինակի ֆայլում սփռել հողամասերըեթե փոփոխականներից կախվածություն չկա, ապա օգտագործվում է ցրման դիագրամ: Այս դեպքում գծապատկերի կետերը դասավորված են ամպի տեսքով։

ՆշումԽնդրում ենք նկատի ունենալ, որ գծապատկերի սանդղակը փոխելով ուղղահայաց կամ հորիզոնական առանցք, կետերի ամպին կարելի է տալ ուղղահայաց կամ հորիզոնական գծի տեսք։ Պարզ է, որ փոփոխականները կմնան անկախ։

Ինչպես նշվեց վերևում, հաշվարկելու համար հարաբերակցության գործակիցը MS EXCEL-ում կա CORREL() ֆունկցիա: Կարող եք նաև օգտագործել նմանատիպ PEARSON() ֆունկցիան, որը վերադարձնում է նույն արդյունքը:

Համոզվելու համար, որ հաշվարկները հարաբերակցություններարտադրվում են CORREL() ֆունկցիայի միջոցով՝ օգտագործելով վերը նշված բանաձևերը, օրինակի ֆայլը ցույց է տալիս հաշվարկը հարաբերակցություններօգտագործելով ավելի մանրամասն բանաձևեր.

=COVARIANCE.G(B28:B88;D28:D88)/STDEV.G(B28:B88)/STDEV.G(D28:D88)

=ԿՈՎԱՐԻԱՆՍ.B(B28:B88;D28:D88)/STDEV.B(B28:B88)/STDEV.B(D28:D88)

Նշում: Քառակուսի հարաբերակցության գործակիցը r-ը հավասար է որոշման գործակիցը R2, որը հաշվարկվում է QPIRSON() ֆունկցիայի միջոցով ռեգրեսիոն գիծ կառուցելիս: R2-ի արժեքը կարող է նաև դուրս գալ ցրման դիագրամկառուցելով գծային միտում՝ օգտագործելով ստանդարտ MS EXCEL ֆունկցիոնալությունը (ընտրեք գծապատկերը, ընտրեք ներդիրը Դասավորություն, ապա խմբում Վերլուծությունսեղմեք կոճակը Թրենդային գիծև ընտրել Գծային մոտարկում) Միտման գիծ կառուցելու մասին լրացուցիչ տեղեկությունների համար տե՛ս, օրինակ, .

Կովարիանսը հաշվարկելու համար MS EXCEL-ի օգտագործումը

Կովարիանսիմաստով մոտ է (նաև դիսպերսիայի չափանիշ) այն տարբերությամբ, որ այն սահմանվում է 2 փոփոխականի համար, և ցրվածություն- մեկի համար: Հետևաբար, cov(x;x)=VAR(x):

MS EXCEL-ում կովարիանսը հաշվարկելու համար (սկսած 2010 թվականի տարբերակից) օգտագործվում են COVARIATION.Г() և COVARIATION.В() ֆունկցիաները։ Առաջին դեպքում հաշվարկման բանաձևը նման է վերը նշվածին (վերջ հանդես է գալիս Բնակչություն ), երկրորդում 1/n բազմապատկիչի փոխարեն օգտագործվում է 1/(n-1), այսինքն. ավարտվող .INհանդես է գալիս Նմուշ.

Նշում COVAR() ֆունկցիան, որն առկա է MS EXCEL-ում ավելի վաղ տարբերակներում, նման է COVARIATION.G() ֆունկցիային:

Նշում CORREL() և COVAR() ֆունկցիաները անգլերեն տարբերակում ներկայացված են որպես CORREL և COVAR: COVARIANCE.G() և COVARIANCE.B() ֆունկցիաները որպես COVARIANCE.P և COVARIANCE.S:

Հաշվարկի լրացուցիչ բանաձևեր կովարիանսներ:

=SUMPRODUCT(B28:B88-AVERAGE(B28:B88);(D28:D88-AVERAGE(D28:D88)))/COUNT(D28:D88)

=SUMPRODUCT(B28:B88-AVERAGE(B28:B88),(D28:D88))/COUNT(D28:D88)

=SUMPRODUCT(B28:B88;D28:D88)/COUNT(D28:D88)-ՄԻՋԻՆ (B28:B88)*ՄԻՋԻՆ (D28:D88)

Այս բանաձևերը օգտագործում են գույքը կովարիանսներ:

Եթե ​​փոփոխականները xԵվ yանկախ, ապա դրանց կովարիանսը 0 է: Եթե փոփոխականներն անկախ չեն, ապա դրանց գումարի շեղումը հավասար է.

VAR(x+y)= VAR(x)+ VAR(y)+2COV(x;y)

Ա ցրվածություննրանց տարբերությունը հավասար է

VAR(x-y)= VAR(x)+ VAR(y)-2COV(x;y)

Հարաբերակցության գործակցի վիճակագրական նշանակության գնահատում

Հիպոթեզը ստուգելու համար մենք պետք է իմանանք պատահական փոփոխականի բաշխումը, այսինքն. հարաբերակցության գործակիցը r. Սովորաբար վարկածը փորձարկվում է ոչ թե r, այլ t r պատահական փոփոխականի համար.

որն ունի n-2 աստիճան ազատության։

Եթե ​​պատահական փոփոխականի հաշվարկված արժեքը |t r | ավելի մեծ է, քան t α,n-2 կրիտիկական արժեքը (α-նշված), ապա զրոյական վարկածը մերժվում է (արժեքների միջև կապը վիճակագրորեն նշանակալի է):

Վերլուծական փաթեթի հավելում

B կովարիանսը և հարաբերակցությունը հաշվարկելու համար կան համանուն գործիքներ վերլուծություն.

Գործիքը կանչելուց հետո երկխոսության տուփ է հայտնվում, որը պարունակում է հետևյալ դաշտերը.

  • Ներածման միջակայքըԴուք պետք է մուտքագրեք հղում դեպի տիրույթ՝ աղբյուրի տվյալներով 2 փոփոխականների համար
  • ԽմբավորումՈրպես կանոն, աղբյուրի տվյալները մուտքագրվում են 2 սյունակում
  • Պիտակներ առաջին տողումԵթե ​​վանդակը նշված է, ապա Ներածման միջակայքըպետք է պարունակի սյունակների վերնագրեր: Խորհուրդ է տրվում նշել վանդակը, որպեսզի Հավելվածի արդյունքը պարունակի տեղեկատվական սյունակներ
  • Արդյունքների ընդմիջում: բջիջների շրջանակը, որտեղ կտեղադրվեն հաշվարկների արդյունքները: Բավական է նշել այս տիրույթի վերին ձախ բջիջը։

Հավելվածը վերադարձնում է հաշվարկված հարաբերակցության և կովարիանսի արժեքները (կովարիանսի համար հաշվարկվում են նաև երկու պատահական փոփոխականների շեղումները):

Հարաբերության քանակական բնութագիրը կարելի է ստանալ՝ հաշվարկելով հարաբերակցության գործակիցը։

Հարաբերակցության վերլուծություն Excel-ում

Ֆունկցիան ինքնին ունի ընդհանուր ձև CORREL (զանգված 1, զանգված 2): «Array1» դաշտում մուտքագրեք արժեքներից մեկի բջիջների տիրույթի կոորդինատները, որոնց կախվածությունը պետք է որոշվի: Ինչպես տեսնում եք, հարաբերակցության գործակիցը թվի տեսքով հայտնվում է մեր նախկինում ընտրված բջիջում: Բացվում է հարաբերակցության վերլուծության պարամետրերով պատուհան: Ի տարբերություն նախորդ մեթոդի, «Input interval» դաշտում մենք մուտքագրում ենք ոչ թե յուրաքանչյուր սյունակի առանձին, այլ վերլուծությանը մասնակցող բոլոր սյունակների միջակայքը։ Ինչպես տեսնում եք, Excel հավելվածն առաջարկում է փոխկապակցվածության վերլուծության միանգամից երկու մեթոդ:

Հարաբերակցության գրաֆիկ excel-ում

6) Վերջնական աղյուսակի առաջին տարրը կհայտնվի ընտրված տարածքի վերին ձախ բջիջում: Ուստի H0 վարկածը մերժվում է, այսինքն՝ ռեգրեսիոն պարամետրերը և հարաբերակցության գործակիցը պատահականորեն չեն տարբերվում զրոյից, բայց վիճակագրորեն նշանակալի են։ 7. Ռեգրեսիայի հավասարման ստացված գնահատականները թույլ են տալիս այն օգտագործել կանխատեսման համար։

Ինչպես հաշվարկել հարաբերակցության գործակիցը Excel-ում

Եթե ​​գործակիցը 0 է, դա ցույց է տալիս, որ արժեքների միջև կապ չկա: Փոփոխականների և y-ի միջև կապը գտնելու համար օգտագործեք ներկառուցված գործառույթը Microsoft Excel«ԿՈՐՌԵԼ». Օրինակ, «Array1»-ի համար ընտրեք y արժեքները, իսկ «Array2»-ի համար՝ x արժեքները: Արդյունքում դուք կստանաք ծրագրով հաշվարկված հարաբերակցության գործակիցը։ Հաջորդը, դուք պետք է հաշվարկեք տարբերությունը յուրաքանչյուր x-ի և xav-ի և yav-ի միջև: Ընտրված բջիջներում գրեք x-x բանաձեւերը, յ-. Մի մոռացեք ամրացնել բջիջները միջիններով: Ստացված արդյունքը կլինի ցանկալի հարաբերակցության գործակիցը:

Պիրսոնի գործակիցը հաշվարկելու վերը նշված բանաձևը ցույց է տալիս, թե որքան աշխատատար է այս գործընթացը, եթե դա արվում է ձեռքով: Երկրորդ, խնդրում եմ խորհուրդ տվեք, թե ինչպիսի հարաբերակցության վերլուծություն կարող է օգտագործվել տվյալների մեծ տարածում ունեցող տարբեր նմուշների համար: Ինչպե՞ս կարող եմ վիճակագրորեն ապացուցել, որ 60-ից բարձր խմբի և բոլորի միջև էական տարբերություն կա:

DIY. Հաշվարկել արժույթի հարաբերակցությունը Excel-ի միջոցով

Օրինակ, մենք օգտագործում ենք Microsoft Excel-ը, բայց ցանկացած այլ ծրագիր, որտեղ դուք կարող եք օգտագործել հարաբերակցության բանաձևը, դա կլինի: 7. Դրանից հետո ընտրեք EUR/USD տվյալներով բջիջները: 9. Սեղմեք Enter՝ EUR/USD-ի և USD/JPY-ի հարաբերակցության գործակիցը հաշվարկելու համար: Չարժե ամեն օր թվերը թարմացնել (դե, եթե տարված չեք արժութային հարաբերակցություններով):

Դուք արդեն հանդիպել եք երկուսի միջև կապի աստիճանը հաշվարկելու անհրաժեշտությանը վիճակագրական մեծություններև որոշե՛ք այն բանաձևը, որով դրանք փոխկապակցված են: Դա անելու համար ես օգտագործել եմ CORREL ֆունկցիան, դրա մասին որոշ տեղեկություններ կան այստեղ: Այն վերադարձնում է երկու տվյալների միջակայքերի միջև հարաբերակցության աստիճանը: Տեսականորեն, հարաբերակցության ֆունկցիան կարելի է կատարելագործել՝ այն գծայինից փոխակերպելով էքսպոնենցիալ կամ լոգարիթմական: Տվյալների և հարաբերակցության գրաֆիկների վերլուծությունը կարող է զգալիորեն բարելավել դրա հուսալիությունը:

Ենթադրենք, որ B2 բջիջը պարունակում է հարաբերակցության գործակիցը, իսկ B3 բջիջը պարունակում է ամբողջական դիտարկումների քանակը: Ռուսալեզու գրասենյակ ունե՞ք, ի դեպ, ես էլ եմ սխալ գտել՝ բացասական հարաբերակցությունների համար նշանակություն չի հաշվարկվում։ Եթե ​​երկու փոփոխականներն էլ մետրիկ են և ունեն նորմալ բաշխում, ապա ընտրությունը ճիշտ է կատարվել։ Իսկ կորերի նմանության չափանիշը հնարավո՞ր է բնութագրել միայն մեկ CC-ով, դուք չունեք «կորերի» նմանություն, այլ երկու շարքի նմանություն, որը սկզբունքորեն կարելի է նկարագրել կորով։

Հարաբերական կապովմեկ հատկանիշի նույն արժեքը համապատասխանում է մյուսի տարբեր արժեքներին: Օրինակ՝ կա հարաբերակցություն հասակի և քաշի, չարորակ նորագոյացությունների դեպքերի և տարիքի միջև և այլն։

Գոյություն ունի հարաբերակցության գործակիցը հաշվարկելու 2 եղանակ՝ քառակուսիների մեթոդ (Pearson), աստիճանների մեթոդ (Spearman)։

Առավել ճշգրիտ է քառակուսիների մեթոդը (Pearson), որտեղ հարաբերակցության գործակիցը որոշվում է բանաձևով.

r xy-ը X և Y վիճակագրական շարքերի հարաբերակցության գործակիցն է:

d x-ը X վիճակագրական շարքի թվերից յուրաքանչյուրի շեղումն է միջին թվաբանականից:

d y-ը վիճակագրական Y շարքի թվերից յուրաքանչյուրի շեղումն է նրա միջին թվաբանականից:

Կախված կապի ուժից և դրա ուղղությունից, հարաբերակցության գործակիցը կարող է տատանվել 0-ից մինչև 1 (-1): 0 հարաբերակցության գործակիցը ցույց է տալիս կապի ամբողջական բացակայությունը: Որքան ավելի մոտ է հարաբերակցության գործակիցի մակարդակը 1-ին կամ (-1-ին), այնքան համապատասխանաբար ավելի մեծ և սերտորեն է չափվում նրա ուղղակի կամ հետադարձ կապը: Երբ հարաբերակցության գործակիցը հավասար է 1-ի կամ (-1), կապը ամբողջական է և գործունակ:

Հարաբերակցության ուժի գնահատման սխեման՝ օգտագործելով հարաբերակցության գործակիցը

Կապի ուժը

Հարաբերակցության գործակիցի արժեքը, եթե առկա է

ուղիղ միացում (+)

հետադարձ կապ (-)

Կապ չկա

Կապը փոքր է (թույլ)

0-ից մինչև +0,29

0-ից մինչև –0,29

Միացման միջին (չափավոր)

+0.3-ից մինչև +0.69

–0,3-ից մինչև –0,69

Կապը մեծ է (ուժեղ)

+0,7-ից մինչև +0,99

–0,7-ից մինչև –0,99

Ամբողջական հաղորդակցություն

(ֆունկցիոնալ)

Քառակուսի մեթոդով հարաբերակցության գործակիցը հաշվարկելու համար կազմվում է 7 սյունակներից բաղկացած աղյուսակ: Դիտարկենք հաշվարկման գործընթացը՝ օգտագործելով օրինակ.

ՈՐՈՇԵՔ ՄԻՋԵՎ ԿԱՑՈՒԹՅԱՆ ՈՒԺԵՂԸ ԵՎ ԲՆՈՒՅԹԸ

Ժամանակն է-

էս

goiter

(Վ y )

դ x = Վ xՄ x

դ y = Վ yՄ y

դ x դ y

դ x 2

դ y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Որոշեք ջրի մեջ յոդի միջին պարունակությունը (մգ/լ):

մգ/լ

2. Որոշեք խոպոպի միջին հաճախականությունը %-ով:

3. Որոշեք յուրաքանչյուր V x-ի շեղումը M x-ից, այսինքն. dx.

201–138=63; 178–138=40 եւ այլն։

4. Նմանապես, մենք որոշում ենք յուրաքանչյուր V y-ի շեղումը M y-ից, այսինքն. d y.

0,2–3,8=-3,6; 0,6–38=-3,2 և այլն։

5. Որոշեք շեղումների արտադրյալները. Մենք ամփոփում ենք ստացված արտադրանքը և ստանում.

6. Քառակուսի ենք դնում d x և ամփոփում ենք արդյունքները, ստանում ենք.

7. Նմանապես, քառակուսի ենք դնում d y, ամփոփում ենք արդյունքները, ստանում ենք

8. Վերջապես, մենք բոլոր ստացված գումարները փոխարինում ենք բանաձևով.

Հարաբերակցության գործակցի հուսալիության հարցը լուծելու համար որոշեք այն միջին սխալըստ բանաձևի.

(Եթե դիտումների թիվը 30-ից պակաս է, ապա հայտարարը n–1 է)։

Մեր օրինակում

Հարաբերակցության գործակիցի արժեքը համարվում է հուսալի, եթե այն առնվազն 3 անգամ գերազանցում է միջին սխալը:

Մեր օրինակում

Այսպիսով, հարաբերակցության գործակիցը հուսալի չէ, ինչը պահանջում է դիտումների քանակի ավելացում։

Հարաբերակցության գործակիցը կարող է որոշվել մի փոքր ավելի քիչ ճշգրիտ, բայց շատ ավելի հեշտ եղանակով` աստիճանների մեթոդով (Spearman):

Սփիրմանի մեթոդը՝ P=1-(6∑d 2 /n-(n 2-1))

կազմել զուգակցված համեմատելի հատկանիշների երկու շարք՝ համապատասխանաբար նշելով առաջին և երկրորդ տողերը x և y: Այս դեպքում հատկանիշի առաջին շարքը ներկայացրեք նվազման կամ աճման կարգով և տեղադրեք երկրորդ շարքի թվային արժեքները առաջին շարքի այն արժեքներին հակառակ, որոնց դրանք համապատասխանում են:

համեմատվող շարքերից յուրաքանչյուրում հատկանիշի արժեքը փոխարինել հերթական համարով (աստիճան): Շարքերը կամ թվերը ցույց են տալիս առաջին և երկրորդ շարքերի ցուցիչների (արժեքների) տեղերը: Որտեղ թվային արժեքներԵրկրորդ հատկանիշի համար կոչումները պետք է նշանակվեն նույն հաջորդականությամբ, ինչ ընդունվել է առաջին հատկանիշի արժեքներին բաշխելիս: Շարքի բնութագրիչի նույնական արժեքներով, շարքերը պետք է որոշվեն որպես միջին թիվ այս արժեքների հերթական թվերի գումարից:

որոշել x-ի և y-ի (d) շարքային տարբերությունը. d = x - y

քառակուսի է ստացված վարկանիշային տարբերությունը (d 2)

ստացեք տարբերության քառակուսիների գումարը (Σ d 2) և ստացված արժեքները փոխարինեք բանաձևով.

Օրինակ:Օգտագործելով աստիճանի մեթոդը, սահմանեք աշխատանքային փորձի տարիների և վնասվածքների հաճախականության միջև կապի ուղղությունը և ուժը, եթե ստացվում են հետևյալ տվյալները.

Մեթոդի ընտրության հիմնավորումը.Խնդիրը լուծելու համար կարելի է ընտրել միայն մեթոդ աստիճանի հարաբերակցություն, որովհետեւ «Աշխատանքային փորձը տարիների ընթացքում» հատկանիշի առաջին շարքում կան բաց տարբերակներ (աշխատանքային փորձ մինչև 1 տարի և 7 և ավելի տարի), ինչը թույլ չի տալիս կապ հաստատել ավելի ճշգրիտ մեթոդի՝ քառակուսիների մեթոդի կիրառումը: համեմատվող բնութագրերի միջև:

Լուծում. Հաշվարկների հաջորդականությունը ներկայացված է տեքստում, արդյունքները ներկայացված են աղյուսակում: 2.

աղյուսակ 2

Աշխատանքային փորձը տարիների ընթացքում

Վնասվածքների թիվը

Սովորական թվեր (շարքեր)

Վարկանիշային տարբերություն

Շարքերի քառակուսի տարբերություն

d (x-y)

դ 2

Զուգակցված բնութագրերի տողերից յուրաքանչյուրը նշանակվում է «x» և «y» (սյունակներ 1-2):

Յուրաքանչյուր հատկանիշի արժեքը փոխարինվում է դասային (շարքային) թվով: «x» տողում աստիճանների բաշխման կարգը հետևյալն է. հատկանիշի նվազագույն արժեքին (մինչև 1 տարի փորձ) վերագրվում է «1» սերիական համարը, հատկանիշի նույն շարքի հաջորդ տարբերակները, համապատասխանաբար. աճող կարգը, 2-րդ, 3-րդ, 4-րդ և 5-րդ սերիական համարները՝ շարքերը (տես սյունակ 3): Նմանատիպ կարգ է պահպանվում երկրորդ «y» հատկանիշին (սյունակ 4) շարքերը բաշխելիս: Այն դեպքերում, երբ կան հավասար մեծության մի քանի տարբերակներ (օրինակ, ստանդարտ խնդրի դեպքում դրանք 12 և 12 վնասվածքներ են 100 աշխատողի համար, ովքեր ունեն 3-4 տարի և 5-6 տարվա փորձ, սերիական համարը նշվում է միջին թվով. Վնասվածքների թվի (12 վնասվածք) մասին այս տվյալները վարկանիշային աղյուսակում պետք է զբաղեցնեն 2-րդ և 3-րդ տեղերը, ուստի նրանց միջին թիվը (2 + 3) / 2 = 2,5 է: Այսպիսով, թիվը վնասվածքներ «12» և «12» (հատկանիշ) պետք է բաշխվեն նույն աստիճանի համարները՝ «2.5» (սյունակ 4):

Որոշեք դասային տարբերությունը d = (x - y) - (սյունակ 5)

Քառակուսեք շարքային տարբերությունը (d 2) և ստացեք Σ d 2 շարքային տարբերության քառակուսիների գումարը (սյունակ 6):

Հաշվարկել վարկանիշային հարաբերակցության գործակիցը բանաձևով.

որտեղ n-ը «x» և «y» տողերում համեմատվող տարբերակների զույգերի թիվն է։

Հարաբերակցության վերլուծություն- հանրաճանաչ մեթոդ վիճակագրական հետազոտություն, որն օգտագործվում է մեկ ցուցանիշի մյուսից կախվածության աստիճանը պարզելու համար։ Microsoft Excel-ն ունի հատուկ գործիք, որը նախատեսված է այս տեսակի վերլուծություններ կատարելու համար: Եկեք պարզենք, թե ինչպես օգտագործել այս հնարավորությունը:

Հարաբերակցության վերլուծության էությունը

Հարաբերակցության վերլուծության նպատակն է բացահայտել միջև հարաբերությունների առկայությունը տարբեր գործոններ. Այսինքն՝ որոշվում է՝ մի ցուցանիշի նվազումը կամ աճը ազդում է մյուսի փոփոխության վրա։

Եթե ​​կախվածությունը հաստատված է, ապա որոշվում է հարաբերակցության գործակիցը։ Ի տարբերություն ռեգրեսիոն վերլուծության, սա միակ ցուցանիշն է, որը հաշվարկում է այս մեթոդըվիճակագրական հետազոտություն։ Հարաբերակցության գործակիցը տատանվում է +1-ից -1: Եթե ​​կա դրական հարաբերակցություն, ապա մեկ ցուցանիշի աճը նպաստում է երկրորդի աճին։ Բացասական հարաբերակցությամբ մեկ ցուցանիշի աճը հանգեցնում է մյուսի նվազմանը: Որքան մեծ է հարաբերակցության գործակիցի մոդուլը, այնքան ավելի նկատելի է մեկ ցուցանիշի փոփոխությունը երկրորդի փոփոխության մեջ: Երբ գործակիցը 0 է, նրանց միջև ամբողջովին կախվածություն չկա:

Հարաբերակցության գործակցի հաշվարկ

Այժմ փորձենք հաշվարկել հարաբերակցության գործակիցը՝ օգտագործելով կոնկրետ օրինակ։ Մենք ունենք աղյուսակ, որտեղ գովազդի ծախսերը և վաճառքի ծավալները թվարկված են ամսական առանձին սյունակներում: Մենք պետք է պարզենք, թե որքանով է կախված վաճառքի քանակը քանակից Փող, որը ծախսվել է գովազդի վրա։

Մեթոդ 1. Հարաբերակցության սահմանում Function Wizard-ի միջոցով

Հարաբերակցության վերլուծության եղանակներից մեկը CORREL ֆունկցիայի օգտագործումն է: Ֆունկցիան ինքնին ունի CORREL(array1, array2) ընդհանուր ձևը:

  1. Ընտրեք այն բջիջը, որտեղ պետք է ցուցադրվի հաշվարկի արդյունքը: Կտտացրեք «Տեղադրեք գործառույթը» կոճակը, որը գտնվում է բանաձևի տողի ձախ կողմում:
  2. Function Wizard պատուհանում ներկայացված ցանկում փնտրեք և ընտրեք CORREL ֆունկցիան: Սեղմեք «OK» կոճակը:
  3. Բացվում է ֆունկցիայի փաստարկների պատուհանը: «Array1» դաշտում մուտքագրեք արժեքներից մեկի բջիջների տիրույթի կոորդինատները, որոնց կախվածությունը պետք է որոշվի: Մեր դեպքում դրանք կլինեն «Վաճառքի արժեք» սյունակի արժեքները: Զանգվածի հասցեն դաշտում մուտքագրելու համար պարզապես ընտրեք վերը նշված սյունակում առկա բոլոր բջիջները:

    «Array2» դաշտում անհրաժեշտ է մուտքագրել երկրորդ սյունակի կոորդինատները: Մեզ համար սա գովազդի ծախս է։ Ճիշտ նույն կերպ, ինչպես նախորդ դեպքում, մենք տվյալները մուտքագրում ենք դաշտում։

    Սեղմեք «OK» կոճակը:

Ինչպես տեսնում եք, հարաբերակցության գործակիցը թվի տեսքով հայտնվում է մեր նախկինում ընտրված բջիջում: IN այս դեպքումայն հավասար է 0,97-ի, որը շատ է բարձր նշանմի քանակի կախվածությունը մյուսից.

Մեթոդ 2. Հաշվարկել հարաբերակցությունը վերլուծության փաթեթի միջոցով

Որպես այլընտրանք, հարաբերակցությունը կարող է հաշվարկվել վերլուծության փաթեթում նախատեսված գործիքներից մեկի միջոցով: Բայց նախ մենք պետք է ակտիվացնենք այս գործիքը:

  1. Գնացեք «Ֆայլ» ներդիր:
  2. Բացվող պատուհանում անցեք «Կարգավորումներ» բաժին:
  3. Հաջորդը, անցեք «Հավելումներ» կետին:
  4. Հաջորդ պատուհանի ներքևում, «Կառավարում» բաժնում, փոխարկիչը տեղափոխեք «Excel հավելումներ» դիրք, եթե այն այլ դիրքում է: Սեղմեք «OK» կոճակը:
  5. Հավելումների պատուհանում նշեք «Վերլուծական փաթեթ» կետի կողքին գտնվող վանդակը: Սեղմեք «OK» կոճակը:
  6. Դրանից հետո վերլուծության փաթեթը ակտիվանում է: Գնացեք «Տվյալներ» ներդիրին: Ինչպես տեսնում եք, այն հայտնվում է այստեղ ժապավենի վրա նոր բլոկգործիքներ – «Վերլուծություն»: Կտտացրեք «Տվյալների վերլուծություն» կոճակը, որը գտնվում է դրանում:
  7. Ցանկը բացվում է տարբեր տարբերակներտվյալների վերլուծություն. Ընտրեք «Համապատասխանություն» կետը: Սեղմեք «OK» կոճակը:
  8. Բացվում է հարաբերակցության վերլուծության պարամետրերով պատուհան: Ի տարբերություն նախորդ մեթոդի, «Input interval» դաշտում մենք մուտքագրում ենք ոչ թե յուրաքանչյուր սյունակի առանձին, այլ վերլուծությանը մասնակցող բոլոր սյունակների միջակայքը։ Մեր դեպքում սա «Գովազդային ծախսեր» և «Վաճառքի արժեք» սյունակների տվյալներն են:

    «Խմբավորում» պարամետրը թողնում ենք անփոփոխ՝ «Ըստ սյունակների», քանի որ մեր տվյալների խմբերը բաժանված են երկու սյունակի: Եթե ​​դրանք բաժանված են տող առ տող, ապա անջատիչը պետք է տեղափոխվի «Գծով» դիրքը:

    Լռելյայն ելքային պարամետրերում դրված է «Նոր աշխատաթերթ» տարրը, այսինքն՝ տվյալները կարտադրվեն մեկ այլ թերթիկի վրա: Դուք կարող եք փոխել գտնվելու վայրը՝ տեղափոխելով անջատիչը: Սա կարող է լինել ընթացիկ թերթիկը (այնուհետև դուք պետք է նշեք տեղեկատվական ելքային բջիջների կոորդինատները) կամ նոր աշխատանքային գիրք (ֆայլ):

    Երբ բոլոր պարամետրերը դրված են, սեղմեք «OK» կոճակը:

Քանի որ վերլուծության արդյունքների ելքային վայրը մնացել է որպես լռելյայն, մենք տեղափոխվում ենք նոր թերթ: Ինչպես տեսնում եք, այստեղ նշված է հարաբերակցության գործակիցը։ Բնականաբար, դա նույնն է, ինչ առաջին մեթոդն օգտագործելիս՝ 0,97։ Դա պայմանավորված է նրանով, որ երկու տարբերակներն էլ կատարում են նույն հաշվարկները, դրանք պարզապես կարող են կատարվել տարբեր ձևերով:

Ինչպես տեսնում եք, Excel հավելվածն առաջարկում է փոխկապակցվածության վերլուծության միանգամից երկու մեթոդ: Հաշվարկների արդյունքը, եթե ամեն ինչ ճիշտ եք անում, լիովին նույնական կլինի։ Բայց, յուրաքանչյուր օգտվող կարող է ընտրել իր համար ավելի հարմար հաշվարկային տարբերակ։

Մենք ուրախ ենք, որ կարողացանք օգնել ձեզ լուծել խնդիրը։

Ձեր հարցը տվեք մեկնաբանություններում՝ մանրամասն նկարագրելով խնդրի էությունը։ Մեր մասնագետները կփորձեն պատասխանել հնարավորինս արագ։

Այս հոդվածն օգնե՞ց ձեզ:

Ռեգրեսիան և հարաբերակցության վերլուծությունը վիճակագրական հետազոտության մեթոդներ են: Սրանք ամենատարածված եղանակներն են՝ ցույց տալու պարամետրի կախվածությունը մեկ կամ մի քանի անկախ փոփոխականներից:

Ստորև՝ կոնկրետ գործնական օրինակներԴիտարկենք այս երկու շատ տարածված վերլուծությունները տնտեսագետների շրջանում։ Կբերենք նաև դրանց համադրման ժամանակ արդյունքներ ստանալու օրինակ։

Ռեգրեսիայի վերլուծություն Excel-ում

Ցույց է տալիս որոշ արժեքների (անկախ, անկախ) ազդեցությունը կախված փոփոխականի վրա: Օրինակ՝ ինչպե՞ս է տնտեսապես ակտիվ բնակչության թիվը կախված ձեռնարկությունների թվից, աշխատավարձից և այլ պարամետրերից։ Կամ՝ ինչպե՞ս են ՀՆԱ-ի մակարդակի վրա ազդում օտարերկրյա ներդրումները, էներգակիրների գները և այլն։

Վերլուծության արդյունքը թույլ է տալիս ընդգծել առաջնահերթությունները: Եվ հիմնվելով հիմնական գործոնների վրա՝ կանխատեսել, պլանավորել առաջնահերթ ոլորտների զարգացումը և կայացնել կառավարման որոշումներ։

Հետընթացը տեղի է ունենում.

  • գծային (y = a + bx);
  • պարաբոլիկ (y = a + bx + cx2);
  • էքսպոնենցիալ (y = a * exp (bx));
  • հզորություն (y = a*x^b);
  • հիպերբոլիկ (y = b/x + a);
  • լոգարիթմական (y = b * 1n (x) + a);
  • էքսպոնենցիալ (y = a * b^x):

Եկեք նայենք շինարարությանը որպես օրինակ ռեգրեսիոն մոդել Excel-ում և արդյունքների մեկնաբանում: Վերցնենք ռեգրեսիայի գծային տեսակը։

Առաջադրանք. 6 ձեռնարկությունում միջին ամսական աշխատավարձև հեռացած աշխատողների թիվը։ Պետք է որոշել, թե ինչ կախվածություն է թողնում աշխատողների թիվը միջին աշխատավարձից։

Մոդել գծային ռեգրեսիաունի հետևյալ ձևը.

Y = a0 + a1x1 +…+ախկ.

Այնտեղ, որտեղ a-ն ռեգրեսիայի գործակիցներն են, x-ը ազդող փոփոխականներ են, k-ն գործոնների քանակն է:

Մեր օրինակում Y-ն աշխատողներից հեռանալու ցուցանիշն է: Ազդող գործոնը աշխատավարձն է (x):

Excel-ն ունի ներկառուցված գործառույթներ, որոնք կարող են օգնել ձեզ հաշվարկել գծային ռեգրեսիայի մոդելի պարամետրերը: Բայց «Վերլուծական փաթեթ» հավելումը դա կանի ավելի արագ:

Մենք ակտիվացնում ենք հզոր վերլուծական գործիք.

  1. Սեղմեք «Office» կոճակը և անցեք «Excel Options» ներդիրին: «Հավելումներ».
  2. Ներքևում, բացվող ցուցակի տակ, «Կառավարել» դաշտում կլինի «Excel Add-ins» մակագրությունը (եթե այն չկա, սեղմեք աջ կողմում գտնվող վանդակը և ընտրեք): Եվ «Գնալ» կոճակը: Սեղմել.
  3. Բացվում է հասանելի հավելումների ցանկը: Ընտրեք «Վերլուծական փաթեթ» և սեղմեք OK:

Ակտիվացնելուց հետո հավելումը հասանելի կլինի Տվյալների ներդիրում:

Հիմա եկեք ինքնին անենք ռեգրեսիոն վերլուծությունը:

  1. Բացեք «Տվյալների վերլուծություն» գործիքի ընտրացանկը: Ընտրեք «Regression»:
  2. Մուտքային արժեքների և ելքային ընտրանքների ընտրության համար կբացվի ընտրացանկ (որտեղ ցուցադրել արդյունքը): Սկզբնական տվյալների դաշտերում մենք նշում ենք նկարագրված պարամետրի միջակայքը (Y) և դրա վրա ազդող գործոնը (X): Մնացածը պետք չէ լրացնել։
  3. Լավ սեղմելուց հետո ծրագիրը կցուցադրի հաշվարկները նոր թերթիկի վրա (կարող եք ընտրել ընթացիկ թերթի վրա ցուցադրելու ընդմիջում կամ նոր աշխատանքային գրքույկի արդյունք վերագրել):

Առաջին հերթին ուշադրություն ենք դարձնում R-քառակուսին և գործակիցներին։

R-քառակուսին որոշման գործակիցն է: Մեր օրինակում՝ 0,755 կամ 75,5%: Սա նշանակում է, որ մոդելի հաշվարկված պարամետրերը բացատրում են ուսումնասիրված պարամետրերի փոխհարաբերությունների 75.5%-ը: Որքան բարձր է որոշման գործակիցը, այնքան լավ է մոդելը: Լավ - 0.8-ից բարձր: Վատ – 0,5-ից պակաս (նման վերլուծությունը հազիվ թե ողջամիտ համարվի): Մեր օրինակում՝ «վատ չէ»:

64.1428 գործակիցը ցույց է տալիս, թե ինչ կլինի Y-ը, եթե դիտարկվող մոդելի բոլոր փոփոխականները հավասար են 0-ի: Այսինքն, վերլուծված պարամետրի արժեքի վրա ազդում են նաև մոդելում չնկարագրված այլ գործոններ:

-0,16285 գործակիցը ցույց է տալիս X փոփոխականի կշիռը Y-ի վրա: Այսինքն, միջին ամսական աշխատավարձը այս մոդելի շրջանակներում ազդում է -0,16285 քաշով հրաժարվողների թվի վրա (սա ազդեցության փոքր աստիճան է): «-» նշանը ցույց է տալիս բացասական ազդեցություն. որքան բարձր է աշխատավարձը, այնքան քիչ մարդիկ են հրաժարվում: Ինչն արդարացի է։

Հարաբերակցության վերլուծություն Excel-ում

Հարաբերակցության վերլուծությունը օգնում է պարզել, թե արդյոք մեկ կամ երկու նմուշների ցուցանիշների միջև կապ կա: Օրինակ, մեքենայի շահագործման ժամանակի և վերանորոգման արժեքի, սարքավորումների գնի և շահագործման տևողության, երեխաների հասակի և քաշի միջև և այլն:

Եթե ​​կա կապ, ապա մի պարամետրի աճը հանգեցնում է մյուսի ավելացմանը (դրական հարաբերակցության) կամ նվազմանը (բացասականին): Հարաբերակցության վերլուծությունը օգնում է վերլուծաբանին որոշել, թե արդյոք մեկ ցուցանիշի արժեքը կարող է օգտագործվել կանխատեսելու համար հնարավոր իմաստըուրիշ.

Հարաբերակցության գործակիցը նշվում է r-ով: Տատանվում է +1-ից մինչև -1: Դասակարգում հարաբերակցություններՀամար տարբեր տարածքներտարբեր կլինի: Երբ գործակիցը 0 է գծային կախվածություննմուշների միջև գոյություն չունի:

Եկեք նայենք, թե ինչպես գտնել հարաբերակցության գործակիցը Excel-ի միջոցով:

Զուգակցված գործակիցները գտնելու համար օգտագործվում է CORREL ֆունկցիան։

Նպատակը. Որոշեք, թե արդյոք կապ կա խառատահաստոցի շահագործման ժամանակի և դրա պահպանման ծախսերի միջև:

Տեղադրեք կուրսորը ցանկացած բջիջում և սեղմեք fx կոճակը:

  1. «Վիճակագրական» կատեգորիայում ընտրեք CORREL ֆունկցիան:
  2. Արգումենտ «Զանգված 1» - արժեքների առաջին միջակայքը - մեքենայի աշխատանքի ժամանակը՝ A2:A14:
  3. Արգումենտ «Array 2» - արժեքների երկրորդ միջակայք - վերանորոգման արժեքը՝ B2:B14: Սեղմեք OK:

Կապի տեսակը որոշելու համար անհրաժեշտ է դիտարկել գործակցի բացարձակ թիվը (գործունեության յուրաքանչյուր ոլորտ ունի իր սանդղակը):

Մի քանի պարամետրերի (ավելի քան 2) հարաբերական վերլուծության համար ավելի հարմար է օգտագործել «Տվյալների վերլուծություն» («Վերլուծական փաթեթ» հավելումը): Ցանկից պետք է ընտրել հարաբերակցությունը և նշանակել զանգվածը: Բոլորը.

Ստացված գործակիցները կցուցադրվեն հարաբերակցության մատրիցով: Սրա նման:

Հարաբերակցության և ռեգրեսիայի վերլուծություն

Գործնականում այս երկու տեխնիկան հաճախ օգտագործվում են միասին:

  1. Մենք կառուցում ենք հարաբերակցության դաշտ՝ «Ներդիր» - «Դիագրամ» - «Ցրման դիագրամ» (թույլ է տալիս համեմատել զույգերը): Արժեքների միջակայքը աղյուսակի բոլոր թվային տվյալներն են:
  2. Ձախ սեղմեք դիագրամի ցանկացած կետի վրա: Հետո ճիշտ: Բացվող ընտրացանկում ընտրեք «Ավելացնել միտումների գիծ»:
  3. Նշանակեք պարամետրեր գծի համար: Տեսակը - «Գծային»: Ներքևում - «Ցույց տալ հավասարումը դիագրամի վրա»:
  4. Սեղմեք «Փակել»:

Այժմ տեսանելի են դարձել ռեգրեսիոն վերլուծության տվյալները։

1. Բացեք Excel-ը

2. Ստեղծեք տվյալների սյունակներ: Մեր օրինակում մենք կքննարկենք առաջին դասարանցիների ագրեսիայի և ինքնավստահության միջև փոխհարաբերությունները կամ հարաբերակցությունը: Փորձին մասնակցել է 30 երեխա, տվյալները ներկայացված են Excel աղյուսակում.

1 սյունակ - առարկայի համար

Սյունակ 2 - ագրեսիվություն միավորներով

Սյունակ 3 - ինքնավստահություն միավորներով

3.Այնուհետև դուք պետք է ընտրեք աղյուսակի կողքին գտնվող դատարկ բջիջ և սեղմեք պատկերակի վրա f(x) Excel վահանակում

4.Ֆունկցիայի ընտրացանկը կբացվի, դուք պետք է ընտրեք կատեգորիաներից Վիճակագրական, և այնուհետև գործառույթների ցանկում այբբենական կարգով գտնել CORRELև սեղմեք OK

5.Այնուհետև կբացվի ֆունկցիայի արգումենտների մենյու, որը թույլ կտա ընտրել մեզ անհրաժեշտ տվյալների սյունակները: Առաջին սյունակը ընտրելու համար Ագրեսիվությունդուք պետք է սեղմեք գծի կողքին գտնվող կապույտ կոճակը Զանգված 1

6. Ընտրեք տվյալները Զանգված 1սյունակից Ագրեսիվությունև կտտացրեք երկխոսության վանդակում գտնվող կապույտ կոճակին

7. Այնուհետև, ինչպես Array 1-ին, կտտացրեք տողի կողքին գտնվող կապույտ կոճակին Զանգված 2

8. Ընտրեք տվյալները Զանգված 2- սյունակ Դժվարությունև կրկին սեղմեք կապույտ կոճակը, ապա OK

9. Այստեղ հաշվարկվել և ընտրված բջիջում գրվել է r-Pearson հարաբերակցության գործակիցը, որը մեր դեպքում դրական է և մոտավորապես հավասար։ Սա խոսում է այն մասին չափավոր դրականԱռաջին դասարանցիների ագրեսիվության և ինքնավստահության միջև կապը

Այսպիսով, վիճակագրական եզրակացությունփորձը կլինի՝ r = 0.225, պարզվեց փոփոխականների միջև չափավոր դրական կապ ագրեսիվությունԵվ անվստահություն.

Որոշ ուսումնասիրություններ, սակայն, պահանջում են, որ ճշգրտվի հարաբերակցության գործակցի նշանակության p-մակարդակը Excel ծրագիր, ի տարբերություն SPSS-ի, նման տարբերակ չի տրամադրում։ Ոչինչ, սեղաններ կան կրիտիկական արժեքներհարաբերակցություններ (A.D. Nasledov).

Կարող եք նաև Excel-ում ռեգրեսիոն գիծ կառուցել և այն կցել հետազոտության արդյունքներին:



Նորություն կայքում

>

Ամենահայտնի