Bahay Prosthetics at implantation Mga kritikal na halaga ng koepisyent ng ugnayan ng ranggo ng Spearman. Pagsusuri ng ugnayan gamit ang Spearman method (Spearman ranks)

Mga kritikal na halaga ng koepisyent ng ugnayan ng ranggo ng Spearman. Pagsusuri ng ugnayan gamit ang Spearman method (Spearman ranks)

Ang rank correlation coefficient, na iminungkahi ni K. Spearman, ay tumutukoy sa isang nonparametric na sukat ng ugnayan sa pagitan ng mga variable na sinusukat sa isang rank scale. Kapag kinakalkula ang koepisyent na ito, walang mga pagpapalagay na kinakailangan tungkol sa likas na katangian ng mga distribusyon ng mga katangian sa populasyon. Tinutukoy ng koepisyent na ito ang antas ng pagiging malapit ng koneksyon sa pagitan ng mga ordinal na katangian, na sa kasong ito ay kumakatawan sa mga ranggo ng inihambing na dami.

Ang koepisyent ng ugnayan ng Spearman ay nasa hanay din ng +1 at -1. Ito, tulad ng koepisyent ng Pearson, ay maaaring maging positibo at negatibo, na nagpapakilala sa direksyon ng ugnayan sa pagitan ng dalawang katangian na sinusukat sa isang antas ng ranggo.

Sa prinsipyo, ang bilang ng mga feature na niraranggo (mga katangian, mga katangian, atbp.) ay maaaring anuman, ngunit ang proseso ng pagraranggo ng higit sa 20 mga tampok ay mahirap. Posible na ito ang dahilan kung bakit ang talahanayan ng mga kritikal na halaga ng koepisyent ng ugnayan ng ranggo ay kinakalkula lamang para sa apatnapung ranggo na mga tampok (n< 40, табл. 20 приложения 6).

Ang koepisyent ng ugnayan ng ranggo ng Spearman ay kinakalkula gamit ang formula:

kung saan ang n ay ang bilang ng mga ranggo na tampok (mga tagapagpahiwatig, paksa);

Ang D ay ang pagkakaiba sa pagitan ng mga ranggo para sa dalawang variable para sa bawat paksa;

Kabuuan ng mga pagkakaiba sa squared rank.

Gamit ang rank correlation coefficient, isaalang-alang ang sumusunod na halimbawa.

Halimbawa: Nalaman ng isang psychologist kung paano ang mga indibidwal na tagapagpahiwatig ng kahandaan para sa paaralan, na nakuha bago magsimula ang paaralan sa 11 unang-graders, ay nauugnay sa isa't isa at ang kanilang average na pagganap sa pagtatapos ng taon ng pag-aaral.

Upang malutas ang problemang ito, niraranggo namin, una, ang mga halaga ng mga tagapagpahiwatig ng kahandaan sa paaralan na nakuha sa pagpasok sa paaralan, at, pangalawa, ang pangwakas na mga tagapagpahiwatig ng pagganap sa akademiko sa katapusan ng taon para sa parehong mga mag-aaral sa karaniwan. Ipinakita namin ang mga resulta sa talahanayan. 13.

Talahanayan 13

Mag-aaral no.

Mga ranggo ng mga tagapagpahiwatig ng kahandaan sa paaralan

Average na taunang mga ranggo ng pagganap

Pinapalitan namin ang nakuhang data sa formula at ginagawa ang pagkalkula. Nakukuha namin:

Upang mahanap ang antas ng kahalagahan, sumangguni sa talahanayan. 20 ng Appendix 6, na naglalaman ng kritikal na halaga para sa mga coefficient ugnayan ng ranggo.

Binibigyang-diin namin iyon sa talahanayan. 20 Appendix 6, tulad ng sa talahanayan para sa linear na ugnayan Pearson, ang lahat ng mga halaga ng mga coefficient ng ugnayan ay ibinibigay sa ganap na halaga. Samakatuwid, ang tanda ng koepisyent ng ugnayan ay isinasaalang-alang lamang kapag binibigyang kahulugan ito.

Ang paghahanap ng mga antas ng kahalagahan sa talahanayang ito ay isinasagawa sa pamamagitan ng bilang n, ibig sabihin, sa pamamagitan ng bilang ng mga paksa. Sa aming kaso n = 11. Para sa numerong ito makikita namin:

0.61 para sa P 0.05

0.76 para sa P 0.01

Binubuo namin ang kaukulang ``significance axis'':

Ang resultang koepisyent ng ugnayan ay kasabay ng kritikal na halaga para sa antas ng kabuluhan na 1%. Dahil dito, maaaring pagtalunan na ang mga tagapagpahiwatig ng kahandaan sa paaralan at ang mga huling baitang ng mga unang baitang ay konektado sa pamamagitan ng isang positibong ugnayan - sa madaling salita, mas mataas ang tagapagpahiwatig ng kahandaan sa paaralan, mas mahusay ang pag-aaral sa unang baitang. Sa mga tuntunin ng statistical hypotheses, dapat tanggihan ng psychologist ang null hypothesis ng pagkakatulad at tanggapin ang alternatibong hypothesis ng mga pagkakaiba, na nagmumungkahi na ang ugnayan sa pagitan ng mga indicator ng kahandaan sa paaralan at average na akademikong pagganap ay iba sa zero.

Ang kaso ng magkatulad (pantay) na ranggo

Kung may magkaparehong mga ranggo, ang formula para sa pagkalkula ng Spearman linear correlation coefficient ay bahagyang mag-iiba. Sa kasong ito, dalawang bagong termino ang idinagdag sa formula para sa pagkalkula ng mga coefficient ng ugnayan, na isinasaalang-alang ang parehong mga ranggo. Ang mga ito ay tinatawag na pantay na ranggo na pagwawasto at idinagdag sa numerator ng formula ng pagkalkula.

kung saan ang n ay ang bilang ng magkatulad na ranggo sa unang hanay,

k ay ang bilang ng magkatulad na ranggo sa ikalawang hanay.

Kung mayroong dalawang pangkat ng magkatulad na ranggo sa alinmang column, ang formula ng pagwawasto ay nagiging mas kumplikado:

kung saan ang n ay ang bilang ng magkaparehong ranggo sa unang pangkat ng ranggo na hanay,

ang k ay ang bilang ng magkatulad na ranggo sa ikalawang pangkat ng nakararanggo na hanay. Pagbabago ng formula sa pangkalahatang kaso ito ba:

Halimbawa: Isang psychologist, gamit ang mental development test (MDT), ay nagsasagawa ng pag-aaral ng katalinuhan sa 12 mga mag-aaral sa ika-9 na baitang. Kasabay nito, hinihiling niya sa mga guro ng panitikan at matematika na ranggo ang parehong mga mag-aaral ayon sa mga tagapagpahiwatig pag-unlad ng kaisipan. Ang gawain ay upang matukoy kung paano ang mga layunin na tagapagpahiwatig ng pag-unlad ng kaisipan (SHTUR data) at mga ekspertong pagtatasa ng mga guro ay nauugnay sa bawat isa.

Ipinakita namin ang pang-eksperimentong data ng problemang ito at ang mga karagdagang column na kinakailangan upang kalkulahin ang koepisyent ng ugnayan ng Spearman sa anyo ng isang talahanayan. 14.

Talahanayan 14

Mag-aaral no.

Mga ranggo ng pagsubok gamit ang SHTURA

Mga ekspertong pagtatasa ng mga guro sa matematika

Mga ekspertong pagtatasa ng mga guro sa panitikan

D (pangalawa at pangatlong hanay)

D (pangalawa at ikaapat na hanay)

(pangalawa at pangatlong hanay)

(pangalawa at ikaapat na hanay)

Dahil ang parehong mga ranggo ay ginamit sa pagraranggo, ito ay kinakailangan upang suriin ang kawastuhan ng ranggo sa ikalawa, ikatlo at ikaapat na mga hanay ng talahanayan. Ang pagbubuod ng bawat isa sa mga column na ito ay nagbibigay ng parehong kabuuan - 78.

Check namin sa pamamagitan ng formula ng pagkalkula. Ang tseke ay nagbibigay ng:

Ang ikalima at ikaanim na hanay ng talahanayan ay nagpapakita ng mga halaga ng pagkakaiba sa mga ranggo sa pagitan ng mga pagsusuri ng dalubhasa ng psychologist sa pagsusulit ng SHTUR para sa bawat mag-aaral at ang mga halaga ng mga pagtatasa ng dalubhasa ng mga guro, ayon sa pagkakabanggit, sa matematika at panitikan. Ang kabuuan ng mga halaga ng pagkakaiba sa ranggo ay dapat na katumbas ng zero. Ang pagbubuod ng mga halaga ng D sa ikalima at ikaanim na hanay ay nagbigay ng nais na resulta. Samakatuwid, ang pagbabawas ng mga ranggo ay naisagawa nang tama. Ang isang katulad na pagsusuri ay dapat gawin sa bawat oras kapag nagsasagawa ng mga kumplikadong uri ng pagraranggo.

Bago simulan ang pagkalkula gamit ang formula, kinakailangang kalkulahin ang mga pagwawasto para sa parehong mga ranggo para sa pangalawa, pangatlo at ikaapat na hanay ng talahanayan.

Sa aming kaso, sa pangalawang haligi ng talahanayan mayroong dalawang magkatulad na ranggo, samakatuwid, ayon sa formula, ang halaga ng pagwawasto D1 ay:

Ang ikatlong hanay ay naglalaman ng tatlong magkatulad na ranggo, samakatuwid, ayon sa formula, ang halaga ng pagwawasto D2 ay magiging:

Sa ika-apat na hanay ng talahanayan mayroong dalawang pangkat ng tatlong magkaparehong ranggo, samakatuwid, ayon sa formula, ang halaga ng pagwawasto D3 ay magiging:

Bago magpatuloy sa solusyon ng problema, alalahanin natin na nilinaw ng psychologist ang dalawang tanong - paano nauugnay ang mga halaga ng mga ranggo sa pagsusulit ng SHtUR sa mga pagtatasa ng eksperto sa matematika at panitikan. Iyon ang dahilan kung bakit ang pagkalkula ay isinasagawa nang dalawang beses.

Kinakalkula namin ang unang ranggo na koepisyent na isinasaalang-alang ang mga additives ayon sa formula. Nakukuha namin:

Kalkulahin natin nang hindi isinasaalang-alang ang additive:

Tulad ng nakikita natin, ang pagkakaiba sa mga halaga ng mga coefficient ng ugnayan ay naging napakaliit.

Kinakalkula namin ang pangalawang ranggo na koepisyent na isinasaalang-alang ang mga additives ayon sa formula. Nakukuha namin:

Kalkulahin natin nang hindi isinasaalang-alang ang additive:

Muli, ang mga pagkakaiba ay napakaliit. Dahil ang bilang ng mga mag-aaral sa parehong mga kaso ay pareho, ayon sa Talahanayan. 20 ng Appendix 6 nakita namin ang mga kritikal na halaga sa n = 12 para sa parehong mga coefficient ng ugnayan nang sabay-sabay.

0.58 para sa P 0.05

0.73 para sa P 0.01

Inilalagay namin ang unang halaga sa ``significance axis'':

Sa unang kaso, ang nakuha na koepisyent ng ugnayan ng ranggo ay nasa zone of significance. Samakatuwid, dapat tanggihan ng psychologist ang null hypothesis na ang correlation coefficient ay katulad ng zero at tanggapin ang alternatibong hypothesis na ang correlation coefficient ay makabuluhang naiiba mula sa zero. Sa madaling salita, ang nakuhang resulta ay nagmumungkahi na kung mas mataas ang mga ekspertong pagtatasa ng mga mag-aaral sa pagsusulit sa SHTUR, mas mataas ang kanilang mga pagsusuri sa dalubhasa sa matematika.

Ibinalot namin ang pangalawang halaga sa ``significance axis'':

Sa pangalawang kaso, ang rank correlation coefficient ay nasa zone ng kawalan ng katiyakan. Samakatuwid, maaaring tanggapin ng isang psychologist ang null Hypothesis na ang correlation coefficient ay katulad ng zero at tanggihan ang alternatibong Hypothesis na ang correlation coefficient ay makabuluhang naiiba mula sa zero. Sa kasong ito, ang resulta na nakuha ay nagmumungkahi na ang mga ekspertong pagtatasa ng mga mag-aaral sa pagsusulit sa SHTUR ay hindi nauugnay sa mga pagsusuri ng eksperto sa panitikan.

Upang mailapat ang koepisyent ng ugnayan ng Spearman, dapat matugunan ang mga sumusunod na kundisyon:

1. Ang mga variable na inihahambing ay dapat makuha sa isang ordinal (ranggo) na sukat, ngunit maaari ding masukat sa isang pagitan at sukat ng ratio.

2. Ang likas na katangian ng pamamahagi ng mga magkakaugnay na dami ay hindi mahalaga.

3. Ang bilang ng iba't ibang katangian sa inihambing na mga variable na X at Y ay dapat magkapareho.

Ang mga talahanayan para sa pagtukoy ng mga kritikal na halaga ng koepisyent ng ugnayan ng Spearman (Talahanayan 20, Appendix 6) ay kinakalkula mula sa bilang ng mga katangian na katumbas ng n = 5 hanggang n = 40, at may mas malaking bilang ng mga kumpara na variable, ang talahanayan para sa Dapat gamitin ang koepisyent ng ugnayan ng Pearson (Talahanayan 19, Appendix 6). Ang paghahanap ng mga kritikal na halaga ay isinasagawa sa k = n.

Ang pagsusuri ng ugnayan ay isang paraan na nagbibigay-daan sa isa na makakita ng mga dependency sa pagitan ng isang tiyak na bilang ng mga random na variable. Ang layunin ng pagsusuri ng ugnayan ay upang matukoy ang isang pagtatasa ng lakas ng mga koneksyon sa pagitan ng mga ito mga random na variable o mga palatandaan na nagpapakilala sa ilang mga tunay na proseso.

Ngayon iminumungkahi naming isaalang-alang kung paano ginagamit ang pagsusuri ng ugnayan ng Spearman upang biswal na ipakita ang mga anyo ng komunikasyon sa praktikal na kalakalan.

Spearman correlation o batayan ng pagsusuri ng ugnayan

Upang maunawaan kung ano ang pagsusuri ng ugnayan, kailangan mo munang maunawaan ang konsepto ng ugnayan.

Kasabay nito, kung ang presyo ay magsisimulang lumipat sa direksyon na kailangan mo, kailangan mong i-unlock ang iyong mga posisyon sa oras.


Para sa diskarteng ito, na batay sa pagsusuri ng ugnayan, ang mga instrumento sa pangangalakal na may mataas na antas ng ugnayan ay pinakaangkop (EUR/USD at GBP/USD, EUR/AUD at EUR/NZD, AUD/USD at NZD/USD, mga kontrata ng CFD at ang katulad).

Video: Application ng Spearman correlation sa Forex market

37. Koepisyent ng ugnayan ng ranggo ng Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Ginagamit ang rank correlation coefficient ng Spearman sa mga kaso kung saan:
- may mga variable iskala ng pagraranggo mga sukat;
- masyadong naiiba ang pamamahagi ng data sa normal o hindi kilala sa lahat;
- ang mga sample ay may maliit na dami (N< 30).

Ang interpretasyon ng koepisyent ng ugnayan ng ranggo ng Spearman ay hindi naiiba sa koepisyent ng Pearson, ngunit ang kahulugan nito ay medyo naiiba. Upang maunawaan ang pagkakaiba sa pagitan ng mga pamamaraang ito at lohikal na bigyang-katwiran ang kanilang mga lugar ng aplikasyon, ihambing natin ang kanilang mga formula.

Pearson correlation coefficient:

Koepisyent ng ugnayan ng Spearman:

Tulad ng nakikita mo, ang mga formula ay naiiba nang malaki. Ihambing natin ang mga formula

Ang pormula ng ugnayan ng Pearson ay gumagamit ng arithmetic mean at standard deviation ng magkakaugnay na serye, ngunit ang Spearman formula ay hindi. Kaya, upang makakuha ng sapat na resulta gamit ang Pearson formula, kinakailangan na ang magkakaugnay na serye ay malapit sa normal na distribusyon (ang mean at standard deviation ay mga parameter normal na pamamahagi ). Hindi ito nauugnay sa formula ng Spearman.

Ang isang elemento ng Pearson formula ay ang standardisasyon ng bawat serye sa z-scale.

Tulad ng nakikita mo, ang conversion ng mga variable sa Z-scale ay naroroon sa formula para sa koepisyent ng ugnayan ng Pearson. Alinsunod dito, para sa koepisyent ng Pearson, ang sukat ng data ay hindi mahalaga: halimbawa, maaari nating iugnay ang dalawang variable, ang isa ay may min. = 0 at max. = 1, at ang pangalawang min. = 100 at max. = 1000. Gaano man kaiba ang hanay ng mga halaga, lahat sila ay mako-convert sa karaniwang z-values ​​​​na pareho sa sukat.

Ang ganitong normalisasyon ay hindi nangyayari sa koepisyent ng Spearman, samakatuwid

ISANG MANDATORYONG KUNDISYON PARA SA PAGGAMIT NG SPEARMAN COEFFICIENT AY ANG PANTAY NG RANGE NG DALAWANG VARIABLE.

Bago gamitin ang koepisyent ng Spearman para sa serye ng data na may iba't ibang saklaw, kinakailangan na ranggo. Ang pagraranggo ay nagreresulta sa mga halaga ng mga seryeng ito na nakakakuha ng parehong minimum = 1 (minimum na ranggo) at isang maximum na katumbas ng bilang ng mga halaga (maximum, huling ranggo = N, ibig sabihin, ang maximum na bilang ng mga kaso sa sample) .

Sa anong mga kaso maaari mong gawin nang walang pagraranggo?

Ang mga ito ay mga kaso kapag ang data ay sa una iskala ng pagraranggo. Halimbawa, ang pagsubok ni Rokeach sa mga oryentasyon ng halaga.

Gayundin, ito ay mga kaso kapag ang bilang ng mga pagpipilian sa halaga ay maliit at ang sample ay naglalaman ng isang nakapirming minimum at maximum. Halimbawa, sa isang semantic differential, minimum = 1, maximum = 7.

Halimbawa ng pagkalkula ng koepisyent ng ugnayan ng ranggo ng Spearman

Ang pagsubok ng mga oryentasyon ng halaga ni Rokeach ay isinagawa sa dalawang sample na X at Y. Layunin: upang malaman kung gaano kalapit ang mga hierarchies ng mga halaga ng mga sample na ito (sa literal, kung gaano sila magkatulad).

Ang resultang halaga r=0.747 ay sinuri ng talahanayan ng mga kritikal na halaga. Ayon sa talahanayan, na may N=18, ang nakuhang halaga ay makabuluhan sa antas ng p<=0,005

Mga koepisyent ng ugnayan sa ranggo ng Spearman at Kendal

Para sa mga variable na kabilang sa isang ordinal scale o para sa mga variable na hindi napapailalim sa isang normal na distribusyon, gayundin para sa mga variable na kabilang sa isang interval scale, ang rank correlation ng Spearman ay kinakalkula sa halip na ang Pearson coefficient. Upang gawin ito, ang mga indibidwal na variable na halaga ay itinalaga ng mga ranggo, na kasunod na pinoproseso gamit ang naaangkop na mga formula. Upang makita ang ugnayan ng ranggo, i-clear ang default na Pearson correlation check box sa Bivariate Correlations... dialog box. Sa halip, i-activate ang pagkalkula ng ugnayan ng Spearman. Ang pagkalkulang ito ay magbibigay ng mga sumusunod na resulta. Ang mga koepisyent ng ugnayan ng ranggo ay napakalapit sa kaukulang mga halaga ng mga coefficient ng Pearson (ang mga orihinal na variable ay may normal na pamamahagi).

titkova-matmetody.pdf p. 45

Ang paraan ng ugnayan ng ranggo ng Spearman ay nagpapahintulot sa iyo na matukoy ang higpit (lakas) at direksyon

ugnayan sa pagitan ng dalawang palatandaan o dalawang profile (hierarchies) palatandaan.

Upang makalkula ang ugnayan ng ranggo, kinakailangan na magkaroon ng dalawang hanay ng mga halaga,

na maaaring i-rank. Ang nasabing serye ng mga halaga ay maaaring:

1) dalawang palatandaan sinusukat sa pareho pangkat mga paksa;

2) dalawang indibidwal na hierarchy ng mga katangian, nakilala sa dalawang paksa gamit ang pareho

hanay ng mga tampok;

3) dalawa pangkat hierarchies ng mga katangian,

4) indibidwal at pangkat hierarchy ng mga tampok.

Una, ang mga tagapagpahiwatig ay niraranggo nang hiwalay para sa bawat isa sa mga katangian.

Bilang isang panuntunan, ang isang mas mababang ranggo ay itinalaga sa isang mas mababang halaga ng katangian.

Sa unang kaso (dalawang katangian), ang mga indibidwal na halaga ay niraranggo ayon sa una

katangian na nakuha ng iba't ibang mga paksa, at pagkatapos ay mga indibidwal na halaga para sa pangalawa

tanda.

Kung ang dalawang katangian ay positibong nauugnay, ang mga paksang may mababang ranggo

ang isa sa kanila ay magkakaroon ng mababang ranggo sa isa, at ang mga paksang may mataas na ranggo sa

ang isa sa mga katangian ay magkakaroon din ng mataas na ranggo para sa iba pang katangian. Upang makalkula ang rs

kailangang matukoy ang mga pagkakaiba (d) sa pagitan ng mga ranggo na nakuha ng isang ibinigay na paksa sa pareho

palatandaan. Pagkatapos ang mga tagapagpahiwatig na ito ay binabago sa isang tiyak na paraan at ibinabawas sa 1. Kaysa

Kung mas maliit ang pagkakaiba sa pagitan ng mga ranggo, mas malaki ang magiging rs, mas malapit ito sa +1.

Kung walang ugnayan, lahat ng ranggo ay magkakahalo at walang

walang sulat. Ang formula ay idinisenyo upang sa kasong ito ang rs ay magiging malapit sa 0.

Sa kaso ng negatibong ugnayan mababang ranggo ng mga paksa sa isang batayan

mataas na ranggo sa ibang batayan ay tumutugma, at vice versa. Mas malaki ang pagkakaiba

sa pagitan ng mga ranggo ng mga paksa sa dalawang variable, ang mas malapit na rs ay sa -1.

Sa pangalawang kaso (dalawang indibidwal na profile), ang mga indibidwal ay niraranggo

mga halaga na nakuha ng bawat isa sa 2 paksa ayon sa isang tiyak (pareho para sa kanila

pareho) hanay ng mga tampok. Ang unang ranggo ay makakatanggap ng katangian na may pinakamaraming mababang halaga; pangalawang ranggo -

isang tanda na may mas mataas na halaga, atbp. Malinaw, ang lahat ng mga katangian ay dapat masukat sa

ang parehong mga yunit, kung hindi, ang pagraranggo ay imposible. Halimbawa, imposible

ranggo ang mga indicator sa Cattell Personality Inventory (16PF), kung ang mga ito ay ipinahayag sa

"raw" na mga puntos, dahil ang mga saklaw ng mga halaga ay naiiba para sa iba't ibang mga kadahilanan: mula 0 hanggang 13, mula 0 hanggang

20 at mula 0 hanggang 26. Hindi natin masasabi kung aling salik ang mauuna

expression hanggang dalhin namin ang lahat ng mga halaga sa isang solong sukat (kadalasan ito ang sukat ng dingding).

Kung ang mga indibidwal na hierarchies ng dalawang paksa ay positibong nauugnay, kung gayon ang mga palatandaan

ang pagkakaroon ng mababang ranggo sa isa sa kanila ay magkakaroon ng mababang ranggo sa isa pa, at kabaliktaran.

Halimbawa, kung ang factor E (dominance) ng isang paksa ay may pinakamababang ranggo, kung gayon

isa pang test subject, mababa ang rank kung may factor C ang isang test subject

(katatagan ng emosyon) ang may pinakamataas na ranggo, kung gayon ang ibang paksa ay dapat na mayroon din

ang salik na ito ay may mataas na ranggo, atbp.

Sa pangatlong kaso (dalawang profile ng grupo), niraranggo ang average na halaga ng grupo,

nakuha sa 2 grupo ng mga paksa ayon sa isang tiyak na hanay, magkapareho para sa parehong grupo

palatandaan. Sa mga sumusunod, ang linya ng pangangatwiran ay kapareho ng sa nakaraang dalawang kaso.

Sa kaso 4 (indibidwal at pangkat na mga profile), sila ay niraranggo nang hiwalay

indibidwal na mga halaga ng paksa at pangkat ng mga average na halaga para sa parehong hanay

mga palatandaan na nakuha, bilang panuntunan, sa pamamagitan ng pagbubukod ng indibidwal na paksang ito - siya

ay hindi lumalahok sa karaniwang profile ng grupo kung saan ihahambing ang kanyang indibidwal na profile

profile. Ang ugnayan ng ranggo ay magbibigay-daan sa iyo upang suriin kung gaano pare-pareho ang indibidwal at

mga profile ng grupo.

Sa lahat ng apat na kaso, ang kahalagahan ng resultang koepisyent ng ugnayan ay tinutukoy

sa pamamagitan ng bilang ng mga niraranggo na halaga N. Sa unang kaso, ang dami na ito ay magkakasabay sa

laki ng sample n. Sa pangalawang kaso, ang bilang ng mga obserbasyon ay ang bilang ng mga tampok,

bumubuo sa hierarchy. Sa ikatlo at pang-apat na kaso, ang N ay ang bilang din ng kumpara

katangian, at hindi ang bilang ng mga paksa sa mga pangkat. Ang mga detalyadong paliwanag ay ibinigay sa mga halimbawa. Kung

ang ganap na halaga ng rs ay umabot o lumampas sa isang kritikal na halaga, ugnayan

maaasahan.

Hypotheses.

Mayroong dalawang posibleng hypotheses. Nalalapat ang una sa case 1, ang pangalawa sa tatlo pa

Unang bersyon ng hypotheses

H0: Ang ugnayan sa pagitan ng mga variable A at B ay hindi naiiba sa zero.

H2: Ang ugnayan sa pagitan ng mga variable A at B ay makabuluhang naiiba mula sa zero.

Pangalawang bersyon ng hypotheses

H0: Ang ugnayan sa pagitan ng hierarchies A at B ay hindi naiiba sa zero.

H2: Ang ugnayan sa pagitan ng hierarchies A at B ay makabuluhang naiiba mula sa zero.

Mga limitasyon ng koepisyent ng ugnayan ng ranggo

1. Para sa bawat variable, hindi bababa sa 5 obserbasyon ang dapat ipakita. Itaas

ang hangganan ng sampling ay tinutukoy ng mga magagamit na talahanayan ng mga kritikal na halaga .

2. Ang koepisyent ng ugnayan ng ranggo ng Spearman ay rs para sa isang malaking bilang ng magkapareho

Ang mga ranggo para sa isa o pareho na pinaghahambing na mga variable ay nagbibigay ng mga magaspang na halaga. Sa isip

parehong magkakaugnay na serye ay dapat na kumakatawan sa dalawang sequence ng divergent

mga halaga. Kung hindi matugunan ang kundisyong ito, kailangang gumawa ng pagbabago sa

parehong ranggo.

Ang koepisyent ng ugnayan ng ranggo ng Spearman ay kinakalkula gamit ang formula:

Kung ang parehong pinaghahambing na serye ng ranggo ay naglalaman ng mga pangkat ng parehong ranggo,

bago kalkulahin ang koepisyent ng ugnayan ng ranggo, kinakailangan na gumawa ng mga pagwawasto para sa pareho

Mga ranggo ng Ta at TV:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

saan A- ang dami ng bawat pangkat ng magkatulad na ranggo sa ranggo serye A, sa dami ng bawat isa

mga pangkat ng magkatulad na ranggo sa serye ng ranggo B.

Upang kalkulahin ang empirical na halaga ng rs, gamitin ang formula:

38. Point-biserial correlation coefficient.

Tungkol sa ugnayan sa pangkalahatan, tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Hayaang sukatin ang variable X sa isang malakas na sukat, at variable Y sa isang dichotomous scale. Ang point biserial correlation coefficient rpb ay kinakalkula gamit ang formula:

Dito ang x 1 ay ang average na halaga sa mga X na bagay na may halaga na "isa" sa Y;

x 0 – average na halaga sa mga X na bagay na may halagang “zero” sa Y;

s x - karaniwang paglihis ng lahat ng mga halaga kasama ang X;

n 1 - bilang ng mga bagay na "isa" sa Y, n 0 - bilang ng mga bagay na "zero" sa Y;

n = n 1 + n 0 – laki ng sample.

Ang point biserial correlation coefficient ay maaari ding kalkulahin gamit ang iba pang katumbas na expression:

Dito x– pangkalahatang average na halaga para sa variable X.

Point biserial correlation coefficient rpb nag-iiba mula -1 hanggang +1. Ang halaga nito ay zero kung ang mga variable ay may isa Y magkaroon ng average Y, katumbas ng average ng mga variable na may zero over Y.

Pagsusulit mga hypotheses ng kahalagahan point biserial correlation coefficient ay upang suriin null hypothesish 0 tungkol sa pagkakapantay-pantay ng pangkalahatang koepisyent ng ugnayan sa zero: ρ = 0, na isinasagawa gamit ang t-test ng Estudyante. Empirical na kahalagahan

kumpara sa mga kritikal na halaga t a (df) para sa bilang ng mga antas ng kalayaan df = n– 2

Kung ang kondisyon | t| ≤ (df), ang null hypothesis ρ = 0 ay hindi tinatanggihan. Ang point biserial correlation coefficient ay malaki ang pagkakaiba sa zero kung ang empirical value | t| nahuhulog sa kritikal na rehiyon, iyon ay, kung ang kondisyon | t| > (n– 2). Ang pagiging maaasahan ng relasyon na kinakalkula gamit ang point biserial correlation coefficient rpb, maaari ding matukoy gamit ang criterion χ 2 para sa bilang ng mga antas ng kalayaan df= 2.

Point biserial correlation

Ang kasunod na pagbabago ng koepisyent ng ugnayan ng produkto ng mga sandali ay makikita sa puntong biserial r. Itong stat. ay nagpapakita ng ugnayan sa pagitan ng dalawang baryabol, ang isa sa mga ito ay diumano'y tuluy-tuloy at normal na ipinamamahagi, at ang isa ay discrete sa mahigpit na kahulugan ng salita. Ang punto biserial correlation coefficient ay tinutukoy ng r pbis Since in r pbis Ang dichotomy ay sumasalamin sa tunay na katangian ng discrete variable, at hindi pagiging artipisyal, tulad ng sa kaso r bis, ang tanda nito ay tinutukoy nang arbitraryo. Samakatuwid, para sa lahat ng praktikal na layunin. mga layunin r pbis isinasaalang-alang sa hanay mula 0.00 hanggang +1.00.

Mayroon ding kaso kung saan ang dalawang variable ay ipinapalagay na tuluy-tuloy at normal na ipinamamahagi, ngunit pareho ay artipisyal na dichotomized, tulad ng sa kaso ng biserial correlation. Upang masuri ang kaugnayan sa pagitan ng mga naturang variable, ginagamit ang tetrachoric correlation coefficient r tet, na pinalaki rin ni Pearson. Basic (eksaktong) mga formula at pamamaraan para sa pagkalkula r tet medyo kumplikado. Samakatuwid, may praktikal Ang pamamaraang ito ay gumagamit ng mga pagtatantya r tet,nakuha batay sa mga pinaikling pamamaraan at talahanayan.

/on-line/dictionary/dictionary.php?term=511

POINT BISERIAL COEFFICIENT ay ang koepisyent ng ugnayan sa pagitan ng dalawang variable, ang isa ay sinusukat sa isang dichotomous scale at ang isa sa isang interval scale. Ginagamit sa klasikal at modernong pagsubok bilang tagapagpahiwatig ng kalidad pagsubok na gawain– pagiging maaasahan-kaayon sa kabuuang marka ng pagsusulit.

Upang iugnay ang mga variable na sinusukat sa dichotomous at interval scale gamitin point-biserial correlation coefficient.
Ang point-biserial correlation coefficient ay isang paraan ng pagsusuri ng ugnayan ng mga variable, ang isa ay sinusukat sa isang sukat ng mga pangalan at tumatagal lamang ng 2 halaga (halimbawa, lalaki/babae, tamang sagot/maling sagot, tampok kasalukuyan/hindi kasalukuyan), at ang pangalawa sa isang scale ratios o interval scale. Formula para sa pagkalkula ng point-biserial correlation coefficient:

saan:
Ang m1 at m0 ay ang average na halaga ng X na may halaga na 1 o 0 sa Y.
σx – karaniwang paglihis ng lahat ng halaga ng X
n1,n0 – bilang ng mga halaga ng X mula 1 o 0 hanggang Y.
n – kabuuan mga pares ng halaga

Mas madalas ganitong klase Ang koepisyent ng ugnayan ay ginagamit upang kalkulahin ang kaugnayan sa pagitan ng mga item sa pagsubok at ang kabuuang sukat. Ito ay isang uri ng validity check.

39. Rank-biserial correlation coefficient.

Tungkol sa ugnayan sa pangkalahatan, tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

Rank biserial correlation coefficient, ginagamit sa mga kaso kung saan ang isa sa mga variable ( X) ay ipinakita sa isang ordinal na sukat, at ang iba pa ( Y) – dichotomous, kinakalkula ng formula

.

Narito ang average na ranggo ng mga bagay na mayroong isa Y; – average na ranggo ng mga bagay na may zero hanggang Y, n– laki ng sample.

Pagsusulit mga hypotheses ng kahalagahan Ang rank-biserial correlation coefficient ay isinasagawa katulad ng point biserial correlation coefficient gamit ang Student's test na may kapalit sa mga formula rpb sa rrb.

Sa mga kaso kung saan ang isang variable ay sinusukat sa isang dichotomous scale (variable X), at ang isa pa sa rank scale (variable Y), ang rank-biserial correlation coefficient ay ginagamit. Naaalala namin na ang variable X, sinusukat sa isang dichotomous scale, tumatagal lamang ng dalawang halaga (mga code) 0 at 1. Lalo naming binibigyang-diin: sa kabila ng katotohanan na ang koepisyent na ito ay nag-iiba sa saklaw mula -1 hanggang +1, ang tanda nito ay hindi mahalaga para sa interpretasyon ng resulta. Ito ay isa pang pagbubukod sa pangkalahatang tuntunin.

Ang koepisyent na ito ay kinakalkula gamit ang formula:

saan ` X 1 average na ranggo para sa mga elemento ng variable Y, na tumutugma sa code (sign) 1 sa variable X;

`X 0 – average na ranggo para sa mga elemento ng variable Y, na tumutugma sa code (sign) 0 sa variable X\

N – kabuuang bilang ng mga elemento sa variable X.

Upang mailapat ang rank-biserial correlation coefficient, ang mga sumusunod na kondisyon ay dapat matugunan:

1. Ang mga variable na inihahambing ay dapat masukat sa iba't ibang sukat: isa X – sa isang dichotomous scale; iba pa Y– sa iskala ng ranggo.

2. Bilang ng iba't ibang katangian sa inihambing na mga variable X At Y dapat pareho.

3. Upang masuri ang antas ng pagiging maaasahan ng rank-biserial correlation coefficient, dapat mong gamitin ang formula (11.9) at ang talahanayan ng mga kritikal na halaga para sa pagsusulit ng Mag-aaral k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Mga kaso kung saan kinakatawan ang isa sa mga variable dichotomous scale, at ang iba pa sa ranggo (ordinal), nangangailangan ng aplikasyon rank-biserial correlation coefficient:

rbb=2 / n * (m1 - m0)

saan:
n – bilang ng mga bagay sa pagsukat
m1 at m0 - ang average na ranggo ng mga bagay na may 1 o 0 sa pangalawang variable.
Ginagamit din ang koepisyent na ito kapag sinusuri ang bisa ng mga pagsusulit.

40. Linear correlation coefficient.

Para sa correlation sa pangkalahatan (at linear correlation sa partikular), tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

G. PEARSON'S COEFFICIENT

r-Pearson (Pearson r) ay ginagamit upang pag-aralan ang relasyon sa pagitan ng dalawang sukataniba't ibang mga variable na sinusukat sa parehong sample. Mayroong maraming mga sitwasyon kung saan ang paggamit nito ay angkop. Nakakaapekto ba ang katalinuhan sa akademikong pagganap sa mga taon ng senior unibersidad? May kaugnayan ba ang laki ng suweldo ng isang empleyado sa kanyang pagiging palakaibigan sa mga kasamahan? Nakakaapekto ba ang mood ng isang mag-aaral sa tagumpay ng paglutas ng isang kumplikadong problema sa aritmetika? Upang masagot ang mga naturang katanungan, dapat sukatin ng mananaliksik ang dalawang tagapagpahiwatig ng interes para sa bawat miyembro ng sample. Ang data upang pag-aralan ang relasyon ay pagkatapos ay i-tabulated, tulad ng sa halimbawa sa ibaba.

HALIMBAWA 6.1

Ang talahanayan ay nagpapakita ng isang halimbawa ng paunang data para sa pagsukat ng dalawang tagapagpahiwatig ng katalinuhan (berbal at nonverbal) para sa 20 mga mag-aaral sa ika-8 baitang.

Ang ugnayan sa pagitan ng mga variable na ito ay maaaring ilarawan gamit ang isang scatterplot (tingnan ang Figure 6.3). Ipinapakita ng diagram na mayroong ilang ugnayan sa pagitan ng mga nasusukat na tagapagpahiwatig: mas malaki ang halaga ng verbal intelligence, ang (karamihan) mas malaki ang halaga ng non-verbal intelligence.

Bago ibigay ang formula para sa koepisyent ng ugnayan, subukan nating subaybayan ang lohika ng paglitaw nito gamit ang data mula sa halimbawa 6.1. Ang posisyon ng bawat /-point (paksa na may numero /) sa scatter diagram na nauugnay sa iba pang mga punto (Larawan 6.3) ay maaaring tukuyin ng mga halaga at palatandaan ng mga paglihis ng kaukulang mga variable na halaga mula sa kanilang mga average na halaga : (xj - MJ At (isip sa ). Kung ang mga palatandaan ng mga paglihis na ito ay nag-tutugma, kung gayon ito ay nagpapahiwatig ng isang positibong relasyon (mas malaking halaga para sa X malaking halaga ang tumutugma sa sa o mas mababang halaga X mas maliliit na halaga ang tumutugma sa y).

Para sa paksa No. 1, paglihis mula sa average X at sa pamamagitan ng sa positibo, at para sa paksa Blg. 3 parehong mga paglihis ay negatibo. Dahil dito, ang data mula sa pareho ay nagpapahiwatig ng isang positibong relasyon sa pagitan ng mga pinag-aralan na katangian. Sa laban, kung ang mga palatandaan ng deviations mula sa average X at sa pamamagitan ng sa magkaiba, ito ay magsasaad ng negatibong relasyon sa pagitan ng mga katangian. Kaya, para sa paksa Blg. 4, ang paglihis mula sa average X ay negatibo, sa pamamagitan ng y - positibo, at para sa paksa No. 9 - vice versa.

Kaya, kung ang produkto ng mga paglihis (x,- M X ) X (isip sa ) positibo, pagkatapos ay ang data ng /-subject ay nagpapahiwatig ng isang direktang (positibong) relasyon, at kung negatibo, pagkatapos ay isang baligtad (negatibong) relasyon. Alinsunod dito, kung Xwy y ay karaniwang nauugnay sa direktang proporsyon, kung gayon ang karamihan sa mga produkto ng mga deviation ay magiging positibo, at kung ang mga ito ay nauugnay sa isang kabaligtaran na relasyon, kung gayon ang karamihan sa mga produkto ay magiging negatibo. Samakatuwid, ang isang pangkalahatang tagapagpahiwatig para sa lakas at direksyon ng relasyon ay maaaring ang kabuuan ng lahat ng mga produkto ng mga paglihis para sa isang naibigay na sample:

Sa isang direktang proporsyonal na ugnayan sa pagitan ng mga variable, ang halaga na ito ay malaki at positibo - para sa karamihan ng mga paksa, ang mga paglihis ay nag-tutugma sa sign (malalaking halaga ng isang variable ay tumutugma sa malalaking halaga ng isa pang variable at vice versa). Kung X At sa magkaroon ng feedback, kung gayon para sa karamihan ng mga paksa, ang mas malalaking halaga ng isang variable ay tumutugma sa mas maliit na halaga ng isa pang variable, ibig sabihin, ang mga palatandaan ng mga produkto ay magiging negatibo, at ang kabuuan ng mga produkto sa kabuuan ay magiging malaki din sa ganap na halaga, ngunit negatibo sa sign. Kung walang sistematikong koneksyon sa pagitan ng mga variable, ang mga positibong termino (mga produkto ng deviations) ay magiging balanse ng mga negatibong termino, at ang kabuuan ng lahat ng mga produkto ng deviations ay magiging malapit sa zero.

Upang matiyak na ang kabuuan ng mga produkto ay hindi nakadepende sa laki ng sample, sapat na ang pag-average nito. Ngunit kami ay interesado sa sukatan ng pagkakabit hindi bilang isang pangkalahatang parameter, ngunit bilang isang kinakalkula na pagtatantya nito - mga istatistika. Samakatuwid, para sa formula ng pagpapakalat, sa kasong ito ay gagawin natin ang pareho, hatiin ang kabuuan ng mga produkto ng mga paglihis hindi sa pamamagitan ng N, at sa TV - 1. Nagreresulta ito sa isang sukatan ng koneksyon, malawakang ginagamit sa pisika at teknikal na agham, na tinatawag na covariance (Covahance):


SA sikolohiya, hindi katulad ng pisika, karamihan sa mga variable ay sinusukat sa di-makatwirang mga sukat, dahil ang mga psychologist ay hindi interesado sa ganap na halaga ng isang tanda, ngunit pagsasaayos ng isa't isa mga paksa sa pangkat. Bilang karagdagan, ang covariance ay napakasensitibo sa sukat ng sukat (variance) kung saan sinusukat ang mga katangian. Upang gawing independyente ang sukat ng koneksyon sa mga yunit ng pagsukat ng parehong mga katangian, sapat na upang hatiin ang covariance sa kaukulang standard deviations. Kaya ito ay nakuha para sa-Mule ng K. Pearson correlation coefficient:

o, pagkatapos palitan ang mga expression para sa o x at


Kung ang mga halaga ng parehong mga variable ay na-convert sa mga r-halaga gamit ang formula


pagkatapos ay ang formula para sa r-Pearson correlation coefficient ay mukhang mas simple (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

CORRELATION LINEAR- istatistikal na linear na relasyon na hindi sanhi ng kalikasan sa pagitan ng dalawang quantitative variable X At sa. Sinusukat gamit ang "K.L coefficient." Pearson, na resulta ng paghahati ng covariance sa mga standard deviations ng parehong variable:

,

saan s xy- covariance sa pagitan ng mga variable X At sa;

s x , s y- standard deviations para sa mga variable X At sa;

x i , y i- mga variable na halaga X At sa para sa bagay na may numero i;

x, y- mga average ng arithmetic para sa mga variable X At sa.

Koepisyent ng Pearson r maaaring kumuha ng mga halaga mula sa pagitan [-1; +1]. Ibig sabihin r = 0 nangangahulugan na walang linear na relasyon sa pagitan ng mga variable X At sa(ngunit hindi nagbubukod ng isang nonlinear na istatistikal na relasyon). Mga positibong halaga ng koepisyent ( r> 0) ipahiwatig ang isang direktang linear na koneksyon; mas malapit ang value nito sa +1, mas malakas ang ugnayan ng statistical line. Mga negatibong halaga ng koepisyent ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее Feedback. Mga halaga r= ±1 ay nangangahulugan ng pagkakaroon ng isang kumpletong linear na koneksyon, direkta o baligtad. Sa kaso ng kumpletong koneksyon, lahat ng mga punto na may mga coordinate ( x i , y i) humiga sa isang tuwid na linya y = a + bx.

"Coefficient K.L." Ginagamit din ang Pearson upang sukatin ang lakas ng koneksyon sa isang linear pairwise regression model.

41. Correlation matrix at correlation graph.

Tungkol sa ugnayan sa pangkalahatan, tingnan ang tanong Blg. 36 Sa. 56 (64) 063.JPG

Correlation matrix. Kadalasan, kasama sa pagsusuri ng ugnayan ang pag-aaral ng mga relasyon sa pagitan ng hindi dalawa, ngunit maraming mga variable na sinusukat sa isang quantitative scale sa isang sample. Sa kasong ito, kinakalkula ang mga ugnayan para sa bawat pares ng hanay ng mga variable na ito. Ang mga kalkulasyon ay karaniwang isinasagawa sa isang computer, at ang resulta ay isang correlation matrix.

Correlation matrix(Kaugnayan Matrix) ay ang resulta ng pagkalkula ng mga ugnayan ng isang uri para sa bawat pares mula sa set R mga variable na sinusukat sa isang quantitative scale sa isang sample.

HALIMBAWA

Ipagpalagay na pinag-aaralan natin ang mga relasyon sa pagitan ng 5 variable (vl, v2,..., v5; P= 5), sinusukat sa isang sample ng N=30 Tao. Nasa ibaba ang isang talahanayan ng source data at isang correlation matrix.

AT
katulad na data:

Correlation matrix:

Madaling mapansin na ang correlation matrix ay parisukat, simetriko na may paggalang sa pangunahing dayagonal (takkak,y = /) y), na may mga yunit sa pangunahing dayagonal (dahil G At = Gu = 1).

Ang correlation matrix ay parisukat: ang bilang ng mga row at column ay katumbas ng bilang ng mga variable. Siya simetriko kamag-anak sa pangunahing dayagonal, dahil ang ugnayan X Sa sa katumbas ng ugnayan sa Sa X. Ang mga yunit ay matatagpuan sa pangunahing dayagonal nito, dahil ang ugnayan ng tampok sa sarili nito ay katumbas ng isa. Dahil dito, hindi lahat ng elemento ng correlation matrix ay napapailalim sa pagsusuri, ngunit ang mga nasa itaas o ibaba ng pangunahing dayagonal.

Bilang ng mga coefficient ng ugnayan, Ang mga tampok na susuriin kapag pinag-aaralan ang mga relasyon ay tinutukoy ng formula: P(P- 1)/2. Sa halimbawa sa itaas, ang bilang ng naturang mga coefficient ng ugnayan ay 5(5 - 1)/2 = 10.

Ang pangunahing gawain ng pag-aaral ng correlation matrix ay pagtukoy sa istruktura ng mga relasyon sa pagitan ng maraming mga tampok. Sa kasong ito, posible ang visual analysis correlation galaxy- graphic na imahe mga istruktura ayon sa istatistikamakabuluhang koneksyon, kung hindi masyadong maraming ganoong koneksyon (hanggang 10-15). Ang isa pang paraan ay ang paggamit ng mga multivariate na pamamaraan: multiple regression, factor o cluster analysis (tingnan ang seksyong “Multivariate method...”). Gamit ang factor o cluster analysis, posibleng matukoy ang mga pagpapangkat ng mga variable na mas malapit na nauugnay sa isa't isa kaysa sa iba pang mga variable. Ang isang kumbinasyon ng mga pamamaraan na ito ay napaka-epektibo, halimbawa, kung mayroong maraming mga palatandaan at hindi sila homogenous.

Paghahambing ng mga ugnayan - isang karagdagang gawain ng pagsusuri sa correlation matrix, na mayroong dalawang pagpipilian. Kung kinakailangan upang ihambing ang mga ugnayan sa isa sa mga hilera ng correlation matrix (para sa isa sa mga variable), ang paraan ng paghahambing para sa mga umaasang sample ay ginagamit (p. 148-149). Kapag naghahambing ng mga ugnayan ng parehong pangalan na kinakalkula para sa iba't ibang mga sample, ang paraan ng paghahambing para sa mga independiyenteng sample ay ginagamit (p. 147-148).

Mga pamamaraan ng paghahambing mga ugnayan sa mga dayagonal correlation matrix (upang masuri ang stationarity random na proseso) at paghahambing ilang Ang mga correlation matrice na nakuha para sa iba't ibang sample (para sa kanilang homogeneity) ay labor-intensive at lampas sa saklaw ng aklat na ito. Maaari kang maging pamilyar sa mga pamamaraang ito mula sa aklat ni G.V. Sukhodolsky 1.

Problema istatistikal na kahalagahan mga ugnayan. Ang problema ay ang pamamaraan pagsusuri sa istatistika ipinapalagay ng mga hypotheses isa-maramihan isinagawa ang pagsubok sa isang sample. Kung ang parehong paraan ay inilapat paulit-ulit, kahit na may kaugnayan sa iba't ibang mga variable, ang posibilidad na makakuha ng isang resulta na puro sa pamamagitan ng pagkakataon ay tumataas. Sa pangkalahatan, kung uulitin natin ang parehong paraan ng pagsubok sa hypothesis minsan na may kaugnayan sa iba't ibang mga variable o sample, pagkatapos ay may itinatag na halaga a kami ay ginagarantiyahan na makatanggap ng kumpirmasyon ng hypothesis sa ahk bilang ng mga kaso.

Ipagpalagay na ang isang correlation matrix ay nasuri para sa 15 variable, iyon ay, 15(15-1)/2 = 105 correlation coefficients ang kinakalkula. Upang subukan ang mga hypothesis, itinakda ang antas a = 0.05. Sa pamamagitan ng pagsuri sa hypothesis ng 105 beses, makakatanggap kami ng kumpirmasyon nito ng limang beses (!), hindi alintana kung ang koneksyon ay aktwal na umiiral. Ang pag-alam nito at pagkakaroon, sabihin nating, 15 na "makabuluhang istatistika" na koepisyent ng ugnayan, masasabi ba natin kung alin ang nakuha ng pagkakataon at alin ang nagpapakita ng tunay na relasyon?

Mahigpit na nagsasalita, para sa pagtanggap solusyon sa istatistika kinakailangang bawasan ang antas a nang kasing dami ng bilang ng mga hypotheses na sinusuri. Ngunit hindi ito maipapayo, dahil ang posibilidad na balewalain ang isang talagang umiiral na koneksyon (paggawa ng Type II error) ay tumataas sa isang hindi mahuhulaan na paraan.

Ang correlation matrix lamang ay hindi sapat na batayanpara sa mga istatistikal na konklusyon tungkol sa mga indibidwal na coefficient na kasama ditomga ugnayan!

Mayroon lamang isang tunay na nakakumbinsi na paraan upang malutas ang problemang ito: hatiin ang sample nang sapalaran sa dalawang bahagi at isaalang-alang lamang ang mga ugnayang iyon na makabuluhan ayon sa istatistika sa parehong bahagi ng sample. Ang isang alternatibo ay maaaring ang paggamit ng mga multivariate na pamamaraan (factor, cluster o multiple regression analysis) upang matukoy at pagkatapos ay bigyang-kahulugan ang mga grupo ng mga variable na makabuluhang nauugnay sa istatistika.

Ang problema ng mga nawawalang halaga. Kung may mga nawawalang halaga sa data, dalawang pagpipilian ang posible para sa pagkalkula ng correlation matrix: a) row-by-row na pag-alis ng mga halaga (Ibukodkasolistwise); b) magkapares na pagtanggal ng mga halaga (Ibukodkasomagkapares). Sa linya sa linyang pagtanggal mga obserbasyon na may mga nawawalang halaga, ang buong row para sa isang bagay (paksa) na may hindi bababa sa isang nawawalang halaga para sa isa sa mga variable ay tatanggalin. Ang pamamaraang ito ay humahantong sa isang "tamang" correlation matrix sa kahulugan na ang lahat ng mga coefficient ay kinakalkula mula sa parehong hanay ng mga bagay. Gayunpaman, kung ang mga nawawalang halaga ay ibinahagi nang sapalaran sa mga variable, kung gayon ang pamamaraang ito ay maaaring humantong sa katotohanang walang matitirang isang bagay sa set ng data na isinasaalang-alang (bawat row ay maglalaman ng hindi bababa sa isang nawawalang halaga). Upang maiwasan ang sitwasyong ito, gumamit ng ibang paraan na tinatawag pares na pagtanggal. Isinasaalang-alang lamang ng paraang ito ang mga gaps sa bawat napiling column-variable pair at binabalewala ang mga gaps sa iba pang variable. Ang ugnayan para sa isang pares ng mga variable ay kinakalkula para sa mga bagay na iyon kung saan walang mga puwang. Sa maraming mga sitwasyon, lalo na kapag ang bilang ng mga puwang ay medyo maliit, sabihin nating 10%, at ang mga puwang ay ibinahagi nang random, ang pamamaraang ito ay hindi humahantong sa mga malubhang pagkakamali. Gayunpaman, kung minsan hindi ito ang kaso. Halimbawa, ang isang sistematikong bias (shift) sa pagtatasa ay maaaring "nakatago" ng isang sistematikong pag-aayos ng mga pagtanggal, na siyang dahilan ng pagkakaiba sa mga koepisyent ng ugnayan na binuo para sa iba't ibang mga subset (halimbawa, para sa iba't ibang mga subgroup ng mga bagay). Isa pang problemang nauugnay sa correlation matrix na kinakalkula sa magkapares ang pag-alis ng mga puwang ay nangyayari kapag ginagamit ang matrix na ito sa iba pang mga uri ng pagsusuri (halimbawa, sa maraming regression o factor analysis). Ipinapalagay nila na ang "tamang" correlation matrix ay ginagamit na may isang tiyak na antas ng pagkakapare-pareho at "pagsunod" ng iba't ibang mga coefficient. Ang paggamit ng isang matrix na may "masamang" (biased) na mga pagtatantya ay humahantong sa katotohanan na ang programa ay maaaring hindi masuri ang naturang matrix, o ang mga resulta ay magiging mali. Samakatuwid, kung gagamitin ang pairwise na paraan ng pagbubukod ng nawawalang data, kinakailangang suriin kung may mga sistematikong pattern sa pamamahagi ng nawawalang data.

Kung ang pairwise na pagtanggal ng nawawalang data ay hindi humahantong sa anumang sistematikong pagbabago sa mga paraan at pagkakaiba-iba (standard deviations), ang mga istatistikang ito ay magiging katulad sa mga nakalkula gamit ang row-by-row na paraan ng pagtanggal ng nawawalang data. Kung ang isang makabuluhang pagkakaiba ay naobserbahan, pagkatapos ay may dahilan upang ipagpalagay na mayroong pagbabago sa mga pagtatantya. Halimbawa, kung ang average (o standard deviation) ng mga halaga ng isang variable A, na ginamit sa pagkalkula ng ugnayan nito sa variable SA, mas mababa kaysa karaniwan (o karaniwang lihis) ang parehong mga variable na halaga A, na ginamit sa pagkalkula ng ugnayan nito sa variable C, kung gayon mayroong lahat ng dahilan upang asahan na ang dalawang ugnayang ito (A-Bkami) batay sa iba't ibang subset ng data. Magkakaroon ng bias sa mga ugnayang dulot ng hindi random na paglalagay ng mga puwang sa mga variable na halaga.

Pagsusuri ng correlation galaxies. Matapos malutas ang problema ng istatistikal na kahalagahan ng mga elemento ng correlation matrix, ang mga makabuluhang ugnayan sa istatistika ay maaaring katawanin nang grapiko sa anyo ng correlation galaxy o galaxy. Correlation galaxy - Ito ay isang figure na binubuo ng mga vertex at linya na nag-uugnay sa kanila. Ang mga vertice ay tumutugma sa mga katangian at karaniwang itinalaga ng mga numero - mga variable na numero. Ang mga linya ay tumutugma sa istatistikal na makabuluhang mga koneksyon at graphical na nagpapahayag ng sign at kung minsan ang j-level ng kahalagahan ng koneksyon.

Maaaring sumasalamin ang correlation galaxy Lahat sa istatistika makabuluhang koneksyon correlation matrix (minsan ay tinatawag na graph ng ugnayan ) o lamang ang kanilang makabuluhang napiling bahagi (halimbawa, naaayon sa isang salik ayon sa mga resulta ng pagsusuri sa salik).

HALIMBAWA NG PAGBUO NG CORRELATION PLEIADE


Paghahanda para sa estado (panghuling) sertipikasyon ng mga nagtapos: pagbuo ng database ng Unified State Exam (pangkalahatang listahan ng mga kalahok ng Unified State Exam ng lahat ng kategorya, na nagpapahiwatig ng mga paksa) - isinasaalang-alang ang mga araw ng reserba sa kaso ng parehong mga paksa;

  • Plano ng trabaho (27)

    Solusyon

    2. Mga aktibidad ng institusyong pang-edukasyon upang mapabuti ang nilalaman at masuri ang kalidad sa mga paksa ng edukasyon sa agham at matematika.

  • Kaugnayan sa ranggo ng Spearman(kaugnayan sa ranggo). Ang ugnayan ng ranggo ng Spearman ay ang pinakasimpleng paraan upang matukoy ang antas ng ugnayan sa pagitan ng mga salik. Ang pangalan ng pamamaraan ay nagpapahiwatig na ang relasyon ay tinutukoy sa pagitan ng mga ranggo, iyon ay, serye ng mga nakuhang dami ng halaga, na niraranggo sa pababang o pataas na pagkakasunud-sunod. Dapat tandaan na, una, ang ugnayan sa ranggo ay hindi inirerekomenda kung ang koneksyon sa pagitan ng mga pares ay mas mababa sa apat at higit sa dalawampu; pangalawa, ginagawang posible ng correlation ng ranggo na matukoy ang relasyon sa ibang kaso, kung ang mga halaga ay semi-quantitative sa kalikasan, iyon ay, wala silang numerical expression at sumasalamin sa isang malinaw na pagkakasunud-sunod ng paglitaw ng mga halagang ito; pangatlo, ipinapayong gumamit ng rank correlation sa mga kaso kung saan ito ay sapat upang makakuha ng tinatayang data. Isang halimbawa ng pagkalkula ng rank correlation coefficient para matukoy ang tanong: sukatin ang questionnaire X at Y ay magkatulad mga personal na katangian mga paksa. Gamit ang dalawang talatanungan (X at Y), na nangangailangan ng mga alternatibong sagot na "oo" o "hindi," nakuha ang mga pangunahing resulta - ang mga sagot ng 15 na paksa (N = 10). Ang mga resulta ay ipinakita bilang kabuuan ng mga sumasang-ayon na sagot nang hiwalay para sa talatanungan X at para sa talatanungan B. Ang mga resultang ito ay buod sa talahanayan. 5.19.

    Talahanayan 5.19. Tabulasyon ng mga pangunahing resulta para kalkulahin ang koepisyent ng ugnayan ng ranggo ng Spearman (p) *

    Pagsusuri ng summary correlation matrix. Paraan ng correlation galaxy.

    Halimbawa. Sa mesa Ang Figure 6.18 ay nagpapakita ng mga interpretasyon ng labing-isang variable na sinusuri gamit ang Wechsler method. Ang data ay nakuha mula sa isang homogenous na sample na may edad na 18 hanggang 25 taon (n = 800).

    Bago ang stratification, ipinapayong i-ranggo ang correlation matrix. Upang gawin ito, ang mga average na halaga ng mga coefficient ng ugnayan ng bawat variable kasama ang lahat ng iba ay kinakalkula sa orihinal na matrix.

    Pagkatapos ay ayon sa talahanayan. 5.20 matukoy ang mga pinahihintulutang antas ng pagsasapin-sapin ng correlation matrix para sa ibinigay posibilidad ng kumpiyansa 0.95 at n - dami

    Talahanayan 6.20. Pataas na correlation matrix

    Mga variable 1 2 3 4 gagawin 0 7 8 0 10 11 M(rij) Ranggo
    1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
    2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
    3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
    4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
    5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
    6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
    7 1 0,310 0,388 0,264 0,266 0,310 9
    8 1 0,897 0,363 0,388 0,363 5
    9 1 0,388 0,430 0,846 6
    10 1 0,336 0,310 8
    11 1 0,300 10

    Mga pagtatalaga: 1 - pangkalahatang kamalayan; 2 - konseptwalidad; 3 - pagkaasikaso; 4 - vdataness K ng generalization; b - direktang pagsasaulo (sa mga numero) 6 - antas ng karunungan katutubong wika; 7 - bilis ng pag-master ng mga kasanayan sa sensorimotor (symbol coding) 8 - pagmamasid; 9 - mga kakayahang kombinatoryal (para sa pagsusuri at synthesis) 10 - kakayahang ayusin ang mga bahagi sa isang makabuluhang kabuuan; 11 - kakayahan para sa heuristic synthesis; M (rij) - ang average na halaga ng mga coefficient ng ugnayan ng variable sa iba pang mga variable ng pagmamasid (sa aming kaso n = 800): r (0) - ang halaga ng zero na "Dissecting" na eroplano - ang minimum na makabuluhang ganap na halaga ng koepisyent ng ugnayan (n - 120, r (0) = 0.236; n = 40, r (0) = 0.407) | Δr | - pinahihintulutang hakbang ng delamination (n = 40, | Δr | = 0.558) sa - pinahihintulutang dami mga antas ng stratification (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - ganap na halaga ng cutting plane (n = 40, r (1) = 0.965).

    Para sa n = 800, nahanap namin ang halaga ng gtype at ang mga hangganan ng gi, pagkatapos nito ay pinagsasapin-sapin namin ang correlation matrix, na nagha-highlight ng mga correlation pleiades sa loob ng mga layer, o mga hiwalay na bahagi ng correlation matrix, pagguhit ng mga asosasyon ng correlation pleiades para sa mga nakapatong na layer (Fig .5.5).

    Ang isang makabuluhang pagsusuri sa mga nagresultang galaxy ay higit pa mga istatistika ng matematika. Dapat tandaan na mayroong dalawang pormal na tagapagpahiwatig na tumutulong sa makabuluhang interpretasyon ng Pleiades. Ang isang makabuluhang tagapagpahiwatig ay ang antas ng isang vertex, iyon ay, ang bilang ng mga gilid na katabi ng isang vertex. Ang variable na may pinakamalaking bilang ng mga gilid ay ang "core" ng kalawakan at maaaring ituring na indicator ng natitirang mga variable ng galaxy na ito. Ang isa pang makabuluhang tagapagpahiwatig ay ang density ng komunikasyon. Ang isang variable ay maaaring may mas kaunting mga koneksyon sa isang kalawakan, ngunit mas malapit, at mas maraming koneksyon sa isa pang kalawakan, ngunit hindi gaanong malapit.

    Mga hula at pagtatantya. Ang equation na y = b1x + b0 ay tinatawag pangkalahatang equation tuwid. Ito ay nagpapahiwatig na ang mga pares ng mga puntos (x, y), na

    kanin. 5.5. Mga correlation galaxies na nakuha sa pamamagitan ng matrix layering

    nakahiga sa isang tiyak na linya, na konektado sa paraang para sa anumang halagang x, ang halagang b na ipinares dito ay mahahanap sa pamamagitan ng pag-multiply ng x sa isang tiyak na numerong b1 at pagdaragdag sa pangalawa, ang numerong b0 sa produktong ito.

    Ang regression coefficient ay nagpapahintulot sa iyo na matukoy ang antas ng pagbabago sa investigative factor kapag ang causal factor ay nagbabago ng isang unit. Ang mga ganap na halaga ay nailalarawan ang kaugnayan sa pagitan ng mga variable na kadahilanan ayon sa kanilang ganap na mga halaga. Ang regression coefficient ay kinakalkula gamit ang formula:

    Disenyo at pagsusuri ng mga eksperimento. Ang disenyo at pagsusuri ng mga eksperimento ay ang ikatlong mahalagang sangay ng mga istatistikal na pamamaraan na binuo upang mahanap at subukan ang mga ugnayang sanhi sa pagitan ng mga variable.

    Upang pag-aralan ang multifactorial dependencies sa Kamakailan lamang Ang mga pamamaraan ng matematikal na eksperimentong pagpaplano ay lalong ginagamit.

    Ang kakayahang sabay-sabay na pag-iba-iba ang lahat ng mga kadahilanan ay nagbibigay-daan sa iyong: a) bawasan ang bilang ng mga eksperimento;

    b) bawasan ang experimental error sa pinakamababa;

    c) gawing simple ang pagproseso ng natanggap na data;

    d) tiyakin ang kalinawan at kadalian ng paghahambing ng mga resulta.

    Ang bawat kadahilanan ay maaaring makakuha ng isang tiyak na katumbas na bilang ng iba't ibang mga halaga, na tinatawag na mga antas at denoted -1, 0 at 1. Tinutukoy ng isang nakapirming hanay ng mga antas ng kadahilanan ang mga kondisyon ng isa sa mga posibleng eksperimento.

    Ang kabuuan ng lahat ng posibleng kumbinasyon ay kinakalkula gamit ang formula:

    Ang isang kumpletong factorial na eksperimento ay isang eksperimento kung saan ang lahat ng posibleng kumbinasyon ng mga antas ng factor ay ipinatupad. Ang buong factorial na mga eksperimento ay maaaring magkaroon ng pag-aari ng orthogonality. Sa orthogonal na pagpaplano, ang mga salik sa eksperimento ay walang kaugnayan; ang mga koepisyent ng regression na sa huli ay kinakalkula ay independiyenteng tinutukoy ng bawat isa.

    Ang isang mahalagang bentahe ng pamamaraan ng matematikal na eksperimentong pagpaplano ay ang kagalingan at pagiging angkop nito sa maraming lugar ng pananaliksik.

    Isaalang-alang natin ang isang halimbawa ng paghahambing ng impluwensya ng ilang mga kadahilanan sa pagbuo ng antas ng mental na stress sa mga color TV controllers.

    Ang eksperimento ay batay sa isang orthogonal na Disenyo 2 tatlo (tatlong salik ang nagbabago sa dalawang antas).

    Ang eksperimento ay isinagawa na may kumpletong bahagi 2 + 3 na may tatlong pag-uulit.

    Ang orthogonal na pagpaplano ay batay sa pagbuo ng isang regression equation. Para sa tatlong kadahilanan, ganito ang hitsura:

    Kasama sa pagproseso ng mga resulta sa halimbawang ito ang:

    a) pagtatayo ng isang orthogonal plan 2 +3 table para sa pagkalkula;

    b) pagkalkula ng mga coefficient ng regression;

    c) suriin ang kanilang kahalagahan;

    d) interpretasyon ng nakuhang datos.

    Para sa mga coefficient ng regression ng nabanggit na equation, kinailangang ilagay ang N = 2 3 = 8 na mga opsyon upang masuri ang kahalagahan ng mga coefficient, kung saan ang bilang ng mga pag-uulit K ay 3.

    Ang matrix para sa pagpaplano ng eksperimento ay ganito ang hitsura:

    Sa mga kaso kung saan ang mga pagsukat ng mga katangian sa ilalim ng pag-aaral ay isinasagawa sa isang sukat ng pagkakasunud-sunod, o ang anyo ng relasyon ay naiiba sa linear, ang pag-aaral ng relasyon sa pagitan ng dalawang random na variable ay isinasagawa gamit ang koepisyent ng pagraranggo mga ugnayan. Isaalang-alang ang koepisyent ng ugnayan ng ranggo ng Spearman. Kapag kinakalkula ito, kinakailangan na ranggo (pagkasunud-sunod) ang mga pagpipilian sa sample. Ang ranggo ay ang pagpapangkat ng pang-eksperimentong data sa isang tiyak na pagkakasunud-sunod, pataas man o pababa.

    Ang operasyon ng pagraranggo ay isinasagawa ayon sa sumusunod na algorithm:

    1. Ang isang mas mababang halaga ay itinalaga ng isang mas mababang ranggo. Ang pinakamataas na halaga ay itinalaga ng isang ranggo na naaayon sa bilang ng mga nararanggo na halaga. Ang pinakamaliit na halaga ay itinalaga ng ranggo na 1. Halimbawa, kung n=7, kung gayon pinakamataas na halaga ay makakatanggap ng ranggo bilang 7, maliban sa ibinigay sa pangalawang panuntunan.

    2. Kung ang ilang mga halaga ay magkapantay, pagkatapos ay itatalaga sa kanila ang isang ranggo na ang average ng mga ranggo na kanilang matatanggap kung sila ay hindi pantay. Bilang halimbawa, isaalang-alang ang pataas na pagkakasunod-sunod na sample na binubuo ng 7 elemento: 22, 23, 25, 25, 25, 28, 30. Ang mga halagang 22 at 23 ay lumilitaw nang isang beses bawat isa, kaya ang kanilang mga ranggo ay ayon sa pagkakabanggit R22=1, at R23=2 . Lumilitaw ang halagang 25 nang 3 beses. Kung ang mga halagang ito ay hindi naulit, ang kanilang mga ranggo ay magiging 3, 4, 5. Samakatuwid, ang kanilang R25 na ranggo ay katumbas ng arithmetic mean ng 3, 4 at 5: . Ang mga halaga 28 at 30 ay hindi paulit-ulit, kaya ang kanilang mga ranggo ay ayon sa pagkakabanggit R28=6 at R30=7. Sa wakas mayroon kaming sumusunod na sulat:

    3. kabuuang halaga Ang mga ranggo ay dapat na tumutugma sa kinakalkula, na tinutukoy ng formula:

    kung saan ang n ay ang kabuuang bilang ng mga niraranggo na halaga.

    Pagkakaiba sa pagitan ng tunay at mga tinantyang halaga ang mga ranggo ay magsasaad ng pagkakamaling nagawa kapag kinakalkula ang mga ranggo o pagbubuod ng mga ito. Sa kasong ito, kailangan mong hanapin at ayusin ang error.

    Ang koepisyent ng ugnayan ng ranggo ng Spearman ay isang paraan na nagpapahintulot sa isa na matukoy ang lakas at direksyon ng relasyon sa pagitan ng dalawang katangian o dalawang hierarchy ng mga katangian. Ang paggamit ng rank correlation coefficient ay may bilang ng mga limitasyon:

    • a) Ang ipinapalagay na pag-asa sa ugnayan ay dapat na monotoniko.
    • b) Ang laki ng bawat sample ay dapat na mas malaki sa o katumbas ng 5. Upang matukoy itaas na limitasyon ang mga sample ay gumagamit ng mga talahanayan ng mga kritikal na halaga (Appendix Table 3). Ang maximum na halaga ng n sa talahanayan ay 40.
    • c) Sa panahon ng pagsusuri, malamang na ang isang malaking bilang ng magkatulad na ranggo ay maaaring lumitaw. Sa kasong ito, ang isang susog ay dapat gawin. Ang pinaka-kanais-nais na kaso ay kapag ang parehong mga sample sa ilalim ng pag-aaral ay kumakatawan sa dalawang pagkakasunud-sunod ng magkakaibang mga halaga.

    Upang magsagawa ng pagsusuri ng ugnayan, ang mananaliksik ay dapat magkaroon ng dalawang sample na maaaring mai-rank, halimbawa:

    • - dalawang katangian na sinusukat sa parehong pangkat ng mga paksa;
    • - dalawang indibidwal na hierarchy ng mga katangian na natukoy sa dalawang paksa gamit ang parehong hanay ng mga katangian;
    • - dalawang pangkat na hierarchy ng mga katangian;
    • - indibidwal at pangkat na mga hierarchy ng mga katangian.

    Sinisimulan namin ang pagkalkula sa pamamagitan ng pagraranggo ng mga pinag-aralan na tagapagpahiwatig nang hiwalay para sa bawat isa sa mga katangian.

    Suriin natin ang isang kaso na may dalawang palatandaan na sinusukat sa parehong grupo ng mga paksa. Una, ang mga indibidwal na halaga na nakuha ng iba't ibang mga paksa ay niraranggo ayon sa unang katangian, at pagkatapos ay ang mga indibidwal na halaga ay niraranggo ayon sa pangalawang katangian. Kung ang mas mababang mga ranggo ng isang tagapagpahiwatig ay tumutugma sa mas mababang mga ranggo ng isa pang tagapagpahiwatig, at ang mas mataas na mga ranggo ng isang tagapagpahiwatig ay tumutugma sa mas mataas na mga ranggo ng isa pang tagapagpahiwatig, kung gayon ang dalawang katangian ay positibong nauugnay. Kung ang mas mataas na ranggo ng isang tagapagpahiwatig ay tumutugma sa mas mababang ranggo ng isa pang tagapagpahiwatig, kung gayon ang dalawang katangian ay negatibong nauugnay. Upang mahanap ang rs, tinutukoy namin ang mga pagkakaiba sa pagitan ng mga ranggo (d) para sa bawat paksa. Kung mas maliit ang pagkakaiba sa pagitan ng mga ranggo, mas malapit ang koepisyent ng ugnayan ng ranggo rs sa "+1". Kung walang relasyon, kung gayon walang magiging sulat sa pagitan nila, kaya ang rs ay magiging malapit sa zero. Kung mas malaki ang pagkakaiba sa pagitan ng mga ranggo ng mga paksa sa dalawang variable, mas malapit sa "-1" ang halaga ng rs coefficient. Kaya, ang koepisyent ng ugnayan ng ranggo ng Spearman ay isang sukatan ng anumang monotonikong relasyon sa pagitan ng dalawang katangiang pinag-aaralan.

    Isaalang-alang natin ang kaso na may dalawang indibidwal na hierarchy ng mga katangiang natukoy sa dalawang paksa gamit ang parehong hanay ng mga katangian. Sa sitwasyong ito, ang mga indibidwal na halaga na nakuha ng bawat isa sa dalawang paksa ay niraranggo ayon sa isang tiyak na hanay ng mga katangian. Ang tampok na may pinakamababang halaga ay dapat italaga sa unang ranggo; ang katangian na may mas mataas na halaga ay ang pangalawang ranggo, atbp. Dapat bayaran Espesyal na atensyon upang matiyak na ang lahat ng mga katangian ay sinusukat sa parehong mga yunit. Halimbawa, imposibleng mag-ranggo ng mga tagapagpahiwatig kung ang mga ito ay ipinahayag sa iba't ibang mga punto ng "presyo", dahil imposibleng matukoy kung alin sa mga kadahilanan ang mauuna sa mga tuntunin ng kalubhaan hanggang ang lahat ng mga halaga ay dinadala sa isang solong sukat. Kung ang mga feature na may mababang rank sa isa sa mga subject ay may mababang rank din sa isa pa, at vice versa, ang mga indibidwal na hierarchy ay positibong nauugnay.

    Sa kaso ng dalawang pangkat na hierarchies ng mga katangian, ang average na halaga ng pangkat na nakuha sa dalawang grupo ng mga paksa ay niraranggo ayon sa parehong hanay ng mga katangian para sa mga pinag-aralan na grupo. Susunod, sinusunod namin ang algorithm na ibinigay sa mga nakaraang kaso.

    Suriin natin ang isang kaso na may indibidwal at pangkat na hierarchy ng mga katangian. Nagsisimula sila sa hiwalay na pagraranggo ng mga indibidwal na halaga ng paksa at ang average na mga halaga ng pangkat ayon sa parehong hanay ng mga katangian na nakuha, hindi kasama ang paksa na hindi nakikilahok sa karaniwang hierarchy ng grupo, dahil ang kanyang indibidwal na hierarchy ay magiging kumpara dito. Ang ugnayan ng ranggo ay nagpapahintulot sa amin na masuri ang antas ng pagkakapare-pareho ng indibidwal at pangkat na hierarchy ng mga katangian.

    Isaalang-alang natin kung paano natutukoy ang kahalagahan ng koepisyent ng ugnayan sa mga kasong nakalista sa itaas. Sa kaso ng dalawang katangian, ito ay matutukoy sa pamamagitan ng laki ng sample. Sa kaso ng dalawang indibidwal na hierarchy ng tampok, ang kahalagahan ay depende sa bilang ng mga tampok na kasama sa hierarchy. Sa huling dalawang kaso, ang kahalagahan ay tinutukoy ng bilang ng mga katangiang pinag-aaralan, at hindi ng bilang ng mga grupo. Kaya, ang kahalagahan ng rs sa lahat ng mga kaso ay tinutukoy ng bilang ng mga ranggo na halaga n.

    Kapag sinusuri ang istatistikal na kahalagahan ng rs, gumagamit sila ng mga talahanayan ng mga kritikal na halaga ng koepisyent ng ugnayan ng ranggo na pinagsama-sama para sa iba't ibang bilang ng mga ranggo na halaga at iba't ibang antas kahalagahan. Kung ang ganap na halaga ng rs ay umabot o lumampas sa isang kritikal na halaga, kung gayon ang ugnayan ay maaasahan.

    Kapag isinasaalang-alang ang unang opsyon (isang kaso na may dalawang palatandaan na sinusukat sa parehong grupo ng mga paksa), ang mga sumusunod na hypotheses ay posible.

    H0: Ang ugnayan sa pagitan ng mga variable na x at y ay hindi naiiba sa zero.

    H1: Ang ugnayan sa pagitan ng mga variable na x at y ay makabuluhang naiiba mula sa zero.

    Kung makikipagtulungan tayo sa alinman sa tatlong natitirang mga kaso, kinakailangan na maglagay ng isa pang pares ng mga hypotheses:

    H0: Ang ugnayan sa pagitan ng mga hierarchies x at y ay hindi naiiba sa zero.

    H1: Ang ugnayan sa pagitan ng mga hierarchies x at y ay makabuluhang naiiba mula sa zero.

    Ang pagkakasunud-sunod ng mga aksyon kapag kinakalkula ang Spearman rank correlation coefficient rs ay ang mga sumusunod.

    • - Tukuyin kung aling dalawang feature o dalawang hierarchy ng mga feature ang lalahok sa paghahambing bilang mga variable na x at y.
    • - I-ranggo ang mga halaga ng variable x, na nagtatalaga ng ranggo ng 1 pinakamababang halaga, alinsunod sa mga panuntunan sa pagraranggo. Ilagay ang mga ranggo sa unang hanay ng talahanayan sa pagkakasunud-sunod ng mga paksa o katangian ng pagsusulit.
    • - Ranggo ang mga halaga ng variable y. Ilagay ang mga ranggo sa ikalawang hanay ng talahanayan sa pagkakasunud-sunod ng mga paksa o katangian ng pagsusulit.
    • - Kalkulahin ang mga pagkakaiba d sa pagitan ng mga ranggo x at y para sa bawat hilera ng talahanayan. Ilagay ang mga resulta sa susunod na hanay ng talahanayan.
    • - Kalkulahin ang mga parisukat na pagkakaiba (d2). Ilagay ang mga resultang halaga sa ikaapat na hanay ng talahanayan.
    • - Kalkulahin ang kabuuan ng mga parisukat na pagkakaiba? d2.
    • - Kung magkakaroon ng magkatulad na ranggo, kalkulahin ang mga pagwawasto:

    kung saan ang tx ay ang dami ng bawat pangkat ng magkatulad na ranggo sa sample x;

    Ang ty ay ang dami ng bawat pangkat ng magkatulad na ranggo sa sample y.

    Kalkulahin ang rank correlation coefficient depende sa presensya o kawalan ng magkatulad na ranggo. Kung walang magkaparehong mga ranggo, kalkulahin ang koepisyent ng ugnayan ng ranggo rs gamit ang formula:

    Kung may magkaparehong ranggo, kalkulahin ang rank correlation coefficient rs gamit ang formula:

    saan?d2 ay ang kabuuan ng mga parisukat na pagkakaiba sa pagitan ng mga ranggo;

    Tx at Ty - mga pagwawasto para sa pantay na ranggo;

    n ay ang bilang ng mga paksa o tampok na kalahok sa pagraranggo.

    Tukuyin ang mga kritikal na halaga ng rs mula sa Appendix Table 3 para sa isang naibigay na bilang ng mga paksa n. Ang isang makabuluhang pagkakaiba mula sa zero ng koepisyent ng ugnayan ay mapapansin kung ang rs ay hindi bababa sa kritikal na halaga.



    Bago sa site

    >

    Pinaka sikat