Bahay Pagtanggal Paano mahahanap ang halaga ng talahanayan ng pamantayan ng Fisher. Criterion φ*—Pagbabago ng angular ng Fisher

Paano mahahanap ang halaga ng talahanayan ng pamantayan ng Fisher. Criterion φ*—Pagbabago ng angular ng Fisher

Pamantayan ng Fisher nagbibigay-daan sa iyo na ihambing ang mga pagkakaiba-iba ng sample ng dalawang independiyenteng sample. Upang kalkulahin ang F emp, kailangan mong hanapin ang ratio ng mga pagkakaiba-iba ng dalawang sample, upang ang mas malaking pagkakaiba ay nasa numerator, at ang mas maliit ay nasa denominator. Ang formula para sa pagkalkula ng Fisher criterion ay:

kung saan ang mga pagkakaiba-iba ng una at pangalawang sample, ayon sa pagkakabanggit.

Dahil, ayon sa kondisyon ng criterion, ang halaga ng numerator ay dapat na mas malaki kaysa o katumbas ng halaga ng denominator, ang halaga ng F emp ay palaging mas malaki kaysa o katumbas ng isa.

Ang bilang ng mga antas ng kalayaan ay natutukoy din nang simple:

k 1 =n l - 1 para sa unang sample (i.e. para sa sample na mas malaki ang pagkakaiba) at k 2 = n 2 - 1 para sa pangalawang sample.

Sa Appendix 1, ang mga kritikal na halaga ng Fisher criterion ay matatagpuan sa pamamagitan ng mga halaga ng k 1 (itaas na linya ng talahanayan) at k 2 (kaliwang haligi ng talahanayan).

Kung t em >t crit, kung gayon ang null hypothesis ay tinatanggap, kung hindi ang alternatibo ay tinatanggap.

Halimbawa 3. Ang pagsubok ay isinagawa sa dalawang ikatlong baitang pag-unlad ng kaisipan sampung mag-aaral sa pagsusulit sa TURMSH. Ang nakuha na average na mga halaga ay hindi naiiba nang malaki, ngunit ang psychologist ay interesado sa tanong kung may mga pagkakaiba sa antas ng homogeneity ng mga tagapagpahiwatig ng pag-unlad ng kaisipan sa pagitan ng mga klase.

Solusyon. Para sa pagsusulit ni Fisher, kinakailangang ihambing ang mga pagkakaiba-iba ng mga marka ng pagsusulit sa parehong mga klase. Ang mga resulta ng pagsubok ay ipinakita sa talahanayan:

Talahanayan 3.

Student nos.

Unang klase

Pangalawang klase

Ang pagkakaroon ng pagkalkula ng mga pagkakaiba-iba para sa mga variable X at Y, nakuha namin ang:

s x 2 =572.83; s y 2 =174,04

Pagkatapos, gamit ang formula (8) para sa pagkalkula gamit ang Fisher's F criterion, makikita natin ang:

Ayon sa talahanayan mula sa Appendix 1 para sa F criterion na may mga antas ng kalayaan sa parehong mga kaso na katumbas ng k = 10 - 1 = 9, nakita namin ang F crit = 3.18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 Mga pagsubok na hindi parametric

Sa pamamagitan ng paghahambing sa pamamagitan ng mata (sa porsyento) ng mga resulta bago at pagkatapos ng anumang epekto, ang mananaliksik ay dumating sa konklusyon na kung ang mga pagkakaiba ay sinusunod, kung gayon mayroong pagkakaiba sa mga sample na inihambing. Ang diskarte na ito ay tiyak na hindi katanggap-tanggap, dahil para sa mga porsyento imposibleng matukoy ang antas ng pagiging maaasahan sa mga pagkakaiba. Ang mga porsyento na kinuha sa kanilang sarili ay hindi ginagawang posible na gumuhit ng maaasahang mga konklusyon ayon sa istatistika. Upang patunayan ang pagiging epektibo ng anumang interbensyon, kinakailangan upang matukoy ang isang makabuluhang trend sa istatistika sa bias (shift) ng mga tagapagpahiwatig. Upang malutas ang mga naturang problema, maaaring gumamit ang isang mananaliksik ng ilang pamantayan sa diskriminasyon. Sa ibaba ay isasaalang-alang namin ang mga non-parametric na pagsusulit: ang sign test at ang chi-square test.

Ang kahalagahan ng multiple regression equation sa kabuuan, gayundin sa paired regression, ay tinasa gamit ang Fisher criterion:

, (2.22)

saan
– factor sum ng mga parisukat sa bawat antas ng kalayaan;
– natitirang kabuuan ng mga parisukat bawat antas ng kalayaan;
– koepisyent (index) ng maramihang pagpapasiya;
– bilang ng mga parameter para sa mga variable (sa linear regression ito ay tumutugma sa bilang ng mga kadahilanan na kasama sa modelo); - bilang ng mga obserbasyon.

Ang kahalagahan ng hindi lamang ang equation sa kabuuan ay tinasa, kundi pati na rin ang salik na kasama pa sa modelo ng regression. Ang pangangailangan para sa naturang pagtatasa ay dahil sa ang katunayan na hindi lahat ng kadahilanan na kasama sa modelo ay maaaring makabuluhang taasan ang proporsyon ng ipinaliwanag na pagkakaiba-iba sa resultang katangian. Bilang karagdagan, kung mayroong ilang mga kadahilanan sa modelo, maaari silang ipasok sa modelo sa iba't ibang mga pagkakasunud-sunod. Dahil sa ugnayan sa pagitan ng mga kadahilanan, ang kahalagahan ng parehong kadahilanan ay maaaring magkakaiba depende sa pagkakasunud-sunod ng pagpapakilala nito sa modelo. Ang panukala para sa pagtatasa ng pagsasama ng isang salik sa modelo ay ang pribado
-pamantayan, i.e. .

Pribado
-criterion ay batay sa paghahambing ng pagtaas sa factor dispersion dahil sa impluwensya ng isang karagdagang kasamang factor sa natitirang dispersion sa bawat isang antas ng kalayaan para sa regression model sa kabuuan. Sa mga pangkalahatang tuntunin para sa kadahilanan pribado
-ang criterion ay matutukoy bilang

, (2.23)

saan
– koepisyent ng maramihang pagpapasiya para sa isang modelo na may buong hanay ng mga kadahilanan,
– ang parehong tagapagpahiwatig, ngunit hindi kasama ang kadahilanan sa modelo ,- bilang ng mga obserbasyon,
– bilang ng mga parameter sa modelo (nang walang libreng termino).

Aktwal na halaga ng quotient
- ang criterion ay inihambing sa talahanayan sa antas ng kahalagahan
at bilang ng mga antas ng kalayaan: 1 at
. Kung ang aktwal na halaga lumampas
, pagkatapos ay ang karagdagang pagsasama ng kadahilanan sa modelo ay nabibigyang katwiran ayon sa istatistika at ang purong regression coefficient sa kadahilanan makabuluhang istatistika. Kung ang aktwal na halaga ay mas mababa kaysa sa halaga ng talahanayan, pagkatapos ay karagdagang pagsasama ng kadahilanan sa modelo hindi makabuluhang pinapataas ang proporsyon ng ipinaliwanag na pagkakaiba-iba sa isang katangian , samakatuwid, hindi nararapat na isama ito sa modelo; Ang regression coefficient para sa salik na ito sa kasong ito ay hindi gaanong mahalaga sa istatistika.

Para sa isang two-factor equation, ang mga quotient
-ang mga pamantayan ay may anyo:

,
. (2.23a)

Gamit ang pribado
-criterion, masusuri ng isa ang kahalagahan ng lahat ng coefficient ng regression sa ilalim ng pag-aakalang ang bawat katumbas na salik huling pumasok sa multiple regression equation.

-Pagsusulit ng mag-aaral para sa multiple regression equation.

Pribado
-nasusuri ng criterion ang kahalagahan ng purong regression coefficients. Alam ang magnitude , posibleng matukoy -criterion para sa regression coefficient sa -m factor, , ibig sabihin:

. (2.24)

Pagtatasa ng kahalagahan ng purong regression coefficients sa pamamagitan ng -Ang t-test ng mag-aaral ay maaaring isagawa nang hindi kinakalkula ang partial
-pamantayan. Sa kasong ito, tulad ng sa pairwise regression, ang formula ay ginagamit para sa bawat salik:

, (2.25)

saan – purong regression coefficient sa factor ,– mean square (standard) error ng regression coefficient .

Para sa isang multiple regression equation, ang mean square error ng regression coefficient ay maaaring matukoy ng sumusunod na formula:

, (2.26)

saan ,– karaniwang paglihis para sa katangian ,
– koepisyent ng determinasyon para sa multiple regression equation,
– koepisyent ng determinasyon para sa pagtitiwala ng salik kasama ang lahat ng iba pang salik sa multiple regression equation;
– bilang ng mga antas ng kalayaan para sa natitirang kabuuan ng mga squared deviations.

Tulad ng nakikita mo, upang magamit ang formula na ito, kailangan mo ng isang interfactor correlation matrix at ang pagkalkula ng kaukulang mga coefficient ng pagpapasiya gamit ito.
. Kaya, para sa equation
pagtatasa ng kahalagahan ng regression coefficients ,,nagsasangkot ng pagkalkula ng tatlong interfactor determination coefficient:
,
,
.

Ang ugnayan sa pagitan ng mga tagapagpahiwatig ng bahagyang koepisyent ng ugnayan, bahagyang
-pamantayan at -Ang t-test ng mag-aaral para sa mga purong regression coefficient ay maaaring gamitin sa pamamaraan ng pagpili ng salik. Ang pag-aalis ng mga kadahilanan kapag bumubuo ng isang equation ng regression sa pamamagitan ng paraan ng pag-aalis ay maaaring praktikal na isagawa hindi lamang sa pamamagitan ng bahagyang mga koepisyent ng ugnayan, hindi kasama sa bawat hakbang ang kadahilanan na may pinakamaliit na hindi gaanong halaga ng bahagyang koepisyent ng ugnayan, kundi pati na rin ng mga halaga. At . Pribado
-Ang pamantayan ay malawakang ginagamit kapag gumagawa ng isang modelo gamit ang paraan ng pagsasama ng mga variable at ang stepwise regression method.

)

Pagkalkula ng criterion φ*

1. Tukuyin ang mga halaga ng katangian na magiging pamantayan para sa paghahati ng mga paksa sa mga "may epekto" at sa mga "walang epekto." Kung ang katangian ay sinusukat nang quantitative, gamitin ang λ criterion upang mahanap ang pinakamainam na separation point.

2. Gumuhit ng apat na cell (kasingkahulugan: apat na patlang) na talahanayan ng dalawang hanay at dalawang hanay. Ang unang column ay "may epekto"; pangalawang hanay - "walang epekto"; unang linya mula sa itaas - 1 pangkat (sample); pangalawang linya - pangkat 2 (sample).

4. Bilangin ang bilang ng mga paksa sa unang sample na "walang epekto" at ilagay ang numerong ito sa kanang itaas na cell ng talahanayan. Kalkulahin ang kabuuan ng dalawang nangungunang mga cell. Dapat itong tumugma sa bilang ng mga paksa sa unang pangkat.

6. Bilangin ang bilang ng mga paksa sa pangalawang sample na "walang epekto" at ilagay ang numerong ito sa kanang ibabang selula ng talahanayan. Kalkulahin ang kabuuan ng dalawang mas mababang mga cell. Dapat itong tumugma sa bilang ng mga paksa sa pangalawang pangkat (sample).

7. Tukuyin ang porsyento ng mga paksa na "may epekto" sa pamamagitan ng pag-uugnay ng kanilang bilang sa kabuuang bilang ng mga paksa sa isang partikular na grupo (sample). Isulat ang mga resultang porsyento sa kaliwang itaas at kaliwang ibabang mga cell ng talahanayan sa mga panaklong, ayon sa pagkakabanggit, upang hindi malito ang mga ito sa mga ganap na halaga.

8. Suriin upang makita kung ang isa sa mga porsyento na inihambing ay katumbas ng zero. Kung ito ang kaso, subukang baguhin ito sa pamamagitan ng paglipat ng punto ng paghihiwalay ng grupo sa isang direksyon o sa isa pa. Kung ito ay imposible o hindi kanais-nais, iwanan ang φ* criterion at gamitin ang χ2 criterion.

9. Tukuyin ayon sa Talahanayan. XII Appendix 1 anggulo φ para sa bawat isa sa mga inihambing na porsyento.

kung saan: φ1 - anggulo na tumutugma sa mas malaking porsyento;

φ2 - anggulo na naaayon sa mas maliit na porsyento;

N1 - bilang ng mga obserbasyon sa sample 1;

N2 - bilang ng mga obserbasyon sa sample 2.

11. Ihambing ang nakuhang halaga φ* sa mga kritikal na halaga: φ* ≤1.64 (p<0,05) и φ* ≤2,31 (р<0,01).

Kung φ*emp ≤φ*cr. Tinanggihan ang H0.

Kung kinakailangan, tukuyin ang eksaktong antas ng kahalagahan ng nagreresultang φ*emp ayon sa Talahanayan. XIII Appendix 1.

Ang pamamaraang ito ay inilarawan sa maraming mga manwal (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992, atbp.) Ang paglalarawang ito ay batay sa bersyon ng pamamaraan na binuo at ipinakita ng E.V. Gubler.

Layunin ng criterion φ*

Ang Fisher criterion ay inilaan upang ihambing ang dalawang sample ayon sa dalas ng paglitaw ng epekto (indicator) ng interes sa mananaliksik. Kung mas malaki ito, mas maaasahan ang mga pagkakaiba.

Paglalarawan ng pamantayan

Sinusuri ng criterion ang pagiging maaasahan ng mga pagkakaiba sa pagitan ng mga porsyento ng dalawang sample kung saan naitala ang epekto (tagapagpahiwatig) ng interes sa amin. Sa matalinghagang pagsasalita, ikinukumpara namin ang 2 pinakamahusay na piraso na pinutol mula sa 2 pie at nagpapasya kung alin ang tunay na mas malaki.

Ang kakanyahan ng pagbabagong angular ng Fisher ay ang pag-convert ng mga porsyento sa mga halaga ng gitnang anggulo, na sinusukat sa mga radian. Ang isang mas malaking porsyento ay tumutugma sa isang mas malaking anggulo φ, at isang mas maliit na porsyento ay tumutugma sa isang mas maliit na anggulo, ngunit ang mga relasyon dito ay hindi linear:

kung saan ang P ay ang porsyento na ipinahayag sa mga fraction ng isang yunit (tingnan ang Fig. 5.1).

Sa pagtaas ng pagkakaiba sa pagitan ng mga anggulo φ 1 at φ 2 at pagtaas ng bilang ng mga sample, tumataas ang halaga ng criterion. Kung mas malaki ang halaga ng φ*, mas malamang na makabuluhan ang mga pagkakaiba.

Hypotheses

H 0 : Proporsyon ng mga tao, kung saan ang pinag-aralan na epekto ay nagpapakita mismo, wala nang higit pa sa sample 1 kaysa sa sample 2.

H 1 : Ang proporsyon ng mga indibidwal na nagpapakita ng pinag-aralan na epekto ay mas malaki sa sample 1 kaysa sa sample 2.

Graphical na representasyon ng criterion φ*

Ang paraan ng pagbabagong angular ay medyo mas abstract kaysa sa iba pang pamantayan.

Ang formula na sinusundan ng E.V. Gubler kapag kinakalkula ang mga halaga ng φ ay ipinapalagay na ang 100% ay bumubuo ng isang anggulo φ=3.142, iyon ay, isang bilugan na halaga π=3.14159... Ito ay nagbibigay-daan sa amin upang ipakita ang mga inihambing na mga sample sa anyo ng dalawang kalahating bilog, bawat isa ay sumisimbolo sa 100% ng populasyon ng sample nito. Ang mga porsyento ng mga paksa na may "epekto" ay kakatawanin bilang mga sektor na nabuo ng mga gitnang anggulo φ. Sa Fig. Ang Figure 5.2 ay nagpapakita ng dalawang kalahating bilog na naglalarawan ng Halimbawa 1. Sa unang sample, 60% ng mga paksa ang nalutas ang problema. Ang porsyentong ito ay tumutugma sa anggulo φ=1.772. Sa pangalawang sample, 40% ng mga paksa ang nalutas ang problema. Ang porsyentong ito ay tumutugma sa anggulo φ =1.369.

Ang φ* criterion ay nagbibigay-daan sa amin na matukoy kung ang isa sa mga anggulo ay talagang higit na mataas sa istatistika kaysa sa isa para sa mga ibinigay na laki ng sample.

Mga limitasyon ng pamantayan φ*

1. Wala sa mga proporsyon na inihahambing ang dapat na zero. Sa pormal, walang mga hadlang sa paggamit ng φ na pamamaraan sa mga kaso kung saan ang proporsyon ng mga obserbasyon sa isa sa mga sample ay katumbas ng 0. Gayunpaman, sa mga kasong ito, ang resulta ay maaaring lumabas na hindi makatwiran na napalaki (Gubler E.V., 1978, p. . 86).

2. Itaas walang limitasyon sa φ criterion - ang mga sample ay maaaring kasing laki ng ninanais.

Ibaba limitasyon - 2 obserbasyon sa isa sa mga sample. Gayunpaman, ang mga sumusunod na ratios sa bilang ng dalawang sample ay dapat sundin:

a) kung ang isang sample ay may 2 obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 30:

b) kung ang isa sa mga sample ay may 3 obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 7:

c) kung ang isa sa mga sample ay may 4 na obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 5:

d) san 1 , n 2 ≥ 5 Posible ang anumang paghahambing.

Sa prinsipyo, posible ring ihambing ang mga sample na hindi nakakatugon sa kundisyong ito, halimbawa, sa kaugnayann 1 =2, n 2 = 15, ngunit sa mga kasong ito ay hindi posibleng matukoy ang mga makabuluhang pagkakaiba.

Ang φ* criterion ay walang ibang paghihigpit.

Tingnan natin ang ilang mga halimbawa upang ilarawan ang mga posibilidadpamantayan φ*.

Halimbawa 1: paghahambing ng mga sample ayon sa isang qualitatively tinukoy na katangian.

Halimbawa 2: paghahambing ng mga sample ayon sa isang quantitatively measured na katangian.

Halimbawa 3: paghahambing ng mga sample sa parehong antas at pamamahagi ng isang katangian.

Halimbawa 4: Paggamit ng φ* criterion kasama ng criterionX Kolmogorov-Smirnov upang makamit ang pinakatumpak na resulta.

Halimbawa 1 - paghahambing ng mga sample ayon sa isang qualitatively tinukoy na katangian

Sa paggamit na ito ng criterion, inihahambing namin ang porsyento ng mga paksa sa isang sample na nailalarawan ng ilang kalidad sa porsyento ng mga paksa sa isa pang sample na nailalarawan sa parehong kalidad.

Sabihin nating interesado tayo kung magkaiba ang dalawang grupo ng mga mag-aaral sa kanilang tagumpay sa paglutas ng bagong pang-eksperimentong problema. Sa unang grupo ng 20 katao, 12 tao ang nakayanan ito, at sa pangalawang sample ng 25 tao - 10. Sa unang kaso, ang porsyento ng mga nakalutas sa problema ay magiging 12/20·100%=60%, at sa pangalawang 10/25·100%= 40%. Malaki ba ang pagkakaiba ng mga porsyentong ito dahil sa data?n 1 Atn 2 ?

Tila kahit na "sa pamamagitan ng mata" ay maaaring matukoy ng isa na ang 60% ay mas mataas kaysa sa 40%. Gayunpaman, sa katunayan, ang mga pagkakaibang ito, na ibinigay sa datan 1 , n 2 hindi mapagkakatiwalaan.

Tingnan natin ito. Dahil interesado kami sa katotohanan ng paglutas ng problema, isasaalang-alang namin ang tagumpay sa paglutas ng pang-eksperimentong problema bilang isang "epekto", at ang pagkabigo sa paglutas nito bilang kawalan ng epekto.

Bumuo tayo ng mga hypotheses.

H 0 : Proporsyon ng mga taoWala nang mga taong nakatapos ng gawain sa unang pangkat kaysa sa pangalawang pangkat.

H 1 : Ang proporsyon ng mga taong nakatapos ng gawain sa unang pangkat ay mas malaki kaysa sa pangalawang pangkat.

Ngayon, buuin natin ang tinatawag na four-cell, o four-field table, na talagang isang talahanayan ng mga empirical frequency para sa dalawang halaga ng katangian: "may epekto" - "walang epekto."

Talahanayan 5.1

Four-cell table para sa pagkalkula ng criterion kapag naghahambing ng dalawang grupo ng mga paksa ayon sa porsyento ng mga nakalutas sa problema.

Mga grupo

"May epekto": nalutas ang problema

"Walang epekto": hindi nalutas ang problema

Mga halaga

Dami

mga paksa

% ibahagi

Dami

mga paksa

% share

1 pangkat

(60%)

(40%)

2nd group

(40%)

(60%)

Mga halaga

Sa isang four-cell table, bilang panuntunan, ang mga column na "May epekto" at "Walang epekto" ay minarkahan sa itaas, at ang mga row na "Group 1" at "Group 2" ay nasa kaliwa. Sa katunayan, ang mga patlang (mga cell) A at B lamang ang kasama sa mga paghahambing, iyon ay, mga porsyento sa column na "May epekto."

Ayon sa TalahanayanXIITinutukoy ng Appendix 1 ang mga halaga ng φ na naaayon sa porsyento ng pagbabahagi sa bawat isa sa mga pangkat.

Ngayon kalkulahin natin ang empirical na halaga ng φ* gamit ang formula:

saan φ 1 - anggulo na katumbas ng mas malaking % share;

φ 2 - anggulo na katumbas ng mas maliit na % share;

n 1 - bilang ng mga obserbasyon sa sample 1;

n 2 - bilang ng mga obserbasyon sa sample 2.

Sa kasong ito:

Ayon sa TalahanayanXIIISa Appendix 1, tinutukoy natin kung anong antas ng kahalagahan ang tumutugma sa φ* em=1,34:

p=0.09

Posible ring magtatag ng mga kritikal na halaga ng φ* na naaayon sa mga antas ng istatistikal na kahalagahan na tinatanggap sa sikolohiya:

Bumuo tayo ng "significance axis".

Ang nakuhang empirical value φ* ay nasa zone of insignificance.

Sagot: H 0 tinanggap. Ang porsyento ng mga taong nakakumpleto ng gawainVsa unang pangkat hindi hihigit sa pangalawang pangkat.

Maaari lamang makiramay ang isa sa isang mananaliksik na isinasaalang-alang ang mga pagkakaiba na 20% at kahit na 10% ay makabuluhan nang hindi sinusuri ang kanilang pagiging maaasahan gamit ang φ* criterion. Sa kasong ito, halimbawa, ang mga pagkakaiba lamang ng hindi bababa sa 24.3% ang magiging makabuluhan.

Tila kapag naghahambing ng dalawang sample sa anumang husay na batayan, ang φ criterion ay maaaring makapagpalungkot sa atin sa halip na maging masaya. Ang tila makabuluhan ay maaaring hindi ganoon mula sa istatistikal na pananaw.

Ang criterion ng Fisher ay may higit pang mga pagkakataon upang masiyahan ang mananaliksik kapag inihambing namin ang dalawang sample ayon sa mga katangiang nasusukat sa dami at maaaring mag-iba ang "epekto."

Halimbawa 2 - paghahambing ng dalawang sample ayon sa isang quantitatively measured na katangian

Sa ganitong paggamit ng pamantayan, inihahambing namin ang porsyento ng mga paksa sa isang sample na nakakamit ng isang partikular na antas ng halaga ng katangian sa porsyento ng mga paksa na nakakamit ang antas na ito sa isa pang sample.

Sa isang pag-aaral ni G. A. Tlegenova (1990), sa 70 kabataang mag-aaral sa vocational school na may edad 14 hanggang 16 na taon, 10 subject na may mataas na marka sa Aggression scale at 11 subject na may mababang score sa Aggression scale ang napili batay sa resulta. ng isang survey gamit ang Freiburg Personality Questionnaire. Kinakailangang matukoy kung ang mga grupo ng agresibo at hindi agresibong mga kabataang lalaki ay naiiba sa mga tuntunin ng distansya na kusang pinili nila sa pakikipag-usap sa isang kapwa mag-aaral. Ang data ng G. A. Tlegenova ay ipinakita sa Talahanayan. 5.2. Mapapansin mo na ang mga agresibong kabataang lalaki ay mas madalas na pumili ng layo na 50cm o mas kaunti pa, habang ang mga hindi agresibong lalaki ay mas madalas na pumili ng layo na higit sa 50 cm.

Ngayon ay maaari nating isaalang-alang ang isang distansya na 50 cm bilang kritikal at ipagpalagay na kung ang distansya na pinili ng paksa ay mas mababa sa o katumbas ng 50 cm, kung gayon "may epekto," at kung ang napiling distansya ay higit sa 50 cm, kung gayon "Walang epekto." Nakikita namin na sa grupo ng mga agresibong kabataang lalaki ang epekto ay sinusunod sa 7 sa 10, i.e. sa 70% ng mga kaso, at sa grupo ng mga hindi agresibong kabataang lalaki - sa 2 sa 11, i.e. sa 18.2% ng mga kaso . Ang mga porsyentong ito ay maihahambing gamit ang φ* na pamamaraan upang maitaguyod ang kahalagahan ng mga pagkakaiba sa pagitan ng mga ito.

Talahanayan 5.2

Mga tagapagpahiwatig ng distansya (sa cm) na pinili ng mga agresibo at hindi agresibong kabataang lalaki sa pakikipag-usap sa kapwa mag-aaral (ayon kay G.A. Tlegenova, 1990)

Pangkat 1: mga lalaki na may matataas na marka sa sukat ng AggressionFPI- R (n 1 =10)

Pangkat 2: mga batang lalaki na may mababang halaga sa scale ng AggressionFPI- R (n 2 =11)

d(c m )

% share

d(c M )

% share

"Kumain ka na

epekto"

d≤50cm

18,2%

"Hindi

epekto"

d>50 cm

80 QO

81,8%

Mga halaga

100%

100%

Katamtaman

5b:o

77.3

Bumuo tayo ng mga hypotheses.

H 0 d 50 cm, sa grupo ng mga agresibong lalaki ay wala nang hihigit pa sa grupo ng mga hindi agresibong lalaki.

H 1 : Proporsyon ng mga taong pumipili ng distansyad50 cm, higit pa sa grupo ng mga agresibong binata kaysa sa grupo ng mga hindi agresibong binata. Ngayon, bumuo tayo ng tinatawag na four-cell table.

Talahanayan 53

Four-cell table para sa pagkalkula ng φ* criterion kapag naghahambing ng mga grupo ng agresibo (nf=10) at hindi agresibong kabataang lalaki (n2=11)

Mga grupo

"May epekto": d≤50

"Walang epekto." d>50

Mga halaga

Bilang ng mga paksa

(% bahagi)

Bilang ng mga paksa

(% bahagi)

Pangkat 1 - mga agresibong binata

(70%)

(30%)

Pangkat 2 - hindi agresibong mga kabataang lalaki

(180%)

(81,8%)

Sum

Ayon sa TalahanayanXIITinutukoy ng Appendix 1 ang mga halaga ng φ na naaayon sa porsyento ng mga bahagi ng "epekto" sa bawat isa sa mga pangkat.

Ang nakuhang empirical value φ* ay nasa zone of significance.

Sagot: H 0 tinanggihan. TinanggapH 1 . Ang proporsyon ng mga taong pumili ng distansya sa pag-uusap na mas mababa sa o katumbas ng 50 cm ay mas malaki sa grupo ng mga agresibong binata kaysa sa grupo ng mga hindi agresibong binata

Batay sa mga resultang nakuha, mahihinuha natin na ang mas agresibong kabataang lalaki ay mas madalas na pumili ng distansiyang mas mababa sa kalahating metro, habang ang hindi agresibong kabataang lalaki ay mas madalas na pumili ng distansiyang higit sa kalahating metro. Nakikita namin na ang mga agresibong binata ay aktwal na nakikipag-usap sa hangganan sa pagitan ng intimate (0-46 cm) at mga personal na zone (mula sa 46 cm). Naaalala namin, gayunpaman, na ang matalik na distansya sa pagitan ng mga kasosyo ay ang prerogative ng hindi lamang malapit, magandang relasyon, ngunitAtkamay-sa-kamay na labanan (HallE. T., 1959).

Halimbawa 3 - paghahambing ng mga sample sa parehong antas at pamamahagi ng katangian.

Sa ganitong kaso ng paggamit, maaari muna nating subukan kung ang mga pangkat ay naiiba sa mga antas ng ilang katangian at pagkatapos ay ihambing ang mga distribusyon ng katangian sa dalawang sample. Ang ganitong gawain ay maaaring may kaugnayan kapag sinusuri ang mga pagkakaiba sa mga saklaw o hugis ng distribusyon ng mga pagtatasa na nakuha ng mga paksa gamit ang anumang bagong pamamaraan.

Sa isang pag-aaral ni R. T. Chirkina (1995), sa kauna-unahang pagkakataon, ginamit ang isang talatanungan na naglalayong tukuyin ang ugali na pigilan ang mga katotohanan, pangalan, intensyon at paraan ng pagkilos mula sa memorya dahil sa personal, pamilya at propesyonal na mga kumplikado. Ang talatanungan ay nilikha kasama ang pakikilahok ng E.V. Sidorenko batay sa mga materyales mula sa aklat na 3. Freud "Psychopathology of Everyday Life". Ang isang sample ng 50 mga mag-aaral ng Pedagogical Institute, walang asawa, walang mga anak, na may edad na 17 hanggang 20 taon, ay sinuri gamit ang talatanungan na ito, pati na rin ang diskarteng Menester-Corzini upang matukoy ang intensity ng pakiramdam ng personal na kakulangan,o"inferiority complex" (ManasterG. J., CorsiniR. J., 1982).

Ang mga resulta ng survey ay ipinakita sa Talahanayan. 5.4.

Posible bang sabihin na mayroong anumang makabuluhang ugnayan sa pagitan ng tagapagpahiwatig ng enerhiya ng panunupil, na nasuri gamit ang isang palatanungan, at mga tagapagpahiwatig ng tindi ng pakiramdam ng sariling kakulangan?

Talahanayan 5.4

Mga tagapagpahiwatig ng intensity ng mga damdamin ng personal na kakulangan sa mga grupo ng mga mag-aaral na may mataas na (nj=18) at mababang (n2=24) displacement energy

Pangkat 1: displacement energy mula 19 hanggang 31 puntos (n 1 =181

Pangkat 2: displacement energy mula 7 hanggang 13 puntos (n 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

Mga halaga

Katamtaman

26,11

15,42

Sa kabila ng katotohanan na ang average na halaga sa pangkat na may mas energetic na panunupil ay mas mataas, 5 zero na mga halaga ay sinusunod din dito. Kung ihahambing natin ang mga histogram ng pamamahagi ng mga rating sa dalawang sample, isang kapansin-pansing kaibahan ang makikita sa pagitan nila (Larawan 5.3).

Upang ihambing ang dalawang distribusyon maaari naming ilapat ang pagsubokχ 2 o pamantayanλ , ngunit para dito kailangan nating palakihin ang mga ranggo, at bilang karagdagan, sa parehong mga samplen <30.

Ang φ* criterion ay magbibigay-daan sa amin na suriin ang epekto ng pagkakaiba sa pagitan ng dalawang distribusyon na naobserbahan sa graph kung sumasang-ayon kaming ipagpalagay na "may epekto" kung ang tagapagpahiwatig ng mga damdamin ng kakulangan ay tumatagal ng alinman sa napakababa (0) o, sa kabaligtaran , napakataas na halaga (S30), at na "walang epekto" kung ang tagapagpahiwatig ng mga damdamin ng kakulangan ay tumatagal ng mga average na halaga, mula 5 hanggang 25.

Bumuo tayo ng mga hypotheses.

H 0 : Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas masiglang panunupil ay hindi mas karaniwan kaysa sa pangkat na may hindi gaanong masiglang panunupil.

H 1 : Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas masiglang panunupil ay mas karaniwan kaysa sa pangkat na may hindi gaanong masiglang panunupil.

Gumawa tayo ng four-cell table na maginhawa para sa karagdagang pagkalkula ng φ* criterion.

Talahanayan 5.5

Four-cell table para sa pagkalkula ng φ* criterion kapag inihahambing ang mga pangkat na may mas mataas at mas mababang repression energies batay sa ratio ng insufficiency indicators

Mga grupo

"May epekto": ang tagapagpahiwatig ng kakulangan ay 0 o >30

"Walang epekto": index ng pagkabigo mula 5 hanggang 25

Mga halaga

(88,9%)

(11,1%)

(33,3%)

(66,7%)

Mga halaga

Ayon sa TalahanayanXIISa Appendix 1, tinutukoy namin ang mga halaga ng φ na naaayon sa inihambing na mga porsyento:

Kalkulahin natin ang empirical na halaga ng φ*:

Mga kritikal na halaga ng φ* para sa anumann 1 , n 2 , gaya ng naaalala natin mula sa nakaraang halimbawa, ay:

mesaXIIIAng Appendix 1 ay nagpapahintulot sa amin na mas tumpak na matukoy ang antas ng kahalagahan ng resulta na nakuha: p<0,001.

Sagot: H 0 tinanggihan. TinanggapH 1 . Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas mataas na enerhiya ng panunupil ay nangyayari nang mas madalas kaysa sa pangkat na may mas kaunting enerhiya ng panunupil.

Kaya, ang mga paksa na may higit na lakas ng panunupil ay maaaring magkaroon ng parehong napakataas (30 o higit pa) at napakababa (zero) na mga tagapagpahiwatig ng pakiramdam ng kanilang sariling kakulangan. Maaaring ipagpalagay na pinipigilan nila ang kanilang kawalang-kasiyahan at ang pangangailangan para sa tagumpay sa buhay. Ang mga pagpapalagay na ito ay nangangailangan ng karagdagang pagsubok.

Ang nakuha na resulta, anuman ang interpretasyon nito, ay nagpapatunay sa mga kakayahan ng φ* criterion sa pagtatasa ng mga pagkakaiba sa hugis ng pamamahagi ng isang katangian sa dalawang sample.

Mayroong 50 tao sa orihinal na sample, ngunit 8 sa kanila ay hindi kasama sa pagsasaalang-alang bilang may average na marka sa repression anergy index (14-15). Ang kanilang mga tagapagpahiwatig ng intensity ng mga damdamin ng kakulangan ay karaniwan din: 6 na halaga ng 20 puntos bawat isa at 2 halaga ng 25 puntos bawat isa.

Ang makapangyarihang mga kakayahan ng φ* criterion ay maaaring ma-verify sa pamamagitan ng pagkumpirma ng isang ganap na naiibang hypothesis kapag sinusuri ang mga materyales ng halimbawang ito. Maaari nating patunayan, halimbawa, na sa isang pangkat na may higit na enerhiya ng panunupil, ang rate ng kakulangan ay mas mataas pa rin, sa kabila ng kabalintunaan ng pamamahagi nito sa grupong ito.

Bumuo tayo ng mga bagong hypotheses.

H 0 Ang pinakamataas na halaga ng index ng kakulangan (30 o higit pa) sa pangkat na may higit na enerhiya ng panunupil ay hindi mas karaniwan kaysa sa pangkat na may mas kaunting enerhiya ng panunupil.

H 1 : Ang pinakamataas na halaga ng index ng kakulangan (30 o higit pa) sa pangkat na may mas mataas na enerhiya ng panunupil ay nangyayari nang mas madalas kaysa sa pangkat na may mas kaunting enerhiya ng panunupil. Bumuo tayo ng four-field table gamit ang data sa Table. 5.4.

Talahanayan 5.6

Four-cell table para sa pagkalkula ng φ* criterion kapag inihahambing ang mga pangkat na may mas malaki at mas mababang repression energy ayon sa antas ng insufficiency indicator

Mga grupo

“May epekto”* mas malaki sa o katumbas ng 30 ang indicator ng pagkabigo

"Walang epekto": mas mababa ang rate ng pagkabigo 30

Mga halaga

Pangkat 1 - na may higit na enerhiya sa pag-aalis

(61,1%)

(38.9%)

Pangkat 2 - na may mas mababang displacement energy

(25.0%)

(75.0%)

Mga halaga

Ayon sa TalahanayanXIIISa Appendix 1, tinutukoy namin na ang resultang ito ay tumutugma sa antas ng kahalagahan ng p = 0.008.

Sagot: Ngunit ito ay tinanggihan. TinanggapHj: Ang pinakamataas na tagapagpahiwatig ng kakulangan (30 o higit pang mga puntos) sa grupoSana may mas malaking displacement energy ay nangyayari nang mas madalas kaysa sa grupo na may mas kaunting displacement energy (p = 0.008).

Kaya, napatunayan namin iyonVpangkatSana may mas masiglang panunupil, ang mga matinding halaga ng tagapagpahiwatig ng kakulangan ay nangingibabaw, at ang katotohanan na ang tagapagpahiwatig na ito ay lumampas sa mga halaga nitoumaboteksakto sa grupong ito.

Ngayon ay maaari naming subukan na patunayan na sa pangkat na may mas mataas na enerhiya ng panunupil, ang mas mababang mga halaga ng index ng kakulangan ay mas karaniwan, sa kabila ng katotohanan na ang average na halagaV ang pangkat na ito ay may higit pa (26.11 kumpara sa 15.42 sa grupoSa mas kaunting displacement).

Bumuo tayo ng mga hypotheses.

H 0 : Pinakamababang antas ng kakulangan (zero) sa grupoSa Ang mga pagsupil na may mas malaking enerhiya ay hindi mas karaniwan kaysa sa grupoSa mas kaunting displacement energy.

H 1 : Ang pinakamababang antas ng kakulangan (zero) ay nangyayariV pangkat na may mas mataas na enerhiya ng panunupil nang mas madalas kaysa sa grupoSa hindi gaanong masiglang panunupil. Ipangkat natin ang data sa isang bagong four-cell table.

Talahanayan 5.7

Four-cell table para sa paghahambing ng mga grupo na may iba't ibang repression energies batay sa dalas ng zero value ng deficiency indicator

Mga grupo

"May epekto": ang tagapagpahiwatig ng kabiguan ay 0

"Walang epekto" ng kakulangan

ang tagapagpahiwatig ay hindi katumbas ng 0

Mga halaga

Pangkat 1 - na may higit na enerhiya sa pag-aalis

(27,8%)

(72,2%)

1 pangkat - na may mas kaunting enerhiya sa pag-aalis

(8,3%)

(91,7%)

Mga halaga

Tinutukoy namin ang mga halaga ng φ at kinakalkula ang halaga ng φ*:

Sagot: H 0 tinanggihan. Ang pinakamababang mga indeks ng kakulangan (zero) sa pangkat na may mas mataas na enerhiya ng panunupil ay mas karaniwan kaysa sa pangkat na may mas kaunting enerhiya ng panunupil (p<0,05).

Sa kabuuan, ang mga resulta na nakuha ay maaaring isaalang-alang bilang katibayan ng isang bahagyang pagkakataon ng mga konsepto ng kumplikado sa S. Freud at A. Adler.

Mahalaga na sa pagitan ng tagapagpahiwatig ng enerhiya ng panunupil at ang tagapagpahiwatig ng intensity ng pakiramdam ng sariling kakulangan sa sample sa kabuuan, isang positibong linear correlation ang nakuha (p = +0.491, p<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Halimbawa 4 - gamit ang φ* criterion kasama ng criterion λ Kolmogorov-Smirnov upang makamit ang maximum tumpakresulta

Kung ang mga sample ay inihambing ayon sa anumang mga indicator na sinusukat sa dami, ang problema ay lumitaw sa pagtukoy ng distribution point na maaaring gamitin bilang isang kritikal na punto sa paghahati sa lahat ng mga paksa sa mga "may epekto" at sa mga "walang epekto."

Sa prinsipyo, ang punto kung saan hahatiin natin ang grupo sa mga subgroup kung saan mayroong epekto at kung saan walang epekto ay maaaring piliin nang arbitraryo. Maaari kaming maging interesado sa anumang epekto at, samakatuwid, maaari naming hatiin ang parehong mga sample sa dalawang bahagi sa anumang punto, hangga't ito ay may katuturan.

Upang ma-maximize ang kapangyarihan ng φ* na pagsubok, gayunpaman, kinakailangang piliin ang punto kung saan ang mga pagkakaiba sa pagitan ng dalawang pinaghahambing na grupo ay pinakamalaki. Sa pinakatumpak, magagawa natin ito gamit ang isang algorithm para sa pagkalkula ng criterionλ , na nagbibigay-daan sa iyong makita ang punto ng maximum na pagkakaiba sa pagitan ng dalawang sample.

Posibilidad ng pagsasama-sama ng pamantayan φ* atλ inilarawan ni E.V. Gubler (1978, pp. 85-88). Subukan nating gamitin ang paraang ito sa paglutas ng sumusunod na problema.

Sa pinagsamang pag-aaral ni M.A. Kurochkina, E.V. Sidorenko at Yu.A. Nagsagawa si Churakov (1992) sa UK ng isang survey sa mga English general practitioner ng dalawang kategorya: a) mga doktor na sumuporta sa repormang medikal at ginawa na ang kanilang mga tanggapan sa pagtanggap sa mga organisasyong may hawak ng pondo na may sariling badyet; b) mga doktor na ang mga opisina ay wala pa ring sariling pondo at ganap na ibinibigay ng badyet ng estado. Ang mga talatanungan ay ipinadala sa isang sample ng 200 mga doktor, kinatawan ng pangkalahatang populasyon ng mga doktor sa Ingles sa mga tuntunin ng representasyon ng mga tao ng iba't ibang kasarian, edad, haba ng serbisyo at lugar ng trabaho - sa malalaking lungsod o sa mga lalawigan.

78 mga doktor ang tumugon sa talatanungan, kung saan 50 ang nagtrabaho sa mga waiting room na may pondo at 28 mula sa mga waiting room na walang pondo. Ang bawat isa sa mga doktor ay kailangang hulaan kung ano ang magiging bahagi ng mga admission na may mga pondo sa susunod na taon, 1993. 70 doktor lamang sa 78 na nagpadala ng mga sagot ang sumagot sa tanong na ito. Ang pamamahagi ng kanilang mga pagtataya ay ipinakita sa Talahanayan. 5.8 nang hiwalay para sa grupo ng mga doktor na may pondo at sa grupo ng mga doktor na walang pondo.

Ang mga hula ba ng mga doktor na may pondo at mga doktor na walang pondo ay iba sa anumang paraan?

Talahanayan 5.8

Pamamahagi ng mga hula mula sa mga pangkalahatang practitioner tungkol sa magiging bahagi ng mga emergency room na may pondo sa 1993

Inaasahang bahagi

mga silid sa pagtanggap na may mga pondo

mga doktor na may pondo (n 1 =45)

mga doktor na walang pondo (n 2 =25)

Mga halaga

1. mula 0 hanggang 20%

4

5

9

2. mula 21 hanggang 40%

15

AT

26

3. mula 41 hanggang 60%

18

5

23

4. mula 61 hanggang 80%

7

4

AT

5. mula 81 hanggang 100%

1

0

1

Mga halaga

45

25

70

Tukuyin natin ang punto ng pinakamataas na pagkakaiba sa pagitan ng dalawang distribusyon ng tugon gamit ang Algorithm 15 mula sa sugnay 4.3 (tingnan ang Talahanayan 5.9).

Talahanayan 5.9

Pagkalkula ng maximum na pagkakaiba sa mga naipon na frequency sa mga pamamahagi ng mga pagtataya ng mga doktor ng dalawang grupo

Tinatayang bahagi ng mga admission na may mga pondo (%)

Mga empirical na frequency na pinili para sa isang partikular na kategorya ng pagtugon

Empirical frequency

Pinagsama-samang empirical frequency

Pagkakaiba (d)

mga doktor na may pondo(n 1 =45)

mga doktor na walang pondo (n 2 =25)

f* eh 1

f* a2

f* e1

f* a1

1. mula 0 hanggang 20%

2. mula 21 hanggang 40%

3. mula 41 hanggang 60%

4. mula 61 hanggang 80%

5. mula 81 hanggang 100%

4

15

18

7

1

5

11

5

4

0

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

1,000

0111

0,218 0,018 0,022

0

Ang pinakamataas na pagkakaiba na nakita sa pagitan ng dalawang naipon na empirical frequency ay0,218.

Ang pagkakaibang ito ay lumalabas na naipon sa pangalawang kategorya ng forecast. Subukan nating gamitin ang pinakamataas na limitasyon ng kategoryang ito bilang criterion para sa paghahati ng parehong sample sa isang subgroup kung saan "may epekto" at isang subgroup kung saan "walang epekto." Ipagpalagay namin na mayroong "epekto" kung hinuhulaan ng isang doktor mula 41 hanggang 100% ng mga admission na may pondo sa1993 taon, at na walang "epekto" kung hinuhulaan ng isang doktor mula 0 hanggang 40% ng mga admission na may pondo sa1993 taon. Pinagsasama namin ang mga kategorya ng pagtataya 1 at 2 sa isang banda, at ang mga kategorya ng pagtataya 3, 4 at 5 sa kabilang banda. Ang resultang pamamahagi ng mga pagtataya ay ipinakita sa Talahanayan. 5.10.

Talahanayan 5.10

Pamamahagi ng mga pagtataya para sa mga doktor na may pondo at mga doktor na walang pondo

Inaasahang bahagi ng mga admission na may mga pondo (%1

Empirical frequency para sa pagpili ng isang ibinigay na kategorya ng forecast

Mga halaga

mga doktor na may pondo(n 1 =45)

mga doktor na walang pondo(n 2 =25)

1. mula 0 hanggang 40%

19

16

35

2. mula 41 hanggang 100%

26

9

35

Mga halaga

45

25

70

Maaari naming gamitin ang resultang talahanayan (Talahanayan 5.10) upang subukan ang iba't ibang mga hypotheses sa pamamagitan ng paghahambing ng alinman sa dalawa sa mga cell nito. Natatandaan natin na ito ang tinatawag na four-cell, o four-field, table.

Dito, kami ay interesado sa kung ang mga manggagamot na mayroon nang mga pondo ay hinuhulaan ang mas malaking hinaharap na paglago ng kilusang ito kaysa sa mga manggagamot na walang mga pondo. Samakatuwid, may kondisyon kaming isinasaalang-alang na "may epekto" kapag ang forecast ay nahulog sa kategorya mula 41 hanggang 100%. Upang gawing simple ang mga kalkulasyon, kailangan na nating paikutin ang talahanayan ng 90°, paikutin ito sa direksyong pakanan. Maaari mo ring gawin ito nang literal sa pamamagitan ng pagpihit ng aklat kasama ang talahanayan. Ngayon ay maaari na tayong magpatuloy sa worksheet para sa pagkalkula ng φ* criterion - Fisher's Angular Transform.

mesa 5.11

Four-cell table para sa pagkalkula ng Fisher's φ* test para matukoy ang mga pagkakaiba sa mga prognosis ng dalawang grupo ng mga general practitioner

Grupo

May epekto - pagtataya mula 41 hanggang 100%

Walang epekto - pagtataya mula 0 hanggang 40%

Kabuuan

akogrupo - mga doktor na kumuha ng pondo

26 (57.8%)

19 (42.2%)

45

IIgrupo - mga doktor na hindi kumuha ng pondo

9 (36.0%)

16 (64.0%)

25

Kabuuan

35

35

70

Bumuo tayo ng mga hypotheses.

H 0 : Proporsyon ng mga taohinuhulaan ang pagkalat ng mga pondo sa 41%-100% ng lahat ng mga opisina ng doktor, sa grupo ng mga doktor na may mga pondo ay hindi hihigit sa grupo ng mga doktor na walang pondo.

H 1 : Ang proporsyon ng mga taong hinuhulaan ang pagkalat ng mga pondo sa 41%-100% ng lahat ng mga pagtanggap ay mas malaki sa grupo ng mga doktor na may pondo kaysa sa grupo ng mga doktor na walang pondo.

Pagtukoy sa mga halaga ng φ 1 at φ 2 ayon sa TalahanayanXIIAppendix 1. Tandaan na φ 1 ay palaging anggulo na tumutugma sa mas malaking porsyento.

Ngayon, alamin natin ang empirical na halaga ng criterion φ*:

Ayon sa TalahanayanXIIISa Appendix 1, tinutukoy natin kung anong antas ng kahalagahan ang katumbas ng halagang ito: p = 0.039.

Gamit ang parehong talahanayan sa Appendix 1, ang mga kritikal na halaga ng criterion φ* ay maaaring matukoy:

Sagot: Ngunit ito ay tinanggihan (p=0.039). Ang bahagi ng mga taong hinuhulaan ang pagkalat ng mga pondo sa41-100 % sa lahat ng mga pagtanggap sa grupo ng mga doktor na kumuha ng pondo ay lumampas sa bahaging ito sa grupo ng mga doktor na hindi kumuha ng pondo.

Sa madaling salita, ang mga doktor na nagtatrabaho na sa kanilang mga waiting room sa isang hiwalay na badyet ay hinuhulaan ang mas malawak na pagkalat ng pagsasanay na ito sa taong ito kaysa sa mga doktor na hindi pa sumang-ayon na lumipat sa isang independiyenteng badyet. Mayroong maraming interpretasyon ng resultang ito. Halimbawa, maaaring ipagpalagay na ang mga doktor sa bawat grupo ay hindi malay na isinasaalang-alang ang kanilang pag-uugali na mas karaniwan. Ito ay maaaring mangahulugan din na ang mga doktor na nagpatibay na ng sariling pagpopondo ay may posibilidad na palakihin ang saklaw ng kilusang ito, dahil kailangan nilang bigyang-katwiran ang kanilang desisyon. Ang mga natukoy na pagkakaiba ay maaari ding mangahulugan ng isang bagay na ganap na lampas sa saklaw ng mga tanong na iniharap sa pag-aaral. Halimbawa, na ang aktibidad ng mga doktor na nagtatrabaho sa isang independiyenteng badyet ay nag-aambag sa pagpapatalas ng mga pagkakaiba sa mga posisyon ng parehong grupo. Mas aktibo sila kapag pumayag silang kunin ang mga pondo; mas aktibo sila kapag hinuhulaan nila na ang ibang mga doktor ay magiging mas aktibo sa pagtanggap ng mga pondo.

Sa isang paraan o iba pa, makatitiyak tayo na ang natukoy na antas ng mga pagkakaiba sa istatistika ay ang pinakamataas na posible para sa totoong data na ito. Itinatag namin gamit ang criterionλ ang punto ng maximum divergence sa pagitan ng dalawang distribusyon, at sa puntong ito na ang mga sample ay nahahati sa dalawang bahagi.

Ang iyong rating.

Gamit ang halimbawang ito, isasaalang-alang natin kung paano tinasa ang pagiging maaasahan ng resultang equation ng regression. Ang parehong pagsubok ay ginagamit upang subukan ang hypothesis na ang mga coefficient ng regression ay sabay-sabay na katumbas ng zero, a=0, b=0. Sa madaling salita, ang kakanyahan ng mga kalkulasyon ay upang sagutin ang tanong: maaari ba itong magamit para sa karagdagang pagsusuri at pagtataya?

Upang matukoy kung magkapareho o magkaiba ang mga pagkakaiba sa dalawang sample, gamitin ang t-test na ito.


Kaya, ang layunin ng pagsusuri ay upang makakuha ng ilang pagtatantya, sa tulong kung saan masasabi na sa isang tiyak na antas ng α, ang resultang equation ng regression ay maaasahan sa istatistika. Para dito coefficient of determination R 2 ang ginagamit.
Ang pagsubok sa kahalagahan ng isang modelo ng regression ay isinasagawa gamit ang Fisher's F test, ang kinakalkula na halaga ay makikita bilang ratio ng pagkakaiba ng orihinal na serye ng mga obserbasyon ng indicator na pinag-aaralan at ang walang pinapanigan na pagtatantya ng pagkakaiba ng natitirang sequence. para sa modelong ito.
Kung ang kinakalkula na halaga na may k 1 =(m) at k 2 =(n-m-1) na antas ng kalayaan ay mas malaki kaysa sa naka-tabulate na halaga sa isang partikular na antas ng kahalagahan, kung gayon ang modelo ay itinuturing na makabuluhan.

kung saan ang m ay ang bilang ng mga kadahilanan sa modelo.
Ang istatistikal na kahalagahan ng ipinares na linear regression ay tinasa gamit ang sumusunod na algorithm:
1. Isang null hypothesis ang iniharap na ang equation sa kabuuan ay hindi gaanong mahalaga sa istatistika: H 0: R 2 =0 sa antas ng kahalagahan α.
2. Susunod, tukuyin ang aktwal na halaga ng F-criterion:


kung saan m=1 para sa pairwise regression.
3. Ang naka-tabulate na halaga ay tinutukoy mula sa mga talahanayan ng pamamahagi ng Fisher para sa isang partikular na antas ng kahalagahan, na isinasaalang-alang na ang bilang ng mga antas ng kalayaan para sa kabuuang kabuuan ng mga parisukat (mas malaking pagkakaiba) ay 1 at ang bilang ng mga antas ng kalayaan para sa natitirang kabuuan ng mga parisukat (mas maliit na pagkakaiba) sa linear regression ay n-2 (o sa pamamagitan ng Excel function na FRIST(probability,1,n-2)).
Ang F table ay ang pinakamataas na posibleng halaga ng criterion sa ilalim ng impluwensya ng mga random na salik na may ibinigay na antas ng kalayaan at antas ng kahalagahan α. Ang antas ng kahalagahan α ay ang posibilidad na tanggihan ang tamang hypothesis, sa kondisyon na ito ay totoo. Karaniwang kinukuha ang α na 0.05 o 0.01.
4. Kung ang aktwal na halaga ng F-test ay mas mababa kaysa sa halaga ng talahanayan, pagkatapos ay sinasabi nila na walang dahilan upang tanggihan ang null hypothesis.
Kung hindi, ang null hypothesis ay tinanggihan at ang alternatibong hypothesis tungkol sa istatistikal na kahalagahan ng equation sa kabuuan ay tinatanggap na may posibilidad (1-α).
Table value ng criterion na may degree of freedom k 1 =1 at k 2 =48, F table = 4

Mga konklusyon: Dahil ang aktwal na halaga F > F talahanayan, ang koepisyent ng pagpapasiya ay makabuluhang istatistika ( ang nahanap na pagtatantya ng equation ng regression ay maaasahan sa istatistika) .

Pagsusuri ng pagkakaiba-iba

.

Mga tagapagpahiwatig ng kalidad ng regression equation

Halimbawa. Batay sa isang kabuuang 25 na negosyo sa pangangalakal, ang ugnayan sa pagitan ng mga sumusunod na katangian ay pinag-aralan: X - presyo ng produkto A, libong rubles; Y ay ang kita ng isang negosyong pangkalakal, milyong rubles. Kapag tinatasa ang modelo ng regression, ang mga sumusunod na intermediate na resulta ay nakuha: ∑(y i -y x) 2 = 46000; ∑(y i -y avg) 2 = 138000. Anong tagapagpahiwatig ng ugnayan ang maaaring matukoy mula sa mga datos na ito? Kalkulahin ang halaga ng tagapagpahiwatig na ito batay sa resulta at paggamit Fisher's F test gumawa ng mga konklusyon tungkol sa kalidad ng modelo ng regression.
Solusyon. Mula sa mga datos na ito matutukoy natin ang empirical correlation ratio: , kung saan ∑(y avg -y x) 2 = ∑(y i -y avg) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92,000.
η 2 = 92,000/138000 = 0.67, η = 0.816 (0.7< η < 0.9 - связь между X и Y высокая).

Fisher's F test: n = 25, m = 1.
R 2 = 1 - 46000/138000 = 0.67, F = 0.67/(1-0.67)x(25 - 1 - 1) = 46. F table (1; 23) = 4.27
Dahil ang aktwal na halaga F > Ftable, ang nahanap na pagtatantya ng equation ng regression ay maaasahan sa istatistika.

Tanong: Anong mga istatistika ang ginagamit upang subukan ang kahalagahan ng isang modelo ng regression?
Sagot: Para sa kahalagahan ng buong modelo sa kabuuan, F-statistics (Fisher's test) ang ginagamit.

Upang paghambingin ang dalawang populasyon na karaniwang ipinamamahagi na walang pagkakaiba sa sample na paraan, ngunit may pagkakaiba sa mga pagkakaiba, gamitin Pagsubok ni Fisher. Ang aktwal na criterion ay kinakalkula gamit ang formula:

kung saan ang numerator ay ang mas malaking halaga ng sample variance, at ang denominator ay ang mas maliit. Upang tapusin ang pagiging maaasahan ng mga pagkakaiba sa pagitan ng mga sample, gamitin BATAYANG PRINSIPYO pagsubok ng mga istatistikal na hypotheses. Mga kritikal na puntos para sa
ay nakapaloob sa talahanayan. Ang null hypothesis ay tinanggihan kung ang aktwal na halaga
lalampas o katumbas ng kritikal (karaniwang) halaga
ang halagang ito para sa tinatanggap na antas ng kahalagahan at bilang ng mga antas ng kalayaan k 1 = n malaki -1 ; k 2 = n mas maliit -1 .

Halimbawa: kapag pinag-aaralan ang epekto ng isang partikular na gamot sa rate ng pagtubo ng binhi, napag-alaman na sa eksperimentong batch ng mga buto at kontrol, ang average na rate ng pagtubo ay pareho, ngunit may pagkakaiba sa mga pagkakaiba-iba.
=1250,
=417. Ang mga sample na laki ay pareho at katumbas ng 20.

=2.12. Samakatuwid, ang null hypothesis ay tinanggihan.

Pagdepende sa ugnayan. Koepisyent ng ugnayan at mga katangian nito. Mga equation ng regression.

GAWAIN Ang pagsusuri ng ugnayan ay bumaba sa:

    Pagtatatag ng direksyon at anyo ng koneksyon sa pagitan ng mga katangian;

    Sinusukat ang higpit nito.

Functional Ang isang hindi malabo na ugnayan sa pagitan ng mga variable na dami ay tinatawag kapag ang isang tiyak na halaga ng isang (independiyenteng) variable X , na tinatawag na argumento, ay tumutugma sa isang tiyak na halaga ng isa pang (umaasa) na variable sa , tinatawag na function. ( Halimbawa: pagtitiwala sa bilis ng isang kemikal na reaksyon sa temperatura; pag-asa ng puwersa ng pagkahumaling sa masa ng pag-akit ng mga katawan at ang distansya sa pagitan nila).

Kaugnayan ay isang relasyon sa pagitan ng mga variable na likas na istatistika, kapag ang isang tiyak na halaga ng isang katangian (itinuring bilang isang independiyenteng variable) ay tumutugma sa isang buong serye ng mga numerical na halaga ng isa pang katangian. ( Halimbawa: relasyon sa pagitan ng pag-aani at pag-ulan; sa pagitan ng taas at timbang, atbp.).

Patlang ng ugnayan kumakatawan sa isang hanay ng mga puntos na ang mga coordinate ay katumbas ng mga pares ng variable na halaga na nakuha sa eksperimentong paraan X At sa .

Sa pamamagitan ng uri ng patlang ng ugnayan ay maaaring hatulan ng isa ang pagkakaroon o kawalan ng isang koneksyon at ang uri nito.



Ang koneksyon ay tinatawag positibo , kung kapag tumaas ang isang variable, tumataas ang isa pang variable.

Ang koneksyon ay tinatawag negatibo , kung kapag tumaas ang isang variable, bababa ang isa pang variable.

Ang koneksyon ay tinatawag linear , kung maaari itong ilarawan nang analitikal bilang
.

Ang isang tagapagpahiwatig ng pagiging malapit ng koneksyon ay koepisyent ng ugnayan . Ang empirical correlation coefficient ay ibinibigay ng:

Ang koepisyent ng ugnayan ay mula sa -1 sa 1 at nailalarawan ang antas ng pagkakalapit sa pagitan ng mga dami x At y . kung:


Ang ugnayan sa pagitan ng mga katangian ay maaaring ilarawan sa iba't ibang paraan. Sa partikular, ang anumang anyo ng koneksyon ay maaaring ipahayag sa pamamagitan ng isang equation ng pangkalahatang anyo
. Equation ng form
At
ay tinatawag regression . Forward Regression Equation sa sa X sa pangkalahatang kaso ay maaaring isulat sa form

Forward Regression Equation X sa sa sa pangkalahatan ito ay parang

Karamihan sa mga posibleng halaga ng coefficient A At V, Sa At d maaaring kalkulahin, halimbawa, gamit ang least squares method.



Bago sa site

>

Pinakasikat