Bahay Mga gilagid Ang pangunahing pamilihan ay ang pamantayan ni Fisher. Ang Fisher criterion ay ginagamit upang subukan ang hypothesis na ang mga pagkakaiba ng dalawang populasyon ay pantay - dokumento

Ang pangunahing pamilihan ay ang pamantayan ni Fisher. Ang Fisher criterion ay ginagamit upang subukan ang hypothesis na ang mga pagkakaiba ng dalawang populasyon ay pantay - dokumento

Pamantayan ng Fisher

Fisher's criterion ay ginagamit upang subukan ang hypothesis na ang mga pagkakaiba ng dalawa pangkalahatang populasyon, ibinahagi ayon sa normal na batas. Ito ay isang parametric criterion.

Ang Fisher F test ay tinatawag na variance ratio dahil ito ay nabuo bilang ratio ng dalawang walang pinapanigan na pagtatantya ng mga variance na inihahambing.

Hayaang makakuha ng dalawang sample bilang resulta ng mga obserbasyon. Mula sa kanila ang mga pagkakaiba-iba at pagkakaroon At antas ng kalayaan. Ipagpalagay namin na ang unang sample ay kinuha mula sa isang populasyon na may pagkakaiba , at ang pangalawa ay mula sa pangkalahatang populasyon na may pagkakaiba . Ang isang null hypothesis ay iniharap tungkol sa pagkakapantay-pantay ng dalawang variances, i.e. H0:
o . Upang tanggihan ang hypothesis na ito, kinakailangan upang patunayan ang kahalagahan ng pagkakaiba sa isang naibigay na antas ng kahalagahan.
.

Ang halaga ng criterion ay kinakalkula gamit ang formula:

Malinaw, kung ang mga pagkakaiba ay pantay, ang halaga ng criterion ay magiging katumbas ng isa. Sa ibang mga kaso ito ay magiging mas malaki (mas mababa) kaysa sa isa.

Ang pagsusulit ay may pamamahagi ng Fisher
. Fisher's test - two-tailed test, at null hypothesis
tinanggihan sa pabor ng isang alternatibo
Kung . Dito kung saan
– ang dami ng una at pangalawang sample, ayon sa pagkakabanggit.

Ang sistema ng STATISTICA ay nagpapatupad ng one-sided Fisher test, i.e. ang maximum na pagkakaiba ay palaging kinukuha bilang kalidad. Sa kasong ito, ang null hypothesis ay tinanggihan pabor sa kahalili kung.

Halimbawa

Hayaang itakda ang gawain upang ihambing ang bisa ng pagtuturo sa dalawang grupo ng mga mag-aaral. Ang antas ng tagumpay ay nagpapakilala sa antas ng pamamahala ng proseso ng pag-aaral, at ang pagpapakalat ay ang kalidad ng pamamahala ng pag-aaral, ang antas ng organisasyon ng proseso ng pag-aaral. Ang parehong mga tagapagpahiwatig ay independyente at pangkalahatang kaso dapat isaalang-alang nang sama-sama. Ang antas ng akademikong pagganap (pang-matematika na inaasahan) ng bawat pangkat ng mga mag-aaral ay nailalarawan sa pamamagitan ng mga average ng arithmetic at , at ang kalidad ay nailalarawan sa pamamagitan ng kaukulang sample na mga pagkakaiba-iba ng mga pagtatantya: at . Kapag tinatasa ang antas ng kasalukuyang pagganap, lumabas na pareho ito para sa parehong mga mag-aaral: = = 4.0. Mga sample na pagkakaiba-iba:
At
. Mga bilang ng antas ng kalayaan na tumutugma sa mga pagtatantya na ito:
At
. Mula dito, upang magtatag ng mga pagkakaiba sa pagiging epektibo ng pag-aaral, maaari nating gamitin ang katatagan ng pagganap sa akademiko, i.e. Subukan natin ang hypothesis.

Magkalkula tayo
(dapat may malaking pagkakaiba sa numerator), . Ayon sa mga talahanayan ( STATISTICAProbabilityPamamahagiCalculator) nakita namin ang , na mas mababa sa kinakalkula, samakatuwid ang null hypothesis ay dapat tanggihan pabor sa alternatibo. Ang konklusyon na ito ay maaaring hindi masiyahan ang mananaliksik, dahil interesado siya sa tunay na halaga ng ratio
(lagi kaming may malaking pagkakaiba sa numerator). Kapag nagsusuri ng isang panig na pamantayan, nakukuha namin iyon na mas mababa sa halagang kinakalkula sa itaas. Kaya, ang null hypothesis ay dapat tanggihan pabor sa alternatibo.

Fisher test sa STATISTICA program sa Windows environment

Para sa isang halimbawa ng pagsubok ng hypothesis (Fisher criterion), ginagamit namin (lumikha) ng file na may dalawang variable (fisher.sta):

kanin. 1. Talahanayan na may dalawang malayang variable

Upang subukan ang hypothesis ito ay kinakailangan sa mga pangunahing istatistika ( BasicMga istatistikaatMga mesa) piliin ang t-test para sa mga independent variable. ( t-test, independyente, ayon sa mga variable).

kanin. 2. Pagsubok ng parametric hypotheses

Pagkatapos pumili ng mga variable at pagpindot sa key Buod Ang mga halaga ng standard deviations at Fisher's criterion ay kinakalkula. Bilang karagdagan, ang antas ng kahalagahan ay tinutukoy p, kung saan ang pagkakaiba ay hindi gaanong mahalaga.

kanin. 3. Mga resulta ng pagsubok sa hypothesis (F-test)

Gamit ProbabilityCalculator at sa pamamagitan ng pagtatakda ng mga halaga ng mga parameter, maaari kang bumuo ng isang graph ng pamamahagi ng Fisher na may markang kinakalkula na halaga.

kanin. 4. Lugar ng pagtanggap (pagtanggi) ng hypothesis (F-criterion)

Mga pinagmumulan.

    Pagsubok ng mga hypotheses tungkol sa ugnayan sa pagitan ng dalawang pagkakaiba

URL: /tryfonov3/terms3/testdi.htm

    Lecture 6. :8080/resources/math/mop/lections/lection_6.htm

    F – Pamantayan ng Fisher

URL: /home/portal/applications/Multivariatadvisor/F-Fisher/F-Fisheer.htm

    Teorya at praktika ng probabilistikong istatistikal na pananaliksik.

URL: /active/referats/read/doc-3663-1.html

    F – Pamantayan ng Fisher

Pamantayan ng Fisher nagbibigay-daan sa iyo na ihambing ang mga pagkakaiba-iba ng sample ng dalawang independiyenteng sample. Upang kalkulahin ang F emp, kailangan mong hanapin ang ratio ng mga pagkakaiba-iba ng dalawang sample, upang ang mas malaking pagkakaiba ay nasa numerator, at ang mas maliit ay nasa denominator. Ang formula para sa pagkalkula ng Fisher criterion ay:

kung saan ang mga pagkakaiba-iba ng una at pangalawang sample, ayon sa pagkakabanggit.

Dahil, ayon sa mga kondisyon ng criterion, ang halaga ng numerator ay dapat na mas malaki kaysa o katumbas ng halaga ng denominator, ang halaga ng F emp ay palaging mas malaki sa o katumbas ng isa.

Ang bilang ng mga antas ng kalayaan ay natutukoy din nang simple:

k 1 =n l - 1 para sa unang sample (i.e. para sa sample na mas malaki ang pagkakaiba) at k 2 = n 2 - 1 para sa pangalawang sample.

Sa Appendix 1, ang mga kritikal na halaga ng Fisher criterion ay matatagpuan sa pamamagitan ng mga halaga ng k 1 (itaas na linya ng talahanayan) at k 2 (kaliwang haligi ng talahanayan).

Kung t em >t crit, kung gayon ang null hypothesis ay tinatanggap, kung hindi ang alternatibo ay tinatanggap.

Halimbawa 3. Ang pagsubok ay isinagawa sa dalawang ikatlong baitang pag-unlad ng kaisipan sampung mag-aaral sa pagsusulit sa TURMSH. Ang nakuha na average na mga halaga ay hindi naiiba nang malaki, ngunit ang psychologist ay interesado sa tanong kung may mga pagkakaiba sa antas ng homogeneity ng mga tagapagpahiwatig ng pag-unlad ng kaisipan sa pagitan ng mga klase.

Solusyon. Para sa pagsusulit ni Fisher, kinakailangang ihambing ang mga pagkakaiba-iba ng mga marka ng pagsusulit sa parehong mga klase. Ang mga resulta ng pagsubok ay ipinakita sa talahanayan:

Talahanayan 3.

Bilang ng mga mag-aaral

Unang baitang

Pangalawang klase

Ang pagkakaroon ng pagkalkula ng mga pagkakaiba-iba para sa mga variable X at Y, nakuha namin:

s x 2 =572.83; s y 2 =174,04

Pagkatapos, gamit ang formula (8) para sa pagkalkula gamit ang Fisher's F criterion, makikita natin ang:

Ayon sa talahanayan mula sa Appendix 1 para sa F criterion na may mga antas ng kalayaan sa parehong mga kaso na katumbas ng k = 10 - 1 = 9, nakita namin ang F crit = 3.18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 Mga pagsubok na hindi parametric

Sa pamamagitan ng paghahambing sa pamamagitan ng mata (sa porsyento) ng mga resulta bago at pagkatapos ng anumang epekto, ang mananaliksik ay dumating sa konklusyon na kung ang mga pagkakaiba ay sinusunod, kung gayon mayroong pagkakaiba sa mga sample na inihambing. Ang diskarte na ito ay tiyak na hindi katanggap-tanggap, dahil para sa mga porsyento imposibleng matukoy ang antas ng pagiging maaasahan sa mga pagkakaiba. Ang mga porsyentong kinuha sa kanilang sarili ay hindi ginagawang posible na gumuhit ng maaasahang mga konklusyon ayon sa istatistika. Upang patunayan ang pagiging epektibo ng anumang interbensyon, kinakailangan upang matukoy ang isang makabuluhang trend sa istatistika sa bias (shift) ng mga tagapagpahiwatig. Upang malutas ang mga naturang problema, maaaring gumamit ang isang mananaliksik ng ilang pamantayan sa diskriminasyon. Sa ibaba ay isasaalang-alang namin ang mga non-parametric na pagsusulit: ang sign test at ang chi-square test.

)

Pagkalkula ng criterion φ*

1. Tukuyin ang mga halaga ng katangian na magiging pamantayan para sa paghahati ng mga paksa sa mga "may epekto" at sa mga "walang epekto." Kung ang katangian ay sinusukat nang quantitative, gamitin ang λ criterion upang mahanap ang pinakamainam na separation point.

2. Gumuhit ng apat na cell (kasingkahulugan: apat na patlang) na talahanayan ng dalawang hanay at dalawang hanay. Ang unang column ay "may epekto"; pangalawang hanay - "walang epekto"; unang linya mula sa itaas - 1 pangkat (sample); pangalawang linya - pangkat 2 (sample).

4. Bilangin ang bilang ng mga paksa sa unang sample na "walang epekto" at ilagay ang numerong ito sa kanang itaas na cell ng talahanayan. Kalkulahin ang kabuuan ng dalawang nangungunang mga cell. Dapat itong tumugma sa bilang ng mga paksa sa unang pangkat.

6. Bilangin ang bilang ng mga paksa sa pangalawang sample na "walang epekto" at ilagay ang numerong ito sa kanang ibabang selula ng talahanayan. Kalkulahin ang kabuuan ng dalawang mas mababang mga cell. Dapat itong tumugma sa bilang ng mga paksa sa pangalawang pangkat (sample).

7. Tukuyin ang porsyento ng mga paksa na "may epekto" sa pamamagitan ng pag-uugnay ng kanilang bilang sa kabuuang bilang ng mga paksa sa isang partikular na grupo (sample). Isulat ang mga resultang porsyento sa kaliwang itaas at kaliwang ibabang mga cell ng talahanayan sa mga panaklong, ayon sa pagkakabanggit, upang hindi malito ang mga ito sa mga ganap na halaga.

8. Suriin upang makita kung ang isa sa mga porsyento na inihambing ay katumbas ng zero. Kung ito ang kaso, subukang baguhin ito sa pamamagitan ng paglipat ng punto ng paghihiwalay ng grupo sa isang direksyon o sa isa pa. Kung ito ay imposible o hindi kanais-nais, iwanan ang φ* criterion at gamitin ang χ2 criterion.

9. Tukuyin ayon sa Talahanayan. XII Appendix 1 mga anggulo φ para sa bawat isa sa mga inihambing na porsyento.

kung saan: φ1 - anggulo na tumutugma sa mas malaking porsyento;

φ2 - anggulo na naaayon sa mas maliit na porsyento;

N1 - bilang ng mga obserbasyon sa sample 1;

N2 - bilang ng mga obserbasyon sa sample 2.

11. Ihambing ang nakuhang halaga φ* sa mga kritikal na halaga: φ* ≤1.64 (p<0,05) и φ* ≤2,31 (р<0,01).

Kung φ*emp ≤φ*cr. Tinanggihan ang H0.

Kung kinakailangan, tukuyin ang eksaktong antas ng kahalagahan ng nagreresultang φ*emp ayon sa Talahanayan. XIII Appendix 1.

Ang pamamaraang ito ay inilarawan sa maraming mga manwal (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992, atbp.) Ang paglalarawang ito ay batay sa bersyon ng pamamaraan na binuo at ipinakita ng E.V. Gubler.

Layunin ng criterion φ*

Ang Fisher criterion ay inilaan upang ihambing ang dalawang sample ayon sa dalas ng paglitaw ng epekto (tagapagpahiwatig) ng interes sa mananaliksik. Kung mas malaki ito, mas maaasahan ang mga pagkakaiba.

Paglalarawan ng criterion

Sinusuri ng criterion ang pagiging maaasahan ng mga pagkakaiba sa pagitan ng mga porsyento ng dalawang sample kung saan naitala ang epekto (tagapagpahiwatig) ng interes sa amin. Sa matalinghagang pagsasalita, ikinukumpara namin ang 2 pinakamahusay na piraso na pinutol mula sa 2 pie at nagpapasya kung alin ang tunay na mas malaki.

Ang kakanyahan ng pagbabagong angular ng Fisher ay ang pag-convert ng mga porsyento sa mga halaga ng gitnang anggulo, na sinusukat sa mga radian. Ang isang mas malaking porsyento ay tumutugma sa isang mas malaking anggulo φ, at isang mas maliit na porsyento ay tumutugma sa isang mas maliit na anggulo, ngunit ang mga relasyon dito ay hindi linear:

kung saan ang P ay ang porsyento na ipinahayag sa mga fraction ng isang yunit (tingnan ang Fig. 5.1).

Sa pagtaas ng pagkakaiba sa pagitan ng mga anggulo φ 1 at φ 2 at pagtaas ng bilang ng mga sample, tumataas ang halaga ng criterion. Kung mas malaki ang halaga ng φ*, mas malamang na makabuluhan ang mga pagkakaiba.

Hypotheses

H 0 : Proporsyon ng mga tao, kung saan ang pinag-aralan na epekto ay nagpapakita mismo, wala nang higit pa sa sample 1 kaysa sa sample 2.

H 1 : Ang proporsyon ng mga indibidwal na nagpapakita ng pinag-aralan na epekto ay mas malaki sa sample 1 kaysa sa sample 2.

Graphical na representasyon ng criterion φ*

Ang paraan ng pagbabagong angular ay medyo mas abstract kaysa sa iba pang pamantayan.

Ang formula na sinusundan ng E.V. Gubler kapag kinakalkula ang mga halaga ng φ ay ipinapalagay na ang 100% ay bumubuo ng isang anggulo φ=3.142, iyon ay, isang bilugan na halaga π=3.14159... Ito ay nagpapahintulot sa amin na ipakita ang mga inihambing na sample sa anyo ng dalawang kalahating bilog, bawat isa ay sumisimbolo sa 100% ng populasyon ng sample nito. Ang mga porsyento ng mga paksa na may "epekto" ay kakatawanin bilang mga sektor na nabuo ng mga gitnang anggulo φ. Sa Fig. Ang Figure 5.2 ay nagpapakita ng dalawang kalahating bilog na naglalarawan ng Halimbawa 1. Sa unang sample, 60% ng mga paksa ang nalutas ang problema. Ang porsyentong ito ay tumutugma sa anggulo φ=1.772. Sa pangalawang sample, 40% ng mga paksa ang nalutas ang problema. Ang porsyentong ito ay tumutugma sa anggulo φ =1.369.

Ang φ* criterion ay nagbibigay-daan sa iyo na matukoy kung ang isa sa mga anggulo ay talagang higit na mataas sa istatistika kaysa sa isa para sa mga ibinigay na laki ng sample.

Mga limitasyon ng pamantayan φ*

1. Wala sa mga proporsyon na inihahambing ang dapat na zero. Sa pormal na paraan, walang mga hadlang sa paglalapat ng paraan ng φ sa mga kaso kung saan ang proporsyon ng mga obserbasyon sa isa sa mga sample ay katumbas ng 0. Gayunpaman, sa mga kasong ito, ang resulta ay maaaring lumabas na hindi makatwiran na napalaki (Gubler E.V., 1978, p. 86).

2. Itaas walang limitasyon sa φ criterion - ang mga sample ay maaaring kasing laki ng ninanais.

Ibaba limitasyon - 2 obserbasyon sa isa sa mga sample. Gayunpaman, ang mga sumusunod na ratio sa bilang ng dalawang sample ay dapat sundin:

a) kung ang isang sample ay may 2 obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 30:

b) kung ang isa sa mga sample ay may 3 obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 7:

c) kung ang isa sa mga sample ay may 4 na obserbasyon lamang, ang pangalawa ay dapat magkaroon ng hindi bababa sa 5:

d) san 1 , n 2 ≥ 5 Posible ang anumang paghahambing.

Sa prinsipyo, posible ring ihambing ang mga sample na hindi nakakatugon sa kundisyong ito, halimbawa, sa kaugnayann 1 =2, n 2 = 15, ngunit sa mga kasong ito ay hindi posibleng matukoy ang mga makabuluhang pagkakaiba.

Ang φ* criterion ay walang ibang paghihigpit.

Tingnan natin ang ilang mga halimbawa upang ilarawan ang mga posibilidadpamantayan φ*.

Halimbawa 1: paghahambing ng mga sample ayon sa isang qualitatively tinukoy na katangian.

Halimbawa 2: paghahambing ng mga sample ayon sa isang quantitatively measured na katangian.

Halimbawa 3: paghahambing ng mga sample sa parehong antas at pamamahagi ng isang katangian.

Halimbawa 4: Paggamit ng φ* criterion kasama ng criterionX Kolmogorov-Smirnov upang makamit ang pinakatumpak na resulta.

Halimbawa 1 - paghahambing ng mga sample ayon sa isang qualitatively tinutukoy na katangian

Sa paggamit na ito ng criterion, inihahambing namin ang porsyento ng mga paksa sa isang sample na nailalarawan ng ilang kalidad sa porsyento ng mga paksa sa isa pang sample na nailalarawan sa parehong kalidad.

Sabihin nating interesado tayo kung magkaiba ang dalawang grupo ng mga mag-aaral sa kanilang tagumpay sa paglutas ng bagong pang-eksperimentong problema. Sa unang grupo ng 20 katao, 12 tao ang nakayanan ito, at sa pangalawang sample ng 25 tao - 10. Sa unang kaso, ang porsyento ng mga nakalutas sa problema ay magiging 12/20·100%=60%, at sa pangalawang 10/25·100%= 40%. Malaki ba ang pagkakaiba ng mga porsyentong ito dahil sa data?n 1 Atn 2 ?

Tila kahit na "sa pamamagitan ng mata" ay matutukoy ng isa na ang 60% ay mas mataas kaysa sa 40%. Gayunpaman, sa katunayan, ang mga pagkakaibang ito, na ibinigay sa datan 1 , n 2 hindi mapagkakatiwalaan.

Tignan natin. Dahil kami ay interesado sa katotohanan ng paglutas ng isang problema, isasaalang-alang namin ang tagumpay sa paglutas ng isang pang-eksperimentong problema bilang isang "epekto", at ang pagkabigo sa paglutas nito bilang ang kawalan ng isang epekto.

Bumuo tayo ng mga hypotheses.

H 0 : Proporsyon ng mga taoWala nang mga taong nakatapos ng gawain sa unang pangkat kaysa sa pangalawang pangkat.

H 1 : Ang proporsyon ng mga taong nakatapos ng gawain sa unang pangkat ay mas malaki kaysa sa pangalawang pangkat.

Ngayon, bumuo tayo ng tinatawag na four-cell, o four-field table, na talagang isang talahanayan ng mga empirical frequency para sa dalawang halaga ng katangian: "may epekto" - "walang epekto."

Talahanayan 5.1

Four-cell table para sa pagkalkula ng criterion kapag naghahambing ng dalawang grupo ng mga paksa ayon sa porsyento ng mga nakalutas sa problema.

Mga grupo

"May epekto": nalutas ang problema

"Walang epekto": ang problema ay hindi nalutas

Mga halaga

Dami

mga paksa

% ibahagi

Dami

mga paksa

% bahagi

1 pangkat

(60%)

(40%)

2nd group

(40%)

(60%)

Mga halaga

Sa isang four-cell table, bilang panuntunan, ang mga column na "May epekto" at "Walang epekto" ay minarkahan sa itaas, at ang mga row na "Group 1" at "Group 2" ay nasa kaliwa. Sa katunayan, ang mga patlang (mga cell) A at B lamang ang kasama sa mga paghahambing, iyon ay, mga porsyento sa column na "May epekto."

Ayon sa Talahanayan.XIITinutukoy ng Appendix 1 ang mga halaga ng φ na naaayon sa porsyento ng pagbabahagi sa bawat isa sa mga pangkat.

Ngayon kalkulahin natin ang empirical na halaga ng φ* gamit ang formula:

saan φ 1 - anggulo na katumbas ng mas malaking % share;

φ 2 - anggulo na katumbas ng mas maliit na % share;

n 1 - bilang ng mga obserbasyon sa sample 1;

n 2 - bilang ng mga obserbasyon sa sample 2.

Sa kasong ito:

Ayon sa Talahanayan.XIIISa Appendix 1, tinutukoy natin kung anong antas ng kahalagahan ang tumutugma sa φ* em=1,34:

p=0.09

Posible rin na magtatag ng mga kritikal na halaga ng φ* na naaayon sa mga antas na tinatanggap sa sikolohiya istatistikal na kahalagahan:

Bumuo tayo ng "significance axis".

Ang nakuhang empirical value φ* ay nasa zone of insignificance.

Sagot: H 0 tinanggap. Ang porsyento ng mga taong nakakumpleto ng gawainVang unang pangkat ay hindi hihigit sa pangalawang pangkat.

Maaari lamang makiramay ang isa sa isang mananaliksik na isinasaalang-alang ang mga pagkakaiba na 20% at kahit na 10% ay makabuluhan nang hindi sinusuri ang kanilang pagiging maaasahan gamit ang φ* criterion. Sa kasong ito, halimbawa, ang mga pagkakaiba lamang ng hindi bababa sa 24.3% ang magiging makabuluhan.

Tila kapag naghahambing ng dalawang sample sa anumang husay na batayan, ang φ criterion ay maaaring makapagpalungkot sa atin sa halip na maging masaya. Ang tila makabuluhan ay maaaring hindi ganoon mula sa istatistikal na pananaw.

Ang criterion ng Fisher ay may higit pang mga pagkakataon upang masiyahan ang mananaliksik kapag inihambing namin ang dalawang sample ayon sa mga katangiang nasusukat sa dami at maaaring mag-iba ang "epekto."

Halimbawa 2 - paghahambing ng dalawang sample ayon sa isang quantitatively measured na katangian

Sa ganitong paggamit ng pamantayan, inihahambing namin ang porsyento ng mga paksa sa isang sample na nakakamit ng isang partikular na antas ng halaga ng katangian sa porsyento ng mga paksa na nakakamit ang antas na ito sa isa pang sample.

Sa isang pag-aaral ni G. A. Tlegenova (1990), sa 70 kabataang mag-aaral sa vocational school na may edad 14 hanggang 16 na taon, 10 subject na may mataas na marka sa Aggression scale at 11 subject na may mababang score sa Aggression scale ang napili batay sa resulta. ng isang survey gamit ang Freiburg Personality Questionnaire. Kinakailangang matukoy kung ang mga grupo ng agresibo at hindi agresibong mga kabataang lalaki ay naiiba sa mga tuntunin ng distansya na kusang pinili nila sa pakikipag-usap sa isang kapwa mag-aaral. Ang data ng G. A. Tlegenova ay ipinakita sa Talahanayan. 5.2. Mapapansin mo na ang mga agresibong kabataang lalaki ay mas madalas na pumili ng layo na 50cm o mas kaunti pa, habang ang mga hindi agresibong lalaki ay mas madalas na pumili ng layo na higit sa 50 cm.

Ngayon ay maaari nating isaalang-alang ang isang distansya na 50 cm bilang kritikal at ipagpalagay na kung ang distansya na pinili ng paksa ay mas mababa sa o katumbas ng 50 cm, kung gayon "may epekto," at kung ang napiling distansya ay higit sa 50 cm, kung gayon "Walang epekto." Nakikita namin na sa grupo ng mga agresibong kabataang lalaki ang epekto ay sinusunod sa 7 sa 10, i.e. sa 70% ng mga kaso, at sa grupo ng mga hindi agresibong kabataang lalaki - sa 2 sa 11, i.e. sa 18.2% ng mga kaso . Ang mga porsyentong ito ay maihahambing gamit ang φ* na pamamaraan upang maitaguyod ang kahalagahan ng mga pagkakaiba sa pagitan ng mga ito.

Talahanayan 5.2

Mga tagapagpahiwatig ng distansya (sa cm) na pinili ng mga agresibo at hindi agresibong kabataang lalaki sa pakikipag-usap sa kapwa mag-aaral (ayon kay G.A. Tlegenova, 1990)

Pangkat 1: mga batang lalaki na may matataas na marka sa sukat ng AggressionFPI- R (n 1 =10)

Pangkat 2: mga batang lalaki na may mababang halaga sa scale ng AggressionFPI- R (n 2 =11)

d(c m )

% bahagi

d(c M )

% bahagi

"Kumain ka na

Epekto"

d≤50 cm

18,2%

"Hindi

epekto"

d>50 cm

80 QO

81,8%

Mga halaga

100%

100%

Karaniwan

5b:o

77.3

Bumuo tayo ng mga hypotheses.

H 0 d 50 cm, sa grupo ng mga agresibong lalaki ay wala nang hihigit pa sa grupo ng mga hindi agresibong lalaki.

H 1 : Proporsyon ng mga taong pumipili ng distansyad50 cm, higit pa sa grupo ng mga agresibong binata kaysa sa grupo ng mga hindi agresibong binata. Ngayon, bumuo tayo ng tinatawag na four-cell table.

Talahanayan 53

Four-cell table para sa pagkalkula ng φ* criterion kapag naghahambing ng mga grupo ng agresibo (nf=10) at hindi agresibong kabataang lalaki (n2=11)

Mga grupo

"May epekto": d≤50

"Walang epekto." d>50

Mga halaga

Bilang ng mga paksa

(% bahagi)

Bilang ng mga paksa

(% bahagi)

Pangkat 1 - mga agresibong binata

(70%)

(30%)

Pangkat 2 - hindi agresibong mga kabataang lalaki

(180%)

(81,8%)

Sum

Ayon sa Talahanayan.XIITinutukoy ng Appendix 1 ang mga halaga ng φ na naaayon sa porsyento ng mga bahagi ng "epekto" sa bawat isa sa mga pangkat.

Ang nakuhang empirical value φ* ay nasa zone of significance.

Sagot: H 0 tinanggihan. TinanggapH 1 . Ang proporsyon ng mga taong pumili ng distansya sa pag-uusap na mas mababa sa o katumbas ng 50 cm ay mas malaki sa grupo ng mga agresibong binata kaysa sa grupo ng mga hindi agresibong binata

Batay sa mga resultang nakuha, mahihinuha natin na ang mas agresibong kabataang lalaki ay mas madalas na pumili ng distansiyang mas mababa sa kalahating metro, habang ang hindi agresibong kabataang lalaki ay mas madalas na pumili ng distansiyang higit sa kalahating metro. Nakikita namin na ang mga agresibong binata ay aktwal na nakikipag-usap sa hangganan sa pagitan ng intimate (0-46 cm) at mga personal na zone (mula sa 46 cm). Naaalala namin, gayunpaman, na ang matalik na distansya sa pagitan ng mga kasosyo ay ang prerogative ng hindi lamang malapit, magandang relasyon, ngunitAtkamay-sa-kamay na labanan (HallE. T., 1959).

Halimbawa 3 - paghahambing ng mga sample sa parehong antas at pamamahagi ng katangian.

Sa ganitong kaso ng paggamit, maaari muna nating subukan kung ang mga pangkat ay naiiba sa mga antas ng ilang katangian at pagkatapos ay ihambing ang mga distribusyon ng katangian sa dalawang sample. Ang ganitong gawain ay maaaring may kaugnayan kapag sinusuri ang mga pagkakaiba sa mga saklaw o hugis ng distribusyon ng mga pagtatasa na nakuha ng mga paksa gamit ang anumang bagong pamamaraan.

Sa isang pag-aaral ni R. T. Chirkina (1995), sa kauna-unahang pagkakataon, ginamit ang isang talatanungan na naglalayong tukuyin ang ugali na pigilan ang mga katotohanan, pangalan, intensyon at paraan ng pagkilos mula sa memorya dahil sa personal, pamilya at propesyonal na mga kumplikado. Ang palatanungan ay nilikha kasama ang pakikilahok ng E.V. Sidorenko batay sa mga materyales mula sa aklat na 3. Freud "Psychopathology of Everyday Life". Ang isang sample ng 50 mga mag-aaral ng Pedagogical Institute, walang asawa, walang mga anak, na may edad na 17 hanggang 20 taon, ay sinuri gamit ang talatanungan na ito, pati na rin ang diskarteng Menester-Corzini upang matukoy ang intensity ng pakiramdam ng personal na kakulangan,o"inferiority complex" (ManasterG. J., CorsiniR. J., 1982).

Ang mga resulta ng survey ay ipinakita sa Talahanayan. 5.4.

Posible bang sabihin na mayroong anumang makabuluhang ugnayan sa pagitan ng tagapagpahiwatig ng enerhiya ng panunupil, na nasuri gamit ang isang palatanungan, at mga tagapagpahiwatig ng tindi ng pakiramdam ng sariling kakulangan?

Talahanayan 5.4

Mga tagapagpahiwatig ng intensity ng mga damdamin ng personal na kakulangan sa mga grupo ng mga mag-aaral na may mataas na (nj=18) at mababang (n2=24) displacement energy

Pangkat 1: displacement energy mula 19 hanggang 31 puntos (n 1 =181

Pangkat 2: displacement energy mula 7 hanggang 13 puntos (n 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

Mga halaga

Karaniwan

26,11

15,42

Sa kabila ng katotohanan na ang average na halaga sa pangkat na may mas energetic na panunupil ay mas mataas, 5 zero na mga halaga ay sinusunod din dito. Kung ihahambing natin ang mga histogram ng pamamahagi ng mga rating sa dalawang sample, isang kapansin-pansing kaibahan ang makikita sa pagitan nila (Larawan 5.3).

Upang ihambing ang dalawang distribusyon maaari naming ilapat ang pagsubokχ 2 o pamantayanλ , ngunit para dito kailangan nating palakihin ang mga ranggo, at bilang karagdagan, sa parehong mga samplen <30.

Ang φ* criterion ay magbibigay-daan sa amin na suriin ang epekto ng pagkakaiba sa pagitan ng dalawang distribusyon na naobserbahan sa graph kung sumasang-ayon kaming ipagpalagay na "may epekto" kung ang tagapagpahiwatig ng mga damdamin ng kakulangan ay tumatagal ng alinman sa napakababa (0) o, sa kabaligtaran , napakataas na halaga (S30), at na "walang epekto" kung ang tagapagpahiwatig ng mga damdamin ng kakulangan ay tumatagal ng mga average na halaga, mula 5 hanggang 25.

Bumuo tayo ng mga hypotheses.

H 0 : Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas masiglang panunupil ay hindi mas karaniwan kaysa sa pangkat na may hindi gaanong masiglang panunupil.

H 1 : Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas masiglang panunupil ay mas karaniwan kaysa sa pangkat na may hindi gaanong masiglang panunupil.

Gumawa tayo ng four-cell table na maginhawa para sa karagdagang pagkalkula ng φ* criterion.

Talahanayan 5.5

Four-cell table para sa pagkalkula ng φ* criterion kapag inihahambing ang mga pangkat na may mas mataas at mas mababang repression energies batay sa ratio ng insufficiency indicators

Mga grupo

"May epekto": ang tagapagpahiwatig ng kakulangan ay 0 o >30

"Walang epekto": index ng pagkabigo mula 5 hanggang 25

Mga halaga

(88,9%)

(11,1%)

(33,3%)

(66,7%)

Mga halaga

Ayon sa Talahanayan.XIISa Appendix 1, tinutukoy namin ang mga halaga ng φ na naaayon sa inihambing na mga porsyento:

Kalkulahin natin ang empirical na halaga ng φ*:

Mga kritikal na halaga ng φ* para sa anumann 1 , n 2 , gaya ng naaalala natin mula sa nakaraang halimbawa, ay:

mesaXIIIAng Appendix 1 ay nagpapahintulot sa amin na mas tumpak na matukoy ang antas ng kahalagahan ng resulta na nakuha: p<0,001.

Sagot: H 0 tinanggihan. TinanggapH 1 . Ang mga matinding halaga ng index ng kakulangan (alinman sa 0 o 30 o higit pa) sa pangkat na may mas mataas na enerhiya ng panunupil ay nangyayari nang mas madalas kaysa sa pangkat na may mas kaunting enerhiya ng panunupil.

Kaya, ang mga paksa na may higit na lakas ng panunupil ay maaaring magkaroon ng parehong napakataas (30 o higit pa) at napakababa (zero) na mga tagapagpahiwatig ng pakiramdam ng kanilang sariling kakulangan. Maaaring ipagpalagay na pinipigilan nila ang kanilang kawalang-kasiyahan at ang pangangailangan para sa tagumpay sa buhay. Ang mga pagpapalagay na ito ay nangangailangan ng karagdagang pagsubok.

Ang nakuha na resulta, anuman ang interpretasyon nito, ay nagpapatunay sa mga kakayahan ng φ* criterion sa pagtatasa ng mga pagkakaiba sa hugis ng pamamahagi ng isang katangian sa dalawang sample.

Mayroong 50 tao sa orihinal na sample, ngunit 8 sa kanila ay hindi kasama sa pagsasaalang-alang bilang may average na marka sa repression anergy index (14-15). Ang kanilang mga tagapagpahiwatig ng intensity ng mga damdamin ng kakulangan ay karaniwan din: 6 na halaga ng 20 puntos bawat isa at 2 halaga ng 25 puntos bawat isa.

Ang makapangyarihang mga kakayahan ng φ* criterion ay maaaring ma-verify sa pamamagitan ng pagkumpirma ng isang ganap na naiibang hypothesis kapag sinusuri ang mga materyales ng halimbawang ito. Maaari nating patunayan, halimbawa, na sa isang pangkat na may higit na enerhiya ng panunupil, ang rate ng kakulangan ay mas mataas pa rin, sa kabila ng kabalintunaan ng pamamahagi nito sa pangkat na ito.

Bumuo tayo ng mga bagong hypotheses.

H 0 Ang pinakamataas na halaga ng index ng kakulangan (30 o higit pa) sa pangkat na may mas mataas na enerhiya ng panunupil ay hindi mas karaniwan kaysa sa pangkat na may mas kaunting enerhiya ng panunupil.

H 1 : Ang pinakamataas na halaga ng index ng kakulangan (30 o higit pa) sa pangkat na may mas mataas na enerhiya ng panunupil ay nangyayari nang mas madalas kaysa sa pangkat na may mas kaunting enerhiya ng panunupil. Bumuo tayo ng four-field table gamit ang data sa Table. 5.4.

Talahanayan 5.6

Four-cell table para sa pagkalkula ng φ* criterion kapag inihahambing ang mga pangkat na may mas malaki at mas mababang repression energy ayon sa antas ng insufficiency indicator

Mga grupo

“May epekto”* mas malaki sa o katumbas ng 30 ang indicator ng pagkabigo

"Walang epekto": mas mababa ang rate ng pagkabigo 30

Mga halaga

Pangkat 1 - na may higit na enerhiya sa pag-aalis

(61,1%)

(38.9%)

Pangkat 2 - na may mas mababang displacement energy

(25.0%)

(75.0%)

Mga halaga

Ayon sa Talahanayan.XIIISa Appendix 1, tinutukoy namin na ang resultang ito ay tumutugma sa antas ng kahalagahan ng p = 0.008.

Sagot: Ngunit ito ay tinanggihan. TinanggapHj: Ang pinakamataas na tagapagpahiwatig ng kakulangan (30 o higit pang mga puntos) sa grupoSana may mas malaking displacement energy ay nangyayari nang mas madalas kaysa sa grupong may mas kaunting displacement energy (p = 0.008).

Kaya, napatunayan namin iyonVpangkatSana may mas masiglang panunupil, ang mga matinding halaga ng tagapagpahiwatig ng kakulangan ay nangingibabaw, at ang katotohanan na ang tagapagpahiwatig na ito ay lumampas sa mga halaga nitoumaboteksakto sa grupong ito.

Ngayon ay maaari nating subukang patunayan na sa pangkat na may mas mataas na enerhiya ng panunupil, mas karaniwan ang mas mababang mga halaga ng index ng kakulangan, sa kabila ng katotohanan na ang average na halagaV ang pangkat na ito ay may higit pa (26.11 kumpara sa 15.42 sa grupoSa mas kaunting displacement).

Bumuo tayo ng mga hypotheses.

H 0 : Pinakamababang antas ng kakulangan (zero) sa grupoSa Ang mga pagsupil na may mas malaking enerhiya ay hindi mas karaniwan kaysa sa grupoSa mas kaunting displacement energy.

H 1 : Ang pinakamababang antas ng kakulangan (zero) ay nangyayariV pangkat na may mas mataas na enerhiya ng panunupil nang mas madalas kaysa sa grupoSa hindi gaanong masiglang panunupil. Ipangkat natin ang data sa isang bagong talahanayan na may apat na cell.

Talahanayan 5.7

Four-cell table para sa paghahambing ng mga grupo na may iba't ibang repression energies batay sa dalas ng zero value ng deficiency indicator

Mga grupo

"May epekto": ang tagapagpahiwatig ng kabiguan ay 0

"Walang epekto" ng kakulangan

ang tagapagpahiwatig ay hindi katumbas ng 0

Mga halaga

Pangkat 1 - na may higit na enerhiya sa pag-aalis

(27,8%)

(72,2%)

1 pangkat - na may mas kaunting enerhiya sa pag-aalis

(8,3%)

(91,7%)

Mga halaga

Tinutukoy namin ang mga halaga ng φ at kinakalkula ang halaga ng φ*:

Sagot: H 0 tinanggihan. Ang pinakamababang mga indeks ng kakulangan (zero) sa pangkat na may mas mataas na enerhiya ng panunupil ay mas karaniwan kaysa sa pangkat na may mas kaunting enerhiya ng panunupil (p<0,05).

Sa kabuuan, ang mga resulta na nakuha ay maaaring isaalang-alang bilang katibayan ng isang bahagyang pagkakataon ng mga konsepto ng kumplikado sa S. Freud at A. Adler.

Mahalaga na sa pagitan ng tagapagpahiwatig ng enerhiya ng panunupil at ang tagapagpahiwatig ng intensity ng pakiramdam ng sariling kakulangan sa sample sa kabuuan, isang positibong linear correlation ang nakuha (p = +0.491, p<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Halimbawa 4 - gamit ang φ* criterion kasama ng criterion λ Kolmogorov-Smirnov upang makamit ang maximum tumpakresulta

Kung ang mga sample ay inihambing ayon sa anumang mga indicator na sinusukat sa dami, ang problema ay lumitaw sa pagtukoy ng distribution point na maaaring gamitin bilang isang kritikal na punto sa paghahati sa lahat ng mga paksa sa mga "may epekto" at sa mga "walang epekto."

Sa prinsipyo, ang punto kung saan hahatiin natin ang grupo sa mga subgroup kung saan mayroong epekto at kung saan walang epekto ay maaaring piliin nang arbitraryo. Maaari kaming maging interesado sa anumang epekto at, samakatuwid, maaari naming hatiin ang parehong mga sample sa dalawang bahagi sa anumang punto, hangga't ito ay may katuturan.

Upang ma-maximize ang kapangyarihan ng φ* na pagsubok, gayunpaman, kinakailangang piliin ang punto kung saan ang mga pagkakaiba sa pagitan ng dalawang pinaghahambing na grupo ay pinakamalaki. Sa pinakatumpak, magagawa natin ito gamit ang isang algorithm para sa pagkalkula ng criterionλ , na nagbibigay-daan sa iyong makita ang punto ng maximum na pagkakaiba sa pagitan ng dalawang sample.

Posibilidad ng pagsasama-sama ng pamantayan φ* atλ inilarawan ni E.V. Gubler (1978, pp. 85-88). Subukan nating gamitin ang paraang ito sa paglutas ng sumusunod na problema.

Sa pinagsamang pag-aaral ni M.A. Kurochkina, E.V. Sidorenko at Yu.A. Nagsagawa si Churakov (1992) sa UK ng isang survey sa mga English general practitioner ng dalawang kategorya: a) mga doktor na sumuporta sa repormang medikal at ginawa na ang kanilang mga tanggapan sa pagtanggap sa mga organisasyong may hawak ng pondo na may sariling badyet; b) mga doktor na ang mga opisina ay wala pa ring sariling pondo at ganap na ibinibigay ng badyet ng estado. Ang mga talatanungan ay ipinadala sa isang sample ng 200 mga doktor, kinatawan ng pangkalahatang populasyon ng mga doktor sa Ingles sa mga tuntunin ng representasyon ng mga tao ng iba't ibang kasarian, edad, haba ng serbisyo at lugar ng trabaho - sa malalaking lungsod o sa mga lalawigan.

78 mga doktor ang tumugon sa talatanungan, kung saan 50 ang nagtrabaho sa mga waiting room na may mga pondo at 28 mula sa mga waiting room na walang pondo. Ang bawat isa sa mga doktor ay kailangang hulaan kung ano ang magiging bahagi ng mga admission na may mga pondo sa susunod na taon, 1993. 70 doktor lamang sa 78 na nagpadala ng mga sagot ang sumagot sa tanong na ito. Ang pamamahagi ng kanilang mga pagtataya ay ipinakita sa Talahanayan. 5.8 nang hiwalay para sa grupo ng mga doktor na may pondo at sa grupo ng mga doktor na walang pondo.

Ang mga hula ba ng mga doktor na may pondo at mga doktor na walang pondo ay iba sa anumang paraan?

Talahanayan 5.8

Pamamahagi ng mga hula mula sa mga general practitioner tungkol sa magiging bahagi ng mga emergency room na may pondo sa 1993

Inaasahang bahagi

mga silid sa pagtanggap na may mga pondo

mga doktor na may pondo (n 1 =45)

mga doktor na walang pondo (n 2 =25)

Mga halaga

1. mula 0 hanggang 20%

4

5

9

2. mula 21 hanggang 40%

15

AT

26

3. mula 41 hanggang 60%

18

5

23

4. mula 61 hanggang 80%

7

4

AT

5. mula 81 hanggang 100%

1

0

1

Mga halaga

45

25

70

Tukuyin natin ang punto ng pinakamataas na pagkakaiba sa pagitan ng dalawang distribusyon ng tugon gamit ang Algorithm 15 mula sa sugnay 4.3 (tingnan ang Talahanayan 5.9).

Talahanayan 5.9

Pagkalkula ng maximum na pagkakaiba sa mga naipon na frequency sa mga pamamahagi ng mga pagtataya ng mga doktor ng dalawang grupo

Tinatayang bahagi ng mga admission na may mga pondo (%)

Mga empirical na frequency na pinili para sa isang partikular na kategorya ng tugon

Empirical frequency

Pinagsama-samang empirical frequency

Pagkakaiba (d)

mga doktor na may pondo(n 1 =45)

mga doktor na walang pondo (n 2 =25)

f* eh 1

f* a2

f* e1

f* a1

1. mula 0 hanggang 20%

2. mula 21 hanggang 40%

3. mula 41 hanggang 60%

4. mula 61 hanggang 80%

5. mula 81 hanggang 100%

4

15

18

7

1

5

11

5

4

0

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

1,000

0111

0,218 0,018 0,022

0

Ang pinakamataas na pagkakaiba na nakita sa pagitan ng dalawang naipon na empirical frequency ay0,218.

Ang pagkakaibang ito ay lumalabas na naipon sa pangalawang kategorya ng pagtataya. Subukan nating gamitin ang pinakamataas na limitasyon ng kategoryang ito bilang criterion para sa paghahati ng parehong sample sa isang subgroup kung saan "may epekto" at isang subgroup kung saan "walang epekto." Ipagpalagay namin na mayroong "epekto" kung hinuhulaan ng isang doktor mula 41 hanggang 100% ng mga admission na may pondo sa1993 taon, at na walang "epekto" kung hinuhulaan ng isang doktor mula 0 hanggang 40% ng mga admission na may pondo sa1993 taon. Pinagsasama namin ang mga kategorya ng pagtataya 1 at 2 sa isang banda, at ang mga kategorya ng pagtataya 3, 4 at 5 sa kabilang banda. Ang resultang pamamahagi ng mga pagtataya ay ipinakita sa Talahanayan. 5.10.

Talahanayan 5.10

Pamamahagi ng mga pagtataya para sa mga doktor na may pondo at mga doktor na walang pondo

Inaasahang bahagi ng mga admission na may mga pondo (%1

Empirical frequency para sa pagpili ng isang ibinigay na kategorya ng forecast

Mga halaga

mga doktor na may pondo(n 1 =45)

mga doktor na walang pondo(n 2 =25)

1. mula 0 hanggang 40%

19

16

35

2. mula 41 hanggang 100%

26

9

35

Mga halaga

45

25

70

Magagamit natin ang resultang talahanayan (Talahanayan 5.10) upang subukan ang iba't ibang hypotheses sa pamamagitan ng paghahambing ng alinman sa dalawa sa mga cell nito. Natatandaan natin na ito ang tinatawag na four-cell, o four-field, table.

Dito, kami ay interesado sa kung ang mga manggagamot na mayroon nang mga pondo ay hinuhulaan ang mas malaking hinaharap na paglago ng kilusang ito kaysa sa mga manggagamot na walang mga pondo. Samakatuwid, may kondisyon kaming isinasaalang-alang na "may epekto" kapag ang forecast ay nahulog sa kategorya mula 41 hanggang 100%. Upang gawing simple ang mga kalkulasyon, kailangan na nating paikutin ang talahanayan ng 90°, paikutin ito sa direksyong pakanan. Maaari mo ring gawin ito nang literal sa pamamagitan ng pag-ikot ng libro kasama ang talahanayan. Ngayon ay maaari na tayong magpatuloy sa worksheet para sa pagkalkula ng φ* criterion - Fisher's Angular Transform.

mesa 5.11

Four-cell table para sa pagkalkula ng Fisher's φ* test para matukoy ang mga pagkakaiba sa mga hula ng dalawang grupo ng mga general practitioner

Grupo

May epekto - pagtataya mula 41 hanggang 100%

Walang epekto - pagtataya mula 0 hanggang 40%

Kabuuan

akogrupo - mga doktor na kumuha ng pondo

26 (57.8%)

19 (42.2%)

45

IIgrupo - mga doktor na hindi kumuha ng pondo

9 (36.0%)

16 (64.0%)

25

Kabuuan

35

35

70

Bumuo tayo ng mga hypotheses.

H 0 : Proporsyon ng mga taohinuhulaan ang pagkalat ng mga pondo sa 41%-100% ng lahat ng mga opisina ng doktor, sa grupo ng mga doktor na may mga pondo ay hindi hihigit sa grupo ng mga doktor na walang pondo.

H 1 : Ang proporsyon ng mga taong hinuhulaan ang pagkalat ng mga pondo sa 41%-100% ng lahat ng admission ay mas malaki sa grupo ng mga doktor na may pondo kaysa sa grupo ng mga doktor na walang pondo.

Pagtukoy sa mga halaga ng φ 1 at φ 2 ayon sa TalahanayanXIIAppendix 1. Tandaan na φ 1 ay palaging anggulo na tumutugma sa mas malaking porsyento.

Ngayon, alamin natin ang empirical na halaga ng criterion φ*:

Ayon sa Talahanayan.XIIISa Appendix 1, tinutukoy natin kung anong antas ng kahalagahan ang katumbas ng halagang ito: p = 0.039.

Gamit ang parehong talahanayan sa Appendix 1, matutukoy mo ang mga kritikal na halaga ng criterion φ*:

Sagot: Ngunit ito ay tinanggihan (p=0.039). Ang bahagi ng mga taong hinuhulaan ang pagkalat ng mga pondo sa41-100 % sa lahat ng mga pagtanggap sa grupo ng mga doktor na kumuha ng pondo ay lumampas sa bahaging ito sa grupo ng mga doktor na hindi kumuha ng pondo.

Sa madaling salita, ang mga doktor na nagtatrabaho na sa kanilang mga waiting room sa isang hiwalay na badyet ay hinuhulaan ang mas malawak na pagkalat ng pagsasanay na ito sa taong ito kaysa sa mga doktor na hindi pa sumang-ayon na lumipat sa isang independiyenteng badyet. Mayroong maraming interpretasyon ng resultang ito. Halimbawa, maaaring ipagpalagay na ang mga doktor sa bawat grupo ay hindi malay na isinasaalang-alang ang kanilang pag-uugali na mas karaniwan. Ito ay maaaring mangahulugan din na ang mga doktor na nagpatibay na ng sariling pagpopondo ay may posibilidad na palakihin ang saklaw ng kilusang ito, dahil kailangan nilang bigyang-katwiran ang kanilang desisyon. Ang mga natukoy na pagkakaiba ay maaari ding mangahulugan ng isang bagay na ganap na lampas sa saklaw ng mga tanong na iniharap sa pag-aaral. Halimbawa, na ang aktibidad ng mga doktor na nagtatrabaho sa isang independiyenteng badyet ay nag-aambag sa pagpapatalas ng mga pagkakaiba sa mga posisyon ng parehong grupo. Mas aktibo sila kapag pumayag silang kunin ang mga pondo, mas aktibo sila kapag nahirapan silang sagutin ang talatanungan sa koreo; mas aktibo sila kapag hinuhulaan nila na ang ibang mga manggagamot ay magiging mas aktibo sa pagtanggap ng mga pondo.

Sa isang paraan o iba pa, makatitiyak tayo na ang natukoy na antas ng mga pagkakaiba sa istatistika ay ang pinakamataas na posible para sa totoong data na ito. Itinatag namin gamit ang criterionλ ang punto ng pinakamataas na pagkakaiba sa pagitan ng dalawang distribusyon, at sa puntong ito na ang mga sample ay nahahati sa dalawang bahagi.

Ang marka mo.

Ibinabalik ng FISCHER function ang Fisher transform ng mga argumento sa X . Ang pagbabagong ito ay gumagawa ng isang function na may normal kaysa sa baluktot na distribusyon. Ang FISCHER function ay ginagamit upang subukan ang hypothesis gamit ang correlation coefficient.

Paglalarawan ng FISCHER function sa Excel

Kapag nagtatrabaho sa function na ito, dapat mong itakda ang halaga ng variable. Kapansin-pansin kaagad na may ilang mga sitwasyon kung saan ang pagpapaandar na ito ay hindi magbubunga ng mga resulta. Posible ito kung ang variable ay:

  • ay hindi isang numero. Sa ganoong sitwasyon, ibabalik ng FISCHER function ang error value na #VALUE!;
  • ay may value na mas mababa sa -1 o mas malaki sa 1. Sa kasong ito, ibabalik ng FISCHER function ang error value na #NUM!.

Ang equation na ginagamit upang ilarawan ang FISCHER function sa matematika ay:

Z"=1/2*ln(1+x)/(1-x)

Isaalang-alang natin ang paggamit ng function na ito gamit ang 3 partikular na halimbawa.



Pagtatantya ng kaugnayan sa pagitan ng kita at mga gastos gamit ang FISHER function

Halimbawa 1. Gamit ang data sa aktibidad ng mga komersyal na organisasyon, kinakailangan na gumawa ng pagtatasa ng ugnayan sa pagitan ng tubo Y (milyong rubles) at mga gastos X (milyong rubles) na ginagamit para sa pagbuo ng produkto (ipinapakita sa Talahanayan 1).

Talahanayan 1 – Paunang data:

XY
1 210,000,000.00 RUR95,000,000.00 RUR
2 RUB 1,068,000,000.0076,000,000.00 RUR
3 RUB 1,005,000,000.0078,000,000.00 RUR
4 610,000,000.00 RUR89,000,000.00 RUR
5 768,000,000.00 RUR77,000,000.00 RUR
6 799,000,000.00 RUR85,000,000.00 RUR

Ang pamamaraan para sa paglutas ng mga naturang problema ay ang mga sumusunod:

  1. Kinakalkula linear coefficient ugnayan r xy ;
  2. Sinusuri ang kahalagahan ng linear correlation coefficient batay sa t-test ng Mag-aaral. Sa kasong ito, ang isang hypothesis ay inilalagay at nasubok na ang koepisyent ng ugnayan ay katumbas ng zero. Ang t-statistic ay ginagamit upang subukan ang hypothesis na ito. Kung ang hypothesis ay nakumpirma, ang t-statistic ay may distribusyon ng Mag-aaral. Kung ang kinakalkula na halaga t p > t cr, pagkatapos ay ang hypothesis ay tinanggihan, na nagpapahiwatig ng kahalagahan ng linear correlation coefficient, at samakatuwid ay ang istatistikal na kahalagahan ng ugnayan sa pagitan ng X at Y;
  3. Tinutukoy ang pagtatantya ng agwat para sa isang makabuluhang istatistikal na linear correlation coefficient.
  4. Ang pagtatantya ng pagitan para sa linear correlation coefficient ay tinutukoy batay sa inverse Fisher z-transform;
  5. Ang karaniwang error ng linear correlation coefficient ay kinakalkula.

Ang mga resulta ng paglutas ng problemang ito sa mga function na ginamit sa Excel ay ipinapakita sa Figure 1.


Figure 1 – Halimbawa ng mga kalkulasyon.

Hindi.Pangalan ng tagapagpahiwatigFormula ng pagkalkula
1 Koepisyent ng ugnayan=CORREL(B2:B7,C2:C7)
2 Kinakalkula ang halaga ng t-test na tp=ABS(C8)/SQRT(1-POWER(C8,2))*SQRT(6-2)
3 Halaga ng talahanayan ng t-test trh=STUDISCOVER(0.05,4)
4 Halaga ng talahanayan ng pamantayan normal na pamamahagi zy=NORMSINV((0.95+1)/2)
5 Fisher z' transform value=FISHER(C8)
6 Kaliwang pagtatantya ng pagitan para sa z=C12-C11*ROOT(1/(6-3))
7 Tamang pagtatantya ng pagitan para sa z=C12+C11*ROOT(1/(6-3))
8 Kaliwang pagtatantya ng pagitan para sa rxy=FISHEROBR(C13)
9 Tamang pagtatantya ng pagitan para sa rxy=FISHEROBR(C14)
10 Standard deviation para sa rxy=ROOT((1-C8^2)/4)

Kaya, na may posibilidad na 0.95, ang linear correlation coefficient ay nasa hanay mula sa (–0.386) hanggang (–0.990) na may karaniwang error na 0.205.

Sinusuri ang istatistikal na kahalagahan ng regression gamit ang FASTER function

Halimbawa 2: Subukan ang istatistikal na kahalagahan ng equation maramihang pagbabalik Gamit ang Fisher's F test, gumawa ng mga konklusyon.

Upang suriin ang kahalagahan ng equation sa kabuuan, inilagay namin ang hypothesis H 0 tungkol sa statistical insignificance ng coefficient of determination at ang kabaligtaran na hypothesis H 1 tungkol sa statistical significance ng coefficient of determination:

H 1: R 2 ≠ 0.

Subukan natin ang mga hypotheses gamit ang Fisher's F test. Ang mga tagapagpahiwatig ay ipinapakita sa Talahanayan 2.

Talahanayan 2 - Paunang data

Upang gawin ito, ginagamit namin ang function sa Excel:

MAS MABILIS (α;p;n-p-1)

  • Ang α ay ang posibilidad na nauugnay sa isang naibigay na pamamahagi;
  • Ang p at n ay ang numerator at denominator ng mga antas ng kalayaan, ayon sa pagkakabanggit.

Alam na ang α = 0.05, p = 2 at n = 53, nakuha namin ang sumusunod na halaga para sa F crit (tingnan ang Larawan 2).


Figure 2 – Halimbawa ng mga kalkulasyon.

Kaya masasabi natin na F kalkulado > F kritikal. Bilang resulta, tinatanggap ang hypothesis H 1 tungkol sa statistical significance ng coefficient of determination.

Kinakalkula ang halaga ng tagapagpahiwatig ng ugnayan sa Excel

Halimbawa 3. Paggamit ng data mula sa 23 negosyo tungkol sa: X ay ang presyo ng produkto A, libong rubles; Ang Y ay ang kita ng isang negosyo sa pangangalakal, milyong rubles; ang kanilang pag-asa ay pinag-aaralan. Grade modelo ng regression nagbigay ng sumusunod: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. Anong tagapagpahiwatig ng ugnayan ang maaaring matukoy mula sa mga datos na ito? Kalkulahin ang halaga ng tagapagpahiwatig ng ugnayan at, gamit ang pamantayan ng Fisher, gumawa ng konklusyon tungkol sa kalidad ng modelo ng regression.

Tukuyin natin ang F crit mula sa expression:

F nakalkula = R 2 /23*(1-R 2)

kung saan ang R ay ang koepisyent ng determinasyon na katumbas ng 0.67.

Kaya, ang kinakalkula na halaga F calc = 46.

Para matukoy ang F crit ginagamit namin ang Fisher distribution (tingnan ang Figure 3).


Figure 3 – Halimbawa ng mga kalkulasyon.

Kaya, ang resultang pagtatantya ng equation ng regression ay maaasahan.

Ang kahalagahan ng multiple regression equation sa kabuuan, pati na rin sa paired regression, ay tinasa gamit ang Fisher criterion:

, (2.22)

saan
– factor sum ng mga parisukat sa bawat antas ng kalayaan;
– natitirang kabuuan ng mga parisukat bawat antas ng kalayaan;
– koepisyent (index) ng maramihang pagpapasiya;
– bilang ng mga parameter para sa mga variable (V linear regression tumutugma sa bilang ng mga kadahilanan na kasama sa modelo); - bilang ng mga obserbasyon.

Ang kahalagahan ng hindi lamang ang equation sa kabuuan ay tinasa, kundi pati na rin ang salik na kasama sa modelo ng regression. Ang pangangailangan para sa naturang pagtatasa ay dahil sa ang katunayan na hindi lahat ng kadahilanan na kasama sa modelo ay maaaring makabuluhang taasan ang proporsyon ng ipinaliwanag na pagkakaiba-iba sa resultang katangian. Bilang karagdagan, kung mayroong ilang mga kadahilanan sa modelo, maaari silang ipasok sa modelo sa iba't ibang mga pagkakasunud-sunod. Dahil sa ugnayan sa pagitan ng mga kadahilanan, ang kahalagahan ng parehong kadahilanan ay maaaring magkakaiba depende sa pagkakasunud-sunod ng pagpapakilala nito sa modelo. Ang panukala para sa pagtatasa ng pagsasama ng isang salik sa modelo ay ang pribado
-pamantayan, i.e. .

Pribado
-criterion ay batay sa paghahambing ng pagtaas sa pagkakaiba-iba ng kadahilanan dahil sa impluwensya ng isang karagdagang kasamang kadahilanan sa natitirang pagkakaiba sa bawat isang antas ng kalayaan para sa modelo ng regression sa kabuuan. SA pangkalahatang pananaw para sa kadahilanan pribado
-ang criterion ay matutukoy bilang

, (2.23)

saan
– koepisyent ng maramihang pagpapasiya para sa isang modelo na may buong hanay ng mga salik,
– ang parehong tagapagpahiwatig, ngunit hindi kasama ang kadahilanan sa modelo ,- bilang ng mga obserbasyon,
– bilang ng mga parameter sa modelo (nang walang libreng termino).

Aktwal na halaga ng quotient
- ang criterion ay inihambing sa talahanayan sa antas ng kahalagahan
at bilang ng mga antas ng kalayaan: 1 at
. Kung ang aktwal na halaga lumampas
, pagkatapos ay ang karagdagang pagsasama ng kadahilanan sa modelo ay nabibigyang katwiran ayon sa istatistika at ang purong regression coefficient sa kadahilanan makabuluhang istatistika. Kung ang aktwal na halaga ay mas mababa kaysa sa halaga ng talahanayan, pagkatapos ay karagdagang pagsasama ng kadahilanan sa modelo hindi makabuluhang pinapataas ang proporsyon ng ipinaliwanag na pagkakaiba-iba sa isang katangian , samakatuwid, hindi nararapat na isama ito sa modelo; Ang regression coefficient para sa salik na ito sa kasong ito ay hindi gaanong mahalaga sa istatistika.

Para sa isang two-factor equation, ang mga quotient
-ang mga pamantayan ay may anyo:

,
. (2.23a)

Gamit ang pribado
-criterion, masusuri ng isa ang kahalagahan ng lahat ng coefficient ng regression sa ilalim ng pag-aakalang ang bawat katumbas na salik huling pumasok sa multiple regression equation.

-Pagsusulit ng mag-aaral para sa multiple regression equation.

Pribado
-nasusuri ng criterion ang kahalagahan ng purong regression coefficients. Alam ang magnitude , posibleng matukoy -criterion para sa regression coefficient sa -m factor, , ibig sabihin:

. (2.24)

Pagtatasa ng kahalagahan ng purong regression coefficients sa pamamagitan ng -Maaaring isagawa ang t-test ng mag-aaral nang hindi kinakalkula ang partial
-pamantayan. Sa kasong ito, tulad ng sa pairwise regression, ang formula ay ginagamit para sa bawat salik:

, (2.25)

saan – purong regression coefficient sa factor ,– mean square (standard) error ng regression coefficient .

Para sa isang multiple regression equation, ang mean square error ng regression coefficient ay maaaring matukoy ng sumusunod na formula:

, (2.26)

saan ,– karaniwang paglihis para sa katangian ,
– koepisyent ng determinasyon para sa multiple regression equation,
– koepisyent ng determinasyon para sa pagtitiwala ng salik kasama ang lahat ng iba pang salik sa multiple regression equation;
– bilang ng mga antas ng kalayaan para sa natitirang kabuuan ng mga squared deviations.

Tulad ng nakikita mo, upang magamit ang formula na ito, kailangan mo ng isang interfactor correlation matrix at ang pagkalkula ng kaukulang mga coefficient ng pagpapasiya gamit ito.
. Kaya, para sa equation
pagtatasa ng kahalagahan ng regression coefficients ,,nagsasangkot ng pagkalkula ng tatlong interfactor determination coefficient:
,
,
.

Ang ugnayan sa pagitan ng mga tagapagpahiwatig ng bahagyang koepisyent ng ugnayan, bahagyang
-pamantayan at -Ang t-test ng mag-aaral para sa mga purong regression coefficient ay maaaring gamitin sa pamamaraan ng pagpili ng salik. Ang pag-aalis ng mga kadahilanan kapag bumubuo ng isang equation ng regression sa pamamagitan ng paraan ng pag-aalis ay maaaring praktikal na isagawa hindi lamang sa pamamagitan ng bahagyang mga koepisyent ng ugnayan, hindi kasama sa bawat hakbang ang kadahilanan na may pinakamaliit na hindi gaanong halaga ng bahagyang koepisyent ng ugnayan, kundi pati na rin ng mga halaga. At . Pribado
-malawakang ginagamit ang criterion kapag gumagawa ng modelo gamit ang paraan ng pagsasama ng mga variable at ang stepwise regression method.



Bago sa site

>

Pinaka sikat