Mājas Mutes dobums Atrodiet 95 ticamības intervālu. Paraugi un ticamības intervāli

Atrodiet 95 ticamības intervālu. Paraugi un ticamības intervāli

Pārliecības intervāls priekš matemātiskās cerības ir intervāls, kas aprēķināts no datiem, kas satur matemātisko cerību ar zināmu varbūtību populācija. Matemātiskās cerības dabiskais novērtējums ir tās novēroto vērtību vidējais aritmētiskais. Tāpēc visas nodarbības laikā izmantosim terminus “vidējā” un “vidējā vērtība”. Uzticamības intervāla aprēķināšanas uzdevumos visbiežāk prasītā atbilde ir šāda: “Vidējā skaitļa [vērtība konkrētā uzdevumā] ticamības intervāls ir no [mazāka vērtība] līdz [lielāka vērtība]. Izmantojot ticamības intervālu, varat novērtēt ne tikai vidējās vērtības, bet arī konkrēta raksturlieluma īpatsvaru vispārējā populācijā. Nodarbībā tiek apspriestas vidējās vērtības, dispersija, standarta novirze un kļūda, caur kurām mēs nonāksim pie jaunām definīcijām un formulām. Izlases un populācijas raksturojums .

Punktu un intervālu aplēses par vidējo

Ja kopas vidējo vērtību novērtē pēc skaitļa (punkta), tad par kopas nezināmās vidējās vērtības novērtējumu tiek ņemts konkrēts vidējais, kas tiek aprēķināts no novērojumu izlases. Šajā gadījumā izlases vidējā vērtība ir nejaušais mainīgais- nesakrīt ar iedzīvotāju vidējo vērtību. Tāpēc, norādot izlases vidējo vērtību, vienlaikus jānorāda izlases kļūda. Izlases kļūdas mērs ir standarta kļūda, ko izsaka tajās pašās vienībās kā vidējo. Tāpēc bieži tiek lietots šāds apzīmējums: .

Ja vidējā aplēse ir jāsaista ar noteiktu varbūtību, tad populācijā interesējošais parametrs jānovērtē nevis pēc viena skaitļa, bet pēc intervāla. Ticamības intervāls ir intervāls, kurā ar noteiktu varbūtību P tiek atrasta aplēstā iedzīvotāju skaita rādītāja vērtība. Pārliecības intervāls, kurā tas ir iespējams P = 1 - α nejaušo lielumu atrod, aprēķina šādi:

,

α = 1 - P, kuru var atrast gandrīz jebkuras statistikas grāmatas pielikumā.

Praksē populācijas vidējā vērtība un dispersija nav zināma, tāpēc populācijas dispersiju aizstāj ar izlases dispersiju, bet populācijas vidējo ar izlases vidējo. Tādējādi ticamības intervālu vairumā gadījumu aprēķina šādi:

.

Ticamības intervāla formulu var izmantot, lai novērtētu populācijas vidējo vērtību, ja

  • ir zināma populācijas standartnovirze;
  • vai arī populācijas standartnovirze nav zināma, bet izlases lielums ir lielāks par 30.

Izlases vidējais rādītājs ir objektīvs populācijas vidējā aprēķins. Savukārt izlases dispersija nav objektīvs populācijas dispersijas novērtējums. Lai iegūtu objektīvu populācijas dispersijas novērtējumu izlases dispersijas formulā, izlases lielums n jāaizstāj ar n-1.

1. piemērs. No 100 nejauši izvēlētām kafejnīcām noteiktā pilsētā tika apkopota informācija, ka vidējais darbinieku skaits tajās ir 10,5 ar standartnovirzi 4,6. Definējiet ticamības intervāls 95% kafejnīcu darbinieku.

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Tādējādi 95% ticamības intervāls vidējam kafejnīcu darbinieku skaitam bija robežās no 9,6 līdz 11,4.

2. piemērs. Nejaušam paraugam no 64 novērojumu kopas tika aprēķinātas šādas kopējās vērtības:

novērojumu vērtību summa,

vērtību kvadrātu noviržu summa no vidējā .

Aprēķiniet 95% ticamības intervālu matemātiskajai cerībai.

Aprēķināsim standarta novirzi:

,

Aprēķināsim vidējo vērtību:

.

Mēs aizstājam vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Mēs iegūstam:

Tādējādi šīs izlases matemātiskās cerības 95% ticamības intervāls svārstījās no 7,484 līdz 11,266.

3. piemērs. Nejaušai populācijas izlasei ar 100 novērojumiem aprēķinātais vidējais ir 15,2 un standarta novirze ir 3,2. Aprēķiniet paredzamās vērtības 95% ticamības intervālu, pēc tam 99% ticamības intervālu. Ja izlases jauda un tās variācijas paliek nemainīgas un ticamības koeficients palielinās, vai ticamības intervāls sašaurinās vai paplašināsies?

Mēs aizstājam šīs vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Mēs iegūstam:

.

Tādējādi šīs izlases vidējais 95% ticamības intervāls bija no 14,57 līdz 15,82.

Mēs atkal aizstājam šīs vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,01 .

Mēs iegūstam:

.

Tādējādi šīs izlases vidējais 99% ticamības intervāls bija no 14,37 līdz 16,02.

Kā redzam, pieaugot ticamības koeficientam, pieaug arī standarta normālā sadalījuma kritiskā vērtība, un līdz ar to intervāla sākuma un beigu punkti atrodas tālāk no vidējā, un līdz ar to palielinās matemātiskās cerības ticamības intervāls. .

Īpatnējā smaguma punktu un intervālu aprēķini

Kāda parauga atribūta daļu var interpretēt kā punktu novērtējumu īpaša gravitāte lpp tāda pati īpašība vispārējā populācijā. Ja šī vērtība ir jāsaista ar varbūtību, tad jāaprēķina īpatnējā smaguma ticamības intervāls lpp raksturīgs populācijā ar varbūtību P = 1 - α :

.

4. piemērs. Dažās pilsētās ir divi kandidāti A Un B kandidē uz mēra amatu. Nejauši tika aptaujāti 200 pilsētas iedzīvotāji, no kuriem 46% atbildēja, ka balsotu par kandidātu A, 26% - kandidātam B un 28% nezina, par ko balsos. Nosakiet 95% ticamības intervālu to pilsētas iedzīvotāju īpatsvaram, kuri atbalsta kandidātu A.

Jebkurš paraugs sniedz tikai aptuvenu priekšstatu par vispārējo kopu, un visi izlases statistiskie raksturlielumi (vidējais, režīms, dispersija...) ir vispārīgu parametru aptuvens vai, teiksim, aprēķins, ko vairumā gadījumu nav iespējams aprēķināt. iedzīvotāju nepieejamībai (20. attēls).

20. attēls. Izlases kļūda

Bet jūs varat norādīt intervālu, kurā ar noteiktu varbūtības pakāpi atrodas statistiskā raksturlieluma patiesā (vispārējā) vērtība. Šo intervālu sauc d ticamības intervāls (CI).

Tātad vispārējā vidējā vērtība ar varbūtību 95% atrodas iekšā

no līdz, (20)

Kur t tabulas vērtība Studenta t tests par α =0,05 un f= n-1

Šajā gadījumā var atrast arī 99% TI t atlasīts priekš α =0,01.

Kāda ir ticamības intervāla praktiskā nozīme?

    Plašs ticamības intervāls norāda, ka izlases vidējais rādītājs precīzi neatspoguļo populācijas vidējo vērtību. Parasti tas ir saistīts ar nepietiekamu izlases lielumu vai tā neviendabīgumu, t.i. liela dispersija. Viņi dod abus liela kļūda vidējais un attiecīgi plašāks CI. Un tas ir pamats, lai atgrieztos pētījuma plānošanas stadijā.

    CI augšējā un apakšējā robeža nodrošina novērtējumu par to, vai rezultāti būs klīniski nozīmīgi

Pakavēsimies sīkāk pie jautājuma par grupu īpašību pētījuma rezultātu statistisko un klīnisko nozīmīgumu. Atcerēsimies, ka statistikas uzdevums ir atklāt vismaz dažas atšķirības vispārējās populācijās, pamatojoties uz izlases datiem. Klīnicistu uzdevums ir atklāt atšķirības (ne tikai jebkuras), kas palīdzēs diagnosticēt vai ārstēt. Un statistikas secinājumi ne vienmēr ir klīnisko secinājumu pamatā. Tādējādi statistiski nozīmīga hemoglobīna līmeņa pazemināšanās par 3 g/l nerada bažas. Un, otrādi, ja kāda problēma cilvēka organismā nav plaši izplatīta visu iedzīvotāju līmenī, tas nav iemesls, lai ar šo problēmu netiktu galā.

Apskatīsim šo situāciju piemērs.

Pētnieki jautāja, vai zēni, kuri ir pārcietuši kādu infekcijas slimību, izaugsmē atpaliek no saviem vienaudžiem. Šim nolūkam tas tika veikts izlases veida aptauja, kurā piedalījās 10 zēni, kuri bija cietuši no šīs slimības. Rezultāti ir parādīti 23. tabulā.

23. tabula. Statistiskās apstrādes rezultāti

apakšējā robeža

augšējā robeža

Standarti (cm)

vidēji

No šiem aprēķiniem izriet, ka izlase vidēja auguma 10 gadus veci zēni, kuri cieta infekcija, tuvu normālam (132,5 cm). Taču ticamības intervāla apakšējā robeža (126,6 cm) norāda, ka pastāv 95% varbūtība, ka šo bērnu patiesais vidējais augums atbilst jēdzienam “īss augums”, t.i. šie bērni ir panīkuši.

Šajā piemērā ticamības intervāla aprēķinu rezultāti ir klīniski nozīmīgi.

Viena no statistikas problēmu risināšanas metodēm ir ticamības intervāla aprēķināšana. To izmanto kā vēlamāku alternatīvu punktu tāme ar nelielu izlases lielumu. Jāatzīmē, ka pats ticamības intervāla aprēķināšanas process ir diezgan sarežģīts. Taču Excel rīki to nedaudz atvieglo. Noskaidrosim, kā tas tiek darīts praksē.

Šo metodi izmanto dažādu intervālu novērtēšanai statistiskie lielumi. Šī aprēķina galvenais uzdevums ir atbrīvoties no punktu tāmes nenoteiktībām.

Programmā Excel ir divas galvenās iespējas aprēķinu veikšanai, izmantojot šī metode: kad dispersija ir zināma un kad tā nav zināma. Pirmajā gadījumā funkcija tiek izmantota aprēķiniem TRUST.NORM, un otrajā - UZGLABĀTĀS.STUDENTS.

1. metode: funkcija CONFIDENCE NORM

Operators TRUST.NORM, kas pieder statistikas funkciju grupai, pirmo reizi parādījās programmā Excel 2010. Šīs programmas iepriekšējās versijās tiek izmantots tās analogs UZTICĪBAS. Šī operatora mērķis ir aprēķināt normāli sadalītu ticamības intervālu populācijas vidējam rādītājam.

Tās sintakse ir šāda:

CONFIDENCE.NORM(alfa;standarta_izslēgts;izmērs)

"Alfa"— arguments, kas norāda nozīmīguma līmeni, ko izmanto ticamības līmeņa aprēķināšanai. Uzticamības līmenis ir vienāds ar šādu izteiksmi:

(1-"Alfa")*100

« Standarta novirze» – Tas ir arguments, kura būtība ir skaidra no nosaukuma. Šī ir piedāvātās izlases standarta novirze.

"Izmērs"— arguments, kas nosaka izlases lielumu.

Ir nepieciešami visi šī operatora argumenti.

Funkcija UZTICĪBAS ir tieši tādi paši argumenti un iespējas kā iepriekšējam. Tās sintakse ir:

TRUST(alfa, standarta_izslēgts, izmērs)

Kā redzat, atšķirības ir tikai operatora nosaukumā. Norādītā funkcija saderības apsvērumu dēļ programmā Excel 2010 un jaunākās versijās atstāta īpašā kategorijā "Saderība". Programmas Excel 2007 un vecākās versijās tas ir iekļauts galvenajā statistikas operatoru grupā.

Uzticamības intervāla robežu nosaka, izmantojot šādu formulu:

X+(-)PĀRLIECĪBAS NORMA

Kur X ir vidējā izlases vērtība, kas atrodas atlasītā diapazona vidū.

Tagad apskatīsim, kā aprēķināt ticamības intervālu, izmantojot konkrētu piemēru. Tika veikti 12 testi, kuru rezultātā tabulā ir norādīti dažādi rezultāti. Tas ir mūsu kopums. Standarta novirze ir 8. Mums jāaprēķina ticamības intervāls 97% ticamības līmenī.

  1. Atlasiet šūnu, kurā tiks parādīts datu apstrādes rezultāts. Noklikšķiniet uz pogas "Ievietot funkciju".
  2. Parādās Funkciju vednis. Dodieties uz kategoriju "Statistika" un iezīmējiet nosaukumu "TRUST.NORM". Pēc tam noklikšķiniet uz pogas "LABI".
  3. Tiek atvērts argumentu logs. Tās lauki dabiski atbilst argumentu nosaukumiem.
    Novietojiet kursoru pirmajā laukā - "Alfa". Šeit mums jānorāda nozīmes līmenis. Kā mēs atceramies, mūsu uzticības līmenis ir 97%. Tajā pašā laikā mēs teicām, ka tas tiek aprēķināts šādi:

    (1 uzticības līmenis)/100

    Tas ir, aizstājot vērtību, mēs iegūstam:

    Ar vienkāršiem aprēķiniem mēs noskaidrojam, ka arguments "Alfa" vienāds 0,03 . Ievadiet šo vērtību laukā.

    Kā zināms, pēc nosacījuma standarta novirze ir vienāda ar 8 . Tāpēc laukā "Standarta novirze" vienkārši pierakstiet šo numuru.

    Laukā "Izmērs" jāievada veikto testa elementu skaits. Kā mēs atceramies, viņu 12 . Bet, lai formulu automatizētu un nerediģētu katru reizi, kad veicam jaunu testu, iestatīsim šo vērtību nevis ar parastu skaitli, bet izmantojot operatoru PĀRBAUDE. Tātad, novietosim kursoru laukā "Izmērs" un pēc tam noklikšķiniet uz trīsstūra, kas atrodas pa kreisi no formulas joslas.

    Tiek parādīts nesen izmantoto funkciju saraksts. Ja operators PĀRBAUDE jūs nesen izmantojāt, tam vajadzētu būt šajā sarakstā. Šajā gadījumā jums vienkārši jānoklikšķina uz tā nosaukuma. Pretējā gadījumā, ja jūs to neatrodat, pārejiet pie lietas "Citas funkcijas...".

  4. Parādās jau pazīstams Funkciju vednis. Atkal atgriezīsimies pie grupas "Statistika". Mēs tur izceļam nosaukumu "PĀRBAUDĪT". Noklikšķiniet uz pogas "LABI".
  5. Parādās iepriekš minētā apgalvojuma argumentu logs. Šī funkcija ir paredzēta, lai aprēķinātu šūnu skaitu noteiktā diapazonā, kas satur skaitliskas vērtības. Tās sintakse ir šāda:

    SKAITS(vērtība1,vērtība2,…)

    Argumentu grupa "Vērtības" ir atsauce uz diapazonu, kurā vēlaties aprēķināt ar skaitliskiem datiem aizpildīto šūnu skaitu. Kopumā var būt līdz 255 tādiem argumentiem, bet mūsu gadījumā mums vajag tikai vienu.

    Novietojiet kursoru laukā "Vērtība1" un, turot nospiestu peles kreiso pogu, atlasiet lapā diapazonu, kurā ir mūsu kolekcija. Tad viņa adrese tiks parādīta laukā. Noklikšķiniet uz pogas "LABI".

  6. Pēc tam lietojumprogramma veiks aprēķinu un parādīs rezultātu šūnā, kurā tā atrodas. Mūsu konkrētajā gadījumā formula izskatījās šādi:

    PĀRLIECĪBAS NORMA(0,03,8,SKAITS(B2:B13))

    Kopējais aprēķinu rezultāts bija 5,011609 .

  7. Bet tas vēl nav viss. Kā mēs atceramies, ticamības intervāla robeža tiek aprēķināta, saskaitot un atņemot aprēķina rezultātu no izlases vidējā TRUST.NORM. Tādā veidā tiek aprēķināta attiecīgi ticamības intervāla labā un kreisā robeža. Parauga vidējo vērtību var aprēķināt, izmantojot operatoru VIDĒJS.

    Šis operators ir paredzēts, lai aprēķinātu izvēlētā skaitļu diapazona vidējo aritmētisko. Tam ir šāda diezgan vienkārša sintakse:

    VIDĒJAIS(skaitlis1,skaitlis2,…)

    Arguments "Numurs" var būt vai nu atsevišķi skaitliskā vērtība, un saite uz šūnām vai pat veseliem diapazoniem, kas tos satur.

    Tātad, atlasiet šūnu, kurā tiks parādīts vidējās vērtības aprēķins, un noklikšķiniet uz pogas "Ievietot funkciju".

  8. Atveras Funkciju vednis. Atgriežoties pie kategorijas "Statistika" un sarakstā atlasiet vārdu "VIDĒJS". Kā vienmēr, noklikšķiniet uz pogas "LABI".
  9. Tiek atvērts argumentu logs. Novietojiet kursoru laukā "Numurs1" un turot nospiestu peles kreiso pogu, atlasiet visu vērtību diapazonu. Kad laukā ir parādītas koordinātas, noklikšķiniet uz pogas "LABI".
  10. Pēc tam VIDĒJS parāda aprēķina rezultātu lapas elementā.
  11. Mēs veicam aprēķinu labā robeža ticamības intervāls. Lai to izdarītu, atlasiet atsevišķu šūnu un ievietojiet zīmi «=» un saskaita to lapas elementu saturu, kuros atrodas funkciju aprēķinu rezultāti VIDĒJS Un TRUST.NORM. Lai veiktu aprēķinu, nospiediet pogu Ievadiet. Mūsu gadījumā mēs saņēmām šādu formulu:

    Aprēķina rezultāts: 6,953276

  12. Tādā pašā veidā mēs aprēķinām ticamības intervāla kreiso robežu, tikai šoreiz no aprēķina rezultāta VIDĒJS atņemiet operatora aprēķina rezultātu TRUST.NORM. Mūsu piemēra iegūtā formula ir šāda veida:

    Aprēķina rezultāts: -3,06994

  13. Mēs centāmies detalizēti aprakstīt visas ticamības intervāla aprēķināšanas darbības, tāpēc mēs detalizēti aprakstījām katru formulu. Bet jūs varat apvienot visas darbības vienā formulā. Ticamības intervāla labās robežas aprēķinu var uzrakstīt šādi:

    VIDĒJAIS(B2:B13)+PĀRLIECINĀJUMS.NORM.(0,03,8,SKAITS(B2:B13))

  14. Līdzīgs aprēķins kreisajai robežai izskatītos šādi:

    VIDĒJAIS(B2:B13)-PĀRLIECINĀJUMS.NORM.(0,03,8,SKAITS(B2:B13))

2. metode: funkcija TRUST.STUDENT

Turklāt programmai Excel ir vēl viena funkcija, kas ir saistīta ar ticamības intervāla aprēķināšanu - UZGLABĀTĀS.STUDENTS. Tas parādījās tikai programmā Excel 2010. Šis operators aprēķina populācijas ticamības intervālu, izmantojot Studenta sadalījumu. To ir ļoti ērti lietot, ja dispersija un attiecīgi standarta novirze nav zināma. Operatora sintakse ir:

CONFIDENCE.STUDENT(alfa,standarta_izslēgts,izmērs)

Kā redzat, operatoru nosaukumi šajā gadījumā palika nemainīgi.

Apskatīsim, kā aprēķināt ticamības intervāla robežas ar nezināmu standartnovirzi, izmantojot tās pašas populācijas piemēru, kuru aplūkojām iepriekšējā metodē. Ņemsim uzticības līmeni, kāds bija pagājušajā reizē, 97%.

  1. Atlasiet šūnu, kurā tiks veikts aprēķins. Noklikšķiniet uz pogas "Ievietot funkciju".
  2. Atvērtajā Funkciju vednis dodieties uz kategoriju "Statistika". Izvēlieties vārdu "Uzticams STUDENTS". Noklikšķiniet uz pogas "LABI".
  3. Tiek atvērts norādītā operatora argumentu logs.

    Laukā "Alfa", ņemot vērā, ka ticamības līmenis ir 97%, mēs pierakstām skaitli 0,03 . Otro reizi mēs nekavēsimies pie šī parametra aprēķināšanas principiem.

    Pēc tam novietojiet kursoru laukā "Standarta novirze". Šoreiz šis rādītājs mums nav zināms un ir jāaprēķina. Tas tiek darīts, izmantojot īpašu funkciju - STDEV.V. Lai atvērtu šī operatora logu, noklikšķiniet uz trīsstūra formulas joslas kreisajā pusē. Ja atvērtajā sarakstā neatrodam vajadzīgo nosaukumu, dodieties uz vienumu "Citas funkcijas...".

  4. Sākas Funkciju vednis. Pāreja uz kategoriju "Statistika" un atzīmējiet tajā vārdu "STDEV.B". Pēc tam noklikšķiniet uz pogas "LABI".
  5. Tiek atvērts argumentu logs. Operatora uzdevums STDEV.V ir noteikt parauga standartnovirzi. Tās sintakse izskatās šādi:

    STANDARTA NOVĒRĒ.B(skaitlis1;skaitlis2;…)

    Nav grūti uzminēt, ka arguments "Numurs" ir atlases elementa adrese. Ja atlase ir ievietota vienā masīvā, varat izmantot tikai vienu argumentu, lai nodrošinātu saiti uz šo diapazonu.

    Novietojiet kursoru laukā "Numurs1" un, kā vienmēr, turot nospiestu peles kreiso pogu, atlasiet kolekciju. Kad koordinātas ir laukā, nesteidzieties nospiest pogu "LABI", jo rezultāts būs nepareizs. Vispirms mums jāatgriežas operatora argumentu logā UZGLABĀTĀS.STUDENTS lai pievienotu pēdējo argumentu. Lai to izdarītu, formulas joslā noklikšķiniet uz atbilstošā nosaukuma.

  6. Atkal tiek atvērts jau pazīstamās funkcijas argumentu logs. Novietojiet kursoru laukā "Izmērs". Atkal noklikšķiniet uz mums jau pazīstamā trīsstūra, lai pārietu uz operatoru atlasi. Kā jūs saprotat, mums ir nepieciešams vārds "PĀRBAUDĪT". Kopš mēs izmantojām šī funkcija aprēķinot ar iepriekšējo metodi, tas ir šajā sarakstā, tāpēc vienkārši noklikšķiniet uz tā. Ja jūs to neatrodat, izpildiet pirmajā metodē aprakstīto algoritmu.
  7. Vienreiz argumentu logā PĀRBAUDE, novietojiet kursoru laukā "Numurs1" un, turot nospiestu peles pogu, atlasiet kolekciju. Pēc tam noklikšķiniet uz pogas "LABI".
  8. Pēc tam programma veic aprēķinu un parāda ticamības intervāla vērtību.
  9. Lai noteiktu robežas, mums atkal būs jāaprēķina izlases vidējais lielums. Bet, ņemot vērā, ka aprēķinu algoritms, izmantojot formulu VIDĒJS tas pats, kas iepriekšējā metodē, un pat rezultāts nav mainījies, otrreiz mēs par to sīkāk nekavēsimies.
  10. Aprēķinu rezultātu saskaitīšana VIDĒJS Un UZGLABĀTĀS.STUDENTS, mēs iegūstam ticamības intervāla pareizo robežu.
  11. Atņemot no operatora aprēķinu rezultātiem VIDĒJS aprēķina rezultāts UZGLABĀTĀS.STUDENTS, mums ir ticamības intervāla kreisā robeža.
  12. Ja aprēķins ir uzrakstīts vienā formulā, tad labās robežas aprēķins mūsu gadījumā izskatīsies šādi:

    VIDĒJS(B2:B13)+PĀRLIECĪBA.STUDENTS(0,03,STDEV.B(B2:B13),SKAITS(B2:B13))

  13. Attiecīgi kreisās robežas aprēķināšanas formula izskatīsies šādi:

    VIDĒJAIS(B2:B13)-PĀRLIECINĀJUMS.STUDENTS(0,03,STDEV.B(B2:B13),SKAITS(B2:B13))

Kā redzat, instrumenti Excel programmasļauj būtiski vienkāršot ticamības intervāla un tā robežu aprēķinu. Šiem nolūkiem tiek izmantoti atsevišķi operatori paraugiem, kuru dispersija ir zināma un nezināma.

Mērķis– iemācīt studentiem statistisko parametru ticamības intervālu aprēķināšanas algoritmus.

Statistiski apstrādājot datus, aprēķinātajam vidējam aritmētiskajam, variācijas koeficientam, korelācijas koeficientam, starpības kritērijiem un citai punktu statistikai jāsaņem kvantitatīvās ticamības robežas, kas norāda uz iespējamām rādītāja svārstībām mazākos un lielākos virzienos ticamības intervāla ietvaros.

Piemērs 3.1 . Kalcija sadalījumu pērtiķu asins serumā, kā noteikts iepriekš, raksturo šādi parauga rādītāji: = 11,94 mg%; = 0,127 mg%; n= 100. Jānosaka ticamības intervāls vispārējam vidējam ( ) ar ticamības varbūtību P = 0,95.

Vispārējais vidējais atrodas ar noteiktu varbūtību intervālā:

, Kur – izlases vidējais aritmētiskais; t– Studentu ieskaite; – vidējā aritmētiskā kļūda.

Izmantojot tabulu “Studenta t-testa vērtības”, mēs atrodam vērtību ar ticamības varbūtību 0,95 un brīvības pakāpju skaitu k= 100-1 = 99. Tas ir vienāds ar 1,982. Kopā ar vidējā aritmētiskā un statistiskās kļūdas vērtībām mēs to aizstājam formulā:

vai 11.69
12,19

Tādējādi ar 95% varbūtību var apgalvot, ka šī normālā sadalījuma vispārējais vidējais ir no 11,69 līdz 12,19 mg%.

Piemērs 3.2 . Nosakiet 95% ticamības intervāla robežas vispārējai dispersijai ( ) kalcija izplatību pērtiķu asinīs, ja ir zināms, ka
= 1,60, plkst n = 100.

Lai atrisinātu problēmu, varat izmantot šādu formulu:

Kur – dispersijas statistiskā kļūda.

Mēs atrodam izlases dispersijas kļūdu, izmantojot formulu:
. Tas ir vienāds ar 0,11. Nozīme t- kritērijs ar ticamības varbūtību 0,95 un brīvības pakāpju skaitu k= 100–1 = 99 ir zināms no iepriekšējā piemēra.

Izmantosim formulu un iegūsim:

vai 1.38
1,82

Precīzāk, vispārējās dispersijas ticamības intervālu var konstruēt, izmantojot (hī kvadrāts) — Pīrsona tests. Kritiskie punkti šim kritērijam ir norādīti īpašā tabulā. Izmantojot kritēriju Lai izveidotu ticamības intervālu, tiek izmantots divpusējs nozīmīguma līmenis. Apakšējai robežai nozīmīguma līmeni aprēķina, izmantojot formulu
, augšai -
. Piemēram, pārliecības līmenim = 0,99= 0,010,= 0,990. Attiecīgi saskaņā ar kritisko vērtību sadalījuma tabulu , ar aprēķinātiem ticamības līmeņiem un brīvības pakāpju skaitu k= 100 – 1= 99, atrodiet vērtības
Un
. Mēs saņemam
vienāds ar 135,80 un
vienāds ar 70,06.

Lai atrastu ticamības robežas vispārējai dispersijai, izmantojot Izmantosim formulas: apakšējai robežai
, augšējai robežai
. Aizstāsim problēmas datus ar atrastajām vērtībām formulās:
= 1,17;
= 2,26. Tādējādi ar ticamības varbūtību P= 0,99 vai 99% vispārējā dispersija būs diapazonā no 1,17 līdz 2,26 mg% ieskaitot.

Piemērs 3.3 . Starp 1000 kviešu sēklām no elevatorā saņemtās partijas 120 sēklas tika konstatētas ar melno rudzu graudiem. Nepieciešams noteikt iespējamās robežas inficēto sēklu vispārējā īpatsvaram noteiktā kviešu partijā.

Ir ieteicams noteikt vispārējās daļas ticamības robežas visām tās iespējamām vērtībām, izmantojot formulu:

,

Kur n – novērojumu skaits; m– vienas grupas absolūtais lielums; t- normalizēta novirze.

Inficēto sēklu īpatsvars paraugā ir
vai 12%. Ar pārliecības varbūtību R= 95% normalizēta novirze ( t-Skolēnu ieskaite plkst k =
)t = 1,960.

Mēs aizstājam pieejamos datus formulā:

Tādējādi ticamības intervāla robežas ir vienādas ar = 0,122–0,041 = 0,081 jeb 8,1%; = 0,122 + 0,041 = 0,163 jeb 16,3%.

Tādējādi ar ticamības varbūtību 95% var apgalvot, ka kopējais inficēto sēklu īpatsvars ir no 8,1 līdz 16,3%.

Piemērs 3.4 . Variācijas koeficients, kas raksturo kalcija (mg%) izmaiņas pērtiķu asins serumā, bija 10,6%. Parauga lielums n= 100. Jānosaka 95% ticamības intervāla robežas vispārīgajam parametram Cv.

Vispārīgā variācijas koeficienta ticamības intervāla robežas Cv nosaka pēc šādām formulām:

Un
, Kur K starpvērtība, kas aprēķināta pēc formulas
.

Zinot to ar pārliecību, varbūtību R= 95% normalizēta novirze (Studenta tests plkst k =
)t = 1,960, vispirms aprēķināsim vērtību UZ:

.

jeb 9,3%

jeb 12,3%

Tādējādi vispārējais variācijas koeficients ar 95% ticamības līmeni ir robežās no 9,3 līdz 12,3%. Veicot atkārtotus paraugus, variācijas koeficients nepārsniegs 12,3% un nebūs zemāks par 9,3% 95 gadījumos no 100.

Jautājumi paškontrolei:

Problēmas patstāvīgam risinājumam.

1. Vidējais tauku procentuālais daudzums pienā Kholmogory krustojuma govju laktācijas laikā bija šāds: 3,4; 3,6; 3,2; 3,1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4.1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3.8. Nosakiet ticamības intervālus vispārējam vidējam 95% ticamības līmenim (20 punkti).

2. 400 rudzu hibrīdaugiem pirmie ziedi parādījās vidēji 70,5 dienas pēc sēšanas. Standarta novirze bija 6,9 dienas. Noteikt vidējo un ticamības intervālu kļūdu vispārējam vidējam un dispersijai nozīmīguma līmenī W= 0,05 un W= 0,01 (25 punkti).

3. Pētot lapu garumu 502 dārza zemeņu īpatņiem, iegūti šādi dati: = 7,86 cm; σ = 1,32 cm, =± 0,06 cm Noteikt ticamības intervālus aritmētiskajai populācijas vidējai vērtībai ar nozīmīguma līmeņiem 0,01; 0,02; 0,05. (25 punkti).

4. Pētījumā, kurā piedalījās 150 pieauguši vīrieši, vidējais augums bija 167 cm, un σ = 6 cm Kādas ir vispārējās vidējās un vispārējās dispersijas robežas ar ticamības varbūtību 0,99 un 0,95? (25 punkti).

5. Kalcija sadalījumu pērtiķu asins serumā raksturo šādi selektīvie rādītāji: = 11,94 mg%, σ = 1,27, n = 100. Izveidojiet 95% ticamības intervālu šī sadalījuma vispārējam vidējam. Aprēķināt variācijas koeficientu (25 punkti).

6. Ir pētīts vispārējs saturs slāpeklis 37 un 180 dienu vecu albīnu žurku asins plazmā. Rezultātus izsaka gramos uz 100 cm3 plazmas. 37 dienu vecumā 9 žurkām bija: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. 180 dienu vecumā 8 žurkām bija: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Iestatiet atšķirības ticamības intervālus ar ticamības līmeni 0,95 (50 punkti).

7. Noteikt 95% ticamības intervāla robežas kalcija (mg%) sadalījuma vispārējai dispersijai pērtiķu asins serumā, ja šim sadalījumam izlases lielums ir n = 100, parauga dispersijas statistiskā kļūda. s σ 2 = 1,60 (40 punkti).

8. Noteikt 95% ticamības intervāla robežas 40 kviešu vārpu sadalījuma vispārējai dispersijai garumā (σ 2 = 40,87 mm 2). (25 punkti).

9. Smēķēšana tiek uzskatīta par galveno faktoru, kas predisponē obstruktīvas plaušu slimības. Pasīvā smēķēšana netiek uzskatīta par šādu faktoru. Zinātnieki apšaubīja pasīvās smēķēšanas nekaitīgumu un pārbaudīja caurlaidību elpceļi nesmēķētājiem, pasīviem un aktīviem smēķētājiem. Lai raksturotu elpceļu stāvokli, mēs ņēmām vienu no funkciju rādītājiem ārējā elpošana– maksimālais vidējais izelpas plūsmas ātrums. Šī indikatora samazināšanās ir elpceļu obstrukcijas pazīme. Aptaujas dati ir parādīti tabulā.

Pārbaudīto cilvēku skaits

Maksimālais vidējais izelpas plūsmas ātrums, l/s

Standarta novirze

Nesmēķētāji

strādāt nesmēķētāju zonā

strādājot piesmēķētā telpā

Smēķēšana

izsmēķēt nelielu skaitu cigarešu

vidējais cigarešu smēķētāju skaits

smēķē lielu skaitu cigarešu

Izmantojot tabulas datus, atrodiet 95% ticamības intervālus katrai grupai kopējam vidējam un vispārējam dispersijai. Kādas ir atšķirības starp grupām? Rezultātus attēlojiet grafiski (25 punkti).

10. Noteikt 95% un 99% ticamības intervālu robežas vispārējai sivēnu skaita dispersijai 64 atnešanās gadījumā, ja izlases dispersijas statistiskā kļūda. s σ 2 = 8,25 (30 punkti).

11. Zināms, ka vidējais trušu svars ir 2,1 kg. Nosakiet 95% un 99% ticamības intervālu robežas vispārējam vidējam un dispersijai pie n= 30, σ = 0,56 kg (25 punkti).

12. Varpu graudu saturs tika mērīts 100 vārpām ( X), auss garums ( Y) un graudu masa vārpā ( Z). Atrodiet ticamības intervālus vispārējam vidējam un dispersijai pie P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 ja = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29,153, σ y 2 = 2, 111, σ z 2 = 0, 064. (25 punkti).

13. 100 nejauši izvēlētās ziemas kviešu vārpās saskaitīts vārpiņu skaits. Izlases populāciju raksturoja šādi rādītāji: = 15 vārpiņas un σ = 2,28 gab. Nosakiet, ar kādu precizitāti tika iegūts vidējais rezultāts ( ) un izveidojiet ticamības intervālu vispārējam vidējam un dispersijai 95% un 99% nozīmīguma līmeņos (30 punkti).

14. Ribu skaits uz fosilo gliemju čaumalām Orthambonīti kaligramma:

Ir zināms, ka n = 19, σ = 4,25. Nosakiet ticamības intervāla robežas vispārējam vidējam un vispārējai dispersijai nozīmīguma līmenī W = 0,01 (25 punkti).

15. Izslaukuma noteikšanai komerciālā piena lopkopības saimniecībā diennaktī tika noteikta produktivitāte 15 govīm. Pēc gada datiem katra govs vidēji dienā devusi šādu piena daudzumu (l): 22; 19; 25; 20; 27; 17; trīsdesmit; 21; 18; 24; 26; 23; 25; 20; 24. Konstruēt ticamības intervālus vispārējai dispersijai un aritmētiskajam vidējam. Vai varam sagaidīt, ka gada vidējais izslaukums no govs būs 10 000 litru? (50 punkti).

16. Lai noteiktu vidējo kviešu ražu lauksaimniecības uzņēmumam, pļaušana veikta izmēģinājuma lauciņos 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 un 2 hektāru platībā. Produktivitāte (c/ha) no lauciņiem bija 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; attiecīgi 29. Izveidojiet ticamības intervālus vispārējai dispersijai un aritmētiskajam vidējam. Vai varam sagaidīt, ka vidējā lauksaimniecības raža būs 42 c/ha? (50 punkti).

Uzticamības intervāls mums nāk no statistikas jomas. Šis ir noteikts diapazons, kas kalpo nezināma parametra novērtēšanai ar augstu ticamības pakāpi. Vienkāršākais veids, kā to izskaidrot, ir ar piemēru.

Pieņemsim, ka jums ir jāizpēta kāds nejaušs mainīgais, piemēram, servera atbildes ātrums uz klienta pieprasījumu. Katru reizi, kad lietotājs ieraksta konkrētas vietnes adresi, serveris reaģē ar dažādu ātrumu. Tādējādi pētāmais reakcijas laiks ir nejaušs. Tātad ticamības intervāls ļauj noteikt šī parametra robežas, un tad varam teikt, ka ar 95% varbūtību serveris atradīsies mūsu aprēķinātajā diapazonā.

Vai arī jums ir jānoskaidro, cik daudz cilvēku par to zina preču zīme kompānijas. Aprēķinot ticamības intervālu, varēs teikt, piemēram, ka ar 95% varbūtību patērētāju daļa, kas to zina, ir robežās no 27% līdz 34%.

Ar šo terminu ir cieši saistīts daudzums ticamības varbūtība. Tas atspoguļo varbūtību, ka vēlamais parametrs ir iekļauts ticamības intervālā. Cik liels būs mūsu vēlamais diapazons, ir atkarīgs no šīs vērtības. Jo lielāka ir vērtība, jo šaurāks kļūst ticamības intervāls, un otrādi. Parasti tas ir iestatīts uz 90%, 95% vai 99%. Vērtība 95% ir vispopulārākā.

Šo rādītāju ietekmē arī novērojumu izkliede un tā definīcija ir balstīta uz pieņēmumu, ka pētāmā pazīme pakļaujas.Šo apgalvojumu sauc arī par Gausa likumu. Pēc viņa domām, normāls ir visu nepārtraukta gadījuma lieluma varbūtību sadalījums, ko var aprakstīt ar varbūtības blīvumu. Ja pieņēmums par normālais sadalījums izrādījās kļūdains, novērtējums var būt nepareizs.

Vispirms izdomāsim, kā aprēķināt ticamības intervālu šeit ir divi iespējamie gadījumi. Izkliede (gadījuma lieluma izplatības pakāpe) var būt zināma un var nebūt zināma. Ja tas ir zināms, mūsu ticamības intervāls tiek aprēķināts, izmantojot šādu formulu:

xsr — t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α zīme,

t - parametrs no Laplasa sadalījuma tabulas,

σ ir dispersijas kvadrātsakne.

Ja dispersija nav zināma, tad to var aprēķināt, ja zinām visas vēlamās pazīmes vērtības. Šim nolūkam tiek izmantota šāda formula:

σ2 = х2ср - (хср)2, kur

х2ср - pētāmā raksturlieluma kvadrātu vidējā vērtība,

(хср)2 ir šī raksturlieluma kvadrāts.

Formula, pēc kuras šajā gadījumā tiek aprēķināts ticamības intervāls, nedaudz mainās:

xsr — t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr — parauga vidējais rādītājs,

α zīme,

t ir parametrs, kas tiek atrasts, izmantojot Studenta sadalījuma tabulu t = t(ɣ;n-1),

sqrt(n) — kvadrātsakne no kopējā izlases lieluma,

s ir dispersijas kvadrātsakne.

Apsveriet šo piemēru. Pieņemsim, ka, pamatojoties uz 7 mērījumu rezultātiem, tika noteikts, ka pētītais raksturlielums ir vienāds ar 30 un izlases dispersija ir vienāda ar 36. Ar 99% varbūtību ir jāatrod ticamības intervāls, kas satur patieso vērtību. izmērītā parametra vērtība.

Vispirms noteiksim, ar ko t ir vienāds: t = t (0,99; 7-1) = 3,71. Izmantojot iepriekš minēto formulu, mēs iegūstam:

xsr — t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 — 3,71*36 / (kvadrātmetri (7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Dispersijas ticamības intervāls tiek aprēķināts gan zināmas vidējās vērtības gadījumā, gan tad, ja nav datu par matemātisko cerību, un ir zināma tikai dispersijas punkta objektīva novērtējuma vērtība. Mēs šeit nesniegsim formulas tā aprēķināšanai, jo tās ir diezgan sarežģītas un, ja vēlaties, vienmēr var atrast internetā.

Atcerēsimies tikai to, ka ir ērti noteikt ticamības intervālu, izmantojot programmu Excel vai tīkla pakalpojumu, ko tā sauc.



Jaunums vietnē

>

Populārākais