Mājas Plāksne uz mēles Ja variāciju sērijai ir forma Variācijas un variāciju sērijas, variāciju diapazons

Ja variāciju sērijai ir forma Variācijas un variāciju sērijas, variāciju diapazons

variācijas sauc par sadales sērijām, kas veidotas uz kvantitatīvā pamata. Kvantitatīvo raksturlielumu vērtības atsevišķās populācijas vienībās nav nemainīgas, vairāk vai mazāk atšķiras viena no otras.

Variācija- atribūta vērtības svārstības, mainīgums populācijas vienībās. Atsevišķi skaitliskās vērtības tiek sauktas pazīmes, kas sastopamas pētāmajā populācijā iespējas vērtības. Vidējās vērtības nepietiekamība pilnīgas īpašības agregāts liek papildināt vidējās vērtības ar rādītājiem, kas ļauj novērtēt šo vidējo rādītāju tipiskumu, mērot pētāmās pazīmes svārstības (variācijas).

Variāciju klātbūtne ir saistīta ar daudzu faktoru ietekmi uz pazīmju līmeņa veidošanos. Šie faktori darbojas ar nevienlīdzīgu spēku un dažādos virzienos. Variācijas indikatori tiek izmantoti, lai aprakstītu iezīmju mainīguma mēru.

Uzdevumi statistiskais pētījums variācijas:

  • 1) zīmju rakstura un pakāpes izpēte atsevišķās populācijas vienībās;
  • 2) atsevišķu faktoru vai to grupu lomas noteikšana atsevišķu populācijas pazīmju variācijā.

Tiek izmantota statistika īpašas metodes variāciju pētījumi, kuru pamatā ir rādītāju kartes izmantošana, Ar ar kuru tiek mērīta variācija.

Variāciju izpētei ir nozīmi. Variāciju mērīšana ir nepieciešama, veicot selektīvu novērošanu, korelāciju un dispersijas analīze utt. Ermolajevs O.Ju. Matemātiskā statistika psihologiem: mācību grāmata [Teksts] / O.Yu. Ermolajevs. - M.: Maskavas Psiholoģiskā un sociālā institūta izdevniecība Flints, 2012. - 335 lpp.

Pēc variācijas pakāpes var spriest par populācijas viendabīgumu, pazīmju individuālo vērtību stabilitāti un vidējā tipiskumu. Pamatojoties uz tiem, tiek izstrādāti zīmju attiecību ciešuma rādītāji, selektīvā novērojuma precizitātes novērtēšanas rādītāji.

Pastāv atšķirības telpā un laikā.

Izmaiņas telpā tiek saprastas kā objekta vērtību svārstības iedzīvotāju vienībās, kas pārstāv atsevišķas teritorijas. Laika izmaiņas nozīmē izmaiņas objekta vērtībās dažādi periodi laiks.

Lai izpētītu sadalījuma sēriju variācijas, visi atribūtu vērtību varianti ir sakārtoti augošā vai dilstošā secībā. Šo procesu sauc par sēriju ranžēšanu.

visvairāk vienkāršas zīmes variācijas ir minimālais un maksimālais- mazākais un augstākā vērtībaīpašība kopumā. Atsevišķu pazīmju vērtību variantu atkārtojumu skaitu sauc par atkārtošanās biežumu (fi). Frekvences ir ērti aizstāt ar frekvencēm - wi. Biežums - relatīvs biežuma rādītājs, ko var izteikt vienības daļās vai procentos un ļauj salīdzināt variāciju sērijas ar atšķirīgs numurs novērojumiem. Izteikts ar formulu:

kur Xmax, Xmin - atribūta maksimālās un minimālās vērtības apkopojumā; n ir grupu skaits.

Pazīmes variācijas mērīšanai izmanto dažādus absolūtos un relatīvos rādītājus. Absolūtie variācijas rādītāji ietver variācijas diapazonu, vidējo lineāro novirzi, dispersiju, standartnovirzi. Pie relatīvajiem svārstību rādītājiem pieder svārstību koeficients, relatīvā lineārā novirze, variācijas koeficients.

Piemēra atrašana variāciju sērija

Vingrinājums.Šim paraugam:

  • a) Atrodi variāciju sēriju;
  • b) Konstruē sadales funkciju;

Nr.=42. Preču paraugi:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Risinājums.

  • a) ranžētas variāciju sērijas izveide:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) diskrētu variāciju rindas konstruēšana.

Aprēķināsim grupu skaitu variāciju sērijā, izmantojot Stērdžesa formulu:

Ņemsim grupu skaitu, kas vienāds ar 7.

Zinot grupu skaitu, mēs aprēķinām intervāla vērtību:

Tabulas veidošanas ērtībai mēs ņemsim grupu skaitu, kas vienāds ar 8, intervāls būs 1.

Rīsi. 1 Veikala preču pārdošanas apjoms noteiktā laika periodā

Variācija nosaka atšķirības jebkura atribūta vērtībās dažādās noteiktas populācijas vienībās tajā pašā periodā (laika punktā). Izmaiņu iemesls ir dažādi apstākļi dažādu iedzīvotāju vienību esamība. Piemēram, pat dvīņi dzīves procesā iegūst atšķirības augumā, svarā, kā arī tādās pazīmēs kā izglītības līmenis, ienākumi, bērnu skaits u.c.

Variācijas rodas tāpēc, ka pašas atribūta vērtības veidojas dažādu apstākļu kopējā ietekmē, kas katrā atsevišķā gadījumā tiek kombinēti dažādos veidos. Tādējādi jebkura opcijas vērtība ir objektīva.

Variācija ir raksturīga visām dabas un sabiedrības parādībām bez izņēmuma, izņemot individuālo sociālo īpašību likumdošanas noteiktās normatīvās vērtības. Statistikas variāciju pētījumi ir liela vērtība palīdz izprast pētāmās parādības būtību. Variāciju atrašana, to cēloņu noskaidrošana, atsevišķu faktoru ietekmes identificēšana dod svarīga informācija zinātniski pamatotu vadības lēmumu īstenošanai.

Vidējā vērtība sniedz vispārinātu populācijas pazīmes raksturojumu, bet neatklāj tās struktūru. Vidējā vērtība neparāda, kā ap to atrodas vidējās pazīmes varianti, vai tie ir izvietoti tuvu vidējam vai novirzās no tā. Vidējais divos komplektos var būt vienāds, taču vienā variantā visas individuālās vērtības nedaudz atšķiras no tā, bet otrā šīs atšķirības ir lielas, t.i. pirmajā gadījumā pazīmes variācija ir neliela, bet otrajā – liela, tas ir ļoti svarīgi, lai raksturotu vidējās vērtības nozīmīgumu.

Lai organizācijas vadītājs, vadītājs, pētnieks varētu pētīt un vadīt variāciju, statistika ir izstrādājusi īpašas metodes variāciju pētīšanai (rādītāju sistēma). Ar to palīdzību tiek atrasta variācija, raksturotas tās īpašības. Izmaiņu rādītāji ir : variācijas diapazons, vidējā lineārā novirze, variācijas koeficients.

Variāciju sērijas un to formas

Variāciju sērija- tas ir sakārtots populācijas vienību sadalījums biežāk, palielinot (retāk samazinot) atribūta vērtības un saskaitot vienību skaitu ar vienu vai otru atribūta vērtību. Ja populācijas vienību skaits ir liels, ranžēta sērija kļūst apgrūtinoša, tās veidošana prasa ilgu laiku. Šādā situācijā variāciju sērija tiek veidota, grupējot populācijas vienības atbilstoši pētāmās pazīmes vērtībām.

Ir šādas variāciju sērijas formas :

  1. ierindota rinda ir atsevišķu populācijas vienību saraksts pētāmās pazīmes augošā (dilstošā) secībā.
  2. Diskrētās variāciju sērijas - šī ir tabula, kas sastāv no divām rindām vai grafika: mainīgā pazīme x konkrētas vērtības un vienību skaits populācijā ar doto vērtību f - frekvenču pazīme. Tas tiek veidots, kad atribūts iegūst lielāko vērtību skaitu.
  3. intervālu sērijas.

Variāciju diapazons ir noteikts kā absolūtā vērtība starpībai starp atribūta maksimālo un minimālo vērtību (opcijas):

Variāciju diapazons parāda tikai ekstrēmas pazīmes novirzes un neatspoguļo visu sērijas variantu individuālās novirzes. Tas raksturo mainīgā atribūta izmaiņu robežas un ir atkarīgs no divu galējo opciju svārstībām un absolūti nav saistīts ar frekvencēm variāciju rindā, tas ir, ar sadalījuma raksturu, kas piešķir šai vērtībai nejaušību. raksturs. Lai analizētu variāciju, ir nepieciešams rādītājs, kas atspoguļo visas variācijas pazīmes svārstības un sniedz vispārīgās īpašības. Vienkāršākais šāda veida rādītājs ir vidējā lineārā novirze.

Statistiskā sadalījuma rinda- tas ir sakārtots iedzīvotāju vienību sadalījums grupās atbilstoši noteiktam mainīgam atribūtam.
Atkarībā no pazīmes, kas ir sadalījuma sērijas veidošanas pamatā, ir atribūtu un variāciju sadalījuma sērijas.

Kopīgas pazīmes esamība ir pamats statistiskās kopas veidošanai, kas ir apraksta vai mērījuma rezultāti kopīgas iezīmes izpētes objekti.

Statistikas izpētes priekšmets ir mainīgas (mainīgas) pazīmes vai statistikas pazīmes.

Statistisko pazīmju veidi.

Sadalījuma sērijas sauc par atribūtu sērijām. būvēts uz kvalitatīviem apsvērumiem. Atribūti- šī ir zīme, kurai ir vārds (piemēram, profesija: šuvēja, skolotājs utt.).
Sadales sērijas ir ierasts sakārtot tabulu veidā. Tabulā. 2.8 parāda sadalījuma atribūtu sēriju.
2.8. tabula. Sugu izplatība juridiskā palīdzība advokāti nodrošina viena no Krievijas Federācijas reģionu pilsoņiem.

Variāciju sērija ir pazīmju vērtības (vai vērtību diapazoni) un to frekvences.
Variāciju sērijas ir izplatīšanas sērijas veidota uz kvantitatīvā pamata. Jebkura variāciju sērija sastāv no diviem elementiem: variantiem un frekvencēm.
Varianti ir atsevišķas objekta vērtības, kuras tas aizņem variāciju sērijā.
Frekvences ir atsevišķu variantu vai katras variāciju sērijas grupas skaitļi, t.i. tie ir skaitļi, kas parāda, cik bieži izplatīšanas sērijās parādās noteiktas opcijas. Visu frekvenču summa nosaka visas populācijas lielumu, tās apjomu.
Frekvences sauc par frekvencēm, kas izteiktas vienības daļās vai procentos no kopsummas. Attiecīgi frekvenču summa ir vienāda ar 1 vai 100%. Variāciju rinda ļauj mums novērtēt sadalījuma likuma formu, pamatojoties uz faktiskajiem datiem.

Atkarībā no pazīmes variācijas rakstura ir diskrētās un intervālu variāciju sērijas.
Diskrētu variāciju sērijas piemērs ir dots tabulā. 2.9.
2.9. tabula - Ģimeņu sadalījums pēc atsevišķos dzīvokļos aizņemto istabu skaita 1989. gadā Krievijas Federācijā.

Tabulas pirmajā slejā ir parādīti diskrētu variāciju sērijas varianti, otrajā ailē ir variāciju sērijas frekvences, bet trešajā kolonnā ir frekvenču indikatori.

Variāciju sērija

IN populācija tiek pētīta kāda kvantitatīvā iezīme. No tā nejauši tiek iegūts tilpuma paraugs n, tas ir, elementu skaits izlasē ir n. Pirmajā statistikas apstrādes posmā diapazonā paraugi, t.i. numuru pasūtīšana x 1 , x 2 , …, x n Augošā. Katra novērotā vērtība x i sauca opciju. Biežums m i ir vērtības novērojumu skaits x i izlasē. Relatīvais biežums (biežums) w i ir frekvences attiecība m i uz parauga lielumu n: .
Pētot variāciju rindu, tiek izmantoti arī kumulatīvās frekvences un kumulatīvās frekvences jēdzieni. Ļaujiet x kādu numuru. Tad opciju skaits , kuru vērtības ir mazākas x, sauc par uzkrāto frekvenci: x i n sauc par uzkrāto frekvenci w i max .
Atribūtu sauc par diskrēti mainīgu, ja tā atsevišķās vērtības (varianti) atšķiras viena no otras ar noteiktu summu (parasti veselu skaitli). Šādas pazīmes variāciju sēriju sauc par diskrētu variāciju sēriju.

1. tabula. Diskrētu frekvenču variāciju sērijas vispārīgs skats

Funkciju vērtībasx i x 1 x2 x n
Frekvencesm i m 1 m2 m n

Atribūtu sauc par nepārtraukti mainīgu, ja tā vērtības atšķiras viena no otras patvaļīgi mazā apmērā, t.i. zīme var iegūt jebkuru vērtību noteiktā intervālā. Šādas pazīmes nepārtrauktu variāciju sēriju sauc par intervālu sēriju.

2. tabula. Frekvenču intervālu variāciju sērijas vispārīgs skats

3. tabula. Variāciju sērijas grafiskie attēli

RindaDaudzstūris vai histogrammaEmpīriskā sadalījuma funkcija
Diskrēts
intervāls
Aplūkojot novērojumu rezultātus, tiek noteikts, cik variantu vērtības iekrita katrā konkrētajā intervālā. Tiek pieņemts, ka katrs intervāls pieder vienam no tā galiem: vai nu visos gadījumos kreisajam (biežāk), vai visos gadījumos labajam, un frekvences vai frekvences parāda norādītajās robežās ietverto opciju skaitu. Atšķirības a i – a i +1 sauc par daļējiem intervāliem. Lai vienkāršotu turpmākos aprēķinus, intervālu variāciju sēriju var aizstāt ar nosacīti diskrētu. Šajā gadījumā vidējā vērtība i-th intervāls tiek ņemts kā opcija x i, un atbilstošā intervāla frekvence m i- šī intervāla biežumam.
Variāciju sēriju grafiskai attēlošanai visbiežāk izmanto daudzstūri, histogrammu, kumulatīvo līkni un empīriskā sadalījuma funkciju.

Tabulā. 2.3 (Krievijas iedzīvotāju grupēšana pēc vidējo ienākumu lieluma uz vienu iedzīvotāju 1994. gada aprīlī). intervālu variāciju sērijas.
Izplatīšanas sērijas ir ērti analizēt, izmantojot grafisko attēlojumu, kas arī ļauj spriest par sadalījuma formu. Variāciju sērijas frekvenču izmaiņu rakstura vizuālu attēlojumu sniedz daudzstūris un histogramma.
Daudzstūris tiek izmantots, attēlojot diskrētas variāciju sērijas.
Attēlosim, piemēram, grafiski dzīvojamā fonda sadalījumu pa dzīvokļu veidiem (2.10. tabula).
2.10. tabula. Pilsētas dzīvojamā fonda sadalījums pa dzīvokļu veidiem (nosacītie skaitļi).


Rīsi. Mājokļu sadales poligons


Uz y ass var uzzīmēt ne tikai frekvenču vērtības, bet arī variāciju sēriju frekvences.
Histogramma tiek uzņemta, lai parādītu intervālu variāciju sērijas. Veidojot histogrammu, intervālu vērtības tiek attēlotas uz abscisu ass, un frekvences tiek attēlotas ar taisnstūriem, kas veidoti uz atbilstošajiem intervāliem. Kolonnu augstumam vienādu intervālu gadījumā jābūt proporcionālam frekvencēm. Histogramma ir grafiks, kurā sērija tiek parādīta kā joslas, kas atrodas blakus viena otrai.
Grafiski attēlosim tabulā dotās intervālu sadalījuma sērijas. 2.11.
2.11. tabula. Ģimeņu sadalījums pēc dzīvojamās platības uz vienu cilvēku (nosacītie skaitļi).
N p / p Ģimeņu grupas pēc dzīvojamās platības uz vienu cilvēku Ģimeņu skaits ar noteiktu dzīvojamo platību Uzkrātais ģimeņu skaits
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
KOPĀ 115 ----


Rīsi. 2.2. Ģimeņu sadalījuma histogramma pēc dzīvojamās platības uz vienu cilvēku


Izmantojot uzkrāto sēriju datus (2.11. tabula), konstruējam sadales kumulatīvā.


Rīsi. 2.3. Ģimeņu kumulatīvais sadalījums pēc dzīvojamās platības uz vienu cilvēku


Variāciju rindas attēlošana kumulatīvā veidā ir īpaši efektīva variāciju sērijām, kuru frekvences ir izteiktas kā daļu vai procentuālo daļu no rindas frekvenču summas.
Ja mainām asis variāciju sērijas grafiskajā attēlojumā kumulatīvā veidā, tad iegūstam ogivu. Uz att. 2.4. ir parādīts attēls, kas izveidots, pamatojoties uz tabulas datiem. 2.11.
Histogrammu var pārvērst sadalījuma daudzstūrī, atrodot taisnstūru malu viduspunktus un pēc tam savienojot šos punktus ar taisnām līnijām. Iegūtais sadalījuma daudzstūris ir parādīts att. 2,2 punktēta līnija.
Konstruējot variāciju rindas sadalījuma histogrammu ar nevienādiem intervāliem, pa ordinātu asi, tiek pielietotas nevis frekvences, bet gan pazīmes sadalījuma blīvums attiecīgajos intervālos.
Sadalījuma blīvums ir frekvence, kas aprēķināta uz intervāla platuma vienību, t.i. cik vienību katrā grupā ir uz vienības intervāla vērtību. Sadalījuma blīvuma aprēķināšanas piemērs ir parādīts tabulā. 2.12.
2.12. tabula. Uzņēmumu sadalījums pēc darbinieku skaita (skaitļi ir nosacīti)
N p / p Uzņēmumu grupas pēc darbinieku skaita, pers. Uzņēmumu skaits Intervāla lielums, pers. Izplatības blīvums
A 1 2 3=1/2
1 līdz 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
KOPĀ 147 ---- ----

Var izmantot arī variāciju sērijas grafiskam attēlojumam kumulatīvā līkne. Ar kumulatora (summu līknes) palīdzību tiek parādīta uzkrāto frekvenču sērija. Uzkrātās frekvences tiek noteiktas, secīgi summējot frekvences pa grupām un parāda, cik daudzām populācijas vienībām ir pazīmju vērtības, kas nav lielākas par aplūkojamo vērtību.


Rīsi. 2.4. Ogiva ģimeņu sadalījums pēc dzīvojamās platības lieluma uz vienu cilvēku

Konstruējot intervāla variāciju rindas kumulātu, rindas varianti tiek attēloti pa abscisu asi, bet uzkrātās frekvences - pa ordinātu asi.

Īpaša vieta statistiskajā analīzē ir pētāmās pazīmes vai parādības vidējā līmeņa noteikšanai. Objekta vidējo līmeni mēra pēc vidējām vērtībām.

Vidējā vērtība raksturo pētāmās pazīmes vispārējo kvantitatīvo līmeni un ir statistiskās populācijas grupas īpašība. Tas izlīdzina, vājina atsevišķu novērojumu nejaušās novirzes vienā vai otrā virzienā un izceļ pētāmās pazīmes galveno, tipisko īpašību.

Vidējie tiek plaši izmantoti:

1. Novērtēt iedzīvotāju veselības stāvokli: fiziskās attīstības raksturlielumus (augums, svars, krūšu apkārtmērs u.c.), identificējot dažādu slimību izplatību un ilgumu, analizējot demogrāfiskos rādītājus (iedzīvotāju dabiskā kustība, vidējais dzīves ilgums, iedzīvotāju vairošanās). , vidējais iedzīvotāju skaits utt.).

2. Izpētīt ārstniecības iestāžu, ārstniecības personu darbību un novērtēt to darba kvalitāti, plānojot un nosakot iedzīvotāju vajadzības dažādos medicīniskās aprūpes veidos (vidējais pieteikumu vai apmeklējumu skaits uz vienu iedzīvotāju gadā, vidējais uzturēšanās ilgums pacienta stāvoklis stacionārā, vidējais izmeklējuma ilgums pacientam, vidējais nodrošinājums ar ārstiem, gultām utt.).

3. Raksturot sanitāri epidemioloģisko stāvokli (vidējais gaisa putekļainums darbnīcā, vidējā platība uz cilvēku, vidējais olbaltumvielu, tauku un ogļhidrātu patēriņš u.c.).

4. Noteikt medicīniskos un fizioloģiskos parametrus veselībā un slimībās, laboratorisko datu apstrādē, noteikt selektīva pētījuma rezultātu ticamību sociāli higiēniskajos, klīniskajos, eksperimentālajos pētījumos.

Vidējo vērtību aprēķins tiek veikts, pamatojoties uz variāciju sērijām. Variāciju sērija- šī ir kvalitatīvi viendabīga statistikas kopa, kuras atsevišķās vienības raksturo pētāmās pazīmes vai parādības kvantitatīvās atšķirības.

Kvantitatīvās variācijas var būt divu veidu: pārtrauktas (diskrētas) un nepārtrauktas.

Nepārtraukta (diskrēta) zīme tiek izteikta tikai kā vesels skaitlis, un tai nevar būt nekādas starpvērtības (piemēram, apmeklējumu skaits, vietnes iedzīvotāju skaits, bērnu skaits ģimenē, slimības smagums punktos utt.).

Nepārtraukta zīme noteiktās robežās var iegūt jebkādas vērtības, tostarp daļējas, un tiek izteikta tikai aptuveni (piemēram, svars - pieaugušajiem varat ierobežot sevi līdz kilogramiem, bet jaundzimušajiem - gramiem; augums, asinsspiediens, laiks iztērēti pacienta apmeklēšanai utt.).



Katras atsevišķas pazīmes vai parādības, kas iekļautas variāciju sērijā, digitālo vērtību sauc par variantu un norāda ar burtu V . Matemātiskajā literatūrā, piemēram, ir arī citi apzīmējumi x vai y.

Variāciju sēriju, kur katra opcija ir norādīta vienreiz, sauc par vienkāršu.Šādas rindas tiek izmantotas lielākajā daļā statistikas problēmu datorizētās datu apstrādes gadījumā.

Pieaugot novērojumu skaitam, parasti ir atkārtotas varianta vērtības. Šajā gadījumā tas rada grupētas variāciju sērijas, kur norādīts atkārtojumu skaits (biežums, apzīmēts ar burtu " R »).

Sarindota variāciju sērija sastāv no iespējām, kas sakārtotas augošā vai dilstošā secībā. Ar ranžēšanu var izveidot gan vienkāršas, gan grupētas sērijas.

Intervālu variāciju sērijas tiek veidoti, lai vienkāršotu turpmākos aprēķinus, kas veikti, neizmantojot datoru, ar ļoti lielu novērošanas vienību skaitu (vairāk nekā 1000).

Nepārtrauktas variācijas sērijas ietver variantu vērtības, kas var būt jebkura vērtība.

Ja variāciju sērijā atribūta (opciju) vērtības ir norādītas atsevišķu konkrētu skaitļu veidā, tad šādu sēriju sauc diskrēts.

Variāciju sērijās atspoguļoto atribūta vērtību vispārīgie raksturlielumi ir vidējās vērtības. Starp tiem visbiežāk lietotie ir: vidējais aritmētiskais M, mode Mo un mediāna es. Katra no šīm īpašībām ir unikāla. Tās nevar aizstāt viena otru, un tikai kopumā, pilnīgi un kodolīgā veidā, ir variāciju sērijas pazīmes.

Mode (Mo) nosauciet visbiežāk sastopamo opciju vērtību.

Mediāna (es) ir tā varianta vērtība, kas dala diapazona variāciju rindu uz pusēm (katrā mediānas pusē ir puse no varianta). Retos gadījumos, kad ir simetriskas variāciju rindas, režīms un mediāna ir vienādi un sakrīt ar vidējā aritmētiskā vērtība.

Tipiskākā variantu vērtību īpašība ir vidējais aritmētiskais vērtība ( M ). Matemātiskajā literatūrā tas ir apzīmēts .

Vidējais aritmētiskais (M, ) ir vispārīgs kvantitatīvs raksturlielums noteiktai pētāmo parādību pazīmei, kas veido kvalitatīvi viendabīgu statistikas kopu. Atšķirt vienkāršo vidējo aritmētisko un svērto vidējo. Vienkāršo aritmētisko vidējo aprēķina vienkāršai variāciju sērijai, summējot visas opcijas un dalot šo summu ar kopējo šajā variāciju rindā iekļauto opciju skaitu. Aprēķini tiek veikti pēc formulas:

,

Kur: M - vienkāršais vidējais aritmētiskais;

Σ V - summas opcija;

n- novērojumu skaits.

Grupētu variāciju rindās nosaka svērto vidējo aritmētisko. Formula tā aprēķināšanai:

,

Kur: M - vidējais aritmētiskais svērtais;

Σ vp - varianta reizinājumu summa to frekvencēs;

n- novērojumu skaits.

Ar lielu novērojumu skaitu manuālo aprēķinu gadījumā var izmantot momentu metodi.

Vidējam aritmētiskajam ir šādas īpašības:

varianta noviržu summa no vidējā ( Σ d ) ir vienāds ar nulli (sk. 15. tabulu);

Visus variantus reizinot (dalot) ar vienu un to pašu koeficientu (dalītāju), vidējo aritmētisko reizina (dala) ar to pašu koeficientu (dalītāju);

Ja visām opcijām pievieno (atņem) vienu un to pašu skaitli, vidējais aritmētiskais palielinās (samazinās) par tādu pašu skaitli.

Vidējie aritmētiskie rādītāji, kas ņemti paši par sevi, neņemot vērā to rindu mainīgumu, no kuras tie ir aprēķināti, var pilnībā neatspoguļot variāciju rindas īpašības, jo īpaši, ja ir nepieciešams salīdzinājums ar citiem vidējiem rādītājiem. Vidējās vērtības, kas ir tuvu vērtībai, var iegūt no sērijām ar dažādu izkliedes pakāpi. Jo tuvāk atsevišķas iespējas ir viena otrai pēc to kvantitatīvām īpašībām, jo ​​mazāk izkliede (svārstības, mainīgums) sērija, jo tipiskāks tās vidējais.

Galvenie parametri, kas ļauj novērtēt pazīmes mainīgumu, ir:

· darbības joma;

Amplitūda;

· Standarta novirze;

· Variācijas koeficients.

Aptuveni pazīmes svārstības var spriest pēc variāciju sērijas apjoma un amplitūdas. Diapazons norāda sērijas maksimālās (V max) un minimālās (V min) opcijas. Amplitūda (A m) ir starpība starp šīm opcijām: A m = V max - V min .

Galvenais, vispārpieņemtais variāciju rindu svārstību mērs ir dispersija (D ). Bet visbiežāk tiek izmantots ērtākais parametrs, ko aprēķina, pamatojoties uz dispersiju - standarta novirzi ( σ ). Tas ņem vērā novirzes vērtību ( d ) katram variāciju sērijas variantam no tās vidējā aritmētiskā ( d=V — M ).

Tā kā varianta novirzes no vidējā var būt pozitīvas un negatīvas, tad summējot tās dod vērtību "0" (S d=0). Lai no tā izvairītos, novirzes vērtības ( d) tiek paaugstināti līdz otrajai pakāpei un aprēķināti vidēji. Tādējādi variāciju rindas dispersija ir varianta noviržu vidējais kvadrāts no vidējā aritmētiskā, un to aprēķina pēc formulas:

.

Tas ir vissvarīgākais mainīguma raksturlielums, un to izmanto daudzu statistisko testu aprēķināšanai.

Tā kā dispersiju izsaka kā noviržu kvadrātu, tās vērtību nevar izmantot salīdzinājumā ar vidējo aritmētisko. Šiem nolūkiem tas tiek izmantots standarta novirze, ko apzīmē ar zīmi "Sigma" ( σ ). Tas raksturo visu variāciju rindas variantu vidējo novirzi no vidējā aritmētiskā tādās pašās vienībās kā pats vidējais, tāpēc tos var izmantot kopā.

Standarta novirzi nosaka pēc formulas:

Šo formulu piemēro novērojumu skaitam ( n ) ir lielāks par 30. Ar mazāku skaitli n standarta novirzes vērtībai būs kļūda, kas saistīta ar matemātisko novirzi ( n - 1). Šajā sakarā precīzāku rezultātu var iegūt, ņemot vērā šādu novirzi standarta novirzes aprēķināšanas formulā:

standarta novirze (s ) ir nejaušā mainīgā lieluma standartnovirzes aprēķins X attiecībā pret tā matemātiskajām prognozēm, pamatojoties uz objektīvu tās dispersijas aplēsi.

Par vērtībām n > 30 standarta novirze ( σ ) un standarta novirze ( s ) būs tāds pats ( σ=s ). Tāpēc lielākajā daļā praktisko rokasgrāmatu šiem kritērijiem ir atšķirīga nozīme. Programmā Excel aprēķins standarta novirzi var izdarīt ar =STDEV(diapazons). Un, lai aprēķinātu standarta novirzi, jums ir jāizveido atbilstoša formula.

Kvadrātsaknes jeb standarta novirze ļauj noteikt, cik ļoti objekta vērtības var atšķirties no vidējās vērtības. Pieņemsim, ka ir divas pilsētas ar vienādu vidējo dienas temperatūru vasarā. Viena no šīm pilsētām atrodas piekrastē, bet otra - kontinentā. Ir zināms, ka pilsētās, kas atrodas piekrastē, dienas temperatūras atšķirības ir mazākas nekā pilsētās, kas atrodas iekšzemē. Tāpēc diennakts temperatūras standartnovirze pie piekrastes pilsētas būs mazāka nekā otrajā pilsētā. Praksē tas nozīmē, ka katra vidējā gaisa temperatūra konkrēta diena pilsētā, kas atrodas kontinentā, vairāk atšķirsies no vidējās vērtības nekā pilsētā piekrastē. Turklāt standarta novirze ļauj novērtēt iespējamās temperatūras novirzes no vidējā ar nepieciešamo varbūtības līmeni.

Saskaņā ar varbūtības teoriju parādībās, kas atbilst normālā sadalījuma likumam, pastāv stingra saistība starp vidējā aritmētiskā, standarta novirzes un opciju vērtībām ( trīs sigmu noteikums). Piemēram, 68,3% mainīgā atribūta vērtību ir M ± 1 robežās σ , 95,5% - M ± 2 robežās σ un 99,7% - M ± 3 robežās σ .

Standartnovirzes vērtība ļauj spriest par variāciju rindas un pētāmās grupas homogenitātes raksturu. Ja standartnovirzes vērtība ir maza, tas norāda uz pietiekami augstu pētāmās parādības viendabīgumu. Vidējais aritmētiskais šajā gadījumā ir jāatzīst par diezgan raksturīgu šai variāciju rindai. Tomēr pārāk maza sigma liek domāt par mākslīgu novērojumu atlasi. Ar ļoti lielu sigmu vidējais aritmētiskais mazākā mērā raksturo variāciju rindu, kas norāda uz būtisku pētāmās pazīmes vai parādības mainīgumu vai pētāmās grupas neviendabīgumu. Tomēr standartnovirzes vērtības salīdzināšana ir iespējama tikai vienādas dimensijas zīmēm. Patiešām, ja salīdzinām jaundzimušo un pieaugušo svara daudzveidību, mēs vienmēr iegūsim augstākas sigmas vērtības pieaugušajiem.

Dažādu izmēru pazīmju mainīguma salīdzināšanu var veikt, izmantojot variācijas koeficients. Tas izsaka daudzveidību procentos no vidējā, ļaujot salīdzināt dažādas zīmes. Variācijas koeficientu medicīnas literatūrā norāda ar zīmi " AR "un matemātikā" v» un aprēķināts pēc formulas:

.

Variācijas koeficienta vērtības, kas mazākas par 10%, norāda uz nelielu izkliedi, no 10 līdz 20% - apmēram vidēji, vairāk nekā 20% - par spēcīgu izkliedi ap vidējo aritmētisko.

No datiem parasti aprēķina vidējo aritmētisko paraugu ņemšanas rāmis. Atkārtoti veicot pētījumus nejaušu parādību ietekmē, vidējais aritmētiskais var mainīties. Tas ir saistīts ar faktu, ka parasti tiek pētīta tikai daļa no iespējamām novērošanas vienībām, tas ir, izlases populācija. Informāciju par visām iespējamām vienībām, kas reprezentē pētāmo parādību, var iegūt, pētot visu vispārējo populāciju, kas ne vienmēr ir iespējams. Tajā pašā laikā, lai vispārinātu eksperimentālos datus, interesē vidējā vērtība vispārējā populācijā. Tāpēc, lai formulētu vispārīgu secinājumu par pētāmo parādību, uz izlases kopas bāzes iegūtie rezultāti ar statistiskām metodēm jāpārnes uz kopējo populāciju.

Lai noteiktu sakritības pakāpi starp izlases pētījumu un vispārējo kopu, ir nepieciešams novērtēt kļūdu apjomu, kas neizbēgami rodas izlases novērošanas laikā. Tādu kļūdu sauc reprezentativitātes kļūda” vai “Vidējā aritmētiskā kļūda”. Faktiski tā ir starpība starp vidējiem rādītājiem, kas iegūti no izlases statistiskais novērojums, un līdzīgas vērtības, kas tiktu iegūtas, nepārtraukti pētot vienu un to pašu objektu, t.i. pētot vispārējo populāciju. Tā kā izlases vidējais lielums ir nejaušs lielums, šāda prognoze tiek veikta ar pētniekam pieņemamu varbūtības līmeni. IN medicīniskā izpēte tas ir vismaz 95%.

Reprezentativitātes kļūdu nedrīkst jaukt ar reģistrācijas kļūdām vai uzmanības kļūdām (drukāšanas kļūdas, nepareizi aprēķini, drukas kļūdas utt.), kas ir jāsamazina ar atbilstošu metodiku un eksperimentā izmantotajiem instrumentiem.

Reprezentativitātes kļūdas lielums ir atkarīgs gan no izlases lieluma, gan no pazīmes mainīguma. Kā vairāk numuru novērojumiem, jo ​​paraugs ir tuvāks vispārējai kopai un jo mazāka ir kļūda. Jo mainīgāka ir pazīme, jo lielāka ir statistiskā kļūda.

Praksē, lai noteiktu reprezentativitātes kļūdu variāciju rindās, tiek izmantota šāda formula:

,

Kur: m – reprezentativitātes kļūda;

σ - standarta novirze;

n ir novērojumu skaits izlasē.

No formulas var redzēt, ka izmērs vidējā kļūda ir tieši proporcionāls standarta novirzei, t.i., pētāmās pazīmes mainīgumam, un apgriezti proporcionāls novērojumu skaita kvadrātsaknei.

Veicot statistisko analīzi, kuras pamatā ir relatīvo vērtību aprēķins, variāciju rindas konstruēšana nav obligāta. Šajā gadījumā relatīvo rādītāju vidējās kļūdas noteikšanu var veikt, izmantojot vienkāršotu formulu:

,

Kur: R- relatīvā rādītāja vērtība, kas izteikta procentos, ppm utt.;

q- P apgrieztā vērtība, kas izteikta kā (1-P), (100-P), (1000-P) utt., atkarībā no tā, kā rādītājs tiek aprēķināts;

n ir novērojumu skaits izlasē.

Tomēr norādīto formulu reprezentativitātes kļūdas aprēķināšanai relatīvajām vērtībām var piemērot tikai tad, ja rādītāja vērtība ir mazāka par tā bāzi. Vairākos gadījumos, kad tiek aprēķināti intensīvi rādītāji, šis nosacījums nav izpildīts, un rādītāju var izteikt kā skaitli, kas pārsniedz 100% vai 1000%o. Šādā situācijā tiek veidota variāciju sērija un reprezentativitātes kļūda tiek aprēķināta, izmantojot vidējo vērtību formulu, pamatojoties uz standartnovirzi.

Vidējās aritmētiskās vērtības prognozēšana vispārējā populācijā tiek veikta, norādot divas vērtības - minimālo un maksimālo. Šīs galējās vērtības iespējamās novirzes, kuru robežās var svārstīties kopējās populācijas vēlamā vidējā vērtība, sauc par " Pārliecības robežas».

Varbūtību teorijas postulāti pierādīja, ka ar normālu pazīmes sadalījumu ar varbūtību 99,7%, vidējās noviržu galējās vērtības nepārsniegs reprezentativitātes trīskāršās kļūdas vērtību ( M ± 3 m ); 95,5% - ne vairāk kā vidējās vērtības dubultotās vidējās kļūdas vērtība ( M ±2 m ); 68,3% - ne vairāk kā vienas vidējās kļūdas vērtība ( M ± 1 m ) (9. att.).

P%

Rīsi. 9. Varbūtības blīvums normālais sadalījums.

Ņemiet vērā, ka iepriekš minētais apgalvojums attiecas tikai uz pazīmi, kas atbilst parastajam Gausa sadalījuma likumam.

Lielākā daļa eksperimentālo pētījumu, tostarp medicīnas jomā, ir saistīti ar mērījumiem, kuru rezultāti var iegūt gandrīz jebkuru vērtību noteiktā intervālā, tāpēc tos parasti apraksta ar nepārtrauktu nejaušu mainīgo modeli. Šajā sakarā lielākā daļa statistikas metožu ņem vērā nepārtrauktus sadalījumus. Viens no šiem sadalījumiem, kam ir būtiska loma matemātiskā statistika, ir normālais jeb Gausa sadalījums.

Tas ir saistīts ar vairākiem iemesliem.

1. Pirmkārt, daudzus eksperimentālos novērojumus var veiksmīgi aprakstīt, izmantojot normālo sadalījumu. Uzreiz jāatzīmē, ka nav empīrisko datu sadalījumu, kas būtu precīzi normāli, jo normāli sadalīti nejauša vērtība ir diapazonā no līdz , kas praksē nekad nenotiek. Tomēr normālais sadalījums ļoti bieži ir labs tuvinājums.

Vai tiek veikti svara, auguma un citu cilvēka ķermeņa fizioloģisko parametru mērījumi - visur rezultātus ietekmē ļoti liels skaits nejaušu faktoru ( dabiski cēloņi un mērījumu kļūdas). Un, kā likums, katra no šiem faktoriem ietekme ir nenozīmīga. Pieredze rāda, ka šādos gadījumos rezultāti tiks sadalīti aptuveni normāli.

2. Daudzi sadalījumi, kas saistīti ar nejaušu izlasi, palielinoties tā apjomam, kļūst normāli.

3. Normālais sadalījums ir labi piemērots citu nepārtrauktu sadalījumu (piemēram, asimetrisko) aptuvenam aprakstam.

4. Normālajam sadalījumam ir vairāki labvēlīgi matemātiskās īpašības, kas to lielā mērā nodrošināja plašs pielietojums statistikā.

Tajā pašā laikā jāatzīmē, ka medicīniskajos datos ir daudz eksperimentālu sadalījumu, ko nevar aprakstīt ar normālā sadalījuma modeli. Lai to izdarītu, statistika ir izstrādājusi metodes, kuras parasti sauc par "neparametriskām".

Konkrētā eksperimenta datu apstrādei piemērotas statistikas metodes izvēle jāveic atkarībā no tā, vai iegūtie dati pieder normālā sadalījuma likumam. Hipotēžu pārbaude zīmes pakārtotībai normālā sadalījuma likumam tiek veikta, izmantojot frekvenču sadalījuma histogrammu (grafiku), kā arī vairākus statistikas kritērijus. Starp viņiem:

Asimetrijas kritērijs ( b );

Kurtozes pārbaudes kritēriji ( g );

Šapiro–Vilksa kritērijs ( W ) .

Katram parametram tiek veikta datu sadalījuma rakstura analīze (to sauc arī par sadalījuma normalitātes testu). Lai droši spriestu par parametru sadalījuma atbilstību normālajam likumam, nepieciešams pietiekami liels novērojumu vienību skaits (vismaz 30 vērtības).

Normālam sadalījumam šķībuma un kurtozes kritēriji iegūst vērtību 0. Ja sadalījums ir nobīdīts pa labi b > 0 (pozitīva asimetrija), ar b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. Plkst g > 0 sadalījuma līkne ir asāka, ja g < 0 пик более сглаженный, чем функция нормального распределения.

Lai pārbaudītu normalitāti, izmantojot Šapiro-Vilksa kritēriju, ir jāatrod šī kritērija vērtība, izmantojot statistikas tabulas ar nepieciešamais līmenis nozīme un atkarībā no novērošanas vienību skaita (brīvības pakāpes). 1. pielikums. Normalitātes hipotēze tiek noraidīta nelielām šī kritērija vērtībām, kā likums w <0,8.

Grupēšanas metode ļauj arī izmērīt variācija zīmju (mainība, svārstības). Ja iedzīvotāju vienību skaits ir salīdzinoši neliels, variācijas mēra, pamatojoties uz ranžētu vienību sēriju, kas veido populāciju. Rinda tiek saukta ierindota ja vienības ir sakārtotas augošā (dilstošā) pazīmē.

Tomēr ranžētas sērijas ir drīzāk orientējošas, ja ir vajadzīgs salīdzinošs variācijas raksturlielums. Turklāt daudzos gadījumos nākas saskarties ar statistikas agregātiem, kas sastāv no liela skaita vienību, kurus praktiski ir grūti attēlot konkrētas sērijas veidā. Šajā sakarā sākotnējai vispārējai iepazīšanai ar statistikas datiem un it īpaši, lai atvieglotu zīmju variācijas izpēti, pētāmās parādības un procesi parasti tiek apvienoti grupās, un grupēšanas rezultāti tiek sastādīti grupu tabulu veidā. .

Ja grupu tabulā ir tikai divas kolonnas - grupas atbilstoši izvēlētajai pazīmei (opcijas) un grupu skaitam (frekvences vai frekvences), tiek izsaukts tuvu izplatīšanai.

Izplatīšanas diapazons - vienkāršākais strukturālās grupēšanas veids pēc viena atribūta, kas attēlots grupu tabulā ar divām kolonnām, kas satur atribūta variantus un biežumus. Daudzos gadījumos ar šādu strukturālu grupējumu, t.i. ar sadalījuma rindu sastādīšanu sākas sākotnējā statistiskā materiāla izpēte.

Strukturālo grupējumu sadalījuma rindas veidā var pārvērst par patiesu strukturālu grupējumu, ja atlasītās grupas raksturo ne tikai biežums, bet arī citi statistiskie rādītāji. Izplatīšanas sērijas galvenais mērķis ir izpētīt pazīmju variācijas. Sadalījuma rindu teoriju detalizēti izstrādā matemātiskā statistika.

Izplatīšanas sērijas ir sadalītas atribūtīvs(grupēšana pēc atribūtīvām pazīmēm, piemēram, iedzīvotāju sadalījums pēc dzimuma, tautības, ģimenes stāvokļa utt.) un variācijas(grupēšana pēc kvantitatīviem rādītājiem).

Variāciju sērija ir grupu tabula, kurā ir divas kolonnas: vienību grupējums pēc viena kvantitatīvā atribūta un vienību skaita katrā grupā. Intervāli variāciju sērijās parasti ir vienādi un slēgti. Variāciju rinda ir šāda Krievijas iedzīvotāju grupēšana pēc vidējiem naudas ienākumiem uz vienu iedzīvotāju (3.10. tabula).

3.10. tabula

Krievijas iedzīvotāju sadalījums pēc vidējiem ienākumiem uz vienu iedzīvotāju 2004.-2009

Iedzīvotāju grupas pēc vidējiem naudas ienākumiem uz vienu iedzīvotāju, rub./mēn

Iedzīvotāju skaits grupā, % no kopskaita

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Vairāk nekā 25 000,0

Visi iedzīvotāji

Savukārt variācijas sērijas iedala diskrētās un intervālā. Diskrēts variāciju sērija apvieno atsevišķu pazīmju variantus, kas atšķiras šaurās robežās. Diskrētu variāciju sērijas piemērs ir krievu ģimeņu sadalījums pēc bērnu skaita.

Intervāls variāciju sērijas apvieno vai nu nepārtrauktu, vai diskrētu funkciju variantus, kas mainās plašā diapazonā. Intervālu rinda ir Krievijas iedzīvotāju sadalījuma variāciju sērija vidējo naudas ienākumu uz vienu iedzīvotāju izteiksmē.

Diskrētās variāciju sērijas praksē netiek izmantotas ļoti bieži. Tikmēr to sastādīšana nav grūta, jo grupu sastāvu nosaka konkrētie varianti, kādi faktiski piemīt pētītajām grupēšanas pazīmēm.

Intervālu variāciju sērijas ir plašāk izplatītas. Sastādot tos, rodas sarežģīts jautājums par grupu skaitu, kā arī par to intervālu lielumu, kas būtu jānosaka.

Šīs problēmas risināšanas principi ir izklāstīti nodaļā par statistisko grupu veidošanas metodiku (sk. 3.3. punktu).

Variāciju sērijas ir līdzeklis daudzveidīgas informācijas sakraušanai vai saspiešanai kompaktā formā, ar tām var izdarīt diezgan skaidru spriedumu par variācijas būtību, izpētīt pētāmajā kopā iekļauto parādību pazīmju atšķirības. Taču variāciju rindu vissvarīgākā nozīme ir tāda, ka uz to pamata tiek aprēķināti variāciju īpašie vispārinošie raksturlielumi (sk. 7. nodaļu).



Jaunums uz vietas

>

Populārākais