Mājas Bērnu zobārstniecība Izveidojiet intervālu sadalījuma sēriju. Intervālu variāciju rindu konstruēšana nepārtrauktiem kvantitatīviem datiem

Izveidojiet intervālu sadalījuma sēriju. Intervālu variāciju rindu konstruēšana nepārtrauktiem kvantitatīviem datiem

Daudzos gadījumos kaķa statistiskā populācija ietver lielu vai pat vairāk bezgalīgs skaitlis opciju, kas visbiežāk sastopama ar nepārtrauktu variāciju, praktiski nav iespējams un nepraktiski katram variantam izveidot vienību grupu. Šādos gadījumos statistikas vienību apvienošana grupās iespējama tikai uz intervāla pamata, t.i. tāda grupa, kurai ir noteiktas robežas mainīgo raksturlielumu vērtībām. Šīs robežas ir norādītas ar diviem cipariem, kas norāda katras grupas augšējo un apakšējo robežu. Intervālu izmantošana noved pie intervālu sadalījuma sērijas veidošanās.

Intervāls rad ir variāciju sērija, kuras varianti ir parādīti intervālu veidā.

Intervālu rindas var veidot ar vienādiem un nevienādiem intervāliem, savukārt šīs rindas konstruēšanas principa izvēle galvenokārt ir atkarīga no statistiskās kopas reprezentativitātes un ērtības pakāpes. Ja populācija ir pietiekami liela (reprezentatīva) vienību skaita ziņā un ir pilnīgi viendabīga savā sastāvā, tad intervālu rindas veidošanu vēlams balstīt uz intervālu vienādību. Parasti, izmantojot šo principu, tiek veidota intervālu rinda tām populācijām, kurās variācijas diapazons ir salīdzinoši neliels, t.i. maksimālās un minimālās iespējas parasti atšķiras viena no otras vairākas reizes. Šajā gadījumā vienādu intervālu vērtību aprēķina pēc raksturlieluma variācijas diapazona attiecības ar noteiktu izveidoto intervālu skaitu. Lai noteiktu vienādu Un intervālu, var izmantot Stērdžesa formulu (parasti ar nelielām intervāla raksturlielumu variācijām un lielu vienību skaitu statistiskajā populācijā):

kur x i - vienāda intervāla vērtība; X max, X min - maksimālās un minimālās iespējas statistikas apkopojumā; n . - vienību skaits summā.

Piemērs. Ieteicams aprēķināt vienāda intervāla lielumu atbilstoši cēzija radioaktīvā piesārņojuma blīvumam - 137 100 Mogiļevas apgabala Krasnopoļskas rajona apdzīvotās vietās, ja ir zināms, ka sākotnējā (minimālā) opcija ir vienāda ar I km. / km 2, fināls ( maksimālais) - 65 ki/km 2. Izmantojot formulu 5.1. mēs iegūstam:

Tāpēc, lai veidotu intervālu sēriju ar vienādos intervālos pēc cēzija piesārņojuma blīvuma - 137 Krasnopoļskas apgabala apdzīvotās vietas, vienāda intervāla lielums var būt 8 ki/km 2.

Nevienmērīga sadalījuma apstākļos, t.i. kad maksimālās un minimālās opcijas ir simtiem reižu, veidojot intervālu sēriju, var pielietot principu nevienlīdzīgi intervāli. Nevienādi intervāli parasti palielinās, pārejot uz lielākām raksturlieluma vērtībām.

Intervālu forma var būt slēgta vai atvērta. Slēgts Ir pieņemts izsaukt intervālus, kuriem ir gan apakšējā, gan augšējā robeža. Atvērt intervāliem ir tikai viena robeža: pirmajā intervālā ir augšējā robeža, pēdējā ir apakšējā robeža.

Novērtēšana intervālu sērijas, īpaši nevienādos intervālos, vēlams veikt, ņemot vērā sadalījuma blīvums, vienkāršākais veids, kā aprēķināt, kura ir lokālās frekvences (vai frekvences) attiecība pret intervāla lielumu.

Lai praktiski veidotu intervālu sēriju, var izmantot tabulas izkārtojumu. 5.3.

5.3. tabula. Intervālu sērijas veidošanas procedūra apmetnes Krasnopolskas rajons pēc radioaktīvā piesārņojuma blīvuma ar cēziju -137

Intervālu sērijas galvenā priekšrocība ir tās maksimums kompaktums. tajā pašā laikā intervālu sadalījuma virknēs attiecīgajos intervālos tiek paslēpti atsevišķi raksturlieluma varianti

Grafiski attēlojot intervālu virkni taisnstūra koordinātu sistēmā, intervālu augšējās robežas tiek uzzīmētas uz abscisu ass, bet virknes lokālās frekvences - uz ordinātu ass. Intervālu sērijas grafiskā konstrukcija atšķiras no sadalījuma daudzstūra konstrukcijas ar to, ka katram intervālam ir apakšējā un augšējā robeža, un vienai ordinātu vērtībai atbilst divas abscises. Tāpēc intervālu sērijas grafikā nav atzīmēts punkts, kā daudzstūrī, bet gan taisne, kas savieno divus punktus. Šīs horizontālās līnijas savieno viena ar otru ar vertikālām līnijām un iegūst pakāpju daudzstūra figūru, ko parasti sauc histogramma sadalījums (5.3. att.).

Plkst grafiskā konstrukcija intervālu sērijas pietiekami lielai statistiskajai populācijai, tuvojas histogramma simetrisks izplatīšanas forma. Gadījumos, kad statistiskā kopa parasti ir maza, asimetrisks joslu diagramma.

Dažos gadījumos vēlams veidot uzkrāto frekvenču virkni, t.i. kumulatīvs rinda. Kumulatīvās rindas var veidot, pamatojoties uz diskrētu vai intervālu sadalījuma sēriju. Grafiski attēlojot kumulatīvo sēriju taisnstūra koordinātu sistēmā, varianti tiek attēloti uz abscisu ass, bet uzkrātās frekvences (frekvences) tiek attēlotas uz ordinātu ass. Iegūto izliekto līniju parasti sauc kumulatīvs sadalījums (5.4. att.).

Veidošana un grafiskais attēlojums dažādi veidi variāciju rindas veicina galveno statistisko raksturlielumu vienkāršotu aprēķinu, kas detalizēti apskatīts 6. tēmā, palīdz labāk izprast statistiskās kopas sadalījuma likumu būtību. Analīze variāciju sērija iegūst īpašu nozīmi gadījumos, kad nepieciešams identificēt un izsekot saistību starp opcijām un frekvencēm (frekvencēm). Šī atkarība izpaužas apstāklī, ka gadījumu skaits uz vienu variantu ir zināmā mērā saistīts ar šīs opcijas lielumu, t.i. palielinoties mainīgā raksturlieluma vērtībām, šo vērtību frekvences (frekvences) piedzīvo noteiktas, sistemātiskas izmaiņas. Tas nozīmē, ka skaitļi frekvences (frekvences) kolonnā nemainās haotiski, bet mainās noteiktā virzienā, noteiktā secībā un secībā.

Ja frekvences uzrāda noteiktu sistemātiskumu to izmaiņās, tas nozīmē, ka mēs esam ceļā uz modeļa identificēšanu. Sistēma, kārtība, secība mainīgajās frekvencēs ir atspulgs izplatīti iemesli, vispārīgie nosacījumi, kas raksturīgs visai populācijai.

Nevajadzētu pieņemt, ka izplatīšanas modelis vienmēr ir norādīts gatavā formā. Ir diezgan daudz variāciju sēriju, kurās frekvences dīvaini lec, dažreiz palielinās, dažreiz samazinās. Šādos gadījumos ieteicams noskaidrot, ar kādu izplatību pētnieks nodarbojas: vai nu šim sadalījumam vispār nav nekādu raksturīgu modeļu, vai arī tā būtība vēl nav atklāta: Pirmais gadījums ir rets, bet otrais. gadījums ir diezgan izplatīta un ļoti plaši izplatīta parādība.

Tādējādi, veidojot intervālu rindu, kopējais statistisko vienību skaits var būt neliels, un katrs intervāls satur nelielu skaitu variantu (piemēram, 1-3 vienības). Šādos gadījumos nevar paļauties uz kāda modeļa izpausmi. Lai, balstoties uz nejaušiem novērojumiem, tiktu iegūts dabisks rezultāts, ir nepieciešams, lai likums stātos spēkā lieli skaitļi, t.i. lai katram intervālam būtu nevis vairākas, bet desmitiem un simtiem statistikas vienību. Šim nolūkam mums ir jācenšas pēc iespējas palielināt novērojumu skaitu. Tas ir visvairāk pareizais ceļš modeļu noteikšana masu procesos. Ja nešķiet reāla iespēja palielināt novērojumu skaitu, tad modeļa identificēšanu var panākt, samazinot intervālu skaitu sadalījuma sērijās. Samazinot intervālu skaitu variāciju sērijā, tādējādi palielinās frekvenču skaits katrā intervālā. Tas nozīmē, ka katra nejaušas svārstības statistiskā vienība pārklāj viens otru, “izlīdzina”, pārvēršas paraugā.

Variāciju rindu veidošana un konstruēšana ļauj iegūt tikai vispārīgu, aptuvenu priekšstatu par statistiskās kopas sadalījumu. Piemēram, histogramma tikai aptuvenā formā izsaka attiecības starp raksturlieluma vērtībām un tā frekvencēm (frekvencēm). Tāpēc variāciju sērijas būtībā ir tikai pamats tālākai, padziļinātai statiskās slodzes iekšējās likumsakarības izpētei. izplatīšana.

5. TĒMAS TESTA JAUTĀJUMI

1. Kas ir variācija? Kas statistiskajā populācijā izraisa pazīmes atšķirības?

2. Kādi dažādu raksturlielumu veidi var būt statistikā?

3. Kas ir variāciju sērija? Kāda veida variāciju sērijas var būt?

4. Kas ir ranga sērija? Kādas ir tās priekšrocības un trūkumi?

5. Kas ir diskrēta sērija un kādas ir tās priekšrocības un trūkumi?

6. Kāda ir intervālu rindas veidošanas procedūra, kādas ir tās priekšrocības un trūkumi?

7. Kas ir ranžētu, diskrētu, intervālu sadalījuma sēriju grafiskais attēlojums?

8. Kas ir sadalījuma kumulāts un ko tas raksturo?

Nosūtiet savu labo darbu zināšanu bāzē ir vienkārši. Izmantojiet zemāk esošo veidlapu

Labs darbs uz vietni">

Studenti, maģistranti, jaunie zinātnieki, kuri izmanto zināšanu bāzi savās studijās un darbā, būs jums ļoti pateicīgi.

Publicēts http://www.allbest.ru/

UZDEVUMS1

Ir pieejama šāda informācija par algas darbinieki uzņēmumā:

1.1. tabula

Algu apmērs konvencionālajos terminos. den. vienības

Ir nepieciešams izveidot intervālu sadalījuma sēriju, pēc kuras atrast;

1) vidējā alga;

2) vidējā lineārā novirze;

4) standartnovirze;

5) variāciju diapazons;

6) svārstību koeficients;

7) lineārais koeficients variācijas;

8) vienkāršais variācijas koeficients;

10) mediāna;

11) asimetrijas koeficients;

12) Pīrsona asimetrijas indekss;

13) kurtozes koeficients.

Risinājums

Kā zināms, opcijas (atpazītās vērtības) ir sakārtotas augošā secībā līdz formai diskrētas variāciju sērijas. Ar lielu skaitu opciju (vairāk nekā 10), pat diskrētas variācijas gadījumā tiek konstruētas intervālu sērijas.

Ja intervālu sēriju sastāda ar pāra intervāliem, tad variāciju diapazons tiek dalīts ar norādīto intervālu skaitu. Turklāt, ja iegūtā vērtība ir vesels skaitlis un nepārprotami (kas ir reti), tiek pieņemts, ka intervāla garums ir vienāds ar šo skaitli. Citos gadījumos ražots noapaļošana Obligāti V pusē palielināt, Tātad uz pēdējais atlikušais cipars bija pāra. Acīmredzot, palielinoties intervāla garumam, variāciju diapazons ar lielumu, kas vienāds ar intervālu skaita reizinājumu: ar starpību starp aprēķināto un sākotnējo intervāla garumu

A) Ja variāciju diapazona paplašināšanās lielums ir nenozīmīgs, tad to vai nu pieskaita lielākajai, vai atņem no raksturlieluma mazākās vērtības;

b) Ja variācijas diapazona paplašināšanās lielums ir pamanāms, tad, lai diapazona centrs nemainītos, to aptuveni dala uz pusēm, vienlaikus pieskaitot lielākajam un atņemot no zemākās vērtības zīme.

Ja tiek sastādīta intervālu sērija ar nevienādiem intervāliem, tad process tiek vienkāršots, bet tomēr intervālu garums ir jāizsaka kā skaitlis ar pēdējo pāra ciparu, kas ievērojami vienkāršo turpmākos skaitlisko raksturlielumu aprēķinus.

30 ir izlases lielums.

Izveidosim intervālu sadalījuma sēriju, izmantojot Stērgesa formulu:

K = 1 + 3,32*log n,

K - grupu skaits;

K = 1 + 3,32 * lg 30 = 5,91 = 6

Mēs atrodam atribūta diapazonu - uzņēmuma strādnieku algas - (x), izmantojot formulu

R= xmax - xmin un dalīt ar 6; R = 195-112 = 83

Tad intervāla garums būs l josla=83:6=13,83

Pirmā intervāla sākums būs 112. Pievienojot 112 l ras = 13,83, iegūstam tā galīgo vērtību 125,83, kas ir arī otrā intervāla sākums utt. piektā intervāla beigas - 195.

Meklējot frekvences, jāvadās pēc noteikuma: "ja pazīmes vērtība sakrīt ar iekšējā intervāla robežu, tad tā ir jāattiecina uz iepriekšējo intervālu."

Mēs iegūstam frekvenču un kumulatīvo frekvenču intervālu sēriju.

1.2. tabula

Līdz ar to 3 darbiniekiem ir alga. maksa no 112 līdz 125,83 parastajām naudas vienībām. Augstākā alga maksa no 181,15 līdz 195 parastajām naudas vienībām. tikai 6 darbinieki.

Lai aprēķinātu skaitliskos raksturlielumus, mēs pārveidojam intervālu sēriju par diskrētu sēriju, kā opciju izmantojot intervālu vidu:

1.3. tabula

14131,83

Izmantojot svērto vidējo aritmētisko formulu

parastās naudas vienības

Vidējā lineārā novirze:

kur xi ir pētāmā raksturlieluma vērtība populācijas i-tajai vienībai,

Pētītās pazīmes vidējā vērtība.

Publicēts http://www.allbest.ru/

LPpublicēts http://www.allbest.ru/

Parastās naudas vienības

Standarta novirze:

Izkliede:

Relatīvais izmaiņu diapazons (oscilācijas koeficients): c= R:,

Relatīvā lineārā novirze: q = L:

Variācijas koeficients: V = y:

Svārstību koeficients parāda raksturlieluma galējo vērtību relatīvās svārstības ap vidējo aritmētisko, un variācijas koeficients raksturo populācijas pakāpi un viendabīgumu.

c= R: = 83 / 159,485*100% = 52,043%

Tādējādi starpība starp galējām vērtībām ir par 5,16% (=94,84%-100%) mazāka nekā uzņēmumā strādājošo vidējā alga.

q = L: = 17,765/ 159,485*100% = 11,139%

V = y: = 21,704/ 159,485*100% = 13,609%

Variācijas koeficients ir mazāks par 33%, kas liecina par vājām uzņēmumā strādājošo algu svārstībām, t.i. ka vidējā vērtība ir tipisks strādnieku algu raksturojums (iedzīvotāju skaits ir viendabīgs).

Intervālu sadalījuma sērijās mode nosaka pēc formulas -

Modālā intervāla biežums, t.i., intervāls, kurā ir vislielākais opciju skaits;

Intervāla biežums pirms modāla;

Intervāla biežums pēc modāla;

Modālā intervāla garums;

Modālā intervāla apakšējā robeža.

Lai noteiktu mediānas intervālu sērijā izmantojam formulu

kur ir kumulatīvā (uzkrātā) intervāla biežums pirms mediānas;

Vidējā intervāla apakšējā robeža;

Vidējā intervāla frekvence;

Vidējā intervāla garums.

Vidējais intervāls- intervāls, kura uzkrātā frekvence (=3+3+5+7) pārsniedz pusi no frekvenču summas - (153,49; 167,32).

Aprēķināsim asimetriju un kurtozi, kam izveidosim jaunu darblapu:

1.4. tabula

Faktiskie dati

Aprēķinātie dati

Aprēķināsim trešās kārtas momentu

Tāpēc asimetrija ir vienāda ar

Tā kā 0,3553 0,25, asimetrija tiek uzskatīta par nozīmīgu.

Aprēķināsim ceturtās kārtas momentu

Tāpēc kurtoze ir vienāda ar

Jo< 0, то эксцесс является плосковершинным.

Asimetrijas pakāpi var noteikt, izmantojot Pīrsona asimetrijas koeficientu (As): oscilācijas izlases vērtības apgrozījums

kur ir sadalījuma rindas vidējais aritmētiskais; -- mode; -- standarta novirze.

Ar simetrisku (normālu) sadalījumu = Mo, tāpēc asimetrijas koeficients ir nulle. Ja As > 0, tad ir vairāk režīmu, tāpēc ir labās puses asimetrija.

Ja kā< 0, то mazāk modes, tāpēc ir kreisās puses asimetrija. Asimetrijas koeficients var svārstīties no -3 līdz +3.

Sadalījums nav simetrisks, bet tam ir kreisās puses asimetrija.

UZDEVUMS 2

Kādam jābūt izlases lielumam, lai ar varbūtību 0,954 izlases kļūda nepārsniegtu 0,04, ja, pamatojoties uz iepriekšējiem apsekojumiem, ir zināms, ka dispersija ir 0,24?

Risinājums

Izlases lielumu neatkārtotai izlasei aprēķina, izmantojot formulu:

t - ticamības koeficients (ar varbūtību 0,954 tas ir vienāds ar 2,0; noteikts no varbūtības integrāļu tabulām),

y2=0,24 - standartnovirze;

10 000 cilvēku - izlases lielums;

Dx =0,04 - maksimālā izlases vidējā kļūda.

Ar 95,4% varbūtību var apgalvot, ka izlases lielumam, nodrošinot relatīvo kļūdu ne lielāku par 0,04, jābūt vismaz 566 ģimenēm.

UZDEVUMS3

Ir pieejami šādi dati par ienākumiem no uzņēmuma pamatdarbības, miljoni rubļu.

Lai analizētu virkni dinamikas, nosakiet šādus rādītājus:

1) ķēde un pamata:

Absolūtie pieaugumi;

Izaugsmes tempi;

Pieauguma temps;

2) vidēji

Dinamikas rindas līmenis;

Absolūts pieaugums;

Pieauguma temps;

Palielinājuma ātrums;

3) 1% pieauguma absolūtā vērtība.

Risinājums

1. Absolūtais pieaugums (Dy)- šī ir atšķirība starp nākamo sērijas līmeni un iepriekšējo (vai pamata):

ķēde: DN = yi - yi-1,

pamata: DN = yi - y0,

уi — rindas līmenis,

i — rindas līmeņa numurs,

y0 — bāzes gada līmenis.

2. Izaugsmes ātrums (Tu) ir rindas nākamā līmeņa un iepriekšējā (vai bāzes gada 2001) attiecība:

ķēde: Tu = ;

pamata: Tu =

3. Izaugsmes temps (TD) ir absolūtā pieauguma attiecība pret iepriekšējo līmeni, izteikta %.

ķēde: Tu = ;

pamata: Tu =

4. 1% pieauguma absolūtā vērtība (A)- šī ir ķēdes absolūtā pieauguma attiecība pret pieauguma tempu, kas izteikta %.

A =

Vidējais rindas līmenis aprēķina, izmantojot vidējo aritmētisko formulu.

Vidējais ienākumu līmenis no pamatdarbības 4 gados:

Vidējais absolūtais pieaugums aprēķina pēc formulas:

kur n ir sērijas līmeņu skaits.

Vidēji gadā ienākumi no pamatdarbības pieauga par 3,333 miljoniem rubļu.

Vidējais gada pieauguma temps aprēķina, izmantojot vidējo ģeometrisko formulu:

уn ir rindas pēdējais līmenis,

y0 - Pirmais līmenis rinda.

Tu = 100% = 102,174%

Vidējais gada pieauguma temps aprēķina pēc formulas:

T? = Tu - 100% = 102,74% - 100% = 2,74%.

Tādējādi vidēji gada laikā ienākumi no uzņēmuma pamatdarbības pieauga par 2,74%.

UZDEVUMIA4

Aprēķināt:

1. Individuālie cenu indeksi;

2. Vispārējais tirdzniecības apgrozījuma indekss;

3. Kopējais cenu indekss;

4. Preču realizācijas fiziskā apjoma summārais indekss;

5. Sadalīt tirdzniecības apgrozījuma vērtības absolūto pieaugumu pa faktoriem (cenu un pārdoto preču skaita izmaiņu dēļ);

6. Izdarīt īsus secinājumus par visiem iegūtajiem rādītājiem.

Risinājums

1. Atbilstoši nosacījumam individuālie cenu indeksi produktiem A, B, C sastādīja -

ipA=1,20; iрБ=1,15; iрВ=1,00.

2. Aprēķināsim vispārējo tirdzniecības apgrozījuma indeksu pēc formulas:

I w = = 1470/1045 * 100% = 140,67%

Tirdzniecības apgrozījums pieauga par 40,67% (140,67%-100%).

Vidēji preču cenas pieauga par 10,24%.

Pircēju papildu izmaksu summa no cenu pieauguma:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 miljoni rubļu.

Cenu kāpuma rezultātā pircējiem nācās papildus tērēt 136,522 miljonus rubļu.

4. Tirdzniecības apgrozījuma fiziskā apjoma vispārējais indekss:

Tirdzniecības apgrozījuma fiziskais apjoms pieauga par 27,61%.

5. Noteiksim kopējās tirdzniecības apgrozījuma izmaiņas otrajā periodā salīdzinājumā ar pirmo periodu:

w = 1470-1045 = 425 miljoni rubļu.

cenu izmaiņu dēļ:

W(p) = 1470 - 1333,478 = 136,522 miljoni rubļu.

fiziskā apjoma izmaiņu dēļ:

w(q) = 1333,478 - 1045 = 288,478 miljoni rubļu.

Preču apgrozījums pieauga par 40,67%. Cenas vidēji 3 precēm pieauga par 10,24%. Tirdzniecības apgrozījuma fiziskais apjoms pieauga par 27,61%.

Kopumā pārdošanas apjoms pieauga par 425 miljoniem rubļu, tajā skaitā cenu kāpuma dēļ pieauga par 136,522 miljoniem rubļu, bet pārdošanas apjomu pieauguma dēļ - par 288,478 miljoniem rubļu.

UZDEVUMS5

Ir pieejami šādi dati par 10 rūpnīcām vienā nozarē.

Augu numurs

Produkta izlaide, tūkst.gab. (X)

Pamatojoties uz sniegtajiem datiem:

I) apstiprināt loģiskās analīzes nosacījumus par lineāras korelācijas esamību starp faktora raksturlielumu (produkta tilpumu) un rezultējošo raksturlielumu (elektroenerģijas patēriņš), attēlot sākotnējos datus korelācijas lauka grafikā un izdarīt secinājumus par formu. norādiet tās formulu;

2) nosaka savienojuma vienādojuma parametrus un uzzīmē iegūto teorētisko taisni korelācijas lauka grafikā;

3) aprēķina lineārās korelācijas koeficientu,

4) izskaidro 2. un 3. punktā iegūto rādītāju nozīmi;

5) izmantojot iegūto modeli, veikt prognozi par iespējamo enerģijas patēriņu ražotnē ar ražošanas apjomu 4,5 tūkstoši vienību.

Risinājums

Atribūta dati - produkcijas apjoms (faktors), tiks apzīmēti ar xi; zīme - elektroenerģijas patēriņš (rezultāts) caur yi; punkti ar koordinātām (x, y) tiek attēloti korelācijas laukā OXY.

Korelācijas lauka punkti atrodas pa noteiktu taisni. Tāpēc sakarība ir lineāra, regresijas vienādojumu meklēsim taisnes Уx=ax+b formā. Lai to atrastu, mēs izmantojam normālo vienādojumu sistēmu:

Izveidosim aprēķinu tabulu.

Izmantojot atrastos vidējos lielumus, mēs sastādām sistēmu un atrisinām to attiecībā uz parametriem a un b:

Tātad, mēs iegūstam regresijas vienādojumu y uz x: = 3,57692 x + 3,19231

Mēs veidojam regresijas līniju korelācijas laukā.

Aizvietojot x vērtības no 2. ailes regresijas vienādojumā, iegūstam aprēķinātās (7. aile) un salīdzinām tās ar y datiem, kas atspoguļoti 8. ailē. Starp citu, aprēķinu pareizību apstiprina y un vidējo vērtību sakritība.

Koeficientslineārā korelācija novērtē sakarības tuvumu starp pazīmēm x un y un aprēķina, izmantojot formulu

Tiešās regresijas leņķiskais koeficients a (pie x) raksturo identificētā virzienuatkarībaszīmes: a>0 tie ir vienādi, a<0- противоположны. Tā absolūta vērtība - iegūtā raksturlieluma izmaiņu mērs, kad faktora raksturlielums mainās par mērvienību.

Tiešās regresijas brīvais termins atklāj virzienu, un tā absolūtā vērtība ir visu pārējo faktoru ietekmes uz iegūto raksturlielumu kvantitatīvais rādītājs.

Ja< 0, tad atsevišķam objektam raksturīgā faktora resurss tiek izmantots ar mazāk, un kad>0 Arlielāka efektivitāte nekā vidēji visam objektu kopumam.

Veiksim pēcregresijas analīzi.

Tiešās regresijas koeficients pie x ir vienāds ar 3,57692 >0, tāpēc, palielinoties (samazinoties) ražošanas izlaidei, elektroenerģijas patēriņš palielinās (samazinās). Ražošanas izlaides pieaugums par 1 tūkstoti vienību. dod vidējo elektroenerģijas patēriņa pieaugumu par 3,57692 tūkst.kWh.

2. Tiešās regresijas brīvais termiņš ir vienāds ar 3,19231, tāpēc citu faktoru ietekme palielina produkcijas izlaides ietekmes spēku uz elektroenerģijas patēriņu gadā. absolūtais mērījums par 3,19231 tūkst.kWh.

3. Korelācijas koeficients 0,8235 atklāj ļoti ciešu elektroenerģijas patēriņa atkarību no produkcijas izlaides.

Saskaņā ar Eq. regresijas modelis viegli izdarīt prognozes. Lai to izdarītu, regresijas vienādojumā tiek aizstātas x vērtības - ražošanas apjoms un tiek prognozēts elektroenerģijas patēriņš. Šajā gadījumā x vērtības var ņemt ne tikai noteiktā diapazonā, bet arī ārpus tā.

Izgatavosim prognozi par iespējamo enerģijas patēriņu ražotnē ar ražošanas apjomu 4,5 tūkstoši vienību.

3,57692*4,5 + 3,19231= 19,288 45 tūkstoši kWh.

IZMANTOTO AVOTU SARAKSTS

1. Zaharenkovs S.N. Sociāli ekonomiskā statistika: mācību grāmata un praktiskais ceļvedis. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumjancevs V.N. Vispārējā statistikas teorija. - M.: INFRA - M., 2000.

3. Elisejeva I.I. Statistika. - M.: Prospekts, 2002.

4. Vispārīgā statistikas teorija / Under general. ed. O.E. Bašina, A.A. Spirina. - M.: Finanses un statistika, 2000.

5. Sociāli ekonomiskā statistika: izglītojoša un praktiska. pabalsts / Zakharenkov S.N. un citi - Mn.: Erevānas Valsts universitāte, 2004.

6. Sociāli ekonomiskā statistika: Mācību grāmata. pabalstu. / Red. Nesterovičs S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistika. - Minska, 2000.

8. Harčenko L.P. Statistika. - M.: INFRA - M, 2002.

9. Harčenko L.P., Dolženkova V.G., Ionins V.G. Statistika. - M.: INFRA - M, 1999. gads.

10. Ekonomikas statistika / Red. Yu.N. Ivanova - M., 2000. gads.

Ievietots vietnē Allbest.ru

...

Līdzīgi dokumenti

    Vidējā aritmētiskā aprēķins intervālu sadalījuma rindai. Definīcija vispārējais indekss tirdzniecības apgrozījuma fiziskais apjoms. Ražošanas kopējo izmaksu absolūto izmaiņu analīze fiziskā apjoma izmaiņu dēļ. Variācijas koeficienta aprēķins.

    tests, pievienots 19.07.2010

    Vairumtirdzniecības, mazumtirdzniecības un publiskās tirdzniecības būtība. Formulas individuālo un kopējo apgrozījuma indeksu aprēķināšanai. Intervālu sadalījuma rindas raksturlielumu aprēķins - vidējais aritmētiskais, režīms un mediāna, variācijas koeficients.

    kursa darbs, pievienots 10.05.2013

    Plānotā un faktiskā pārdošanas apjoma aprēķins, plāna izpildes procents, apgrozījuma absolūtās izmaiņas. Absolūtā pieauguma, vidējo pieauguma tempu un naudas ienākumu pieauguma noteikšana. Strukturālo vidējo rādītāju aprēķins: režīmi, mediānas, kvartiles.

    tests, pievienots 24.02.2012

    Banku sadalījuma intervālu rindas pēc peļņas apjoma. Iegūtās intervālu sadalījuma sērijas režīma un mediānas atrašana grafiskā metode un pēc aprēķiniem. Intervālu sadalījuma rindu raksturlielumu aprēķins. Vidējā aritmētiskā aprēķins.

    tests, pievienots 15.12.2010

    Formulas intervālu sērijas vidējo vērtību noteikšanai - režīmi, mediānas, dispersija. Dinamikas rindu analītisko rādītāju aprēķins, izmantojot ķēdes un pamatshēmas, pieauguma tempus un inkrementus. Konsolidētā izmaksu, cenu, izdevumu un apgrozījuma indeksa jēdziens.

    kursa darbs, pievienots 27.02.2011

    Variāciju sērijas konstruēšanas jēdziens un mērķis, secība un noteikumi. Datu viendabīguma analīze grupās. Pazīmes variācijas (fluktuācijas) rādītāji. Vidējās lineārās un kvadrātiskās novirzes, svārstību un variācijas koeficienta noteikšana.

    tests, pievienots 26.04.2010

    Režīma un mediānas jēdziens kā tipiskas īpašības, to noteikšanas kārtību un kritērijus. Režīma un mediānas atrašana diskrētās un intervālu variāciju rindās. Kvartiles un deciles kā variācijas papildu raksturlielumi statistikas sērijas.

    tests, pievienots 11.09.2010

    Intervālu sadalījuma sērijas konstruēšana, pamatojoties uz grupēšanas raksturlielumiem. Frekvences sadalījuma novirzes no simetriskas formas raksturojums, kurtozes un asimetrijas rādītāju aprēķināšana. Rādītāju analīze Bilance vai ienākumu deklarāciju.

    tests, pievienots 19.10.2014

    Empīrisko sēriju pārvēršana diskrētās un intervālu sērijās. Vidējās vērtības noteikšana diskrētai sērijai, izmantojot tās īpašības. Aprēķins, izmantojot diskrētu režīmu, mediānas, variācijas indikatoru sēriju (dispersija, novirze, svārstību koeficients).

    tests, pievienots 17.04.2011

    Organizāciju sadalījuma statistiskās sērijas izveide. Režīma un vidējo vērtību grafiskā noteikšana. Tuvums korelācijas savienojums izmantojot determinācijas koeficientu. Vidējā darbinieku skaita izlases kļūdas noteikšana.

Matemātiskās statistikas testa risināšanas piemērs

1. problēma

Sākotnējie dati : noteiktas grupas studenti 30 cilvēku sastāvā nokārtoja eksāmenu kursā “Informātika”. Studentu saņemtās atzīmes veido šādu skaitļu sēriju:

I. Izveidosim variāciju sēriju

m x

w x

m x nak

w x nak

Kopā:

II. Statistiskās informācijas grafisks attēlojums.

III. Parauga skaitliskās īpašības.

1. Vidējais aritmētiskais

2. Ģeometriskais vidējais

3. Mode

4. Mediāna

222222333333333 | 3 34444444445555

5. Izlases dispersija

7. Variācijas koeficients

8. Asimetrija

9. Asimetrijas koeficients

10. Pārmērība

11. Kurtozes koeficients

2. problēma

Sākotnējie dati : Dažas grupas skolēni uzrakstīja gala pārbaudījumu. Grupas sastāvā ir 30 cilvēki. Skolēnu iegūtie punkti veido šādu skaitļu sēriju

Risinājums

I. Tā kā raksturlielumam ir daudz dažādu vērtību, mēs tam izveidosim intervālu variāciju sēriju. Lai to izdarītu, vispirms iestatiet intervāla vērtību h. Izmantosim Stangera formulu

Izveidosim intervālu skalu. Šajā gadījumā par pirmā intervāla augšējo robežu ņemsim vērtību, kas noteikta pēc formulas:

Mēs nosakām nākamo intervālu augšējās robežas, izmantojot šādu atkārtotu formulu:

, Tad

Mēs pabeidzam konstruēt intervālu skalu, jo nākamā intervāla augšējā robeža ir kļuvusi lielāka vai vienāda ar maksimālo izlases vērtību
.

II. Intervālu variāciju sēriju grafiskais attēlojums

III. Parauga skaitliskās īpašības

Lai noteiktu izlases skaitliskos raksturlielumus, mēs sastādīsim palīgtabulu

Summa:

1. Vidējais aritmētiskais

2. Ģeometriskais vidējais

3. Mode

4. Mediāna

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Izlases dispersija

6. Parauga standartnovirze

7. Variācijas koeficients

8. Asimetrija

9. Asimetrijas koeficients

10. Pārmērība

11. Kurtozes koeficients

3. problēma

Stāvoklis : ampērmetra skalas dalījuma vērtība ir 0,1 A. Rādījumi tiek noapaļoti līdz tuvākajam veselajam dalījumam. Atrodiet varbūtību, ka nolasīšanas laikā tiks pieļauta kļūda, kas pārsniedz 0,02 A.

Risinājums.

Izlases noapaļošanas kļūdu var uzskatīt par nejaušu lielumu X, kas ir vienmērīgi sadalīts intervālā starp diviem blakus esošiem veseliem skaitļiem. Vienmērīgs sadalījuma blīvums

Kur
- intervāla garums, kas satur iespējamās vērtības X; ārpus šī intervāla
Šajā uzdevumā intervāla garums, kas satur iespējamās vērtības, ir X, ir vienāds ar 0,1, tātad

Lasīšanas kļūda pārsniegs 0,02, ja tā atrodas intervālā (0,02; 0,08). Tad

Atbilde: R=0,6

4. problēma

Sākotnējie dati: normāli sadalīta raksturlieluma matemātiskā gaida un standartnovirze X attiecīgi vienāds ar 10 un 2. Atrodiet varbūtību, ka testa rezultātā Xņems vērtību, kas ietverta intervālā (12, 14).

Risinājums.

Izmantosim formulu

Un teorētiskās frekvences

Risinājums

Viņai X paredzamā vērtība M(X) un dispersija D(X). Risinājums. Atradīsim sadalījuma funkciju F(x) nejaušais mainīgais... izlases kļūda). Sacerēsim variācijas rinda Intervāla platums būs: katrai vērtībai rinda Aprēķināsim, cik...

  • Risinājums: atdalāms vienādojums

    Risinājums

    Formā Lai atrastu koeficientu risinājumus nehomogēns vienādojums samierināsimies sistēma Atrisināsim iegūto sistēmu... ; +47; +61; +10; -8. Veidošanas intervāls variācijas rinda. Sniedziet statistiskus aprēķinus par vidējo vērtību...

  • Risinājums: Aprēķināsim ķēdes un pamata absolūtos pieaugumus, pieauguma tempus, pieauguma tempus. Mēs apkopojam iegūtās vērtības 1. tabulā

    Risinājums

    Ražošanas apjoms. Risinājums: intervāla vidējais aritmētiskais variācijas rinda tiek aprēķināts šādi: priekš... Marginālā izlases kļūda ar varbūtību 0,954 (t=2) būs: Δ w = t*μ = 2*0,0146 = 0,02927 Definēsim robežas...

  • Risinājums. Pierakstīties

    Risinājums

    PAR darba pieredze kas un izdomāts paraugs. Izlases vidējā darba pieredze... šo darbinieku un izdomāts paraugs. Vidējais ilgums izlasei... 1,16, nozīmīguma līmenis α = 0,05. Risinājums. Variācijas rinda no šī parauga izskatās šādi: 0,71 ...

  • Darba programma bioloģijā 10.-11.klasei Sastādīja: Poļikarpova S.V.

    Darbojas apmācību programma

    Vienkāršākās šķērsošanas shēmas" 5 L.r. " Risinājums elementāras ģenētiskas problēmas" 6 L.b. " Risinājums elementāras ģenētiskas problēmas" 7 L.r. "..., 110, 115, 112, 110. Rakstīt variācijas rinda, zīmēt variācijas līkne, atrodiet raksturlieluma vidējo vērtību...

  • Diskrētu variāciju sērija ir izveidota diskrētiem raksturlielumiem.

    Lai izveidotu diskrētu variāciju virkni, jāveic šādas darbības: 1) sakārto novērojumu vienības augošā secībā pēc raksturlieluma pētītās vērtības,

    2) nosaka visas iespējamās atribūta x i vērtības, sakārto tās augošā secībā,

    atribūta vērtība, i .

    atribūta vērtības biežums un apzīmē f i . Sērijas visu frekvenču summa ir vienāda ar elementu skaitu pētāmajā populācijā.

    1. piemērs .

    Studentu eksāmenos saņemto vērtējumu saraksts: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

    Šeit ir numurs X - pakāpeir diskrēts gadījuma mainīgais, un iegūtais aplēšu saraksts irstatistiskie (novērojamie) dati .

      sakārto novērojumu vienības augošā secībā pēc pētītās raksturīgās vērtības:

    2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

    2) nosaka visas iespējamās atribūta x i vērtības, sakārto tās augošā secībā:

    Šajā piemērā visas aplēses var iedalīt četrās grupās ar šādām vērtībām: 2; 3; 4; 5.

    Tiek izsaukta gadījuma lieluma vērtība, kas atbilst noteiktai novēroto datu grupai atribūta vērtība, opciju (opciju) un norādiet x i .

    Tiek izsaukts skaitlis, kas parāda, cik reižu atbilstošā raksturlieluma vērtība notiek vairākos novērojumos atribūta vērtības biežums un apzīmē f i .

    Mūsu piemēram

    2. rezultāts parādās - 8 reizes,

    3. rezultāts parādās - 12 reizes,

    4. rezultāts parādās - 23 reizes,

    5. rezultāts notiek - 17 reizes.

    Kopumā ir 60 vērtējumi.

    4) ierakstīt saņemtos datus tabulā ar divām rindām (kolonnām) - x i un f i.

    Pamatojoties uz šiem datiem, ir iespējams izveidot diskrētu variāciju sēriju

    Diskrētās variāciju sērijas - šī ir tabula, kurā pētāmā raksturlieluma sastopamās vērtības ir norādītas kā atsevišķas vērtības augošā secībā un to biežums

    1. Intervālu variāciju sērijas konstruēšana

    Papildus diskrētajām variāciju sērijām bieži tiek izmantota datu grupēšanas metode, piemēram, intervāla variāciju sērijas.

    Intervālu sēriju veido, ja:

      zīmei ir nepārtraukts pārmaiņu raksturs;

      Bija daudz atsevišķu vērtību (vairāk nekā 10)

      diskrēto vērtību frekvences ir ļoti mazas (nepārsniedz 1-3 ar salīdzinoši lielu novērošanas vienību skaitu);

      daudzas atsevišķas objekta vērtības ar vienādām frekvencēm.

    Intervālu variāciju sērija ir veids, kā grupēt datus tabulas veidā, kurā ir divas kolonnas (rakstzīmes vērtības vērtību intervāla veidā un katra intervāla biežums).

    Atšķirībā no diskrēta sērija intervālu sērijas atribūta vērtības tiek attēlotas nevis ar atsevišķām vērtībām, bet gan ar vērtību intervālu (“no - līdz”).

    Tiek izsaukts skaitlis, kas parāda, cik novērojumu vienību iekļuva katrā atlasītajā intervālā atribūta vērtības biežums un apzīmē f i . Sērijas visu frekvenču summa ir vienāda ar elementu (novērošanas vienību) skaitu pētāmajā populācijā.

    Ja vienībai ir raksturīga vērtība, kas vienāda ar augšējā robeža intervālu, tad tas jāpiešķir nākamajam intervālam.

    Piemēram, bērns, kura augums ir 100 cm, iekritīs 2. intervālā, nevis pirmajā; un bērns ar 130 cm augumu iekritīs pēdējā intervālā, nevis trešajā.

    Pamatojoties uz šiem datiem, var izveidot intervālu variāciju sēriju.

    Katram intervālam ir apakšējā robeža (xn), augšējā robeža (xw) un intervāla platums ( i).

    Intervāla robeža ir atribūta vērtība, kas atrodas uz divu intervālu robežas.

    bērnu augums (cm)

    bērnu augums (cm)

    bērnu daudzums

    vairāk nekā 130

    Ja intervālam ir augšējā un apakšējā robeža, tad to sauc slēgts intervāls. Ja intervālam ir tikai apakšējā vai tikai augšējā robeža, tad tas ir - atvērtais intervāls. Var būt atvērts tikai pats pirmais vai pēdējais intervāls. Iepriekš minētajā piemērā pēdējais intervāls ir atvērts.

    Intervāla platums (i) – atšķirība starp augšējo un apakšējo robežu.

    i = x n - x collas

    Tiek pieņemts, ka atvērtā intervāla platums ir tāds pats kā blakus esošā slēgtā intervāla platums.

    bērnu augums (cm)

    bērnu daudzums

    Intervāla platums (i)

    aprēķiniem 130+20=150

    20 (jo blakus esošā slēgtā intervāla platums ir 20)

    Visas intervālu sērijas tiek sadalītas intervālu sērijās ar vienādiem intervāliem un intervālu sērijās ar nevienādiem intervāliem . Atdalītās rindās ar vienādiem intervāliem visu intervālu platums ir vienāds. Intervālu sērijās ar nevienādiem intervāliem intervālu platums ir atšķirīgs.

    Apskatāmajā piemērā - intervālu sērija ar nevienādiem intervāliem.

    Ja pētāmais gadījuma mainīgais ir nepārtraukts, tad novēroto vērtību sakārtošana un grupēšana bieži vien neļauj identificēt rakstura iezīmes mainot tās vērtības. Tas izskaidrojams ar to, ka gadījuma lieluma atsevišķas vērtības var atšķirties viena no otras tik maz, cik vēlas, un tāpēc novēroto datu kopumā reti var rasties identiskas lieluma vērtības, un varianti maz atšķiras viens no otra.

    Ir arī nepraktiski izveidot diskrētu rindu diskrētam gadījuma mainīgajam skaitlim iespējamās vērtības kas ir lieliski. Šādos gadījumos jums vajadzētu būvēt intervālu variāciju sērijas sadales.

    Lai izveidotu šādu sēriju, viss nejaušā lieluma novēroto vērtību variācijas intervāls tiek sadalīts sērijā daļējie intervāli un vērtību vērtību rašanās biežuma skaitīšana katrā daļējā intervālā.

    Intervāls variāciju sērija izsauciet sakārtotu nejauša lieluma mainīgo vērtību intervālu kopu ar atbilstošām frekvencēm vai mainīgā lieluma vērtību relatīvajām frekvencēm, kas ietilpst katrā no tām.

    Lai izveidotu intervālu sēriju, jums ir nepieciešams:

    1. definēt Izmērs daļējie intervāli;
    2. definēt platums intervāli;
    3. iestatiet to katram intervālam tops Un apakšējā robeža ;
    4. sagrupējiet novērojumu rezultātus.

    1 . Jautājums par grupēšanas intervālu skaita un platuma izvēli ir jāizlemj katrā konkrētajā gadījumā, pamatojoties uz mērķi pētniecība, apjoms paraugi un variācijas pakāpe raksturlielums izlasē.

    Aptuvenais intervālu skaits k var novērtēt, pamatojoties tikai uz izlases lielumu n kādā no šiem veidiem:

    • saskaņā ar formulu Sturges : k = 1 + 3,32 log n ;
    • izmantojot 1. tabulu.

    1. tabula

    2 . Parasti priekšroka tiek dota vienāda platuma telpām. Lai noteiktu intervālu platumu h aprēķināt:

    • variāciju diapazons R - parauga vērtības: R = x max - x min ,

    Kur xmax Un xmin - maksimālās un minimālās paraugu ņemšanas iespējas;

    • katra intervāla platums h nosaka pēc šādas formulas: h = R/k .

    3 . Apakšējā līnija pirmais intervāls x h1 ir atlasīts tā, lai minimālā izlases opcija xmin iekrita aptuveni šī intervāla vidū: x h1 = x min - 0,5 h .

    Starpposma intervāli iegūts, iepriekšējā intervāla beigām pievienojot daļējā intervāla garumu h :

    x hi = x hi-1 + h.

    Intervālu skalas konstruēšana, pamatojoties uz intervālu robežu aprēķinu, turpinās līdz vērtībai x sveiks apmierina attiecību:

    x sveiks< x max + 0,5·h .

    4 . Saskaņā ar intervālu skalu raksturīgās vērtības tiek grupētas - katram daļējam intervālam tiek aprēķināta frekvenču summa n i iekļauta opcija i th intervāls. Šajā gadījumā intervāls ietver nejaušā lieluma vērtības, kas ir lielākas vai vienādas ar apakšējo robežu un mazākas par intervāla augšējo robežu.

    Daudzstūris un histogramma

    Skaidrības labad tiek konstruēti dažādi statistiskā sadalījuma grafiki.

    Pamatojoties uz diskrētu variāciju sērijas datiem, viņi konstruē daudzstūris frekvences vai relatīvās frekvences.

    Frekvences daudzstūris x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Lai izveidotu frekvenču daudzstūri, opcijas ir attēlotas uz abscisu ass. x i , un uz ordinātas - atbilstošās frekvences n i . Punkti ( x i ; n i ) savieno taisni segmenti un iegūst frekvences daudzstūri (1. att.).

    Relatīvo frekvenču daudzstūris sauc par lauztu līniju, kuras segmenti savieno punktus ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Ned ). Lai izveidotu relatīvo frekvenču daudzstūri, opcijas ir attēlotas uz abscisu ass x i , un uz ordinātas - atbilstošās relatīvās frekvences W i . Punkti ( x i ; W i ) ir savienoti ar taisniem segmentiem un tiek iegūts relatīvo frekvenču daudzstūris.

    Kad nepārtraukta zīme vēlams būvēt histogramma .

    Frekvences histogramma sauc par pakāpju figūru, kas sastāv no taisnstūriem, kuru pamati ir daļēji garuma intervāli h , un augstumi ir vienādi ar attiecību NIH (frekvences blīvums).

    Lai izveidotu frekvenču histogrammu, uz abscisu ass tiek izlikti daļējie intervāli, un virs tiem attālumā tiek uzzīmēti segmenti, kas ir paralēli abscisu asij. NIH .



    Jaunums vietnē

    >

    Populārākais