Dom Obložen jezik Ako varijacioni niz ima oblik. Varijacije i varijantne serije, opseg varijacije

Ako varijacioni niz ima oblik. Varijacije i varijantne serije, opseg varijacije

Varijacija nazivaju se redovi distribucije konstruisani na kvantitativnoj osnovi. Vrijednosti kvantitativnih karakteristika u pojedinim jedinicama populacije nisu konstantne i međusobno se manje-više razlikuju.

Varijacija- fluktuacija, promjenjivost vrijednosti neke karakteristike među jedinicama stanovništva. Odvojite numeričke vrijednosti karakteristike koje se nalaze u populaciji koja se proučava nazivaju se opcije vrijednosti. Nedovoljna prosječna vrijednost za pune karakteristike populacija nas prisiljava da prosječne vrijednosti dopunimo indikatorima koji nam omogućavaju da procijenimo tipičnost ovih prosjeka mjerenjem varijabilnosti (varijacije) karakteristike koja se proučava.

Prisustvo varijacije je posljedica uticaja velikog broja faktora na formiranje nivoa osobine. Ovi faktori djeluju s nejednakom snagom iu različitim smjerovima. Indeksi varijacije se koriste za opisivanje mjere varijabilnosti osobina.

Zadaci statistička studija varijacije:

  • 1) proučavanje prirode i stepena varijacije karakteristika u pojedinim jedinicama stanovništva;
  • 2) utvrđivanje uloge pojedinih faktora ili njihovih grupa u variranju pojedinih karakteristika populacije.

Koristi se u statistici posebne metode studije varijacije zasnovane na upotrebi sistema indikatora, With kojim se mjeri varijacija.

Studija varijacija ima bitan. Mjerenje varijacija je neophodno prilikom provođenja uzorkovanja, korelacije i analiza varijanse itd. Ermolaev O.Yu. Matematička statistika za psihologe: Udžbenik [Tekst]/ O.Yu. Ermolaev. - M.: Izdavačka kuća Flint Moskovskog psihološko-socijalnog instituta, 2012. - 335 str.

Po stepenu varijacije može se suditi o homogenosti populacije, stabilnosti pojedinačnih vrijednosti karakteristika i tipičnosti prosjeka. Na njihovoj osnovi se razvijaju indikatori bliskosti veze između karakteristika i indikatora za procjenu tačnosti posmatranja uzorka.

Pravi se razlika između varijacije u prostoru i varijacije u vremenu.

Varijacija u prostoru se podrazumijeva kao fluktuacija vrijednosti atributa među populacijskim jedinicama koje predstavljaju pojedinačne teritorije. Varijacija tokom vremena znači promjenu vrijednosti karakteristike u različiti periodi vrijeme.

Za proučavanje varijacija u redovima distribucije, sve varijante vrijednosti atributa su raspoređene u rastućem ili opadajućem redoslijedu. Ovaj proces se naziva rangiranje serije.

Najviše jednostavni znakovi varijacije su minimum i maksimum- najmanje i najveća vrijednost znakova u zbiru. Broj ponavljanja pojedinačnih varijanti vrijednosti karakteristika naziva se frekvencija ponavljanja (fi). Pogodno je zamijeniti frekvencije sa frekvencijama - wi. Učestalost je relativni pokazatelj učestalosti, koji se može izraziti u dijelovima jedinice ili postotku i omogućava vam da uporedite niz varijacija sa drugačiji broj zapažanja. Izraženo formulom:

gdje su Xmax, Xmin maksimalne i minimalne vrijednosti karakteristike u agregatu; n - broj grupa.

Za mjerenje varijacije neke karakteristike koriste se različiti apsolutni i relativni indikatori. Apsolutni indikatori varijacije uključuju opseg varijacije, prosječnu linearnu devijaciju, disperziju i standardnu ​​devijaciju. Relativni indikatori oscilacije uključuju koeficijent oscilacije, relativno linearno odstupanje i koeficijent varijacije.

Pronalaženje primjera varijantne serije

Vježbajte. Za ovaj uzorak:

  • a) Pronađite varijacioni niz;
  • b) Konstruisati funkciju distribucije;

br.=42. Elementi uzorka:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Rješenje.

  • a) konstrukcija rangirane serije varijacija:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) konstrukcija diskretne serije varijacija.

Izračunajmo broj grupa u nizu varijacija koristeći Sturgessovu formulu:

Uzmimo broj grupa jednak 7.

Znajući broj grupa, izračunavamo veličinu intervala:

Radi praktičnosti konstruisanja tabele, uzet ćemo broj grupa jednak 8, interval će biti 1.

Rice. 1 Obim prodaje robe od strane prodavnice za određeni vremenski period

Varijacija određuje razlike u vrijednostima karakteristike među različitim jedinicama date populacije u istom periodu (trenutku). Razlozi za varijacije su različitim uslovima postojanje različitih jedinica totaliteta. Na primjer, čak i blizanci u toku svog života stiču razlike u visini, težini, kao i u karakteristikama kao što su nivo obrazovanja, prihodi, broj djece itd.

Varijacije nastaju kao rezultat činjenice da se same vrijednosti atributa formiraju pod ukupnim utjecajem različitih uvjeta, koji se u svakom pojedinačnom slučaju kombiniraju na različite načine. Dakle, vrijednost svake opcije je objektivna.

Varijacija je karakteristična na sve pojave prirode i društva, bez izuzetka, osim na zakonom utvrđena normativna značenja individualnih društvenih karakteristika. Studije varijacija u statistici imaju velika vrijednost, pomoći da se shvati suština fenomena koji se proučava. Pronalaženje varijacije, otkrivanje njenih uzroka, utvrđivanje uticaja pojedinačnih faktora daje važna informacija za implementaciju naučno utemeljenih upravljačkih odluka.

Prosječna vrijednost daje generaliziranu karakteristiku karakteristike populacije, ali ne otkriva njenu strukturu. Prosječna vrijednost ne pokazuje kako se varijante prosječne karakteristike nalaze oko nje, da li su raspoređene blizu prosjeka ili odstupaju od njega. Prosjek u dvije populacije može biti isti, ali u jednoj verziji sve pojedinačne vrijednosti se neznatno razlikuju od njega, au drugoj su te razlike velike, tj. u prvom slučaju varijacija karakteristike je mala, au drugom velika, što je veoma važno za karakterizaciju značajnosti prosječne vrijednosti.

Da bi rukovodilac organizacije, menadžer ili istraživač proučavao varijaciju i upravljao njome, statistika je razvila posebne metode za proučavanje varijacija (sistem indikatora). Uz njihovu pomoć pronalazi se varijacija i karakteriziraju njena svojstva. Indikatori varijacije uključuju : opseg varijacije, prosječno linearno odstupanje, koeficijent varijacije.

Varijacijski nizovi i njegovi oblici

Varijacijska serija- ovo je uređena distribucija jedinica populacije, često prema rastućim (rjeđe opadajućim) vrijednostima karakteristike i računajući broj jedinica sa određenom vrijednošću karakteristike. Kada je broj populacijskih jedinica velik, rangirana serija postaje glomazna, njena konstrukcija traje dugo vrijeme. U takvoj situaciji, niz varijacija se konstruira grupiranjem jedinica populacije prema vrijednostima karakteristike koja se proučava.

Postoje sljedeće oblici varijacije serija :

  1. Rangirana serija predstavlja listu pojedinačnih jedinica populacije u rastućem (opadajućem) redoslijedu karakteristike koja se proučava.
  2. Diskretne serije varijacija - ovo je tabela koja se sastoji od dva reda ili grafikona: specifične vrijednosti varijabilne karakteristike x i broja jedinica populacije sa datom vrijednošću f - frekvencijska karakteristika. Konstruira se kada atribut poprimi najveći broj vrijednosti.
  3. Intervalne serije.

Opseg varijacije je određen kao apsolutna vrijednost razlike između maksimalne i minimalne vrijednosti (varijanti) karakteristike:

Raspon varijacija pokazuje samo ekstremna odstupanja karakteristike i ne odražavaju pojedinačna odstupanja svih opcija u seriji. Karakterizira granice promjene promjenjive karakteristike i ovisi o fluktuacijama dvije ekstremne opcije i apsolutno nije povezan s frekvencijama u nizu varijacija, odnosno s prirodom distribucije, što ovoj vrijednosti daje slučajan karakter. Da biste analizirali varijaciju, potreban vam je indikator koji odražava sve fluktuacije u karakteristikama varijacije i daje opšte karakteristike. Najjednostavniji indikator ovog tipa je prosječno linearno odstupanje.

Statističke distribucijske serije– ovo je uređena distribucija populacijskih jedinica u grupe prema određenoj varijabilnoj karakteristici.
U zavisnosti od karakteristika na kojima se formira niz distribucije, postoje atributivne i varijacione serije distribucije.

Prisustvo zajedničke karakteristike je osnova za formiranje statističke populacije, koja predstavlja rezultate opisa ili mjerenja. zajedničke karakteristike objekti istraživanja.

Predmet proučavanja u statistici su promjenjive (promjenjive) karakteristike ili statističke karakteristike.

Vrste statističkih karakteristika.

Redovi distribucije se nazivaju atributivni izgrađena po kriterijumima kvaliteta. Atributivno– ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica, itd.).
Serija distribucije se obično prikazuje u obliku tabela. U tabeli 2.8 prikazuje seriju raspodjele atributa.
Tabela 2.8 - Rasprostranjenost vrsta pravna pomoć usluge koje pružaju advokati građanima jedne od regija Ruske Federacije.

Varijacijska serija– to su vrijednosti karakteristike (ili intervala vrijednosti) i njihove frekvencije.
Varijabilne serije su distribucijske serije, izgrađen na kvantitativnoj osnovi. Bilo koja serija varijacija sastoji se od dva elementa: opcija i frekvencija.
Varijantama se smatraju pojedinačne vrijednosti karakteristike koje ona uzima u nizu varijacija.
Učestalosti su brojevi pojedinačnih varijanti ili svake grupe varijantne serije, tj. Ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u nizu distribucije. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen.
Frekvencije su učestalosti izražene kao dijelovi jedinice ili kao postotak ukupnog iznosa. Prema tome, zbir frekvencija je jednak 1 ili 100%. Varijaciona serija omogućava procjenu oblika zakona raspodjele na osnovu stvarnih podataka.

U zavisnosti od prirode varijacije osobine, postoje diskretne i intervalne varijacione serije.
Primjer diskretne serije varijacija dat je u tabeli. 2.9.
Tabela 2.9 - Distribucija porodica prema broju nastanjenih soba u pojedinačnim stanovima 1989. godine u Ruskoj Federaciji.

Prva kolona tabele predstavlja opcije za diskretnu seriju varijacija, druga kolona sadrži frekvencije serije varijacija, a treća sadrži indikatore frekvencije.

Varijacijska serija

IN stanovništva istražuje se određena kvantitativna osobina. Iz njega se nasumično izdvaja uzorak zapremine n, odnosno broj elemenata uzorka je jednak n. U prvoj fazi statističke obrade, rasponu uzorci, tj. redosled brojeva x 1 , x 2 , …, x n Uzlazno. Svaka posmatrana vrednost x i pozvao opcija. Frekvencija m i je broj zapažanja vrijednosti x i u uzorku. Relativna frekvencija (frekvencija) w i je omjer frekvencija m i na veličinu uzorka n: .
Prilikom proučavanja varijacionih serija koriste se i koncepti akumulirane frekvencije i akumulirane frekvencije. Neka x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se akumulirana frekvencija: za x i n naziva se akumulirana frekvencija w i max.
Karakteristika se naziva diskretno varijabilnom ako se njene pojedinačne vrijednosti (varijante) razlikuju jedna od druge za određenu konačnu vrijednost (obično cijeli broj). Varijacijski niz takve karakteristike naziva se diskretni varijacioni niz.

Tabela 1. Opšti prikaz diskretne serije frekvencija varijacije

Karakteristične vrijednostix i x 1 x 2 x n
Frekvencijem i m 1 m 2 m n

Karakteristika se naziva kontinuirano promjenjiva ako se njene vrijednosti razlikuju jedna od druge za proizvoljno mali iznos, tj. znak može uzeti bilo koju vrijednost u određenom intervalu. Kontinuirani niz varijacija za takvu karakteristiku naziva se interval.

Tabela 2. Opšti prikaz intervalnih varijacionih serija frekvencija

Tabela 3. Grafičke slike serije varijacija

RedPoligon ili histogramEmpirijska funkcija distribucije
Diskretno
Interval
Pregledom rezultata promatranja utvrđuje se koliko vrijednosti varijanti spada u svaki određeni interval. Pretpostavlja se da svaki interval pripada jednom od svojih krajeva: ili u svim slučajevima lijevo (češće) ili u svim slučajevima desno, a frekvencije ili frekvencije pokazuju broj opcija sadržanih unutar navedenih granica. Razlike a i – a i +1 nazivaju se parcijalnim intervalima. Da bi se pojednostavili naknadni proračuni, niz intervalnih varijacija može se zamijeniti uslovno diskretnim. U ovom slučaju, prosječna vrijednost i-interval se uzima kao opcija x i, i odgovarajuću frekvenciju intervala m i– za frekvenciju ovog intervala.
Za grafički prikaz varijacionih serija najčešće se koriste poligon, histogram, kumulativna kriva i empirijska funkcija raspodjele.

U tabeli 2.3 (Grupacija ruskog stanovništva prema prosječnom dohotku po glavi stanovnika u aprilu 1994.) je prikazana intervalne varijacione serije.
Pogodno je analizirati nizove distribucije pomoću grafičke slike, koja omogućava prosuđivanje oblika distribucije. Vizuelni prikaz prirode promjena u frekvencijama varijacionih serija je dat pomoću poligon i histogram.
Poligon se koristi kada se prikazuje diskretna serija varijacija.
Hajde da, na primjer, grafički prikažemo raspodjelu stambenog fonda po tipu stana (tabela 2.10).
Tabela 2.10 - Raspodjela stambenog fonda urbanog područja prema tipu stana (uslovne brojke).


Rice. Distribucija stambenog prostora


Na osi ordinata mogu se nacrtati ne samo vrijednosti frekvencija, već i frekvencije serije varijacija.
Histogram se koristi za prikaz niza intervalnih varijacija. Prilikom konstruiranja histograma, vrijednosti intervala se iscrtavaju na osi apscise, a frekvencije su prikazane pravokutnicima izgrađenim na odgovarajućim intervalima. Visina stubova u slučaju jednakih intervala treba da bude proporcionalna frekvencijama. Histogram je graf u kojem je niz prikazan u obliku šipki jedna uz drugu.
Hajde da grafički prikažemo niz intervalne distribucije date u tabeli. 2.11.
Tabela 2.11 - Raspodjela porodica prema veličini stambenog prostora po osobi (uslovne brojke).
N p/p Grupe porodica prema veličini stambenog prostora po osobi Broj porodica sa datom veličinom stambenog prostora Kumulativni broj porodica
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Rice. 2.2. Histogram distribucije porodica prema veličini stambenog prostora po osobi


Koristeći podatke akumulirane serije (tabela 2.11), konstruišemo kumulirajuća distribucija.


Rice. 2.3. Kumulativna distribucija porodica prema veličini stambenog prostora po osobi


Reprezentacija varijacione serije u obliku kumulata je posebno efikasna za varijacione serije čije su frekvencije izražene kao razlomci ili procenti zbira frekvencija serija.
Ako promijenimo osi kada grafički prikazujemo niz varijacija u obliku kumulata, onda ćemo dobiti ogiva. Na sl. 2.4 prikazuje ogive konstruisano na osnovu podataka u tabeli. 2.11.
Histogram se može pretvoriti u poligon distribucije pronalaženjem središta stranica pravougaonika, a zatim povezivanjem ovih tačaka pravim linijama. Rezultirajući poligon distribucije prikazan je na Sl. 2.2 sa isprekidanom linijom.
Prilikom konstruiranja histograma distribucije varijacionog niza s nejednakim intervalima, duž ordinatne ose nisu iscrtane frekvencije, već gustoća distribucije karakteristike u odgovarajućim intervalima.
Gustina distribucije je frekvencija izračunata po jedinici širine intervala, tj. koliko jedinica u svakoj grupi ima po jedinici vrijednosti intervala. Primjer izračunavanja gustine distribucije prikazan je u tabeli. 2.12.
Tabela 2.12 - Distribucija preduzeća prema broju zaposlenih (uslovne brojke)
N p/p Grupe preduzeća prema broju zaposlenih, ljudi. Broj preduzeća Veličina intervala, ljudi. Gustina distribucije
A 1 2 3=1/2
1 Do 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Može se koristiti i za grafičko predstavljanje serije varijacija kumulativna kriva. Koristeći kumulaciju (krivulja zbira), prikazan je niz akumuliranih frekvencija. Kumulativne frekvencije se određuju uzastopnim zbrajanjem frekvencija po grupama i pokazuju koliko jedinica u populaciji ima vrijednosti atributa ne veće od vrijednosti koja se razmatra.


Rice. 2.4. Ogive raspodjele porodica prema veličini stambenog prostora po osobi

Prilikom konstruiranja kumulata intervalne varijacione serije, varijante niza se crtaju duž ose apscise, a akumulirane frekvencije se crtaju duž ordinatne ose.

Posebno mjesto u statističkoj analizi pripada određivanju prosječnog nivoa karakteristike ili pojave koja se proučava. Prosječni nivo osobine mjeri se prosječnim vrijednostima.

Prosječna vrijednost karakteriše opšti kvantitativni nivo karakteristike koja se proučava i predstavlja grupno svojstvo statističke populacije. On izravnava, slabi nasumična odstupanja pojedinačnih zapažanja u jednom ili drugom smjeru i ističe glavno, tipično svojstvo karakteristike koja se proučava.

Prosjeci se široko koriste:

1. Procijeniti zdravstveno stanje stanovništva: karakteristike fizičkog razvoja (visina, težina, obim grudnog koša itd.), utvrđivanje prevalencije i trajanja različitih bolesti, analiziranje demografskih pokazatelja (vitalno kretanje stanovništva, prosječan životni vijek, reprodukcija stanovništva, prosječna veličina populacije itd.).

2. Proučiti aktivnosti zdravstvenih ustanova, medicinskog osoblja i ocijeniti kvalitet njihovog rada, planirati i utvrditi potrebe stanovništva za različitim vidovima medicinske zaštite (prosječan broj zahtjeva ili posjeta po stanovniku godišnje, prosječna dužina boravka pacijent u bolnici, prosječno trajanje pregleda pacijenta, prosječna dostupnost ljekara, kreveta itd.).

3. Okarakterisati sanitarno-epidemiološko stanje (prosečan sadržaj prašine u vazduhu u radionici, prosečna površina po osobi, prosečna potrošnja proteina, masti i ugljenih hidrata itd.).

4. Određivanje medicinskih i fizioloških pokazatelja u normalnim i patološkim stanjima, prilikom obrade laboratorijskih podataka, utvrđivanje pouzdanosti rezultata uzorka u društvenim, higijenskim, kliničkim i eksperimentalnim studijama.

Izračunavanje prosječnih vrijednosti vrši se na osnovu varijacionih serija. Varijacijska serija je kvalitativno homogena statistička populacija, čije pojedinačne jedinice karakterišu kvantitativne razlike karakteristike ili fenomena koji se proučava.

Kvantitativna varijacija može biti dva tipa: diskontinuirana (diskretna) i kontinuirana.

Diskontinuirani (diskretni) atribut se izražava samo kao cijeli broj i ne može imati nikakve međuvrijednosti (na primjer, broj posjeta, stanovništvo stranice, broj djece u porodici, težina bolesti u bodovima , itd.).

Neprekidni znak može poprimiti bilo koje vrijednosti u određenim granicama, uključujući i frakcijske, i izražava se samo približno (na primjer, težina - za odrasle može biti ograničena na kilograme, a za novorođenčad - na grame; visina, krvni tlak, vrijeme proveo u pregledu pacijenta i sl.).



Digitalna vrijednost svake pojedinačne karakteristike ili fenomena uključene u seriju varijacija naziva se varijanta i označava se slovom V . U matematičkoj literaturi se, na primjer, nalaze i druge oznake x ili y.

Serija varijacija, u kojoj je svaka opcija naznačena jednom, naziva se jednostavna. Takve serije se koriste u većini statističkih problema u slučaju kompjuterske obrade podataka.

Kako se broj zapažanja povećava, pojavljuju se ponavljajuće vrijednosti varijanti. U ovom slučaju se kreira grupisane serije varijacija, gdje je označen broj ponavljanja (učestalost, označena slovom “ R »).

Serija rangiranih varijacija sastoji se od opcija raspoređenih u rastućem ili opadajućem redoslijedu. I jednostavne i grupisane serije mogu se sastaviti sa rangiranjem.

Serija intervalnih varijacija sastavljen u cilju pojednostavljenja naknadnih proračuna izvedenih bez upotrebe računara, sa veoma velikim brojem jedinica posmatranja (više od 1000).

Kontinuirana serija varijacija uključuje vrijednosti opcija, koje mogu biti bilo koje vrijednosti.

Ako su u nizu varijacija vrijednosti karakteristike (varijante) date u obliku pojedinačnih specifičnih brojeva, tada se takav niz naziva diskretno.

Opće karakteristike vrijednosti karakteristike koje se odražavaju u nizu varijacija su prosječne vrijednosti. Među njima se najčešće koriste: aritmetička sredina M, moda Mo i medijana Ja. Svaka od ovih karakteristika je jedinstvena. One se međusobno ne mogu zamijeniti i samo zajedno predstavljaju karakteristike varijantnog niza sasvim u potpunosti i u sažetom obliku.

Moda (Mo) navedite vrijednost opcija koje se najčešće pojavljuju.

Medijan (ja) – ovo je vrijednost opcije koja rangirani niz varijacija dijeli na pola (na svakoj strani medijane nalazi se polovina opcije). U rijetkim slučajevima, kada postoji simetrična varijantna serija, mod i medijan su međusobno jednaki i poklapaju se sa vrijednošću aritmetičke sredine.

Najtipičnija karakteristika vrijednosti opcija je aritmetička sredina vrijednost( M ). U matematičkoj literaturi se označava .

Aritmetička sredina (M, ) je opšta kvantitativna karakteristika određene karakteristike fenomena koji se proučava, čineći kvalitativno homogenu statističku populaciju. Postoje jednostavne i ponderisane aritmetičke sredine. Jednostavna aritmetička sredina izračunava se za jednostavnu seriju varijacija tako što se zbroje sve opcije i podijeli ovaj zbir s ukupnim brojem opcija uključenih u ovu seriju varijacija. Izračuni se vrše prema formuli:

,

gdje: M - prosta aritmetička sredina;

Σ V - opcija iznosa;

n- broj zapažanja.

U grupisanom nizu varijacija utvrđuje se ponderisana aritmetička sredina. Formula za njegovo izračunavanje:

,

gdje: M - aritmetički ponderisani prosek;

Σ Vp - zbir proizvoda varijante po njihovim frekvencijama;

n- broj zapažanja.

Uz veliki broj zapažanja, u slučaju ručnih proračuna, može se koristiti metoda momenata.

Aritmetička sredina ima sledeća svojstva:

· zbir odstupanja od prosjeka ( Σ d ) jednak je nuli (vidi tabelu 15);

· pri množenju (dijeljenju) svih opcija sa istim faktorom (djeliteljem), aritmetička sredina se množi (dijeli) istim faktorom (djeliteljem);

· ako svim opcijama dodate (oduzmete) isti broj, aritmetička sredina se povećava (smanjuje) za isti broj.

Aritmetički prosjeci, uzeti sami po sebi, bez uzimanja u obzir varijabilnosti serije iz koje su izračunati, možda neće u potpunosti odražavati svojstva varijacione serije, posebno kada je potrebno poređenje sa drugim prosjecima. Prosjeci koji su bliski po vrijednosti mogu se dobiti iz serija s različitim stupnjevima raspršenja. Što su pojedinačne opcije bliže jedna drugoj u smislu svojih kvantitativnih karakteristika, to je manje disperzija (oscilacija, varijabilnost) serije, tipičniji je njen prosek.

Glavni parametri koji nam omogućavaju da procijenimo varijabilnost osobine su:

· Obim;

· Amplituda;

· Standardna devijacija;

· Koeficijent varijacije.

Varijabilnost osobine može se približno ocijeniti rasponom i amplitudom serije varijacija. Raspon označava maksimalnu (V max) i minimalnu (V min) opcije u seriji. Amplituda (A m) je razlika između ovih opcija: A m = V max - V min.

Glavna, općeprihvaćena mjera varijabilnosti varijacione serije je disperzija (D ). Ali najčešće se koristi pogodniji parametar izračunat na osnovu disperzije - standardna devijacija ( σ ). Uzima u obzir veličinu odstupanja ( d ) svake serije varijacija iz njene aritmetičke sredine ( d=V - M ).

Budući da odstupanja od prosjeka mogu biti pozitivna i negativna, kada se saberu daju vrijednost “0” (S d=0). Da bi se to izbjeglo, vrijednosti odstupanja ( d) se podižu na drugi stepen i prosječuju. Dakle, disperzija niza varijacija je srednji kvadrat odstupanja varijante od aritmetičke sredine i izračunava se po formuli:

.

To je najvažnija karakteristika varijabilnosti i koristi se za izračunavanje mnogih statističkih kriterijuma.

Budući da se disperzija izražava kao kvadrat odstupanja, njena vrijednost se ne može koristiti u poređenju sa aritmetičkom sredinom. U te svrhe se koristi standardna devijacija, koji je označen znakom "Sigma" ( σ ). Karakterizira prosječno odstupanje svih varijanti varijacionog niza od srednje aritmetičke vrijednosti u istim jedinicama kao i sama prosječna vrijednost, tako da se mogu koristiti zajedno.

Standardna devijacija se određuje formulom:

Navedena formula se primjenjuje kada se broj zapažanja ( n ) više od 30. Sa manjim brojem n vrijednost standardne devijacije će imati grešku povezanu s matematičkim pomakom ( n - 1). S tim u vezi, točniji rezultat može se dobiti uzimanjem u obzir takve pristranosti u formuli za izračunavanje standardne devijacije:

standardna devijacija (s ) je procjena standardne devijacije slučajne varijable X u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse.

Sa vrijednostima n > 30 standardne devijacije ( σ ) i standardna devijacija ( s ) bit će isti ( σ =s ). Stoga se u većini praktičnih priručnika smatra da ovi kriteriji imaju različita značenja. U programu Excel proračun standardna devijacija se može izvesti pomoću funkcije =STDEV(opseg). A da biste izračunali standardnu ​​devijaciju, morate kreirati odgovarajuću formulu.

Srednji kvadrat ili standardna devijacija vam omogućavaju da odredite koliko se vrijednosti neke karakteristike mogu razlikovati od prosječne vrijednosti. Pretpostavimo da postoje dva grada sa istom prosječnom dnevnom temperaturom ljeti. Jedan od ovih gradova nalazi se na obali, a drugi na kontinentu. Poznato je da su u gradovima koji se nalaze na obali, razlike u dnevnim temperaturama manje nego u gradovima koji se nalaze u unutrašnjosti. Stoga će standardna devijacija dnevnih temperatura za primorski grad biti manja nego za drugi grad. U praksi to znači da je prosječna temperatura zraka svake od njih određeni dan u gradu koji se nalazi na kontinentu će se razlikovati više od prosjeka nego u gradu na obali. Osim toga, standardna devijacija vam omogućava da procijenite moguća odstupanja temperature od prosjeka sa potrebnim nivoom vjerovatnoće.

Prema teoriji vjerovatnoće, u pojavama koje se pridržavaju zakona normalne distribucije, postoji stroga veza između vrijednosti aritmetičke sredine, standardne devijacije i opcija ( tri sigma pravilo). Na primjer, 68,3% vrijednosti različite karakteristike je unutar M ± 1 σ , 95,5% - unutar M ± 2 σ i 99,7% - unutar M ± 3 σ .

Vrijednost standardne devijacije nam omogućava da prosudimo prirodu homogenosti serije varijacija i studijske grupe. Ako je vrijednost standardne devijacije mala, onda to ukazuje na prilično visoku homogenost fenomena koji se proučava. Aritmetičku sredinu u ovom slučaju treba smatrati prilično karakterističnom za dati niz varijacija. Međutim, premala sigma vrijednost navodi na razmišljanje o vještačkom odabiru zapažanja. Uz vrlo veliku sigmu, aritmetička sredina u manjoj mjeri karakterizira varijacijski niz, što ukazuje na značajnu varijabilnost karakteristike ili fenomena koji se proučava ili heterogenost grupe koja se proučava. Međutim, poređenje vrijednosti standardne devijacije moguće je samo za karakteristike iste dimenzije. Zaista, ako uporedimo raznolikost težine novorođene djece i odraslih, uvijek ćemo dobiti veće sigma vrijednosti kod odraslih.

Poređenje varijabilnosti karakteristika različitih dimenzija može se izvršiti pomoću koeficijent varijacije. Izražava različitost kao procenat srednje vrijednosti, omogućavajući poređenje razni znakovi. Koeficijent varijacije u medicinskoj literaturi označen je znakom “ WITH ", i u matematici" v"i izračunava se po formuli:

.

Vrijednosti koeficijenta varijacije manje od 10% ukazuju na malo rasipanje, od 10 do 20% - oko prosjeka, više od 20% - na jako rasipanje oko aritmetičke sredine.

Aritmetički prosjek se obično izračunava na osnovu podataka uzorak populacije. Uz ponovljene studije, pod uticajem slučajnih pojava, aritmetička sredina se može promeniti. To je zbog činjenice da se, po pravilu, proučava samo dio mogućih jedinica posmatranja, odnosno populacija uzorka. Podaci o svim mogućim jedinicama koje predstavljaju fenomen koji se proučava mogu se dobiti proučavanjem cjelokupne populacije, što nije uvijek moguće. Istovremeno, za potrebe generalizacije eksperimentalnih podataka, od interesa je vrijednost prosjeka u opštoj populaciji. Stoga, da bi se formulisao opšti zaključak o fenomenu koji se proučava, rezultati dobijeni na osnovu populacije uzorka moraju se statističkim metodama preneti na opštu populaciju.

Da bi se odredio stepen slaganja između studije uzorka i opšte populacije, potrebno je procijeniti veličinu greške koja neizbježno nastaje tokom posmatranja uzorka. Ova greška se zove " Greška reprezentativnosti"ili "Prosječna greška aritmetičke sredine." To je zapravo razlika između prosjeka dobijenih iz uzorka statističko posmatranje, te slične vrijednosti koje bi se dobile tokom kontinuiranog proučavanja istog objekta, tj. prilikom proučavanja opšte populacije. Budući da je srednja vrijednost uzorka slučajna varijabla, takva prognoza se izvodi sa nivoom vjerovatnoće prihvatljivim za istraživača. IN medicinska istraživanja to je najmanje 95%.

Greška reprezentativnosti se ne može brkati sa greškama u registraciji ili greškama pažnje (promašaji, pogrešni proračuni, greške u kucanju, itd.), koje treba minimizirati adekvatnim metodama i alatima koji se koriste tokom eksperimenta.

Veličina greške reprezentativnosti zavisi i od veličine uzorka i od varijabilnosti osobine. Kako veći broj posmatranja, što je uzorak bliži populaciji i manja je greška. Što je predznak varijabilniji, to je veća statistička greška.

U praksi, za određivanje greške reprezentativnosti u nizu varijacija, koristi se sljedeća formula:

,

gdje: m – greška reprezentativnosti;

σ - standardna devijacija;

n– broj opservacija u uzorku.

Iz formule je jasno da je veličina prosečna greška je direktno proporcionalna standardnoj devijaciji, tj. varijabilnosti karakteristike koja se proučava, i obrnuto proporcionalna kvadratnom korijenu broja opažanja.

Prilikom izvođenja statističke analize zasnovane na izračunavanju relativnih vrijednosti, konstruiranje varijacionog niza nije potrebno. U ovom slučaju, određivanje prosječne greške za relativne pokazatelje može se izvršiti korištenjem pojednostavljene formule:

,

gdje: R– vrijednost relativnog indikatora, izražena u procentima, ppm, itd.;

q– recipročan P i izražen kao (1-P), (100-P), (1000-P) itd., u zavisnosti od osnove na kojoj se indikator izračunava;

n– broj opservacija u populaciji uzorka.

Međutim, navedena formula za izračunavanje greške reprezentativnosti za relativne vrijednosti može se primijeniti samo kada je vrijednost indikatora manja od njegove osnove. U jednom broju slučajeva izračunavanja intenzivnih indikatora ovaj uslov nije ispunjen, te se indikator može izraziti kao broj veći od 100% ili 1000%. U takvoj situaciji se konstruiše varijacioni niz i izračunava se greška reprezentativnosti pomoću formule za prosečne vrednosti na osnovu standardne devijacije.

Predviđanje vrijednosti aritmetičke sredine u populaciji vrši se navođenjem dvije vrijednosti – minimalne i maksimalne. Ove ekstremne vrednosti moguća odstupanja, unutar kojih željena prosječna vrijednost stanovništva može fluktuirati nazivaju se “ Granice povjerenja».

Postulati teorije vjerojatnosti dokazali su da uz normalnu distribuciju karakteristike s vjerovatnoćom od 99,7%, ekstremne vrijednosti odstupanja prosjeka neće biti veće od vrijednosti trostruke greške reprezentativnosti ( M ± 3 m ); u 95,5% – ne više od dvostruke prosječne greške prosječne vrijednosti ( M ± 2 m ); u 68,3% – ne više od jedne prosečne greške ( M ± 1 m ) (Sl. 9).

P%

Rice. 9. Gustoća vjerovatnoće normalna distribucija.

Imajte na umu da je gornja izjava tačna samo za osobinu koja se pridržava normalnog Gaussovog zakona raspodjele.

Većina eksperimentalnih studija, uključujući i područje medicine, povezana je s mjerenjima, čiji rezultati mogu poprimiti gotovo bilo koju vrijednost u datom intervalu, pa se u pravilu opisuju modelom kontinuiranih slučajnih varijabli. U tom smislu, većina statističkih metoda razmatra kontinuirane distribucije. Jedna od ovih distribucija, koja ima osnovnu ulogu u matematičke statistike, je normalna ili Gausova distribucija.

To je zbog brojnih razloga.

1. Prije svega, mnoga eksperimentalna opažanja mogu se uspješno opisati korištenjem normalne distribucije. Odmah treba napomenuti da ne postoje distribucije empirijskih podataka koje bi bile sasvim normalne, budući da je normalno raspoređena slučajna vrijednost je u rasponu od do , što se nikada ne dešava u praksi. Međutim, normalna raspodjela vrlo često dobro funkcionira kao aproksimacija.

Bilo da se vrše mjerenja težine, visine i drugih fizioloških parametara ljudskog tijela - svuda na rezultate utiče veoma veliki broj nasumičnih faktora ( prirodni uzroci i greške mjerenja). Štaviše, po pravilu, efekat svakog od ovih faktora je beznačajan. Iskustvo pokazuje da će rezultati u takvim slučajevima biti približno normalno raspoređeni.

2. Mnoge distribucije povezane sa slučajnim uzorkovanjem postaju normalne kako se volumen potonjeg povećava.

3. Normalna distribucija je prikladna kao aproksimacija drugih kontinuiranih distribucija (na primjer, iskrivljene).

4. Normalna distribucija ima niz povoljnih matematička svojstva, koji je to u velikoj mjeri obezbijedio široka primena u statistici.

Istovremeno, treba napomenuti da u medicinskim podacima postoje mnoge eksperimentalne distribucije koje se ne mogu opisati normalnim modelom distribucije. U tu svrhu, statistika je razvila metode koje se obično nazivaju “neparametrijski”.

Izbor statističke metode koja je pogodna za obradu podataka iz određenog eksperimenta treba vršiti u zavisnosti od toga da li dobijeni podaci pripadaju normalnom zakonu distribucije. Testiranje hipoteze o podređenosti znaka zakonu normalne distribucije vrši se korištenjem histograma (grafa) raspodjele frekvencije, kao i niza statističkih kriterija. Među njima:

Kriterijum asimetrije ( b );

Kriterijum za testiranje kurtoze ( g );

Shapiro-Wilksov test ( W ) .

Za svaki parametar se vrši analiza prirode distribucije podataka (koja se naziva i test za normalnost distribucije). Za pouzdanu procjenu da li raspodjela parametra odgovara normalnom zakonu, potreban je dovoljno veliki broj jedinica promatranja (najmanje 30 vrijednosti).

Za normalnu distribuciju, kriterijumi nagnutosti i ekscesa uzimaju vrijednost 0. Ako je distribucija pomaknuta udesno b > 0 (pozitivna asimetrija), sa b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. At g > 0 kriva distribucije je oštrija ako g < 0 пик более сглаженный, чем функция нормального распределения.

Da biste provjerili normalnost pomoću Shapiro-Wilksovog testa, trebate pronaći vrijednost ovog kriterija koristeći statističke tablice na adresi potreban nivo značaj i zavisnost od broja jedinica posmatranja (stepeni slobode). Dodatak 1. Hipoteza normalnosti se odbacuje pri malim vrijednostima ovog kriterija, po pravilu, pri w <0,8.

Metoda grupisanja također vam omogućava mjerenje varijacija(varijabilnost, fluktuacija) znakova. Kada je broj jedinica u populaciji relativno mali, varijacija se mjeri na osnovu rangiranog broja jedinica koje čine populaciju. Serija se zove rangiran, ako su jedinice raspoređene u rastućem (opadajućem) redoslijedu karakteristike.

Međutim, rangirane serije su prilično indikativne kada je potrebna uporedna karakteristika varijacije. Osim toga, u mnogim slučajevima imamo posla sa statističkim populacijama koje se sastoje od velikog broja jedinica, koje je praktično teško predstaviti u obliku određene serije. S tim u vezi, za početno opšte upoznavanje sa statističkim podacima, a posebno radi lakšeg proučavanja varijacije karakteristika, fenomeni i procesi koji se proučavaju obično se kombinuju u grupe, a rezultati grupisanja se prikazuju u obliku grupnih tabela.

Ako tabela grupa ima samo dva stupca - grupe prema odabranoj karakteristici (opcije) i broj grupa (učestalost ili učestalost), naziva se blizu distribucije.

Raspon distribucije - najjednostavniji tip strukturnog grupisanja zasnovanog na jednoj karakteristici, prikazan u grupnoj tabeli sa dve kolone koje sadrže varijante i frekvencije karakteristike. U mnogim slučajevima, sa ovakvim strukturnim grupisanjem, tj. Sastavljanjem serija distribucije počinje proučavanje početnog statističkog materijala.

Strukturno grupisanje u obliku distributivnog niza može se pretvoriti u istinsko strukturno grupisanje ako se odabrane grupe karakterišu ne samo po učestalostima, već i po drugim statističkim pokazateljima. Glavna svrha distributivnih serija je proučavanje varijacija karakteristika. Teorija redova distribucije je detaljno razvijena matematičkom statistikom.

Distribucijske serije su podijeljene na atributivno(grupiranje prema atributnim karakteristikama, na primjer, podjela stanovništva po spolu, nacionalnosti, bračnom statusu, itd.) i varijacijski(grupiranje po kvantitativnim karakteristikama).

Varijacijska serija je grupna tabela koja sadrži dvije kolone: ​​grupiranje jedinica prema jednoj kvantitativnoj karakteristici i broju jedinica u svakoj grupi. Intervali u nizu varijacija obično se formiraju jednaki i zatvoreni. Serija varijacija je sljedeća grupacija ruske populacije prema prosječnom novčanom dohotku po glavi stanovnika (tabela 3.10).

Tabela 3.10

Distribucija stanovništva Rusije prema prosječnom dohotku po glavi stanovnika u 2004-2009.

Grupe stanovništva prema prosječnom novčanom dohotku po glavi stanovnika, rub./mjesečno

Stanovništvo u grupi, % od ukupnog broja

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Preko 25.000,0

Celo stanovništvo

Varijacijski nizovi se, pak, dijele na diskretne i intervalne. Diskretno varijantne serije kombinuju varijante diskretnih karakteristika koje variraju u uskim granicama. Primjer diskretne serije varijacija je distribucija ruskih porodica prema broju djece koju imaju.

Interval serije varijacija kombinuju varijante ili kontinuiranih karakteristika ili diskretnih karakteristika koje variraju u širokom rasponu. Interval je serija varijacija distribucije ruskog stanovništva prema prosječnom novčanom dohotku po glavi stanovnika.

Diskretne varijacijske serije se ne koriste često u praksi. U međuvremenu, njihovo sastavljanje nije teško, budući da je sastav grupa određen specifičnim varijantama koje proučavane karakteristike grupisanja zapravo posjeduju.

Intervalne varijacijske serije su rasprostranjenije. Prilikom njihovog sastavljanja postavlja se teško pitanje o broju grupa, kao i o veličini intervala koje treba uspostaviti.

Principi za rješavanje ovog pitanja navedeni su u poglavlju o metodologiji za konstruisanje statističkih grupa (vidjeti paragraf 3.3).

Varijacijski nizovi su sredstvo sažimanja ili sažimanja različitih informacija u kompaktan oblik; iz njih se može donijeti prilično jasan sud o prirodi varijacije i proučavati razlike u karakteristikama fenomena uključenih u skup koji se proučava. Ali najvažniji značaj varijacionih nizova je u tome što se na osnovu njih izračunavaju posebne generalizirajuće karakteristike varijacije (vidi Poglavlje 7).



Novo na sajtu

>

Najpopularniji