Dom Stomatološki tretman Određivanje veličine populacije uzorka. Veličina uzorka - metoda uzorkovanja sociološkog istraživanja

Određivanje veličine populacije uzorka. Veličina uzorka - metoda uzorkovanja sociološkog istraživanja

Proračun veličine uzorka

Od svih pitanja koja se postavljaju poznatim anketarima Galupa, najpopularnije je ovo: Kako možete procijeniti šta misli 250 miliona Amerikanaca nakon intervjuisanja 1.000 ljudi?

Za odgovor na ovo pitanje potrebno je spomenuti ne samo visoke kvalifikacije i ogromno praktično iskustvo zaposlenih, već i njihovo korištenje statistike i matematike. Ako metode istraživanja nisu zasnovane na nauci, rezultati mogu biti pogrešni.

U statistici je prihvaćeno sljedeće razgraničenje veličina uzoraka. Veličina uzorka dovoljna da se poništi slučajnost i dobiju statističke karakteristike pravilne prirode je 30. Uzorak ove veličine naziva se mala Priroda distribucije vrijednosti atributa u malim uzorcima približava se normalnoj kako se broj testova povećava. Minimalna veličina uzorka koja omogućava da se dobiju prosječne vrijednosti karakteristike sa naznakom pouzdanosti je 5. Uzorci ove veličine nazivaju se ultra-mala. Distribuciju vrijednosti atributa u takvim uzorcima karakterizira Studentova distribucija. Ali najčešće se u sociologiji bave mnogo većom veličinom uzorka.

Kada planirate uzorkovanu anketu, dolazi vrijeme kada morate odlučiti koliko ćete ljudi intervjuirati, tj. kolika bi trebala biti veličina uzorka? Ova odluka je izuzetno važna, jer će preveliki uzorak uzrokovati nepotrebne troškove, a premali će smanjiti kvalitetu rezultata.

Veličina uzorka- ukupan broj jedinica posmatranja uključenih u populaciju uzorka.

Pošto je populacija uzorka dio stanovništva, odabrano pomoću posebne metode, - važno je da ovaj dio ne naruši ideju cjeline, tj. ga je zastupao. Sociolozi koji često sprovode empirijska istraživanja stalno se bave pitanjem koliko ljudi treba intervjuisati da bi se dobile pouzdane informacije? Institut Gallup u SAD sprovodi redovne ankete na nacionalnom uzorku od 1,5 hiljada ljudi i postiže neverovatnu preciznost (greška uzorkovanja se kreće od 1 do 1,5%). Socio-ekspres centar Instituta za sociologiju Ruske akademije nauka sprovodi istraživanje na uzorku od 2 hiljade ljudi, a greška uzorkovanja ne prelazi 3% 31 .

Stručnjaci smatraju da najbolji uzorak nije nužno veliki. Naravno, što je veći uzorak, to je veća tačnost njegovih rezultata. Međutim, čak ni veliki uzorak ne garantuje uspjeh ako je populacija “loše miješana”, tj. je heterogena. Homogene uzima se u obzir skup u kojem je kontrolirana karakteristika raspoređena ravnomjerno i ne stvara praznine ili kondenzacije. U ovom slučaju, intervjuisanjem nekoliko ljudi, možete dobiti tačne informacije o distribuciji ove karakteristike u opštoj populaciji.

Dakle, na reprezentativnost podataka ne utiču kvantitativne karakteristike populacije uzorka (njen obim), već kvalitativne karakteristike opšte populacije – stepen njene homogenosti.

U sociologiji još nije izmišljena jedinstvena i jasna formula pomoću koje se može izračunati optimalna veličina populacije uzorka - takva formula jednostavno ne postoji u prirodi. I to se objašnjava vrlo jednostavno. Činjenica je da određivanje veličine populacije uzorka nije toliko statistički koliko suštinski problem. Drugim riječima, veličina populacije uzorka ovisi o mnogim faktorima, uključujući ciljeve i zadatke, teorijski model, hipoteze i metode istraživanja, stepen homogenosti populacije i konačno, traženu tačnost dobijenih informacija.

Uvijek moramo imati na umu da svaki postotak povećanja tačnosti informacija u studiji vodi ka naglo povećanje troškove za njegovu implementaciju. Čuveni institut Gallup, koji već decenijama sprovodi ankete u Sjedinjenim Državama, otkrio je da će sa nacionalnim uzorkom od 100 ljudi greška uzorka biti unutar ±11%; 200 ljudi - ±8%; 400 - ±6%; 600 - ±5%; 750 -±4%; 1000 - ±4%; 1500 - ±3%; 4000 ljudi - ±2%. Zato provodi nacionalna istraživanja u Sjedinjenim Državama na uzorku od 1500-2000 ljudi. Kao što se može vidjeti, on preferira povećanje greške od 1% nego višestruko povećanje cijene studije.

Praksa pokazuje da je za mnoge sociologe opravdanje veličine uzorka kamen spoticanja, uprkos značajnoj količini literature posvećene metodama uzorkovanja, a posebno izračunavanju veličine uzorka. Postoji nekoliko razloga: 1) nedostatak specijalizovanu literaturu na periferiji; 2) nedostatak vremena za samoobrazovanje; 3) nesposobnost upotrebe matematičkog aparata. S tim u vezi, postoji potreba da se ocrta strategija i taktika za opravdavanje veličine uzorka bez složenih matematičkih formula.

Procedura za izračunavanje veličine uzorka je lanac beskrajnih kompromisa između želje za preciznošću i ograničenih resursa, nedostatka vremena i nepotpunih informacija o fenomenu koji se proučava. Istovremeno, ovo je nauka i umjetnost čije je znanje dostupno svakom čovjeku. Međutim, za ovo morate znati strategije za izračunavanje veličine uzorka (preliminarni proračun, sekvencijalne i kombinovane strategije), kao i faktore koji utiču na veličinu uzorka (veličina populacije, varijacije u odgovorima ispitanika, tačnost procjene, priroda očekivane distribucije odgovora, metod istraživanja, postupak obrade) .

Strategija predkalkulacije je da se veličina uzorka određuje prije nego što se sprovede glavna studija. U najjednostavnijem slučaju, možete koristiti već stečeno iskustvo, na primjer, Gallup instituta, koji koristi uzorak veličine otprilike 1500-2000 ljudi. Za prosječnu domaću studiju, veličina uzorka je otprilike 400-600 ljudi.

Da biste izračunali veličinu slučajnog uzorka, morate znati željenu tačnost procjene, veličinu rizika rezultirajućeg odgovora i stepen varijabilnosti odgovora. Tradicionalno, tačnost procjene se uzima kao 5%, a vrijednost rizika kao 0,95. Drugim riječima, ako je, prema uzorku studije, 60% ispitanika zadovoljno svojim radom, onda se može tvrditi da će u opštoj populaciji udio onih koji su zadovoljni biti od 55 do 65% u 95% slučajeva, au 5% slučajeva ovaj udio može biti izvan ovog intervala. Uz pretpostavku tačnosti od 5% i vrijednosti rizika od 0,95, veličina uzorka će biti sljedeća (Tabela 2.4).

Table 2.4 Ovisnost veličine uzorka o veličini populacije



Rezultati prikazani u tabeli. 2.4, svjedoče protiv uobičajene zablude da je veličina uzorka strogo fiksan postotak opšte populacije, jednak 10. U stvari, ova vrijednost nije konstanta, već varijabla koja se mijenja u specifičnim uslovima. Veličina uzorka zavisi i od pitanja koja se koriste u upitniku. Brojevi u tabeli. 2.4 važe samo za jedan slučaj – kada je u pitanju dihotomno pitanje, za koje je maksimalni raspon odgovora 50 do 50%. Bez preliminarnih informacija o rasprostranjenosti procjena, sociolog se, takoreći, unaprijed osigurava i vjeruje da će taj raspon biti 50 do 50%. Ako su takve informacije dostupne, tada će veličina uzorka biti sljedeća.

Tabela 2.5 Ovisnost veličine uzorka o distribuciji dihotomnog odgovora

U tabeli Slika 2.5 prikazuje distribuciju odgovora na kvalitativna pitanja. Izračun veličine uzorka za kvantitativna pitanja koja uključuju starost i nadnica“, zasniva se na koeficijentu varijacije (Tabela 2.6), koji pokazuje koliki je postotak standardne devijacije od aritmetičke sredine, i omogućava vam da međusobno uporedite bilo koje karakteristike (u smislu stepena varijacije).

Tabela 2.6 Ovisnost veličine uzorka o koeficijentu varijacije

Koeficijent varijacije, %
Veličina uzorka

Ako se proučavaju uslovi rada, odnosi u timu, plate itd. koristeći petočlanu skalu, koeficijent varijacije ovdje varira od 27 do 62%, a kada se koristi sedmočlana skala - od 78 do 113%. Stoga, što je skala duža, to je veći koeficijent varijacije i veća bi trebala biti veličina uzorka. Ako sociolog želi da se snađe sa malim uzorkom, onda pitanja treba formulisati jednostavnije. Ponekad se smatra da što je skala duža, to je mjerenje preciznije. Ali prednosti skale od sedam tačaka u odnosu na petostepene nisu dokazane.

Među sociolozima je uvriježeno uvjerenje da što je veći uzorak, to je rezultat tačniji, a to ih tjera da pretjerano povećavaju broj ispitanika. U stvarnosti, situacija je drugačija: tabela. Slika 2.7, zasnovana na Gallupovim podacima, prikazuje odnos između veličine uzorka i tačnosti procjene u procentima. Iz ovoga slijedi da kako se veličina uzorka povećava, točnost raste, ali do određenog praga. Već sa 600 ispitanika postignut je željeni nivo tačnosti od 5%. Stoga je 600 ljudi prihvatljiva veličina uzorka.

Nema kontradikcije između brojki od 400 i 600 ljudi. U prvom slučaju, veličina uzorka je izračunata na osnovu pretpostavke normalne distribucije odgovora ispitanika, au drugom iz prakse. Nesklad između teorije i prakse je zbog činjenice da se u stvarnoj situaciji raspodjela ocjena razlikuje od normalne, pa se veličina uzorka mora izračunati uzimajući u obzir ovu posebnu okolnost; većina efikasan način smanjenje veličine uzorka je smanjenje koeficijenta varijacije procjena.

Tabela 2.7 Odnos između veličine uzorka i tačnosti procjene

Prilikom izračunavanja veličine uzorka, sociolozi često prave sljedeću grešku: nakon što su izračunali potrebnu veličinu uzorka za populaciju kao cjelinu koristeći postojeće formule, zatim ga proporcionalno smještaju među pojedinačne jedinice uzorka, na primjer, po radionicama, preduzećima, okruzima, gradovima i vrste porodica. Nakon toga, u fazi obrade podataka, analiziraju se razlike između samih odjela. Međutim, ispravnije je izračunati veličinu uzorka zasebno za svako odjeljenje, a zatim zbrojiti pojedinačne količine. Recimo da su proračuni veličine uzorka za tri radionice (uzimajući u obzir dimenziju skale, broj zaposlenih, prirodu očekivane distribucije ocjena) omogućili da se ustanovi da je u prvoj radionici potrebno pitati 384 osobe, u drugom - 222, a u trećem - 600. Tada će ukupna veličina uzorka biti 384 + 222 + 600 = 1206 ljudi.

Ako sociolog treba da intervjuiše kategoriju radnika (npr. vozače autobusa), za koju se zna samo da joj pripada deseti radnik preduzeća, odlučio je da pita 139 vozača autobusa, a ukupnu veličinu uzorka za preduzeće će imati 1390 ljudi, tj. drugim riječima, slučajnim odabirom 1.390 ispitanika iz preduzeća, mi se, u skladu sa teorijom uzorkovanja, nadamo da ćemo identificirati 139 osoba u specijalnosti koja nas zanima.

Prilikom izračunavanja kvotnog uzorka, sociolozi često proizvoljno određuju njegovu veličinu na 1000 ljudi, na osnovu pogodnosti izračunavanja kvota. Ali isto tako lako možete uzeti bilo koji drugi okrugli broj. Razumniji pristup je izračunavanje veličine uzorka kvote kao za slučajni. Druga opcija za izračunavanje veličine uzorka kvote je korištenje teorije malog uzorka. Njegova suština: ako nije cilj da se pruži diferencirana analiza po grupama radnika, onda pomnožite broj gradacija pitanja koja se proučavaju sa 25 (minimalna statistički značajna veličina grupe). Na primjer, proučavaju se tri varijable: spol - dvije kategorije, starost - dvije kategorije (ispod 30 godina i preko 30 godina), zadovoljstvo poslom - mjereno na skali od pet tačaka. Tada će potrebna veličina uzorka za ovaj primjer biti 2x2x5x25 = 500 ljudi. Veličina uzorka se povećava za 2,5 puta. Jasno je da sa proširenjem broja varijabli i broja gradacija, veličina uzorka može postati katastrofalno velika. Postoji samo jedan izlaz: detaljna studija izvornog problema, koja će vam omogućiti da uklonite nepotrebna pitanja u upitniku, ostavljajući najvažnija. Ako studija testira više hipoteza, veličina uzorka za testiranje svake hipoteze se izračunava zasebno. Stoga, kada se koristi uzorkovanje, broj pitanja u upitniku i hipotezama treba biti minimalan.

Dakle, izračunali smo potrebnu veličinu uzorka. Sada, i tek sada, potrebno je provjeriti da li je rezultirajuća vrijednost kompatibilna s dodijeljenim resursima. Uobičajena greška mnogi primijenjeni sociolozi je da se prilikom izračunavanja veličine uzorka u prvi plan stavljaju raspoloživi resursi, ili, još gore, sociolog pasivno prihvata sve uslove koje diktira kupac. Ovo je fundamentalno pogrešno iz nekoliko razloga. Prvo, izračunavanje veličine uzorka omogućava vam da steknete dublji uvid u suštinu predmeta koji se proučava i specifičnosti istraživačkih metoda, što znači da možete razumno zahtijevati više resursa ili donijeti ispravnu odluku da smanjite veličinu uzorka. Ako uprava odbija dodatna sredstva, a ciljevi istraživanja ne dozvoljavaju smanjenje veličine uzorka (tj. sociolog ne može prihvatiti odluku uprave), potrebno je prijeći na drugi dizajn istraživanja. Drugo, razumna kalkulacija veličine uzorka pokazuje profesionalizam sociologa i čini da se klijent prema njemu odnosi s većim poštovanjem.

Strategija sekvencijalnog proračuna veličina uzorka. Prilikom izračunavanja veličine uzorka poželjno je znati širenje procjena i neke druge parametre. Međutim, oni su, po pravilu, nepoznati. Kako bi se spriječile greške, bolje je pretpostaviti da su one maksimalne. Cijena našeg neznanja je povećanje uzorka iznad potrebnog i dodatni finansijski i vremenski troškovi (moramo intervjuisati više ljudi). Da bi se uštedjeli troškovi, koristi se dosljedna strategija - veličina uzorka se ne izračunava unaprijed, već zavisi od konačnih rezultata studije. Na primjer, intervjuišu 100 ljudi, zatim određuju širenje procjena i, ovisno o tome, izračunavaju potrebnu veličinu uzorka. Ako se pokaže da je 100 ljudi dovoljno, onda se studija završava. Inače, potreban broj ispitanika stiže tamo, ali ne u beskonačnost. Poznat je primjer iz prakse J. Gallupa, koji je na početku svoje karijere aktivno eksperimentirao s veličinama uzoraka. Godine 1936. Amerikanci su upitani: "Da li biste željeli da se obnovi Nacionalni zakon o industrijskom oporavku?" Pojavio se čudan paradoks: J. Gallup je prvo anketirao 500 ljudi i izmjerio grešku uzorka, a zatim je uzastopno povećao broj ispitanika na 30 hiljada. Na njegovu žalost, otkrio je da je dodavanjem 29,5 hiljada ispitanika tačnost informacija povećana za manje od 1%. Shodno tome, istraživanje bi moglo biti zaustavljeno nakon 500 ispitanika. Ovaj primjer pokazuje da je primjenom sekvencijalne strategije moguće postići značajno smanjenje potrebnog broja opservacija u odnosu na preliminarni proračun veličine uzorka.

Međutim, strategija sekvencijalnog izračuna veličine uzorka donosi željeni rezultat samo ako sociolog može napraviti potrebne proračune tokom samog istraživanja, na primjer telefonsko istraživanje, koristeći kompjuterske sisteme. Odgovore ispitanika sociolog unosi u svoj personalni računar, sa kojeg se rezultati odmah šalju na računar direktora istraživanja, obrađuju, a ekran pruža informacije ne samo o jednodimenzionalnim frekvencijama koje su raspoređene na određeno pitanje, već io traženim veličina uzorka.

Ako postoji opasnost da veličina uzorka bude katastrofalno velika, potrebno je kombinovati oba tipa strategije – preliminarnu i sekvencijalnu, tj. primijeniti kombinovana strategija. Izračunavanjem uzorka prema preliminarnoj strategiji dobijamo gornje dozvoljene vrijednosti za sekvencijalnu strategiju ili, drugim riječima, vrijednost veličine uzorka, po dostizanju koje prestaje ispitivanje po sekvencijalnoj strategiji.

Najrazumniji i najispravniji pristup određivanju veličine uzorka zasniva se na izračunavanju intervala povjerenja, koji se zasniva na nizu osnovnih koncepata matematičke statistike (varijacija, standardna devijacija, interval povjerenja, srednja kvadratna greška).

Za izračunavanje potrebne veličine uzorka u kvantitativno istraživanje Najčešće se koriste dva statistička koncepta - interval povjerenja i vjerovatnoća povjerenja. Interval povjerenja predstavlja grešku uzorkovanja koju navedete unaprijed. Na primjer, ako postavite interval povjerenja od 3% i konkretan odgovor na određeno istraživačko pitanje je 48%, to znači da čak i ako anketirate cijelu populaciju, prava vrijednost će pasti između 45 (48 - 3) i 51 % (48 + 3). Vjerovatnoća povjerenja pokazuje koliko možete biti sigurni u dobijene rezultate, da karakteristike uzorka odgovaraju karakteristikama cijele populacije - drugim riječima, kolika je vjerovatnoća da će nasumični odgovor pasti u interval povjerenja. Obično se koriste nivoi pouzdanosti od 95 i 99%. Najčešće korišteno je 95% - to je dovoljno u velikoj većini studija. Ako kombiniramo vjerovatnoću povjerenja i interval povjerenja, možemo reći da odgovori na pitanje imaju 95% vjerovatnoću pada između 45 i 51%.

Sljedeća gruba procjena pouzdanosti rezultata ankete uzorka je vrlo korisna. Povećana pouzdanost omogućava grešku uzorkovanja do 3%, uobičajenu - od 3 do 10% (interval pouzdanosti distribucija na nivou od 0,03-0,1), približnu - od 10 do 20%, približnu - od 20 do 40%, i procijenjeno - više od 40%.

Na osnovu ovih koncepata i uzimajući u obzir niz pretpostavki, izvedene su formule za izračunavanje veličine uzorka, koje pretpostavljaju da je reprezentativnost zagarantovana upotrebom ispravnih probabilističkih procedura uzorkovanja.

U nekim slučajevima, trošak provođenja ankete se koristi kao glavni argument pri određivanju veličine uzorka. Dakle, budžetom marketinškog istraživanja predviđeni su troškovi provođenja određenih anketa, koji se ne mogu premašiti, a očito je da se ne uzima u obzir vrijednost dobijenih informacija. Međutim, u nekim slučajevima, mali uzorak može dati prilično točne rezultate.

Istraživačka praksa predlaže sljedeće pravilo: veličina uzorka treba da pruži najmanje 100 opservacija za svaku primarnu i najmanje 20-50 opservacija za svaku sekundarnu komponentu klasifikacije. 11 primarnih klasifikacijskih komponenti odgovaraju najkritičnijim, a sekundarne odgovaraju najmanje kritičnim ćelijama unakrsne klasifikacije usvojene u ovoj studiji 34. Teorijski proračuni i praksa dokazuju da bi se dobili pouzdani podaci o mišljenjima i sklonostima populacije takvih veliki grad, kao i Sankt Peterburg, dovoljno je intervjuisati 700-800 ljudi. Međutim, većina istraživanja stanovništva ovdje se provodi na uzorcima do 1,5 hiljada ljudi.

Greška uzorkovanja

Kao što već znamo, reprezentativnost je svojstvo populacije uzorka da predstavlja karakteristike opšte populacije. Ako nema poklapanja, kažu greška reprezentativnosti- stepen do kojeg statistička struktura uzorka odstupa od strukture odgovarajuće opšte populacije. Pretpostavimo da je prosječni mjesečni porodični prihod penzionera u opštoj populaciji 2 hiljade rubalja, au populaciji uzorka - 6 hiljada rubalja. To znači da je sociolog intervjuisao samo imućniji dio penzionera, a u njegovu studiju se uvukla greška u reprezentativnosti. Drugim riječima, naziva se greška reprezentativnosti nesklad između dvije populacije- opšti, na koji je usmeren teorijski interes sociologa i ideja o svojstvima koja na kraju želi da dobije, i selektivni, na koji je usmeren praktični interes sociologa, koji deluje i kao predmet istraživanja i kao sredstvo dobijanja informacija o opštoj populaciji.

Uz termin “greška reprezentativnosti” u domaćoj literaturi se može naći još jedan termin: “greška uzorkovanja”. Ponekad se koriste naizmjenično, a ponekad se koristi “greška uzorkovanja” umjesto “reprezentativne greške” kao kvantitativno precizniji koncept.

Greška uzorkovanja- odstupanje prosječnih karakteristika populacije uzorka od prosječnih karakteristika opšte populacije.

U praksi, greška uzorkovanja se utvrđuje upoređivanjem poznatih karakteristika populacije sa srednjim vrijednostima uzorka. U sociologiji se pri anketiranju odrasle populacije najčešće koriste podaci iz popisa stanovništva, trenutne statistike, te rezultati prethodnih istraživanja. Socio-demografske karakteristike se obično koriste kao kontrolni parametri. Poređenje prosjeka opšte populacije i populacije uzorka, na osnovu ovog određivanja greške uzorkovanja i njenog smanjenja naziva se kontrola reprezentativnosti. Budući da se po završetku studije može izvršiti poređenje svojih i tuđih podataka, ovaj način kontrole se naziva a posteriori, one. sprovedeno nakon iskustva.

U Gallupovim anketama, reprezentativnost se kontroliše korišćenjem podataka dostupnih u nacionalnim popisima o raspodeli stanovništva prema polu, starosti, obrazovanju, prihodima, profesiji, rasi, mestu stanovanja i veličini naselja. Sveruski centar za proučavanje javnog mnjenja (VTsIOM) u te svrhe koristi indikatore kao što su spol, starost, obrazovanje, vrsta naselja, bračni status, oblast zaposlenja, status zaposlenja ispitanika, koji su pozajmljeni od Državni komitet za statistiku Ruske Federacije. U oba slučaja populacija je poznata. Greška uzorkovanja se ne može utvrditi ako su vrijednosti varijable u uzorku i populaciji nepoznate.

Stručnjaci VTsIOM osiguravaju pažljivu popravku uzorka tokom analize podataka kako bi se minimizirala odstupanja koja su nastala u fazi terenski rad. Posebno jake pristrasnosti se primjećuju u pogledu spola i starosti. Ovo se objašnjava činjenicom da žene i osobe sa visokim obrazovanjem provode više vremena kod kuće i lakše ostvaruju kontakt sa anketarom, tj. su lako dostupna grupa u poređenju sa muškarcima i “neobrazovanim” ljudima.

Grešku uzorkovanja uzrokuju dva faktora: metoda uzorkovanja i veličina uzorka.

Greške uzorkovanja se dijele na dvije vrste - slučajne i sistematske. Slučajna greška - je vjerovatnoća da će srednja vrijednost uzorka (ili neće) pasti izvan datog intervala. Slučajne greške uključuju statističke greške koje su svojstvene samoj metodi uzorkovanja. Oni se smanjuju sa povećanjem veličine uzorka (tabela 2.8).

Tabela 2.8

Zavisnost veličine uzorka od njegove greške 36 (veličina opšte populacije je 20 hiljada jedinica)

Greška uzorkovanja, %
Veličina uzorka, jedinice

Druga vrsta greške uzorkovanja je sistematske greške. Ako je sociolog odlučio da sazna mišljenje svih stanovnika grada o tome što se dešava lokalne vlasti vlasti socijalne politike, a anketirali samo one koji imaju telefon, onda postoji namjerna pristrasnost u uzorku u korist imućnih slojeva, tj. sistematska greška.

Dakle, sistematske greške su rezultat aktivnosti samog istraživača. Oni su najopasniji jer dovode do prilično značajnih pristrasnosti u rezultatima istraživanja. Sistematske greške se smatraju gorim od slučajnih i zato što se ne mogu kontrolisati i mjeriti.

Oni nastaju kada, na primer: 1) uzorak ne odgovara ciljevima studije (sociolog je odlučio da proučava samo zaposlene penzionere, ali je intervjuisao sve); 2) očigledno je nepoznavanje prirode opšte populacije (sociolog je smatrao da 70% svih penzionera ne radi, a ispostavilo se da samo 10% ne radi); 3) biraju se samo „pobednički“ elementi opšte populacije (na primer, samo bogati penzioneri).

Pažnja!Za razliku od slučajnih grešaka, sistematske greške se ne smanjuju sa povećanjem veličine uzorka.

Nakon što su sumirali sve slučajeve u kojima se javljaju sistematske greške, metodolozi su sastavili registar istih. Oni vjeruju da izvor nekontrolisanih distorzija u distribuciji opservacija uzorka može biti sledeći faktori:

♦ metodološka i metodološka pravila za izvođenje sociološko istraživanje;

♦ odabrane su neadekvatne metode za formiranje uzorka populacije, metode za prikupljanje i izračunavanje podataka;

♦ potrebne jedinice za posmatranje su zamijenjene drugim, pristupačnijim;

♦ Konstatovan je nepotpuni obuhvat populacije uzorka (nedovoljan prijem upitnika, nepotpuno popunjavanje, nedostupnost jedinica posmatranja).

Sociolog rijetko pravi namjerne greške. Češće greške nastaju zbog činjenice da sociolog slabo poznaje strukturu opće populacije: distribuciju ljudi po godinama, profesiji, prihodima itd.

Sistematske greške je lakše sprečiti (u poređenju sa slučajnim), ali ih je veoma teško eliminisati. Sistematske greške je najbolje spriječiti preciznim predviđanjem njihovih izvora unaprijed – na samom početku studije.

Evo nekih načini za izbjegavanje grešaka:

♦ svaka jedinica u populaciji mora imati jednaku vjerovatnoću da bude uključena u uzorak;

♦ preporučljivo je birati iz homogenih populacija;

♦ morate znati karakteristike opšte populacije;

♦ prilikom sastavljanja populacije uzorka, slučajne i sistematske greške se moraju uzeti u obzir.

Ako je populacija uzorka (ili jednostavno uzorak) pravilno sastavljena, onda sociolog dobija pouzdane rezultate koji karakterišu čitavu populaciju. Ako je pogrešno sastavljen, onda se greška koja je nastala u fazi uzorkovanja umnožava u svakoj narednoj fazi sociološkog istraživanja i na kraju dostiže toliku vrijednost koja je veća od vrijednosti provedenog istraživanja. Kažu da takva istraživanja donose više štete nego koristi.

Takve greške se mogu pojaviti samo sa populacijom uzorka. Da biste izbjegli ili smanjili vjerovatnoću greške, najlakši način je povećati veličinu uzorka (i idealno na veličinu opće populacije: kada se obje populacije poklapaju, greška uzorkovanja će potpuno nestati). Ekonomski, ova metoda je nemoguća. Ostaje još jedan način - poboljšati matematičke metode za uzorkovanje. Koriste se u praksi. Ovo je prvi kanal prodora u sociologiju matematike. Drugi kanal je matematička obrada podataka.

Problem grešaka postaje posebno važan u marketinškim istraživanjima, gdje se koriste mali uzorci. Obično ih ima nekoliko stotina, rjeđe - hiljadu ispitanika. Ovdje je polazna tačka za izračunavanje uzorka pitanje određivanja veličine populacije uzorka. Veličina uzorka zavisi od dva faktora: I) troškova prikupljanja informacija i 2) želje za određenim stepenom statističkog poverenja u rezultate koje se istraživač nada da će dobiti. Naravno, čak i ljudi koji nisu iskusni u statistici i sociologiji intuitivno razumiju šta veća veličina s uzoraka, tj. Što su bliži veličini populacije u cjelini, to su dobijeni podaci pouzdaniji i validniji. Međutim, gore smo već govorili o praktičnoj nemogućnosti kontinuiranih istraživanja u slučajevima kada se ona provode na objektima čiji broj prelazi desetine, stotine hiljada, pa čak i milione. Jasno je da troškovi prikupljanja informacija (uključujući plaćanje za umnožavanje alata, rad upitnika, terenskih menadžera i operatera kompjuterskog unosa) zavise od iznosa koji je korisnik spreman da izdvoji, a malo zavisi od istraživača. Što se tiče drugog faktora, na njemu ćemo se zadržati malo detaljnije.

Dakle, što je veća veličina uzorka, to je manja moguća greška. Iako treba napomenuti da ako želite udvostručiti točnost, morat ćete povećati uzorak ne za dva, već za četiri. Na primjer, da biste dvostruko preciznije procijenili podatke dobijene anketom od 400 ljudi, trebali biste anketirati 1.600 ljudi umjesto 800. Međutim, malo je vjerovatno da marketinško istraživanje treba 100% tačnost. Ako pivar treba da otkrije koji udio potrošača piva preferira njegovu marku u odnosu na marku svog konkurenta - 60% ili 40% - onda na njegove planove neće utjecati razlika između 57%, 60 ili 63%.

Greška uzorkovanja može zavisiti ne samo od njegove veličine, već i od stepena razlika između pojedinačnih jedinica unutar populacije koju proučavamo. Na primjer, ako želimo znati koliko se piva konzumira, otkrit ćemo da u našoj populaciji stope potrošnje različiti ljudi značajno razlikuju (heterogena opšta populacija). U drugom slučaju ćemo proučiti potrošnju hljeba i to otkriti različiti ljudi razlikuje se mnogo manje značajno (homogeno opšta populacija). Što je veća varijacija (ili heterogenost) unutar populacije, veća je veličina moguće greške uzorkovanja. Ovaj obrazac samo potvrđuje ono što nam govori jednostavan zdrav razum. Dakle, kako V. Yadov ispravno tvrdi, „veličina (volumen) uzorka zavisi od nivoa homogenosti ili heterogenosti objekata koji se proučavaju.Što su homogeniji, manji brojevi mogu dati statistički pouzdane zaključke.”

Određivanje veličine uzorka zavisi i od nivoa intervala pouzdanosti dozvoljene statističke greške. Ovdje mislimo na tzv nasumično greške koje su povezane sa prirodom bilo koje statističke greške. IN AND. Paniotto daje sljedeće proračune za reprezentativni uzorak uz pretpostavku greške od 5% (tabela 2.9):

Tabela 2.9

Reprezentativni uzorci proračuna

To znači da ako ste anketirali, recimo, 400 ljudi u regionalnom gradu, gdje je odrasla solventna populacija 100 hiljada ljudi, ustanovili da 33% ispitanih kupaca preferira proizvode lokalne fabrike za preradu mesa, onda sa 95% vjerovatno se može reći da su redovni kupci ovih proizvoda 33±5% (tj. od 28 do 38%) stanovnika ovog grada.

Također možete koristiti Gallupove proračune za procjenu odnosa između veličine uzorka i greške uzorkovanja (vidi gore).

Danas se mnoga teška proračuna izvode pomoću tehnologije, a statistički programi se mogu dobiti na internetu. Dakle, izračunavanjem uzorka, lijeni sociolog je dobio takvu priliku na web stranici Analitičkog centra „Posao i marketing“ (http://www.bma.ru/enter.htm), gdje korisniku samo treba da unesete potrebne podatke, a zatim kliknite na dugme "Izračunaj".

Prije direktnog vršenja opservacije uzorka, uvijek se rješava pitanje koliko jedinica populacije koja se proučava mora biti odabrano za uzorkovanje. Formule za određivanje njegovog broja izvedene su iz formula za maksimalne greške uzorkovanja u skladu sa sljedećim polaznim tačkama:

  • vrsta predloženog uzorka;
  • metod selekcije (ponovljeni ili neponavljajući);
  • izbor procjene parametra (prosječna vrijednost ili proporcija).

Osim toga, potrebno je unaprijed odrediti vrijednost vjerovatnoće povjerenja koja bi odgovarala potrošaču informacije, te veličinu dopuštene maksimalne greške uzorkovanja. Postavka D i I (koja odgovara vjerovatnoći povjerenja), po pravilu, ne predstavlja posebne poteškoće, jer su vezane za prirodu populacije koja se proučava.

Međutim, moramo imati na umu da velika vjerovatnoća povjerenja uvelike povećava veličinu uzorka. Slična je situacija i s marginalnom greškom uzorkovanja: njeno smanjenje za polovicu četverostruko povećava veličinu uzorka. Pitanje koja točnost zadovoljava istraživača postaje fundamentalno ako ispitivanje druge jedinice osmatranja dovodi do velikih finansijskih i materijalnih troškova (s obzirom na teritorijalnu udaljenost jedinica osmatranja, povjerljivost prikupljenih podataka, složenost programa posmatranja itd.), a nevažno ako je trošak istraživanja jedne jedinice relativno mali.

Formule za izračunavanje potrebne veličine uzorka za Različiti putevi izbor je prikazan u tabeli. 13.10.

Kada koristite formule date u tabeli, preporučuje se da se dobijena veličina uzorka zaokruži kako bi se osigurala određena „marža“ tačnosti.

Osim toga, u statističkoj praksi uobičajena je opcija kada je vrijednost maksimalne greške uzorkovanja specificirana kao postotak (relativna maksimalna greška uzorkovanja). U ovom slučaju, apsolutna vrijednost greške se dijeli sa prosječnom vrijednošću karakteristike i množi sa 100%. Zatim, da biste primijenili formule tabele, trebali biste pronaći apsolutnu vrijednost maksimalne greške na sljedeći način:

Tabela 13.10

Formule za pronalaženje veličine uzorka

Metoda odabira

Ponovna selekcija

Neponovljiv izbor

Prilikom procjene prosjeka

Pravilno nasumično

Mehanički

Tipično

Serijski sa jednakim serijama

Prilikom procjene udjela

Pravilno nasumično

Mehanički

Kraj

Metoda odabira

Ponovna selekcija

Neponovljiv izbor

Tipično

Serijski sa jednakim serijama

Ako su početni parametri za određivanje veličine uzorka relativna greška D% i koeficijent varijacije

proučavanog svojstva, izračunato kao F„=^100%, zatim formula

Stvarni slučajni uzorak tokom ponovljenog odabira može se transformirati na sljedeći način:

Prava poteškoća u određivanju veličine uzorka je određivanje veličine varijacije atributa – disperzije. U praksi ova vrijednost najčešće ostaje nepoznata sve dok se anketa ne sprovede. Šta učiniti u svakom konkretnom slučaju odlučuje sam istraživač.

Ponekad se varijansa procjenjuje na direktne načine:

  • izvršiti opsežna ispitivanja prije početka glavnog posmatranja kako bi se utvrdila vrijednost o 2;
  • uslovno prihvataju vrijednost varijanse iz prethodnih sličnih istraživanja (metoda koja se najčešće koristi u praksi). Takav pristup je opravdan ako opća populacija, zbog svoje prirode, nije potvrđena značajnim dinamičkim procesima ili njihove manifestacije nisu toliko živopisne.

Postoji i niz „indirektnih“ metoda za pronalaženje varijanse karakteristike koja se proučava, a to su određene matematičke tehnike koje se zasnivaju na svojstvima statističkih populacija. Budući da su distribucije većine njih bliske normalnom zakonu, vrijednost disperzije se može približno odrediti na sljedeći način.

Budući da su sve vrijednosti varijante atributa prema zakonu normalne distribucije postavljene na 3 u jednom ili drugom smjeru od prosjeka, postoji približna jednakost R«6a, gdje R- opseg varijacije osobine, definisan kao R= x max - x min.

dakle,

U praksi, da bi dobili određenu „rezervu“ jedinica uzorka kako bi se osigurala potrebna tačnost, oni često radije koriste relaciju

Vrijednosti x max i x min pri praćenju društveno-ekonomskih procesa obično su poznate ili određene važećim zakonodavstvom. Na primjer, prosječan broj zaposlenih u malim preduzećima je strogo ograničen zakonom.

Za društveno-ekonomske fenomene, ako je na neki način (na primjer, iz podataka iz prošlih istraživanja) poznata vrijednost srednje vrijednosti, relacija se koristi za aproksimaciju standardne devijacije

Varijanca alternativne karakteristike ovisi o udjelu jedinica koje imaju proučavanu karakteristiku (svojstvo) w. Ako je ovaj udio nepoznat, uzima se maksimum moguće značenje disperzija - 0,25, postignuto na w = 0,5.

Iz formula u tabeli. 13.10 slijedi da je veličina uzorka direktno proporcionalna varijansi karakteristike koja se proučava. Zaista, kako se varijabilnost jedinica povećava, da bi se varijacija obuhvatila, potreban je sve veći broj jedinica za odabir i uključivanje u uzorak.

Dakle, razmotrili smo određivanje veličine uzorka za jednu vidljivu karakteristiku. Ali šta ako postoji nekoliko karakterističnih osobina i varijacije ovih karakteristika su različite ili su neke od njih alternativne. Bilo bi logično odabrati karakteristiku za koju proračuni dovode do najveće veličine uzorka od ostalih (ova karakteristika bi bila ona za koju je potrebno dobiti najmanju relativnu grešku uzorkovanja pri istoj vjerovatnoći pouzdanosti). Zaista, u ovom slučaju će određivanje općih parametara ostalih karakteristika biti praćeno većom preciznošću od potrebne, tj. postojaće neka „granica“ tačnosti.

Takođe treba napomenuti da se u praksi veličina uzorka često prilagođava u skladu sa raspoloživim finansijskim i ljudskim resursima, zatim se vodi računa o potrebi postizanja optimalne ravnoteže troškova i tačnosti rezultata. Ako postoje poteškoće sa finansiranjem statistička zapažanja, posebno ako je smanjenje troškova prilično značajno uz prihvatljive gubitke u točnosti, takav korak je više nego opravdan.

Na određivanje veličine uzorka utiče i vrlo česta pojava u statičkim opservacijama povezana sa neodgovorom ispitivanih jedinica. U slučaju velikih populacija koje se mjere u stotinama ili milionima (na primjer, stanovništvo neke zemlje), određena prilagodba za neodgovor se može izvršiti povećanjem veličine uzorka. Međutim, prilikom obrade rezultata ankete, a posebno kada se koriste konkretne preporuke zasnovane na njima, treba imati na umu pretpostavke koje su napravljene prilikom prikupljanja podataka.

Pogledajmo primjere problema kako bismo odredili potrebnu veličinu populacije uzorka.

Primjer 13. 7. Koliko objekata od ukupno 507 firmi mora provjeriti poreska inspekcija da bi sa vjerovatnoćom od 0,997 utvrdila udio firmi sa prekršajima u plaćanju poreza? Prema prethodnom istraživanju, standardna devijacija je bila 0,15; veličina greške uzorkovanja ne bi trebala biti veća od 0,15.

Kada ponavljate nasumično uzorkovanje, trebali biste provjeriti

U slučaju ponovljenog slučajnog prekida, potrebno je provjeriti

Kao što vidimo, upotreba nerepetitivnog uzorkovanja dovodi do ispitivanja znatno manjeg broja objekata.

Primjer 13.8. Administracija jednog od konstitutivnih entiteta Ruske Federacije odlučila je provesti anketu uzorka od 366 malih preduzeća, tokom koje je planirano utvrditi:

  • udio ljudi sa visokim obrazovanjem koji rade u malim firmama (veličina maksimalne greške ne smije biti veća od 0,1);
  • udio žena koje rade u malim firmama (veličina maksimalne greške ne smije biti veća od 0,12);
  • prosječna starost radnika u malim firmama (veličina maksimalne greške ne smije biti veća od dvije godine).

Distribucija malih preduzeća po privrednim sektorima je sljedeća:

Gradska uprava pretpostavlja da značenje proučavanih karakteristika značajno varira u zavisnosti od delatnosti preduzeća, pa je odabran tipičan uzorak, proporcionalan veličini tipičnih grupa.

Odredimo koliki bi trebao biti njegov broj i koliko jedinica posmatranja treba izdvojiti iz svake tipične grupe sa vjerovatnoćom povjerenja od 0,954. Prva dva znaka su alternativna, zatim procjena Ne poznata varijansa je njegova maksimalna vrijednost - 0,25.

Potrebna veličina uzorka pri procjeni udjela osoba sa visokim obrazovanjem imat će sljedeću vrijednost:

Procjena udjela zaposlenih žena zahtijeva anketiranje

Moglo bi se odmah odrediti na osnovu čega treba izvršiti proračune. To je uvijek onaj koji ima veću tačnost (manju grešku za isti nivo pouzdanosti). Međutim, treći znak u našem primjeru je kvantitativan. Hajde da odredimo koja je veličina uzorka potrebna za procjenu. Dobijamo približnu vrijednost disperzije na osnovu svojstava normalne distribucije:

(sa maksimalnom i minimalnom starošću od 60 odnosno 18 godina, što je najvjerovatniji raspon).

Odakle dolazi st.2 = 49?

Uradimo računicu:

Dakle, da bi se postigla zadata tačnost za sve posmatrane karakteristike, treba izabrati maksimalan broj dobijen za sva tri indikatora, tj. n = 65 kompanija.

Grana privrede

Broj firmi odabranih u populaciji uzorka

Industrija

Poljoprivreda

Izgradnja

Transport i komunikacije

Trgovina i ugostiteljstvo

Opće poslovne aktivnosti

Stambeno-komunalne usluge i neproizvodne vrste potrošačke usluge stanovništva

Ostale industrije

Neformalizovane metode uzorkovanja. Pitanje optimalne veličine uzorka uvijek je bilo kontroverzno među istraživačima. Odluka o veličini populacije uzorka donosi se uzimajući u obzir niz faktora, među kojima dva imaju najznačajniju ulogu: 1) vrijednost i novina informacija dobijenih kao rezultat istraživanja; 2) troškove sprovođenja studije (uključujući vreme) za datu veličinu uzorka.

U mnogim slučajevima se može voditi ustaljenom praksom, tj. veličina uzorka korištena u sličnim studijama. Osim toga, postoje sljedeća jednostavna pravila za određivanje veličine populacije uzorka.

Veličina uzorka raste ako:

  • potrebno je dobiti podatke za pojedinačne podgrupe (veličine poduzoraka se sumiraju i uzorak kao cjelina raste proporcionalno broju podgrupa);
  • Već dostupne informacije o ključnim pitanjima su nedovoljne i neizvjesnost je značajna.

Osim toga, praksa brojnih studija već je razradila “tipične” veličine uzoraka. Dakle, za nacionalne ankete stanovništva ovi obim variraju između 1000-2500 ispitanika (u zavisnosti od broja analiziranih grupa). Za regionalna istraživanja i istraživanja posebnih populacija - od 200 do 500 (kada se analiziraju brojne podgrupe, veličina regionalnog ili posebnog uzorka stanovništva obično se povećava na najmanje 1000 ljudi). Navedene vrijednosti, naravno, mogu poslužiti samo kao opća smjernica za određivanje optimalna veličina uzorci.

U praksi, odlučivanje o veličini uzorka predstavlja kompromis između pretpostavke o tačnosti rezultata istraživanja i izvodljivosti njihove praktične implementacije (tj. na osnovu troškova sprovođenja istraživanja).

U praksi se koristi nekoliko pristupa za određivanje veličine uzorka. Obratimo pažnju na najjednostavnije od njih. Prvi od njih naziva se proizvoljnim pristupom i zasniva se na primjeni „pravila thumb».

Na primjer, prihvaćeno je bez dokaza da za dobijanje tačnih rezultata uzorak mora biti 5% populacije. Ovaj pristup je jednostavan i lak za implementaciju, ali ne omogućava postizanje tačnih rezultata. Njegova prednost je relativno niska cijena. U drugom pristupu, veličina uzorka se može postaviti na osnovu unaprijed specificiranih uslova. Kupac marketinškog istraživanja, na primjer, zna da je kod proučavanja javnog mnijenja uzorak obično 1000 - 1200 ljudi, pa preporučuje istraživaču da se drži ove brojke.

Treći pristup znači da u nekim slučajevima glavno razmatranje pri određivanju veličine uzorka može biti trošak provođenja istraživanja. Iako se vrijednost i pouzdanost primljenih informacija ne uzima u obzir.

U četvrtom pristupu, veličina uzorka se utvrđuje na osnovu statističke analize. Ovaj pristup uključuje određivanje minimalne veličine uzorka, uzimajući u obzir zahtjeve za pouzdanost i valjanost dobijenih rezultata.

Peti pristup se smatra najteorijski zasnovanim i pravi pristup u određivanju veličine uzorka. Zasnovan je na izračunavanju intervala povjerenja.

Interval pouzdanosti je raspon čije ekstremne tačke karakterišu procenat određenih odgovora na pitanje. Ovaj koncept tijesta povezan je s konceptom “standardne devijacije rezultirajuće karakteristike u općoj populaciji”. Što je veći, širi interval pouzdanosti mora biti da bi se uključilo, na primjer, 9,5% odgovora.

Iz svojstava krive normalne distribucije proizilazi da su krajnje tačke intervala pouzdanosti, jednake, na primjer, 9,5%, definirane kao proizvod: 1,96 (normalizirana devijacija) i standardne devijacije.

Brojevi 1,96 i 2,58 (za interval pouzdanosti od 99%) označeni su z.

Postoje tabele "Vrijednost integrala vjerovatnoće", koje omogućavaju određivanje z vrijednosti za različite intervale povjerenja. Interval pouzdanosti od 95% ili 99% je standard za provođenje marketinškog istraživanja.

Na primjer, provedeno je istraživanje o broju posjeta vlasnika automobila servisnim radionicama godišnje. Interval pouzdanosti za srednji broj posjeta je izračunat na 5-7 posjeta na nivou pouzdanosti od 99%. To znači da ako bude moguće samostalno provesti studije uzorka 100 puta, onda će za 99 uzoraka studija prosječan broj posjeta pasti u rasponu od 5 do 7 posjeta. Drugim riječima, 99% vlasnika automobila će pasti u interval poverenja.

Recimo da je sprovedena studija na do 50 nezavisnih uzoraka. Srednji rezultati za ove uzorke formirali su krivu normalne distribucije tzv distribucija uzorkovanja.

Prosječni rezultat za populaciju u cjelini jednak je srednjem rezultatu krivulje distribucije. Koncept „distribucije uzorkovanja“ se takođe smatra jednim od osnovnih koncepata teorijskog koncepta koji leži u osnovi definicije V uzorka.

Naravno, nijedna kompanija ne može formirati 10, 20, 50 nezavisnih uzoraka. Obično se koristi samo jedan uzorak.

Matematička statistika vam omogućava da dobijete neke informacije o distribuciji uzorka tako što imate tačne podatke o varijaciji jednog uzorka.

Pokazatelj stepena do kojeg se procjena istinita za populaciju u cjelini razlikuje od one koja se očekuje za tipičan uzorak korijen srednje kvadratne greške. Na primjer, proučava se mišljenje potrošača o novom proizvodu i kupca ovu studiju je naveo da bi bio zadovoljan preciznošću dobijenih rezultata, jednakom plus ili minus 5%.

Pretpostavimo da je 30% uzorka za novi proizvod. To znači da je raspon mogućih procjena za cjelokupnu populaciju 25 – 35%. Štaviše, što je veća veličina uzorka, manja je greška. Velika vrijednost varijacije uzrokuje visoku vrijednost greške i obrnuto.

Odredimo veličinu uzorka na osnovu izračunavanja intervala pouzdanosti. Početne informacije potrebne za implementaciju ovog pristupa su:

  • · količina varijacija za koju se vjeruje da ima populaciju;
  • · željena tačnost;
  • · nivo pouzdanosti koji rezultati ankete moraju zadovoljiti.

Kada je uključen postavljeno pitanje Postoje samo dvije opcije odgovora, izražene kao postotak (koristi se mjera procenta), veličina uzorka se određuje sljedećom formulom:

gdje je n veličina uzorka;

z – normalizovano odstupanje, određeno na osnovu izabranog nivoa pouzdanosti (tabela 7);

p – pronađena varijacija za uzorak;

q = (100 – p);

e – dozvoljena greška.

Tabela 7

Vrijednost normaliziranog odstupanja z rezultata od srednje vrijednosti

ovisno o vjerovatnoći pouzdanosti (a) dobijenog rezultata

Na primjer, kompanija za proizvodnju guma provodi anketu među vozačima koji koriste radijalne gume.

Stoga, na pitanje: "Koristite li radijalne gume?" Moguća su samo 2 odgovora: “Da” ili “Ne”. Ako pretpostavimo da populacija zaljubljenika u automobile ima nizak koeficijent varijacije, to znači da gotovo svi ispitani koriste radijalne gume. IN u ovom slučaju može se formirati dovoljno mala veličina uzorka. U formuli (1), proizvod pg izražava varijaciju svojstvenu populaciji. Na primjer, recimo 90% jedinica u populaciji koristi radijalne gume. To znači da je pg = 900. Ako pretpostavimo da je koeficijent varijacije veći (p = 70%), onda je pg = 2100. Najveća varijacija se postiže kada polovina populacije (50%) koristi radijalne gume, a druga nemoj. U tom slučaju proizvod dostiže vrijednost jednaku 2500.

Prilikom sprovođenja ankete važno je ukazati na tačnost dobijenih procjena. Na primjer, utvrđeno je da 44% ispitanika koristi radijalne gume. Rezultati mjerenja moraju biti predstavljeni u obliku: postotak vozača koji koriste radijalne gume je 44 plus ili minus %. Visinu dozvoljene greške zajednički unaprijed određuju naručilac istraživanja i izvođač.

Nivo povjerenja u marketinško istraživanje obično se procjenjuje na osnovu dvije vrijednosti: 95% ili 99%. Prva vrijednost odgovara vrijednosti z = 1,96; drugi – z = 2,58. Ako je odabran nivo pouzdanosti od 99%, onda to znači sljedeće: 99% smo sigurni (drugim riječima, nivo pouzdanosti je 0,99) da je postotak članova populacije koji spadaju u raspon plus - minus e% jednak postotak članova uzorka koji spadaju u isti raspon greške. Uz pretpostavku varijacije od 50%, tačnost od 10% na nivou pouzdanosti od 95%, izračunavamo veličinu uzorka:

n = 1,962 (50 x 50) / 102 = 96.

Sa nivoom pouzdanosti od 99%, i e = ±3%, n = 1067.

Prilikom određivanja indeksa varijacije za konkretnu populaciju preporučljivo je provesti preliminarnu kvalitativnu analizu populacije koja se proučava i utvrditi sličnost populacijskih jedinica u demografskom, socijalnom i drugim aspektima od interesa za istraživača. Moguće je odrediti veličinu uzorka koristeći srednje vrijednosti umjesto postotaka. Pretpostavimo da je nivo pouzdanosti odabran na 95% (z = 1,96,), da je standardna devijacija (S) izračunata na 100, a željena preciznost (bias) je ±10. Tada će veličina uzorka biti

U stvarnosti, u praksi, ako se uzorak iznova formira, a slična istraživanja nisu sprovedena, S je nepoznat.

U ovom slučaju, preporučljivo je postaviti grešku e u dijelovima standardne devijacije. Formula za izračun transformira se i poprima sljedeći oblik:

Uglavnom smo govorili o vrlo velikim agregacijama koje karakteriziraju tržišta robe široke potrošnje. Ali u nekim slučajevima agregati nisu tako veliki, a na primjer na tržištima pojedinačne vrste industrijski proizvodi.

Obično, ako je uzorak manji od 5% populacije, tada se populacija smatra velikom, a proračuni se provode prema gore navedenim pravilima.

Ako V uzorka prelazi 5% populacije, onda se potonji smatra malim, a faktor korekcije se uvodi u gornje formule. Veličina uzorka se u ovom slučaju određuje na sljedeći način:

gdje je n1 veličina uzorka za malu populaciju,

n – veličina uzorka (bilo za procentualne mjere ili za prosjeke), izračunata korištenjem gornjih formula,

N je obim opće populacije.

Na primjer, proučava se mišljenje pripadnika populacije od 1000 kompanija o izgradnji hemijskog postrojenja u granicama grada Tomska. Zbog nedostatka informacija o varijaciji, pretpostavlja se najgori slučaj: 50:50. Istraživač je odlučio da koristi nivo pouzdanosti od 95%. Kupac studije je naveo da bi bio zadovoljan preciznošću rezultata plus-minus 5%. U ovom slučaju se koristi sljedeća formula za procentualno mjerenje:

Ovakav pristup formiranju V uzorka, uz određene rezerve, može se koristiti i pri izračunavanju veličine panela i ekspertske grupe.

Formule za izračunavanje uzoraka date su zasnovane na pretpostavci da su ispoštovana sva pravila uzorkovanja, a jedina greška je greška zbog njene veličine.

Poglavlje iz knjige "Marketinška istraživanja"

  • Psihologija: ličnost i biznis

Identifikacija populacijskih objekata

Izbor metode ispitivanja

Kompletan pregled

Uzorak ankete

Odabir postupka uzorkovanja

Proračun veličine uzorka

Implementacija plana uzorkovanja

Rice. 4.3. Planiranje uzorkovanja

Planiranje uzorkovanja uključuje sljedeće procedure (slika 4.3):

    Identifikacija objekata opšte populacije.

    Određivanje metode ispitivanja.

    Određivanje postupka uzorkovanja.

    Određivanje veličine uzorka.

Identifikacija objekata u opštoj populaciji

Populacija je skup svih jedinica koje su predmet proučavanja.

U ovoj fazi pripreme istraživanja potrebno je utvrditi koji subjekti čine populaciju koja se proučava. Ispitanici uključeni u opštu populaciju po pravilu su heterogeni, pa se pri određivanju tipičnih predstavnika objekta istraživanja mogu propustiti neke grupe. Posebno je teško predstaviti sve elemente populacije koju čine organizacije, jer sve firme ne reklamiraju svoje aktivnosti. Opšta populacija se može definirati kao tržište u cjelini, tržišni segment ili ciljna grupa subjekata.

Određivanje metode ispitivanja

U zavisnosti od veličine populacije i ciljeva studije, mogu se koristiti metode kontinuiranog ili uzorkovanog istraživanja.

Metoda kontinuiranog ispitivanja sastoji se od proučavanja svih jedinica opšte populacije. Metoda je povezana s visokim troškovima istraživanja, a opravdana je, na primjer, u slučaju malog broja potrošača koji predstavljaju segment, ili u slučaju kada obim kupovine datog klijenta čini značajan udio na tržištu. kapacitet u celini.

Uzorak- ovo je grupa istraživačkih objekata koja nosi karakteristike svih jedinica opšte populacije, na primjer, grupa potrošača koja zastupa interese i ukuse cjelokupnog ciljnog tržišta.

Metoda uzorkovanog istraživanja daje manju tačnost u poređenju sa metodom kontinuiranog istraživanja, ali je manje radno intenzivna. Preporučljivo je koristiti ovu metodu u prisustvu velikog broja homogenih jedinica opće populacije.

Metoda uzorkovanja pruža informacije o populaciji na osnovu istraživanja samo njenog dijela, tako da su podaci dobijeni uzorkom istraživanja vjerovatnoće. U praksi to znači da se kao rezultat studije ne utvrđuje određena vrijednost, već interval u kojem se nalazi željena vrijednost. Vjerovatnoća sa kojom se može reći da greška uzorkovanja neće preći određenu specificirana vrijednost, zvao verovatnoća poverenja.

Svojstvo uzorka da odražava karakteristike populacije naziva se reprezentativnost. Razlika između karakteristika opšte populacije i populacije uzorka naziva se greška uzorkovanja, koja zavisi od odabranog postupka uzorkovanja.

Procedure uzorkovanja

Procedura uzorkovanja je redoslijed odabira ispitanika za uzorak.

Odabir ispitanika može biti praćen sistematskim i slučajnim greškama. Sistematske greške nastaju kada je postupak uzorkovanja odabran pogrešno. Slučajne greške uvijek postoje jer su povezane sa uticajem teško predvidljivih faktora. Uticaj slučajnosti se ne može potpuno eliminisati, ali se veličina slučajne greške može odrediti statističkim metodama. Pristrasnost se ne može procijeniti, ali se može eliminirati promjenom procedure uzorkovanja.

S obzirom na postojanje dvije vrste grešaka u uzorkovanju, razlikuju se slučajni (vjerovatni) i neslučajni (deterministički) tipovi postupaka uzorkovanja.

Postupci neslučajnog uzorkovanja

Non-random procedure uzorkovanja samim procesom uzorkovanja uključuju neslučajni odabir ispitanika, čije se mišljenje može razlikovati od mišljenja opće populacije u cjelini, što dovodi do prisustva neslučajne (sistemske) greške u podacima u rezultatima istraživanja. . Kada se koriste nenasumične procedure, odabir ispitanika u uzorak se vrši na osnovu svih prihvaćenih uslova koji ograničavaju krug verovatnih učesnika u istraživanju. Na primjer, za uzorak su odabrani samo oni ispitanici koji posjeduju računar ili su otišli u radnju između 10 i 11 sati.

Mogući su sljedeći tipovi neslučajnih uzoraka:

Slučajno uzorkovanje – elementi se biraju bez plana, nasumično; metoda je jeftina i praktična, ali stvara nepreciznost i nereprezentativnost;

    tipičan uzorak - skup je ograničen samo na karakteristične (tipične) elemente opšte populacije; koristi se, na primjer, prilikom formiranja fokus grupa; međutim, to zahtijeva informacije o tipičnosti objekata koji se proučavaju;

    kvotno uzorkovanje - struktura uzorkovanja je konstruisana po analogiji sa distribucijom određenih karakteristika u opštoj populaciji; Iz svake grupe opšte populacije biraju se učesnici istraživanja čiji je broj proporcionalan zastupljenosti grupe u opštoj populaciji.

Procedure slučajnog uzorkovanja

At formiranje slučajnog uzorka Primjenjuju se sljedeće procedure.

    jednostavan odabir - elementi se biraju pomoću slučajni brojevi; ovim pristupom se pretpostavlja da je za sve jedinice opće populacije vjerovatnoća da budu odabrana u populaciju uzorka ista (vrijednost vjerovatnoće jednaka je omjeru veličine uzorka i veličine opće populacije). Metoda je vrlo radno intenzivna i zahtijeva popis svih jedinica u općoj populaciji;

    sistematsko (mehaničko) uzorkovanje - prvi element se bira nasumičnim brojevima, preostali elementi uzorka se biraju u jednakim intervalima (interval skoka), koji su jednaki omjeru veličine populacije i veličine uzorka. Ovaj postupak uzorkovanja uvelike pojednostavljuje proceduru, ali može unijeti distorzije u strukturu uzorkovanja ako je populacija uređena prema bilo kojem atributu.

Ako je opća populacija uređena prema bitnoj karakteristici (karakteristika se smatra značajnom ako određuje stanje indikatora koji se proučava), tada da bi se smanjila izobličenja u karakteristici uzorka, jedinice uzorka treba odabrati iz sredine utvrđenog intervala. Isto se radi iu slučaju kada je opća populacija uređena prema sekundarnoj karakteristici koja djelimično utiče na objekt koji se proučava.

Ako je opšta populacija uređena prema neutralnoj karakteristici (koja ne utiče na ponašanje objekta koji se proučava), onda je dozvoljeno uključiti u uzorak bilo koju jedinicu opšte populacije iz utvrđenog intervala;

Stratificirano (tipično ili grupno) uzorkovanje - opća populacija je podijeljena na grupe sa skupom određenih karakteristika (segmenata ili stratuma), u svakoj od kojih se formira vlastiti uzorak slučajnim odabirom; težinski koeficijent svakog sloja u ukupna zapremina uzorak mu odgovara specifična gravitacija u opštoj populaciji; klastersko (serijsko) uzorkovanje - opća populacija je podijeljena u identične grupe (gnijezda, cvjetne gredice ili grozdovi). Klasteri bi trebali biti što sličniji, a sastav klastera trebao bi biti sličan općoj populaciji. Nekoliko grupa je nasumično odabrano iz opšte populacije i podvrgnuto kompletnom istraživanju (jednostepeni pristup). Moguć je i dvofazni pristup, kada se uzorak inicijalno formira iz klastera, a iz njega se nasumično biraju istraživačke jedinice (tj. jedinica uzorka prethodne faze postaje opća populacija za sljedeću). Nedostatak ovog postupka uzorkovanja je što klasteri mogu biti heterogeni među sobom, ali je ovaj postupak jednostavan i ekonomičan.

Višestepeno uzorkovanje

Bilo koja vrsta uzorkovanja može biti jednostepena ili višestepena. Višestepeno uzorkovanje se koristi u slučajevima kada je teško direktno izdvojiti uzorak iz opšte populacije, dok su sve jedinice uzorka u svakoj fazi ekvivalentne za istraživanje.

Višestepeni izbor povezivanja razne procedure uzorkovanje, čini uzorak kombinovan. Ova opcija uzorkovanja nam omogućava da postignemo najracionalnije i najekonomičnije uslove za prikupljanje podataka u skladu sa ciljevima.

Određivanje veličine uzorka

Određivanje veličine uzorka predstavlja kompromis između teorije tačnosti rezultata istraživanja i mogućnosti njegove praktične implementacije u smislu troškova prikupljanja informacija.

Najprikladniji sledećim metodama određivanje veličine uzorka:

1. Metoda proizvoljnog obračuna; u ovom slučaju, veličina uzorka je određena na nivou od 5-10% opšte populacije.

    Tradicionalna metoda proračuna; uključuje provođenje periodičnih godišnjih istraživanja, na primjer, 500, 1000 ili 1500 ispitanika.

    Metoda statističkog izračunavanja; na osnovu definicije statističku pouzdanost informacije.

    Metoda proračuna pomoću nomograma.

    Empirijska metoda; u ovom slučaju se uzorak smatra dovoljnim kada sve nove informacije unose samo manje promjene (koje se mogu zanemariti) u već prikupljenim rezultatima istraživanja.

    Metoda troškova; na osnovu iznosa troškova koji se mogu potrošiti na sprovođenje istraživanja.

Statistička metoda za izračunavanje veličine uzorka

Sljedeći faktori utiču na veličinu statističkog uzorka:

    Dostupnost informacija o veličini populacije i stepenu njene homogenosti.

    Zahtevana tačnost rezultata, regulisana vrednošću maksimalno dozvoljene greške reprezentativnosti i vrednošću nivoa pouzdanosti sa kojim se donosi zaključak o pouzdanosti rezultata istraživanja.

    Dostupnost informacija o prosječnim pokazateljima opće populacije za karakteristiku koja se proučava ili o intervalu varijacije karakteristike (varijanse).

    Mogućnost ponovnog uključivanja jedinice populacije u uzorak.

Prilikom određivanja veličine uzorka za velike populacije (kada je veličina uzorka manja od 5% populacija) mogu se koristiti sljedeće formule:

a) ponovljeno uzorkovanje (ako je moguće da se jedinica opšte populacije ponovo uključi u uzorak) sa nepoznatom veličinom opšte populacije, ali poznata distribucija kontrolisani znak:

Gdje t- normalizovano odstupanje, koje je određeno odabranim nivoom pouzdanosti (na 95% nivoa pouzdanosti t= 1,96; na 99% nivou pouzdanosti t= 2,58); R - pronađena varijacija opšte populacije, u % ili u udjelima; q= 100 - R; D - dozvoljena greška, u % ili u udjelima;

b) ponovljeno uzorkovanje sa poznatom varijansom karakteristike koja se proučava (o):

c) uzorkovanje bez ponavljanja (sa izuzetkom mogućnosti ponovnog unosa jedinice opšte populacije u uzorak) sa poznatim volumenom opšte populacije i poznatom distribucijom kontrolisane karakteristike:

Gdje N- ;

d) nerepetitivno uzorkovanje sa poznatom varijansom karakteristike koja se proučava:

Uzorak se smatra malim ako njegova veličina prelazi 5% opće populacije, u kom slučaju se veličina uzorka može prilagoditi:

Gdje P" - veličina uzorka za malu populaciju, P - statistička veličina uzorka, N- veličina opšte populacije.

Proračun statističkog uzorkovanja s normaliziranim odstupanjem t= 2 i prihvatljiva greška od 5% (vidi tabelu 4.2) pokazuje da se za velike populacije veličina uzorka može odrediti na bilo koji način, pošto praktične tehnike koje se koriste imaju tendenciju da precijene veličinu populacije koja se ispituje.

Tabela 4.2 Ovisnost veličine uzorka o veličini populacije*

Veličina populacije

Veličina uzorka

* sa normalizovanim odstupanjem t= 2 i dozvoljena greška 5%.

Sa stola 4.2 jasno je da kada je veličina populacije veća od 5000, njena vrijednost ne utiče na veličinu uzorka, tako da formula može imati sljedeći oblik (vrijednost 1/ N može se zanemariti):

(4.6)

Na primjer, iz prethodnih istraživanja poznato je da je distribucija odgovora na pitanje koje zanima istraživača (npr. o statusu korisnika) bila 60% i 40% (60% ispitanika je potvrdno odgovorilo na pitanje o koristeći proizvod i 40% je odgovorilo negativno). Udio ciljnih ispitanika u ukupnom broju ispitanika je 70%. Za više detaljna analiza potrebno je da dobijete 100 pozitivnih odgovora. Da biste dobili ovaj rezultat, potrebno je da anketirate 238 ljudi:

Dakle, u nedostatku tačnih podataka o veličini i karakteristikama populacije (pod uslovom da je najmanje 5000), dovoljno je u uzorak uključiti 400 njenih predstavnika. Međutim, treba napomenuti da ako ćemo kontrolirati strukturu uzorka duž nekoliko parametara, tada će veličina uzorka biti mnogo veća. G. A. Churchill u svom radu “Marketing Research” daje pravilo u vezi s tim: “Veličina uzorka treba da pruži najmanje 100 zapažanja za svaku primarnu i najmanje 20-50 zapažanja za svaku sekundarnu komponentu klasifikacije”; Također se mora uzeti u obzir mogućnost da pojedinačni ispitanici uključeni u uzorak mogu biti nedostupni ili mogu odbiti da učestvuju u studiji.1

Broj ispitanika koje je potrebno intervjuisati da bi se dobio potreban broj pozitivnih odgovora na pitanje od interesa može se izračunati pomoću formule:

Gdje P - broj pozitivnih odgovora potrebnih za analizu; Pj - udio pozitivnih odgovora; R 2 - podijeliti ciljne grupe, izračunato kao proizvod svih udjela ispitanika koji ispunjavaju utvrđene uslove (starost, pol, status korisnika itd.).

Korištenje nomograma za izračunavanje veličine uzorka

Želja da se pojednostavi postupak izračunavanja veličine uzorka dovodi do kreiranja tabela, skala ili programa koji su usmjereni na osiguranje statističke pouzdanosti informacija, ali ne opterećuju korisnika poznavanjem posebnih formula iz oblasti statistike. Na primjer, postoji kalkulator uzorkovanja (www. shortway. to/few/calculator, htm), na Gallup web stranici (www. gallup. ru) možete pronaći tabelu koja povezuje indikatore veličine uzorka, distribucije odgovora sa standardnom greškom (Tabela 4.3).

Tabela 4.3 Odnos između indikatora veličine uzorka i distribucije odgovora i standardna greška

Distribucija odgovora,

Veličina uzorka

Nomogram je grafički način za određivanje veličine uzorka. Nomogram uključuje tri skale (slika 4.4). Na skali s lijeve strane postavlja se označavanje indikatora standardne devijacije ili raspodjela udjela karakteristike. Na desnoj skali, tačnost mjerenja je označena u obliku prihvatljive greške (polovina intervala) sa datom vjerovatnoćom povjerenja od 95 ili 99%. Oznake se vrše na srednjoj skali koja odgovara potrebnoj veličini uzorka. Oznake se prave na desnoj i lijevoj skali na nivou željenih vrijednosti indikatora (udio karakteristike i dozvoljene greške). Ove dvije oznake povezuju se lenjirom, a na sjecištu ravnala sa srednjom skalom postavlja se oznaka koja odgovara zapremini uzorka koja odgovara želji istraživača.

Rice. 4.4. Nomogram za određivanje veličine uzorka (95% nivo pouzdanosti)"

4.5. Određivanje veličine uzorka

Procedura plana uzorkovanja uključuje sekvencijalno rešenje sledeća tri zadatka:

Definicija objekta istraživanja;

Određivanje strukture uzorkovanja;

Određivanje veličine uzorka.

obično, predmet marketing istraživanja je skup objekata posmatranja, koji mogu biti potrošači, zaposleni u kompaniji, posrednici itd. Ako je ova populacija toliko mala da istraživački tim ima potrebne radne, finansijske i vremenske resurse da uspostavi kontakt sa svakim svojim elementom, onda je sasvim moguće provoditi kontinuirano proučavanje cjelokupne populacije. U tom slučaju, nakon što ste odredili predmet istraživanja, možete preći na sljedeću proceduru (odabir metode prikupljanja podataka, instrumenta istraživanja i načina komunikacije s publikom).

Međutim, u praksi često nije moguće ili preporučljivo provesti sveobuhvatno istraživanje cjelokupne populacije. Za to mogu postojati sljedeći razlozi:

Nemogućnost uspostavljanja kontakta sa nekim elementima totaliteta;

Nerazumno visoki troškovi za izvođenje kontinuirane studije ili prisustvo finansijskih ograničenja koja ne dozvoljavaju izvođenje kompletne studije;

Kratak vremenski okvir određen za istraživanje je zbog gubitka relevantnosti informacija tokom vremena ili drugih razloga i ne dozvoljava prikupljanje, sistematizaciju i analizu obimnih podataka za cjelokupnu populaciju.

Zbog toga se velike i raspršene populacije često proučavaju pomoću uzorka, koji se, kao što je poznato, podrazumijeva kao dio populacije namijenjen da predstavlja populaciju u cjelini.

Od toga zavisi tačnost s kojom uzorak odražava populaciju u cjelini struktura i veličina uzorka.

Postoje dva pristupa dizajnu uzorkovanja- probabilistički i deterministički.

Probabilistički pristup dizajnu uzorkovanja pretpostavlja da se bilo koji element populacije može odabrati sa određenom (ne-nultom) vjerovatnoćom. Postoji različite vrste uzorci zasnovani na teoriji vjerovatnoće (tipični, ugniježđeni, itd.). Najjednostavniji i najčešći u praksi je jednostavno nasumično uzorkovanje, u kojem svaki element populacije ima jednaku vjerovatnoću da bude odabran za istraživanje.

Uzorkovanje vjerovatnoće je preciznije i omogućava istraživaču da procijeni stepen pouzdanosti podataka koje je prikupio, iako je složenije i skuplje od determinističkog uzorkovanja.

Deterministički pristup na okvir uzorkovanja pretpostavlja da se odabir elemenata populacije vrši metodama zasnovanim ili na razmatranju pogodnosti, ili na odluci istraživača, ili na kontingentnim grupama.

iz razloga pogodnosti, sastoji se u odabiru bilo kojeg elementa populacije na osnovu lakoće uspostavljanja kontakta s njima. Nesavršenost ove metode je vjerovatno posljedica niske reprezentativnosti dobivenog uzorka, jer elementi populacije koji su pogodni za istraživača možda neće biti dovoljno reprezentativni predstavnici populacije zbog svog neslučajnog i nerazumnog odabira.

Međutim, s druge strane, jednostavnost, ekonomičnost i efikasnost istraživanja sprovedenog ovom metodom su ga doveli do prilično široke upotrebe u praksi, a pre svega tokom preliminarnih istraživanja u cilju razjašnjenja osnovnih problema.

Na osnovu metode uzorkovanja na odluku istraživača, sastoji se u odabiru elemenata populacije koji su, po njegovom mišljenju, njeni karakteristični predstavnici. Ova metoda je naprednija od prethodne, jer se zasniva na orijentaciji na karakteristične predstavnike populacije koja se proučava, iako je odabrana na osnovu subjektivnih predstava istraživača o njoj.

Metoda uzorkovanja zasnovana na kontingentni standardi, sastoji se u odabiru karakterističnih elemenata populacije u skladu sa prethodno dobijenim karakteristikama populacije u cjelini. Ove karakteristike se mogu dobiti provođenjem preliminarnih istraživanja i, za razliku od prethodne metode, nisu subjektivne. Stoga je ova metoda naprednija; omogućava dobijanje populacija uzoraka ne manje reprezentativnih od uzoraka vjerovatnoće uz znatno niže troškove za provođenje istraživanja.

Odabravši strukturu uzorka (pristup njegovom formiranju, tip probabilističkog ili determinističkog uzorkovanja), istraživač će morati da odredi zapreminu, tj. broj elemenata u populaciji uzorka.

Veličina uzorka određuje pouzdanost informacija dobijena kao rezultat njenog istraživanja, kao i troškovi neophodni za sprovođenje istraživanja. Veličina uzorka zavisi na nivou homogenosti ili raznolikosti objekata koji se proučavaju.

Što je veći uzorak, to je veća njegova tačnost i veći su troškovi provođenja istraživanja. Uz probabilistički pristup strukturi uzorka, njegov volumen se može odrediti korištenjem dobro poznatih statističkih formula, na osnovu specificiranih zahtjeva za njegovu tačnost.

U praksi se koristi nekoliko pristupa za određivanje veličine uzorka:

1. Slobodan pristup na osnovu primjene "pravila palca". Na primjer, prihvaćeno je bez dokaza da za dobijanje tačnih rezultata uzorak mora biti 5% populacije. Ovaj pristup je jednostavan i lak za implementaciju, ali nije moguće utvrditi tačnost dobijenih rezultata. Uz dovoljno veliku populaciju, može biti i prilično skupo.

Veličina uzorka se može postaviti na osnovu određenih unaprijed dogovorenih uslova. Na primjer, korisnik marketinškog istraživanja zna da je prilikom proučavanja javnog mnijenja uzorak obično 1000-1200 ljudi, pa preporučuje istraživaču da se drži ove brojke. Ako se godišnje istraživanje provodi na određenom tržištu, tada se svake godine koristi uzorak iste veličine. Za razliku od prvog pristupa, ovdje se pri određivanju veličine uzorka koristi dobro poznata logika, koja je, međutim, vrlo ranjiva.

Na primjer, prilikom provođenja određenih studija može biti potrebna manja preciznost nego kod proučavanja javnog mnijenja, a veličina populacije može biti višestruko manja nego kada se proučava javno mnijenje. Stoga ovaj pristup ne uzima u obzir trenutne okolnosti i može biti prilično skup.

U nekim slučajevima, trošak provođenja ankete se koristi kao glavni argument pri određivanju veličine uzorka. Dakle, budžetom marketinškog istraživanja predviđeni su troškovi provođenja određenih anketa, koji se ne mogu prekoračiti. Očigledno, vrijednost primljenih informacija nije uzeta u obzir. Međutim, u nekim slučajevima, mali uzorak može dati prilično točne rezultate.

Čini se razumnim razmotriti troškove ne u apsolutnim iznosima, već u odnosu na korisnost informacija dobijenih iz sprovedenih anketa. Klijent i istraživač treba da uzmu u obzir različite veličine uzoraka i metode prikupljanja podataka, troškove i druge faktore

2. Veličina uzorka iz nivoa intervala pouzdanosti dozvoljene greške, što je, kao što je već pomenuto, određeno svrsishodnom tačnošću konačnih generalizacija: od povećane do indikativne. Međutim, ovo se odnosi na takozvane slučajne greške povezane sa prirodom bilo koje statističke greške. Izračunavaju se kao greške u reprezentativnosti uzoraka vjerovatnoće.

V. I. Paniotto daje sljedeće proračune za reprezentativni uzorak uz pretpostavku greške od 5 posto (tabela 4.2).

Tabela 4.2

Primer tabele proračuna

Za populaciju veću od 100.000, veličina uzorka je 400 jedinica. Ako imamo u vidu opšte populacije od 5 hiljada i više, onda, prema proračunima istog autora, možemo ukazati na veličinu stvarne greške uzorkovanja u zavisnosti od njenog obima, što je za nas veoma važno, imajući u vidu da veličina dozvoljene greške zavisi od namjene studije i ne mora biti blizu nivoa od 5 posto.

Tabela 4.3

Tablica proračuna

Uz slučajne greške, moguće su i sistematske greške. One zavise od organizacije uzorka istraživanja. To su različite pristranosti uzorkovanja prema jednom od polova parametra uzorka.

3. Veličina uzorka na osnovu statističke analize . Ovaj pristup se zasniva na određivanju minimalne veličine uzorka na osnovu određenih zahtjeva za pouzdanost i validnost dobijenih rezultata. Koristi se i kada se analiziraju rezultati dobijeni za pojedinačne podgrupe formirane unutar uzorka prema polu, starosti, stepenu obrazovanja itd. Zahtjevi za pouzdanost i tačnost rezultata za pojedinačne podgrupe diktiraju određene zahtjeve za veličinu uzorka u cjelini.

Najteorijski zasnovan i najispravniji pristup određivanju veličine uzorka zasniva se na izračunavanju vjerodostojnih intervala. Koncept varijacije karakteriše količinu različitosti (sličnosti) odgovora ispitanika na određeno pitanje. U strožijem smislu, varijacija vrijednosti neke karakteristike u agregatu je razlika u njenim vrijednostima među različitim jedinicama date populacije u istom periodu ili trenutku. Rezultati anketnih odgovora se obično prikazuju u obliku krive distribucije (slika 4.1). Kada je sličnost odgovora velika, govorimo o niskoj varijaciji (uska kriva distribucije), a kada je sličnost odgovora niska, govorimo o visokoj varijaciji (široka kriva distribucije).

Kao mjera varijacije obično se uzima standardna devijacija, koja karakteriše prosječnu udaljenost od prosječne procjene odgovora svakog ispitanika na određeno pitanje.

Mala varijacija

Visoka varijacija

Rice. 4.1. Krivulje varijacije i distribucije

Budući da se sve marketinške odluke donose u uvjetima neizvjesnosti, preporučljivo je uzeti u obzir ovu okolnost prilikom određivanja veličine uzorka. Budući da se određivanje proučavanih vrijednosti za populaciju na uski način vrši na osnovu statistike uzorka, potrebno je utvrditi raspon (interval pouzdanosti) u kojem se očekuju procjene za populaciju u cjelini. pad, i greška u njihovoj odluci.

Interval pouzdanosti je raspon čije ekstremne tačke odgovaraju određenom procentu određenih odgovora na pitanje. Interval pouzdanosti je usko povezan sa standardnom devijacijom karakteristike koja se proučava u populaciji: što je veći, širi interval povjerenja mora biti da bi se uključio određeni postotak odgovora.

Interval pouzdanosti od 95% ili 99% je standard za provođenje istraživanja tržišta. Nijedna kompanija ne provodi marketinško istraživanje koristeći više uzoraka. I matematička statistika omogućava da se dobiju neke informacije o distribuciji uzorkovanja, imajući samo podatke o varijaciji jednog uzorka.

Indikator stepena do kojeg se istinita procjena za populaciju u cjelini razlikuje od procjene očekivane za tipičan uzorak je srednja kvadratna greška. Štaviše, što je veća veličina uzorka, manja je greška. Velika vrijednost varijacije uzrokuje visoku vrijednost greške i obrnuto.

Kada postoje samo dva moguća odgovora na dato pitanje, izražena u procentima (koristi se procentualna mjera), veličina uzorka se određuje sljedećom formulom:

gdje je n veličina uzorka; z – normalizovano odstupanje, određeno na osnovu izabranog nivoa pouzdanosti; p – pronađena varijacija za uzorak; g – (100-r); e – dozvoljena greška.

Prilikom određivanja indeksa varijacije za određenu populaciju, prije svega je preporučljivo provesti preliminarnu kvalitativnu analizu populacije koja se proučava, prije svega, kako bi se utvrdila sličnost populacijskih jedinica u demografskom, socijalnom i drugim aspektima od interesa za populaciju. istraživač. Moguće je provesti pilot istraživanje, koristeći rezultate sličnih studija provedenih u prošlosti. Kada se koristi procentualna mjera varijabilnosti, uzima se u obzir da se maksimalna varijabilnost postiže za p = 50%, što je najgori slučaj. Štaviše, ovaj pokazatelj ne utječe radikalno na veličinu uzorka. Takođe se uzima u obzir mišljenje naručioca istraživanja o veličini uzorka.

Moguće je odrediti veličinu uzorka koristeći srednje vrijednosti umjesto postotaka.

gdje je s standardna devijacija.

U praksi, ako je uzorak novoformiran, a slična istraživanja nisu sprovedena, onda je s nepoznat. U ovom slučaju, preporučljivo je postaviti grešku e u dijelovima standardne devijacije. Formula izračuna se transformira i poprima sljedeći oblik:

Gdje .

Gore je bilo riječi o agregatima vrlo velikih veličina. Međutim, u nekim slučajevima agregati nisu veliki. Obično, ako je uzorak manji od pet posto populacije, tada se populacija smatra velikom i proračuni se provode prema gore navedenim pravilima. Ako veličina uzorka prelazi 5% populacije, onda se potonja smatra malom i faktor korekcije se uvodi u gornje formule.

Veličina uzorka se u ovom slučaju određuje na sljedeći način:

,

Određivanje veličine uzorka vjerovatnoće

Volume verovatnoća uzorkovanja se određuje pomoću posebnih formula, zavisno od datog pouzdanost, tačnost istraživanja i varijanse opšta populacija.

Teorijska osnova za mogućnost korištenja uzorka istraživanja procijeniti karakteristike stanovništvo je centralna granična teorema.

Centralna granična teorema stanja: za jednostavne slučajne uzorke volumen br, izolovani od opšte populacije sa pravom srednjom μ I disperzija σ2, Za velika n distribucija uzoraka srednjih vrijednosti približava se normalnom sa centrom jednakim pravoj sredini i varijansom jednakom omjeru varijanse populacije i veličine uzorka, odnosno:

Teorema je tačna za bilo koju distribuciju frekvencija u populaciji, ali što je distribucija u populaciji bliža normalnoj, to je manja veličina uzorka potrebna da bi se postigla ekvivalentna pouzdanost i tačnost studije.

U praksi, istraživač formira samo jedan uzorak iz populacije i treba da zna koja veličina uzorka treba da bude da bi se održali navedeni parametri pouzdanosti i tačnosti. Formula za određivanje veličine uzorka prilikom procjene prosjeka može se izvesti na osnovu odredbi centralne granične teoreme, i ima oblik:

n- potrebna veličina uzorka;

z- broj intervala koji karakterišu zahtjev za pouzdanošću studije;

H- traženu vrijednost tačnosti istraživanja;

σ2- disperzija opšte populacije.

Pogledajmo bliže parametre na desnoj strani jednačine.

Kredibilitet karakterizira vjerovatnoću da određeni slučajni uzorak adekvatno odražava karakteristike populacije.

Pouzdanost od 99% znači da će u 99 uzoraka od 100 srednja vrijednost populacije biti unutar intervala srednje vrijednosti dobivene kao rezultat studije uzorka.

Primjer . Na primjer, sprovedene su tri nezavisne uzorke studije nivoa prihoda stanovništva u određenom regionu. Dobijeni su sljedeći podaci o prosječnom nivou prihoda: 300 10 UAH, 310 10 UAH, 305 10 UAH, prava prosječna vrijednost je 302 UAH.

Kao što vidimo, prava prosječna vrijednost je uključena u sva tri intervala.

Sa pouzdanošću od 99% i navedenom preciznošću od 10 UAH. u 99 uzoraka od sto, prosjek uzorka će biti u rasponu od 292 do 312 UAH. U jednom od stotinu, dobit ćemo rezultat ispod 292 UAH ili više od 312 UAH. Rezultati takve studije će biti nepouzdani, jer prosek opšte populacije neće biti uključen u koridor prosečne vrednosti dobijene kao rezultat studije uzorka.

U prikazanoj formuli, pouzdanost se karakteriše z vrednošću koja se određuje iz tabele z-distribucije u zavisnosti od navedene pouzdanosti u procentima.

Predstavljamo korespondenciju samo za neke tipične vjerovatnoće: 68,26% (z=1), 95,45% (z=2), 99,73% (z=3).

z-distribucija – Standardna normalna (Z) distribucija

z vrijednost je broj standardnih grešaka za koje je tačka uklonjena iz srednje vrijednosti.

Umjesto tabele za izračunavanje vjerovatnoće da slučajna varijabla padne u označeni (osenčeni) raspon

Možete koristiti sljedeću EXCEL formulu:

2*NORMSDIST(z)-1

zamjenjujući traženu z vrijednost u njega. Na primjer:

Preciznost određuje istraživač na osnovu konkretnog zadatka.

Ako je vrijednost koja se proučava apsolutna, tada tačnost treba biti predstavljena kao apsolutna, a ne relativna vrijednost. Prilikom utvrđivanja postotaka (udjela) tačnost se utvrđuje u postocima.

Prilikom utvrđivanja tačnosti, istraživač mora uzeti u obzir moguća studija dinamika indikatora.

Primjer . Na primjer, ako je s točnošću od 10 UAH. Rezultati studije prošle godine utvrdili su prosječni prihod od 300 UAH, a ove godine je 305 UAH. Netačno je izvoditi zaključke o povećanju prihoda, jer veličina promjene je unutar navedenog intervala točnosti (manje od 10 UAH).

Najteža stvar pri izračunavanju veličine uzorka je određivanje varijanse . Prilikom procjene prosjeka javljaju se dva glavna slučaja:

1) varijansa populacije je poznata na osnovu prethodnih studija;

2) varijansa populacije je nepoznata.

Mogućnost korištenja varijansa dobijena iz prethodnih studija, zasniva se na činjenici da je ovaj parametar populacije inercijski od prosjeka. Drugim riječima, mijenja se sporije i stoga, ako, na primjer, svake godine proučavate nivo prihoda stanovništva, možete koristiti iznos varijanse dobijen u prošlogodišnjim studijama.

Primjer izračuna veličine uzorka.

Prvo, na veličinu uzorka utiče nivo samopouzdanja α, koji se koristi za određivanje pomoću posebne tabele normalizovano odstupanje z. Na primjer, za slučaj α = 99%, iz tabele nalazimo z = 2,58.

Drugo, utiče nivo (koeficijent) varijacije . Uzmimo, na primjer, koeficijent varijacije = 50%.

Treće, na veličinu uzorka utiče potrebno tačnost (dozvoljena greška)

Ako Ne znate ništa o opštem nivou, zatim za procjenu nivoa disperzije moguće je koristiti tri sigma pravila . Uz normalnu distribuciju, 99% parametara karakteristika bi trebalo biti u intervalu plus ili minus tri sigma od pravog prosjeka. Kada provodite istraživanje, trebali biste procjena tipične gornje ( b) i niže (a ) nivoi parametara, interval između kojih je šest sigma. Sigma vrijednost će biti razlika u nivoima parametara podijeljena sa 6.

Disperzija ili varijacija var:

,

Gdje b, a– gornju i donju vrijednost parametra, redom.

Sigma je srednja kvadratna devijacija (standardna devijacija):

.

Primjer . Na primjer, prilikom istraživanja nivo prihoda donja vrijednost parametra uzima se na nivou od 0 UAH, a gornja vrijednost, pretpostavimo, na nivou od 6000 UAH. U ovom slučaju vrijednost srednja kvadratna (standardna) devijacija biće: (6000-0)/6=1000.

Treba napomenuti da ako je istraživač zaista spreman za istraživanje, onda se određivanje tipičnog nižeg i gornja granica parametri nisu posebno teški.

Kada radite sa marketinškim skalama, prihvaćeni iznos varijanse zavisi od broja tačaka skale i vrste distribucije frekvencije.

Razmatra se najgori slučaj u marketinškom istraživanju (koji odgovara maksimalnoj varijansi). ujednačena distribucija odgovori između tačaka na skali. Najbolje je normalno sa maksimalnom učestalošću odgovora u sredini skale.

Tabela 5.1. Tipični rasponi disperzije u zavisnosti od broja tačaka na skali

Donji nivoi opsega odgovaraju normalna distribucija frekvencije, gornje – ujednačene.

Primjenjuje se formula za određivanje veličine uzorka o kojoj je bilo riječi pri procjeni prosjeka.

Ako istraživač radi sa procentima ili udjelima, tada se formula transformira u sljedeći oblik:

,

gdje je p udio ljudi koji na pitanje odgovaraju pozitivno ili negativno.

Kada radite s procentima, zamijenite 100 umjesto jedan u formuli.

Očigledno, maksimalna vrijednost množitelja (1-r)r se javlja sa jednakim udjelom pozitivnih i negativnih odgovora i iznosi 0,25 kada se radi sa dionicama, a 2500 kada se radi sa procentima. Međutim, rezultat pri radu sa dionicama ili procentima će biti ekvivalentan, jer će se brojčana vrijednost kvadrata tačnosti u nazivniku također razlikovati za faktor od 10.000.

Osim kada se primjenjuje konačni faktor prilagođavanja stanovništva. Ovo može izgledati nevjerovatno, ali ako razmislite o tome, ova izjava ima smisla. Na primjer, ako su proučavane karakteristike svih elemenata populacije identične, onda je uzorak koji se sastoji od jednog elementa sasvim dovoljan za izračunavanje prosjeka. Ovo važi i ako se populacija sastoji od 50, 500, 5000 ili 50000 elemenata.

Istovremeno, varijabilnost karakteristika populacije direktno utiče na veličinu uzorka. Ova varijabilnost se uzima u obzir prilikom izračunavanja veličine uzorka koristeći varijansu populacije σ2 ili varijansu uzorka s2.

Primjer (N.B. Safronova, I.E. Korneeva). Izračunajmo uzorak za marketinšku studiju o svijesti potrošača o brendu. Vrijednost vjerovatnoće P = 0,954, maksimalna dozvoljena greška ove studije ne bi trebala biti veća od 5%. Koliko bi ispitanika bilo potrebno ispitati da bi se ovaj problem riješio slučajnim ponovnim uzorkovanjem, s obzirom da nema podataka o distribuciji karakteristika?

Rješenje . Pošto je udio atributa nepoznat, pretpostavimo da 50% potrošača zna zaštitni znak, a 50% - ne. Koristimo formulu za izračunavanje uzorka uzimajući u obzir udio karakteristike:

= =400 ljudi

Sofisticiranije metode za izračunavanje veličine uzorka su potrebne kada se u procesu analize koristi dvostruka ili trostruka tabela. To je zbog činjenice da se pouzdanost i tačnost postignuta izračunatom veličinom uzorka za uzorak u cjelini ne postižu za njegove pojedinačne dijelove na koje se uzorak dijeli tokom procesa tabele.

Primjer . Na primjer, pri određivanju prosječnog nivoa prihoda stanovništva, određena veličina uzorka može biti dovoljna, ali nije dovoljna da se odredi prosječan nivo prihoda muškaraca i žena (sa zadatom tačnošću i pouzdanošću). Ovo je lako razumeti jer je broj muškaraca i žena koji su učestvovali u anketi odvojeno manji od broja svih ispitanika. Poznavajući, međutim, omjer muškaraca i žena, lako je odrediti s kojom se tačnošću izračunava nivo prosječnog dohotka za svaku od razmatranih grupa.

Određivanje veličine uzorka: prosjek

Metoda koja se koristi za kreiranje intervala pouzdanosti može se modificirati kako bi se odredila veličina uzorka na osnovu željenog intervala povjerenja. Pretpostavimo da želite preciznije procijeniti mjesečnu potrošnju robne kuće domaćinstva, tako da rezultat bude unutar ±5,00 dolara od pravog prosjeka stanovništva. Kolika bi trebala biti veličina uzorka? U tabeli 12.2 neophodna lista radnju koju morate izvršiti.

1. Odredite stepen tačnosti. Ovo je najveća dozvoljena razlika (D) između srednje vrijednosti uzorka i srednje vrijednosti populacije. U našem primjeru D=±$5,00.

2. Odredite nivo pouzdanosti. Pretpostavimo da je željeni nivo pouzdanosti 95%.

3. Odredite vrijednost r pridruženu datom nivou pouzdanosti koristeći tabelu. 2 u dodatku "Statističke tabele". Na nivou pouzdanosti od 95%, vjerovatnoća da će srednja vrijednost populacije biti izvan jednostranog intervala je 0,025 (0,05/2). Odgovarajuća vrijednost r je 1,96.

4. Odredite standardnu ​​devijaciju srednje vrijednosti populacije. Može se dobiti iz sekundarnih izvora ili izračunati provođenjem pilot studije. Dodatno, standardna devijacija se može postaviti na osnovu mišljenja istraživača. Na primjer, raspon normalno raspoređene varijable je otprilike šest standardne devijacije(po tri lijevo i desno od prosjeka). Dakle, standardna devijacija se može izračunati dijeljenjem vrijednosti cijelog raspona sa 6. Istraživač često može odrediti veličinu raspona na osnovu vlastitog razumijevanja fenomena koji se analizira.

5. Odredite veličinu uzorka koristeći standardnu ​​grešku formule srednje vrijednosti:

U našem primjeru

(zaokruženo na najbliži cijeli broj).

standardna devijacija uzorka 5 je 50,00. Tada će ispravljeni interval pouzdanosti biti

Imajte na umu da je rezultujući interval pouzdanosti uži od očekivanog. To je zbog činjenice da standardna devijacija populacija je naduvana na osnovu karakteristika uzorka.

8. Ponekad se tačnost definiše u relativnom, a ne u apsolutnom smislu. Drugim riječima, može se znati da bi rezultat proračuna trebao biti plus ili minus R% od prosjeka. To znači da D = rm.

U ovom slučaju, veličina uzorka se može odrediti kao

Veličina populacije N ne utiče direktno na veličinu uzorka osim ako se ne primeni konačni faktor prilagođavanja populacije. Ovo može izgledati nevjerovatno, ali ako razmislite o tome, ova izjava ima smisla. Na primjer, ako su karakteristike svih elemenata u populaciji koja se proučava identična, tada je uzorak koji se sastoji od jednog elementa dovoljan za izračunavanje prosjeka. To vrijedi i ako se populacija sastoji od 50,500,5000 ili 50000 elemenata. Istovremeno, varijabilnost karakteristika populacije direktno utiče na veličinu uzorka. Ova varijabilnost se uzima u obzir pri izračunavanju veličine uzorka koristeći varijansu populacije s2 ili varijansu uzorka s2.

Ukupan broj objekata posmatranja (ljudi, domaćinstva, preduzeća, naselja itd.), koji posjeduju određeni skup karakteristika (pol, starost, prihod, broj, promet itd.), ograničen u prostoru i vremenu. Primjeri populacija

  • Svi stanovnici Moskve (10,6 miliona ljudi prema popisu iz 2002.)
  • Moskovljani (4,9 miliona ljudi prema popisu iz 2002.)
  • Pravna lica Rusija (2,2 miliona na početku 2005.)
  • Maloprodajni objekti za prodaju prehrambenih proizvoda (20 hiljada početkom 2008. godine) itd.

Uzorak (uzorak populacije)

Dio populacije odabran za proučavanje kako bi se izveli zaključci o cijeloj populaciji. Da bi se zaključak dobijen proučavanjem uzorka proširio na cijelu populaciju, uzorak mora imati svojstvo reprezentativnosti.

Reprezentativnost uzorka

Svojstvo uzorka da ispravno odražava populaciju. Isti uzorak može biti reprezentativan i nereprezentativan za različite populacije.
primjer:

  • Uzorak koji se u potpunosti sastoji od Moskovljana koji posjeduju automobil ne predstavlja cjelokupnu populaciju Moskve.
  • Uzorak ruskih preduzeća sa do 100 zaposlenih ne predstavlja sva preduzeća u Rusiji.
  • Uzorak Moskovljana koji kupuju na pijaci ne predstavlja kupovno ponašanje svih Moskovljana.

Istovremeno, ovi uzorci (podložni drugim uvjetima) mogu savršeno predstavljati Moskovljane koji su vlasnici malih i srednjih automobila. Ruska preduzeća i kupci koji kupuju na pijacama, respektivno.
Važno je shvatiti da su reprezentativnost uzorka i greška uzorkovanja različite pojave. Reprezentativnost, za razliku od greške, ni na koji način ne zavisi od veličine uzorka.
primjer:
Koliko god da povećamo broj ispitanih Moskovljana koji su vlasnici automobila, nećemo moći da predstavimo sve Moskovljane ovim uzorkom.

Greška uzorkovanja (interval pouzdanosti)

Odstupanje rezultata dobijenih posmatranjem uzorka od istinitih podataka opšte populacije.
Postoje dvije vrste greške uzorkovanja – statistička i sistematska. Statistička greška zavisi od veličine uzorka. Što je veći uzorak, to je manji.
primjer:
Za jednostavan slučajni uzorak od 400 jedinica, maksimalna statistička greška (sa 95% nivoa pouzdanosti) je 5%, za uzorak od 600 jedinica - 4%, za uzorak od 1100 jedinica - 3% Obično, kada se govori o uzorkovanju greška, oni znače statističku grešku.
Sistematska greška zavisi od različitih faktora koji stalno utiču na studiju i pristrasnost rezultata studije u određenom pravcu.
primjer:

  • Korištenje bilo kojeg uzorka vjerovatnoće će potcijeniti udio ljudi s visokim prihodima koji vode aktivan životni stil. To se događa zbog činjenice da je mnogo teže pronaći takve ljude na bilo kojem određenom mjestu (na primjer, kod kuće).
  • Problem odbijanja ispitanika da odgovore na pitanja (udio „odbijača“ u Moskvi, za različita istraživanja, kreće se od 50% do 80%)

U nekim slučajevima, kada su poznate prave distribucije, sistematska greška se može izravnati uvođenjem kvota ili ponovnom ponderacijom podataka, ali u većini stvarnih studija može biti prilično problematično čak i procijeniti je.

Tipovi uzoraka

Uzorci su podijeljeni u dvije vrste:

  • vjerovatnoća
  • nevjerovatni

1. Uzorci vjerovatnoće
1.1 Slučajno uzorkovanje (jednostavno nasumično uzorkovanje)
Takav uzorak pretpostavlja homogenost opće populacije, istu vjerovatnoću dostupnosti svih elemenata, prisutnost puna lista svi elementi. Prilikom odabira elemenata, u pravilu se koristi tabela slučajnih brojeva.
1.2 Mehaničko (sistematsko) uzorkovanje
Vrsta slučajnog uzorka, poredanog prema nekim karakteristikama (abecedni red, broj telefona, datum rođenja, itd.). Prvi element se bira nasumično, zatim, korakom 'n', svaki 'k' element se bira. Veličina populacije, u ovom slučaju – N=n*k
1.3 Stratificirano (zonirano)
Koristi se u slučaju heterogenosti populacije. Opća populacija je podijeljena na grupe (stratume). U svakom stratumu selekcija se vrši nasumično ili mehanički.
1.4 Serijsko (klaster ili klaster) uzorkovanje
U serijskom uzorkovanju, jedinice selekcije nisu sami objekti, već grupe (klasteri ili gnijezda). Grupe se biraju nasumično. Objekti unutar grupa se ispituju na veliko.

2. Nevjerovatni uzorci
Odabir u takvom uzorku se ne vrši prema principima slučajnosti, već prema subjektivnim kriterijima - dostupnosti, tipičnosti, jednakoj zastupljenosti itd.
2.1. Uzorkovanje kvota
U početku se identifikuje niz grupa objekata (na primjer, muškarci u dobi od 20-30 godina, 31-45 godina i 46-60 godina; osobe sa prihodima do 30 hiljada rubalja, sa prihodima od 30 do 60 hiljada rubalja i sa prihodom preko 60 hiljada rubalja ) Za svaku grupu je određen broj objekata koji se moraju ispitati. Broj objekata koji treba da spadaju u svaku od grupa najčešće se postavlja ili proporcionalno prethodno poznatom udelu grupe u opštoj populaciji, ili isti za svaku grupu. Unutar grupa, objekti se biraju nasumično. Uzorkovanje kvota se koristi prilično često.
2.2. Metoda grudve snijega
Uzorak je konstruiran na sljedeći način. Od svakog ispitanika, počevši od prvog, traže se kontakt podaci njegovih prijatelja, kolega, poznanika koji bi odgovarali uslovima selekcije i koji bi mogli učestvovati u istraživanju. Dakle, sa izuzetkom prvog koraka, uzorak se formira uz učešće samih subjekata istraživanja. Metoda se često koristi kada je potrebno pronaći i intervjuisati teško dostupne grupe ispitanika (na primjer, ispitanike s visokim primanjima, ispitanike koji pripadaju istoj profesionalnoj grupi, ispitanike sa sličnim hobijima/interesovanjima, itd.)
2.3 Spontano uzorkovanje
Intervjuisani su najpristupačniji ispitanici. Tipični primjeri spontani uzorci - u novinama/časopisima, dati ispitanicima na samostalno popunjavanje, većina onlajn anketa. Veličina i sastav spontanih uzoraka nije unaprijed poznat, a određen je samo jednim parametrom – aktivnošću ispitanika.
2.4 Uzorak tipičnih slučajeva
Odabiru se jedinice opće populacije koje imaju prosječnu (tipičnu) vrijednost karakteristike. Ovo postavlja problem odabira karakteristike i određivanja njene tipične vrijednosti.

Kurs predavanja iz teorije statistike

Više detaljne informacije za uzorke zapažanja se mogu dobiti pregledom.



Novo na sajtu

>

Najpopularniji