Mājas Zobu ārstēšana Izlases populācijas lieluma noteikšana. Izlases lielums - socioloģiskā pētījuma izlases metode

Zobu ārstēšana

Izlases populācijas lieluma noteikšana. Izlases lielums - socioloģiskā pētījuma izlases metode

Parauga lieluma aprēķins

No visiem slavenajiem Gallup aptaujātajiem jautājumiem vispopulārākais ir šāds: kā jūs varat spriest, ko domā 250 miljoni amerikāņu pēc 1000 cilvēku intervēšanas?

Lai atbildētu uz šo jautājumu, jāmin ne tikai darbinieku augstā kvalifikācija un plašā praktiskā pieredze, bet arī statistikas un matemātikas izmantošana. Ja aptaujas metodes nav balstītas uz zinātni, rezultāti var būt maldinoši.

Statistikā tiek pieņemta šāda izlases lieluma robeža. Izlases lielums, kas ir pietiekams, lai izslēgtu nejaušību un iegūtu regulārus statistiskos raksturlielumus, ir 30. Šāda lieluma izlasi sauc par mazs Atribūtu vērtību sadalījuma raksturs mazos paraugos tuvojas normālam, jo palielinās testu skaits. Minimālais izlases lielums, kas ļauj iegūt raksturlieluma vidējās vērtības ar ticamības varbūtības norādi, ir 5. Šāda izmēra paraugus sauc īpaši mazs. Atribūtu vērtību sadalījumu šādos paraugos raksturo Studenta sadalījums. Bet visbiežāk socioloģijā viņi nodarbojas ar daudz lielāku izlases lielumu.

Plānojot izlases aptauju, pienāk brīdis, kad jāizlemj, cik cilvēkus intervēt, t.i. kādam jābūt izlases lielumam? Šis lēmums ir ārkārtīgi svarīgs, jo pārāk liels paraugs radīs nevajadzīgas izmaksas, bet pārāk mazs – pasliktinās rezultātu kvalitāti.

Parauga lielums- kopējais izlases populācijā iekļauto novērojumu vienību skaits.

Tā kā izlases kopa ir daļa populācija, atlasīts, izmantojot īpašas metodes, - svarīgi, lai šī daļa neizkropļo priekšstatu par veselumu, t.i. pārstāvēja viņu. Sociologus, kuri bieži veic empīriskus pētījumus, pastāvīgi uztrauc jautājums par to, cik daudz cilvēku ir jāiztaujā, lai iegūtu ticamu informāciju? Gallup institūts ASV veic regulāras aptaujas 1,5 tūkstošu cilvēku valsts izlasē un sasniedz pārsteidzošu precizitāti (izlases kļūda svārstās no 1 līdz 1,5%). Krievijas Zinātņu akadēmijas Socioloģijas institūta Socioekspresa centrs veic pētījumus par 2 tūkstošiem cilvēku, un izlases kļūda nepārsniedz 3% 31 .

Eksperti uzskata, ka labākais paraugs ne vienmēr ir liels. Protams, jo lielāks ir izlases lielums, jo augstāka ir tā rezultātu precizitāte. Taču pat milzīga izlase negarantē panākumus, ja populācija ir “slikti sajaukta”, t.i. ir neviendabīgs. Homogēns tiek ņemta vērā kopa, kurā kontrolētais raksturlielums ir vienmērīgi sadalīts un neveido tukšumus vai kondensāciju. Šajā gadījumā, aptaujājot vairākus cilvēkus, var iegūt precīzu informāciju par šīs pazīmes izplatību kopējā populācijā.

Tādējādi datu reprezentativitāti ietekmē nevis izlases kopas kvantitatīvās īpašības (tās apjoms), bet gan kopējās populācijas kvalitatīvās īpašības - tās viendabīguma pakāpe.

Socioloģijā vēl nav izdomāta vienota un skaidra formula, pēc kuras varētu aprēķināt izlases populācijas optimālo lielumu – tādas formulas dabā vienkārši nav. Un tas ir izskaidrots ļoti vienkārši. Fakts ir tāds, ka izlases kopas lieluma noteikšana nav tik daudz statistikas problēma, cik būtiska problēma. Citiem vārdiem sakot, izlases kopas lielums ir atkarīgs no daudziem faktoriem, tostarp mērķiem un uzdevumiem, teorētiskā modeļa, hipotēzēm un pētījumu metodēm, populācijas viendabīguma pakāpes un, visbeidzot, nepieciešamās saņemtās informācijas precizitātes.

Mums vienmēr jāatceras, ka katrs procentuālais informācijas precizitātes pieaugums pētījumā noved pie straujš pieaugums izdevumi tā īstenošanai. Slavenais Gallup institūts, kas ASV ir veicis aptaujas daudzus gadu desmitus, ir atklājis, ka ar 100 cilvēku valsts izlasi izlases kļūda būs ±11% robežās; 200 cilvēki - ±8%; 400 - ±6%; 600 - ±5%; 750 -±4%; 1000 - ±4%; 1500 - ±3%; 4000 cilvēku - ±2%. Tāpēc viņš veic nacionālo aptauju Amerikas Savienotajās Valstīs 1500–2000 cilvēku izlasē. Kā redzams, viņš dod priekšroku kļūdas palielinājumam par 1%, nevis vairākkārtējai pētījuma izmaksu pieaugumam.

Prakse rāda, ka daudziem sociologiem izlases lieluma pamatojums ir klupšanas akmens, neskatoties uz ievērojamo literatūras daudzumu, kas veltīts izlases metodēm un jo īpaši izlases lieluma aprēķināšanai. Ir vairāki iemesli: 1) trūkums specializētā literatūra perifērijā; 2) laika trūkums pašizglītībai; 3) nespēja lietot matemātisko aparātu. Šajā sakarā ir jāizklāsta stratēģija un taktika izlases lieluma pamatošanai bez sarežģītām matemātiskām formulām.

Izlases lieluma aprēķināšanas procedūra ir nebeidzamu kompromisu ķēde starp vēlmi pēc precizitātes un ierobežotiem resursiem, laika trūkumu un nepilnīgu informāciju par pētāmo parādību. Tajā pašā laikā šī ir zinātne un māksla, kuras zināšanas ir pieejamas ikvienam. Tomēr, lai to izdarītu, jums jāzina izlases lieluma aprēķināšanas stratēģijas (provizoriskais aprēķins, secīgās un kombinētās stratēģijas), kā arī faktori, kas ietekmē izlases lielumu (populācijas lielums, respondentu atbilžu atšķirības, aplēses precizitāte, paredzamā atbilžu sadalījuma raksturs, pētījuma metode, apstrādes procedūra) .

Iepriekšēja aprēķinu stratēģija ir tas, ka izlases lielumu nosaka pirms galvenā pētījuma veikšanas. Vienkāršākajā gadījumā var izmantot jau uzkrāto pieredzi, piemēram, Gallup institūtā, kura izlases lielums ir aptuveni 1500-2000 cilvēku. Vidējā vietējā pētījumā izlases lielums ir aptuveni 400–600 cilvēku.

Lai aprēķinātu nejaušās izlases lielumu, jums jāzina vēlamā novērtējuma precizitāte, iegūtās atbildes riska lielums un atbildes mainīguma pakāpe. Tradicionāli novērtējuma precizitāte tiek uzskatīta par 5%, bet riska vērtība ir 0,95. Proti, ja pēc izlases pētījuma 60% respondentu ir apmierināti ar savu darbu, tad var apgalvot, ka kopējā populācijā apmierināto īpatsvars 95% gadījumu būs no 55 līdz 65%, un 5% gadījumu šī proporcija var būt ārpus šī intervāla. Pieņemot 5% precizitāti un riska vērtību 0,95, izlases lielums būs šāds (2.4. tabula).

Tabula 2.4 Izlases lieluma atkarība no populācijas lieluma

Rezultāti parādīti tabulā. 2.4., liecina pret izplatīto nepareizo priekšstatu, ka izlases lielums ir stingri noteikta procentuālā daļa no vispārējās populācijas, kas vienāda ar 10. Faktiski šī vērtība nav konstante, bet gan mainīgais, kas mainās konkrētos apstākļos. Izlases lielums ir atkarīgs arī no tā, kādi jautājumi tiek izmantoti anketā. Tabulā norādītie skaitļi. 2.4 ir derīgi tikai vienam gadījumam - ja runa ir par dihotomu jautājumu, kuram maksimālais atbilžu sadalījums ir 50 līdz 50%. Bez iepriekšējas informācijas par aplēšu izplatību sociologs it kā iepriekš apdrošina un uzskata, ka šī izplatība būs 50 līdz 50%. Ja šāda informācija ir pieejama, izlases lielums būs šāds.

2.5. tabula Izlases lieluma atkarība no dihotomās atbildes sadalījuma

Tabulā 2.5. attēlā parādīts atbilžu sadalījums uz kvalitatīviem jautājumiem. Izlases lieluma aprēķins kvantitatīviem jautājumiem, kas ietver vecumu un alga", ir balstīta uz variācijas koeficientu (2.6. tabula), kas parāda, cik procentu ir standarta novirze no vidējā aritmētiskā, un ļauj salīdzināt jebkurus raksturlielumus savā starpā (variācijas pakāpes izteiksmē).

2.6. tabula Izlases lieluma atkarība no variācijas koeficienta

Variācijas koeficients, %

Parauga lielums

Ja tiek pētīti darba apstākļi, attiecības kolektīvā, darba samaksa utt. izmantojot piecu locekļu skalu, variācijas koeficients šeit svārstās no 27 līdz 62%, bet, izmantojot septiņu locekļu skalu - no 78 līdz 113%. Tāpēc, jo garāka ir skala, jo lielāks ir variācijas koeficients un jo lielākam jābūt izlases lielumam. Ja sociologs vēlas iztikt ar nelielu izlasi, tad jautājumi jāformulē vienkāršāk. Dažreiz tiek uzskatīts, ka, jo garāka skala, jo precīzāks ir mērījums. Bet septiņu ballu skalas priekšrocības salīdzinājumā ar piecu ballu skalām nav pierādītas.

Sociologu vidū ir izplatīts uzskats, ka jo lielāks ir izlases lielums, jo precīzāks ir rezultāts, un tas liek viņiem pārmērīgi palielināt respondentu skaitu. Patiesībā situācija ir atšķirīga: tabula. 2.7. attēlā, pamatojoties uz Gallup datiem, ir parādīta attiecība starp izlases lielumu un novērtējuma precizitāti procentos. No tā izriet, ka, palielinoties izlases lielumam, precizitāte palielinās, bet līdz noteiktam slieksnim. Jau ar 600 respondentiem tiek sasniegts vēlamais 5% precizitātes līmenis. Tāpēc 600 cilvēku ir pieņemams izlases lielums.

Starp skaitļiem 400 un 600 cilvēku nav pretrunu. Pirmajā gadījumā izlases lielums tika aprēķināts, pamatojoties uz pieņēmumu par normālu respondentu atbilžu sadalījumu, bet otrajā - no prakses. Teorijas un prakses neatbilstība ir saistīta ar to, ka reālā situācijā vērtējumu sadalījums atšķiras no parastā, tāpēc izlases lielums ir jāaprēķina, ņemot vērā šo konkrēto apstākli; Visefektīvākais veids, kā samazināt izlases lielumu, ir samazināt aprēķinu variācijas koeficientu.

2.7. tabula Saistība starp izlases lielumu un novērtējuma precizitāti

Aprēķinot izlases lielumu, sociologi bieži pieļauj šādu kļūdu: pēc esošās formulas aprēķinājuši nepieciešamo izlases lielumu visai populācijai, pēc tam to proporcionāli ievieto atsevišķās izlases vienībās, piemēram, pa darbnīcām, uzņēmumiem, rajoniem, pilsētām. , un ģimeņu veidi. Pēc tam datu apstrādes posmā tiek analizētas atšķirības starp pašām nodaļām. Tomēr pareizāk ir aprēķināt izlases lielumu katrai nodaļai atsevišķi un pēc tam summēt atsevišķus apjomus. Pieņemsim, ka trīs darbnīcu izlases lieluma aprēķini (ņemot vērā mēroga dimensiju, darbinieku skaitu, paredzamā novērtējumu sadalījuma raksturu) ļāva konstatēt, ka pirmajā darbnīcā ir jājautā 384 cilvēki, otrajā - 222, bet trešajā - 600. Tad kopējais izlases lielums būs 384 + 222 + 600 = 1206 cilvēki.

Ja sociologam ir nepieciešams intervēt darbinieku kategoriju (piemēram, autobusu vadītājus), par kuru ir zināms tikai desmitais uzņēmuma darbinieks, un viņš nolēma uzdot jautājumu 139 autobusu vadītājiem, un kopējais izlases lielums uzņēmumā būs 1390 cilvēki, tie. citiem vārdiem sakot, nejauši atlasot 1390 respondentus no uzņēmuma, mēs, saskaņā ar izlases teoriju, ceram identificēt 139 cilvēkus mūs interesējošajā specialitātē.

Aprēķinot kvotu izlasi, sociologi bieži vien patvaļīgi nosaka tā lielumu 1000 cilvēku, pamatojoties uz kvotu aprēķināšanas ērtībām. Bet tikpat viegli varat paņemt jebkuru citu apaļu skaitli. Saprātīgāka pieeja ir aprēķināt kvotas izlases lielumu kā izlases veidam. Vēl viena iespēja kvotas izlases lieluma aprēķināšanai ir izmantot mazo paraugu teoriju. Tās būtība: ja mērķis nav nodrošināt diferencētu analīzi pa darbinieku grupām, tad pētāmo jautājumu gradāciju skaitu reiziniet ar 25 (minimālais statistiski nozīmīgo grupas lielums). Piemēram, tiek pētīti trīs mainīgie: dzimums - divas kategorijas, vecums - divas kategorijas (līdz 30 gadiem un virs 30 gadiem), apmierinātība ar darbu - mēra piecu ballu skalā. Tad nepieciešamais izlases lielums šim piemēram būs 2x2x5x25 = 500 cilvēki. Izlases lielums palielinās 2,5 reizes. Ir skaidrs, ka, palielinoties mainīgo skaitam un gradāciju skaitam, izlases lielums var kļūt katastrofāli liels. Ir tikai viena izeja: detalizēta sākotnējās problēmas izpēte, kas ļaus anketā novērst nevajadzīgos jautājumus, atstājot svarīgākos. Ja pētījumā tiek pārbaudītas vairākas hipotēzes, izlases lielums katras hipotēzes pārbaudei tiek aprēķināts atsevišķi. Tādējādi, izmantojot izlasi, jautājumu skaitam anketā un hipotēzēs jābūt minimālam.

Tātad, mēs esam aprēķinājuši nepieciešamo izlases lielumu. Tagad un tikai tagad ir jāpārbauda, vai iegūtā vērtība ir saderīga ar piešķirtajiem resursiem. Bieža kļūda daudzi lietišķie sociologi ir tādi, ka, aprēķinot izlases lielumu, priekšplānā tiek izvirzīti pieejamie resursi vai, vēl ļaunāk, sociologs pasīvi pieņem visus klienta diktētos nosacījumus. Tas ir fundamentāli nepareizi vairāku iemeslu dēļ. Pirmkārt, izlases lieluma aprēķins ļauj gūt dziļāku ieskatu pētāmā priekšmeta būtībā un pētniecības metožu specifikā, kas nozīmē, ka var pamatoti prasīt vairāk resursu vai pieņemt pareizo lēmumu par izlases lieluma samazināšanu. Ja administrācija atsakās no papildu resursiem un pētījuma mērķi neļauj samazināt izlases lielumu (t.i., sociologs nevar pieņemt administrācijas lēmumu), ir jāpāriet pie cita pētījuma projekta. Otrkārt, saprātīgs izlases lieluma aprēķins parāda sociologa profesionalitāti un liek klientam izturēties pret viņu cieņpilnāk.

Secīgā aprēķinu stratēģija parauga lielums. Aprēķinot izlases lielumu, vēlams zināt aplēšu izkliedi un dažus citus parametrus. Tomēr tie, kā likums, nav zināmi. Lai novērstu kļūdas, labāk pieņemt, ka tās ir maksimālas. Cena par mūsu nezināšanu ir izlases apjoma palielināšana, pārsniedzot nepieciešamo, un papildu finansiālās un laika izmaksas (mums ir jāintervē vairāk cilvēku). Lai ietaupītu izmaksas, tiek izmantota konsekventa stratēģija - izlases lielums netiek aprēķināts iepriekš, bet tiek padarīts atkarīgs no pētījuma gala rezultātiem. Piemēram, viņi intervē 100 cilvēkus, pēc tam nosaka aplēšu izplatību un atkarībā no tā aprēķina nepieciešamo izlases lielumu. Ja izrādās, ka pietiek ar 100 cilvēkiem, tad pētījums beidzas. Citādi tur nokļūst vajadzīgais respondentu skaits, bet ne līdz bezgalībai. Ir labi zināms piemērs no J. Gallupa prakses, kurš savas karjeras sākumā aktīvi eksperimentēja ar izlases izmēriem. 1936. gadā amerikāņiem tika jautāts: "Vai jūs vēlētos, lai tiktu atjaunots Nacionālais rūpniecības atveseļošanas likums?" Izrādījās dīvains paradokss: J. Gallups vispirms aptaujāja 500 cilvēkus un izmērīja izlases kļūdu, bet pēc tam secīgi palielināja respondentu skaitu līdz 30 tūkstošiem.Par nožēlu atklāja, ka, pievienojot 29,5 tūkstošus respondentu, informācijas precizitāte palielinājās par mazāk nekā 1%. Līdz ar to aptauju varētu pārtraukt pēc 500 respondentiem. Šis piemērs parāda, ka, piemērojot secīgu stratēģiju, ir iespējams panākt ievērojamu nepieciešamo novērojumu skaita samazinājumu, salīdzinot ar provizorisku izlases lieluma aprēķinu.

Tomēr secīga izlases lieluma aprēķināšanas stratēģija nodrošina vēlamo rezultātu tikai tad, ja nepieciešamos aprēķinus sociologs var veikt pašas aptaujas laikā, piemēram, telefona aptauju, izmantojot datorsistēmas. Respondenta atbildes sociologs ievada savā personālajā datorā, no kura rezultāti uzreiz tiek nosūtīti uz pētījuma vadītāja datoru, apstrādāti, un displeja ekrānā tiek sniegta informācija ne tikai par viendimensionālajām frekvencēm, kas sadalītas konkrētajā jautājumā, bet arī par nepieciešamajām. parauga lielums.

Ja pastāv briesmas, ka izlases lielums var būt katastrofāli liels, nepieciešams apvienot abus stratēģijas veidus – provizorisko un secīgo, t.i. pieteikties kombinētā stratēģija. Aprēķinot izlasi pēc provizoriskās stratēģijas, mēs iegūstam secīgās stratēģijas augšējās pieļaujamās vērtības jeb, citiem vārdiem sakot, izlases lieluma vērtību, kuru sasniedzot apstājas aptauja saskaņā ar secīgo stratēģiju.

Vispiemērotākā un pareizākā pieeja izlases lieluma noteikšanai ir balstīta uz ticamības intervālu aprēķinu, kas balstās uz vairākiem matemātiskās statistikas pamatjēdzieniem (variācija, standartnovirze, ticamības intervāls, vidējā kvadrātiskā kļūda).

Lai aprēķinātu nepieciešamo parauga lielumu in kvantitatīvie pētījumi Visbiežāk tiek izmantoti divi statistikas jēdzieni - ticamības intervāls un ticamības varbūtība. Ticamības intervāls ir iepriekš norādītā izlases kļūda. Piemēram, ja jūs iestatāt 3% ticamības intervālu un konkrētā pētījuma jautājuma konkrētā atbilde ir 48%, tas nozīmē, ka pat tad, ja jūs aptaujājat visu populāciju, patiesā vērtība būs no 45 (48 - 3) līdz 51. % (48 + 3). Pārliecības varbūtība parāda, cik pārliecināts varat būt par iegūtajiem rezultātiem, ka izlases raksturlielumi atbilst visas populācijas raksturlielumiem - citiem vārdiem sakot, cik liela ir iespējamība, ka nejauša atbilde nonāks ticamības intervālā. Parasti tiek izmantoti 95 un 99% ticamības līmeņi. Visbiežāk izmantotie ir 95% - ar to pietiek lielākajā daļā pētījumu. Ja saskaitām ticamības varbūtību un ticamības intervālu, varam teikt, ka atbildēm uz jautājumu ir 95% varbūtība nokrist starp 45 un 51%.

Sekojošais aptuvenais izlases apsekojuma rezultātu ticamības novērtējums ir ļoti noderīgs. Paaugstināta uzticamība pieļauj izlases kļūdu līdz 3%, parastā - no 3 līdz 10% (sadalījumu ticamības intervāls 0,03-0,1 līmenī), aptuvens - no 10 līdz 20%, aptuvens - no 20 līdz 40% un lēsts - vairāk nekā 40%.

Pamatojoties uz šiem jēdzieniem un ņemot vērā vairākus pieņēmumus, tiek atvasinātas izlases lieluma aprēķināšanas formulas, kurās tiek pieņemts, ka reprezentativitāte tiek garantēta, izmantojot pareizas varbūtiskās izlases procedūras.

Dažos gadījumos aptaujas veikšanas izmaksas tiek izmantotas kā galvenais arguments, nosakot izlases lielumu. Tādējādi mārketinga pētījumu budžetā ir paredzētas atsevišķu aptauju veikšanas izmaksas, kuras nevar pārsniegt, un ir acīmredzams, ka netiek ņemta vērā iegūtās informācijas vērtība. Tomēr dažos gadījumos neliels paraugs var dot diezgan precīzus rezultātus.

Pētījumu prakse iesaka ievērot šādu noteikumu: izlases lielumam jānodrošina vismaz 100 novērojumi katrai primārajai un vismaz 20-50 novērojumi katrai sekundārajai klasifikācijas sastāvdaļai. 11 primārās klasifikācijas komponentes atbilst viskritiskākajām, bet sekundārās - šajā pētījumā pieņemtās krusteniskās klasifikācijas vismazāk kritiskajām šūnām 34. Teorētiskie aprēķini un prakse pierāda, ka, lai iegūtu ticamus datus par tik lielas pilsētas kā Sanktpēterburga iedzīvotāju viedokļiem un vēlmēm, pietiek ar 700-800 cilvēku aptauju. Tomēr lielākā daļa iedzīvotāju aptauju šeit tiek veiktas līdz pat 1,5 tūkstošiem cilvēku.

Izlases kļūda

Kā mēs jau zinām, reprezentativitāte ir izlases kopas īpašība, lai attēlotu vispārējās populācijas īpašības. Ja nav sakritības, viņi saka reprezentativitātes kļūda- cik lielā mērā izlases statistiskā struktūra atšķiras no atbilstošās vispārējās kopas struktūras. Pieņemsim, ka vidējie pensionāru ģimenes ienākumi mēnesī kopumā ir 2 tūkstoši rubļu, bet izlases grupā - 6 tūkstoši rubļu. Tas nozīmē, ka sociologs intervēja tikai turīgo pensionāru daļu, un viņa pētījumā iezagās reprezentativitātes kļūda. Citiem vārdiem sakot, tiek saukta reprezentativitātes kļūda neatbilstība starp divām populācijām- vispārīgs, uz kuru ir vērsta sociologa teorētiskā interese un priekšstats par īpašībām, kuras viņš galu galā vēlas iegūt, un selektīvs, uz kuru ir vērsta sociologa praktiskā interese, kas darbojas gan kā aptaujas objekts, gan līdzeklis iegūt informāciju par visiem iedzīvotājiem.

Līdzās terminam “reprezentativitātes kļūda” vietējā literatūrā var atrast citu terminu: “izlases kļūda”. Dažreiz tie tiek lietoti savstarpēji aizstājami, un dažreiz "reprezentatīvās kļūdas" vietā tiek izmantota "izlases kļūda" kā kvantitatīvi precīzāks jēdziens.

Izlases kļūda- izlases kopas vidējo raksturlielumu novirze no vispārējās populācijas vidējiem raksturlielumiem.

Praksē izlases kļūdu nosaka, salīdzinot zināmos populācijas raksturlielumus ar izlases vidējiem. Socioloģijā, aptaujājot pieaugušos iedzīvotājus, visbiežāk tiek izmantoti tautas skaitīšanas dati, aktuālā statistika, iepriekšējo aptauju rezultāti. Kā kontroles parametri parasti tiek izmantoti sociāli demogrāfiskie raksturlielumi. Vispārējās un izlases populācijas vidējo salīdzināšanu, pamatojoties uz šo izlases kļūdas noteikšanu un tās samazināšanu sauc reprezentativitātes kontrole. Tā kā pēc pētījuma pabeigšanas var veikt savu un citu cilvēku datu salīdzināšanu, tad šo kontroles metodi sauc par a posteriori, tie. veikta pēc pieredzes.

Gallup aptaujās reprezentativitāte tiek kontrolēta, izmantojot tautas skaitīšanā pieejamos datus par iedzīvotāju sadalījumu pēc dzimuma, vecuma, izglītības, ienākumiem, profesijas, rases, dzīvesvietas un apdzīvotās vietas lieluma. Viskrievijas sabiedriskās domas izpētes centrs (VTsIOM) šādiem mērķiem izmanto tādus rādītājus kā dzimums, vecums, izglītība, apmetnes veids, ģimenes stāvoklis, nodarbinātības joma, respondenta darba statuss, kas aizgūti no Krievijas Federācijas Valsts statistikas komiteja. Abos gadījumos iedzīvotāju skaits ir zināms. Izlases kļūdu nevar noteikt, ja mainīgā lieluma vērtības izlasē un populācijā nav zināmas.

VTsIOM speciālisti nodrošina rūpīgu parauga remontu datu analīzes laikā, lai līdz minimumam samazinātu posmā radušās novirzes lauka darbi. Īpaši spēcīgas novirzes tiek novērotas dzimuma un vecuma ziņā. Tas skaidrojams ar to, ka sievietes un cilvēki ar augstāko izglītību vairāk laika pavada mājās un vieglāk veido kontaktu ar intervētāju, t.i. ir viegli sasniedzama grupa salīdzinājumā ar vīriešiem un “neizglītotiem” cilvēkiem.

Izlases kļūdu izraisa divi faktori: izlases metode un izlases lielums.

Izlases kļūdas iedala divos veidos – nejaušās un sistemātiskās. nejauša kļūda - ir varbūtība, ka izlases vidējais rādītājs būs (vai nebūs) ārpus noteiktā intervāla. Nejaušas kļūdas ietver statistikas kļūdas, kas raksturīgas pašai izlases metodei. Tie samazinās, palielinoties izlases lielumam (2.8. tabula).

2.8. tabula

Izlases lieluma atkarība no tās kļūdas 36 (vispārējās populācijas lielums ir 20 tūkstoši vienību)

Izlases kļūda, %

Izlases lielums, vienības

Otrs izlases kļūdu veids ir sistemātiskas kļūdas. Ja sociologs nolēma noskaidrot visu pilsētas iedzīvotāju viedokli par pašvaldību īstenoto sociālo politiku un aptaujāja tikai tos, kuriem ir telefons, tad izlasē rodas apzināta neobjektivitāte par labu turīgajiem slāņiem, t.i. sistemātiska kļūda.

Tādējādi sistemātiskas kļūdas ir paša pētnieka darbības rezultāts. Tie ir visbīstamākie, jo tie izraisa diezgan ievērojamas novirzes pētījuma rezultātos. Sistemātiskās kļūdas tiek uzskatītas par sliktākām par nejaušām arī tāpēc, ka tās nevar kontrolēt un izmērīt.

Tie rodas, ja, piemēram: 1) izlase neatbilst pētījuma mērķiem (sociologs nolēma pētīt tikai strādājošos pensionārus, bet aptaujāja visus); 2) ir acīmredzama neziņa par kopējo iedzīvotāju dabu (sociologs domāja, ka 70% no visiem pensionāriem nestrādā, bet izrādījās, ka tikai 10% nestrādā); 3) tiek atlasīti tikai "uzvarošie" elementi no vispārējās populācijas (piemēram, tikai turīgi pensionāri).

Uzmanību!Atšķirībā no nejaušām kļūdām, sistemātiskās kļūdas nesamazinās, palielinoties izlases lielumam.

Apkopojot visus gadījumus, kad rodas sistemātiskas kļūdas, metodiķi sastādīja to reģistru. Viņi uzskata, ka šādi faktori var būt nekontrolētu izkropļojumu avots paraugu novērojumu sadalījumā:

♦ vadīšanas metodiskie un metodiskie noteikumi socioloģiskie pētījumi;

♦ neadekvātas metodes izlases kopas veidošanai, izvēlētas datu vākšanas un aprēķināšanas metodes;

♦ vajadzīgās novērojumu vienības tika aizstātas ar citām, pieejamākām;

♦ konstatēts nepilnīgs izlases kopas pārklājums (nepietiekama anketu saņemšana, nepilnīga to aizpildīšana, novērojumu vienību nepieejamība).

Sociologs reti pieļauj apzinātas kļūdas. Biežāk kļūdas rodas tāpēc, ka sociologs slikti pārzina iedzīvotāju vispārējo struktūru: cilvēku sadalījumu pēc vecuma, profesijas, ienākumiem utt.

Sistemātiskas kļūdas ir vieglāk novērst (salīdzinājumā ar nejaušām), taču tās ir ļoti grūti novērst. Vislabāk ir novērst sistemātiskas kļūdas, precīzi paredzot to avotus jau iepriekš – pašā pētījuma sākumā.

Te ir daži veidi, kā izvairīties no kļūdām:

♦ katrai kopas vienībai jābūt ar vienādu varbūtību tikt iekļautai izlasē;

♦ vēlams atlasīt no viendabīgām populācijām;

♦ jums jāzina vispārējās populācijas īpašības;

♦ veidojot izlases kopu, jāņem vērā nejaušās un sistemātiskās kļūdas.

Ja izlases kopa (vai vienkārši izlase) ir sastādīta pareizi, tad sociologs iegūst ticamus rezultātus, kas raksturo visu populāciju. Ja tas ir sastādīts nepareizi, tad kļūda, kas radusies izlases posmā, tiek reizināta katrā nākamajā socioloģiskā pētījuma posmā un galu galā sasniedz tādu vērtību, kas atsver veiktā pētījuma vērtību. Viņi saka, ka šādi pētījumi nodara vairāk ļauna nekā laba.

Šādas kļūdas var rasties tikai izlases populācijā. Lai izvairītos no kļūdas vai samazinātu to iespējamību, vienkāršākais veids ir palielināt izlases lielumu (un ideālā gadījumā līdz vispārējās populācijas lielumam: kad abas populācijas sakrīt, izlases kļūda vispār pazudīs). Ekonomiski šī metode nav iespējama. Atliek vēl viens veids - uzlabot matemātiskās metodes izlasei. Tos izmanto praksē. Šis ir pirmais kanāls iespiešanās matemātikas socioloģijā. Otrais kanāls ir matemātiskā datu apstrāde.

Kļūdu problēma kļūst īpaši aktuāla mārketinga pētījumos, kur tiek izmantoti nelieli paraugi. Parasti tie ir vairāki simti, retāk - tūkstotis respondentu. Šeit izlases aprēķina sākumpunkts ir jautājums par izlases kopas lieluma noteikšanu. Izlases lielums ir atkarīgs no diviem faktoriem: I) informācijas vākšanas izmaksām un 2) vēlmes pēc zināmas statistiskās pārliecības par rezultātiem, ko pētnieks cer iegūt. Protams, pat statistikā un socioloģijā nepieredzējuši cilvēki intuitīvi saprot, ka jo lielāks ir izlases lielums, t.i. Jo tuvāk tie ir iedzīvotāju skaitam kopumā, jo ticamāki un ticamāki ir iegūtie dati. Taču mēs jau iepriekš runājām par nepārtrauktu apsekojumu praktisko neiespējamību gadījumos, kad tos veic objektos, kuru skaits pārsniedz desmitus, simtus tūkstošus un pat miljonus. Ir skaidrs, ka informācijas vākšanas izmaksas (ieskaitot samaksu par rīku pavairošanu, anketu, lauka vadītāju un datoru ievades operatoru darbu) ir atkarīgas no summas, ko klients ir gatavs piešķirt, un maz ir atkarīgas no pētniekiem. Kas attiecas uz otro faktoru, mēs pie tā pakavēsimies nedaudz sīkāk.

Tātad, jo lielāks ir izlases lielums, jo mazāka ir iespējamā kļūda. Lai gan jāņem vērā, ka, ja vēlaties dubultot precizitāti, jums būs jāpalielina izlase nevis par diviem, bet par četriem. Piemēram, lai 400 cilvēku aptaujā iegūto datu aplēse būtu divreiz precīzāka, jums vajadzētu aptaujāt 1600 cilvēku, nevis 800. Tomēr maz ticams, ka mārketinga pētījumiem ir nepieciešama 100% precizitāte. Ja alus darītājam ir jānoskaidro, kāda daļa alus patērētāju dod priekšroku viņa zīmolam, nevis konkurenta zīmolam - 60% vai 40% -, tad viņa plānus nekādi neietekmēs atšķirība starp 57%, 60 vai 63%.

Izlases kļūda var būt atkarīga ne tikai no tās lieluma, bet arī no atšķirību pakāpes starp atsevišķām vienībām mūsu pētāmajā populācijā. Piemēram, ja mēs vēlamies uzzināt, cik daudz alus tiek patērēts, mēs atklāsim, ka mūsu iedzīvotāju vidū ir patēriņa rādītāji dažādi cilvēki būtiski atšķiras (heterogēns vispārējā populācijā). Citā gadījumā mēs pētīsim maizes patēriņu un atklāsim, ka dažādu cilvēku vidū tas atšķiras daudz mazāk (viendabīgs vispārējā populācijā). Jo lielāka ir atšķirība (vai neviendabīgums) populācijā, jo lielāka ir iespējamā izlases kļūda. Šis modelis tikai apstiprina to, ko mums saka vienkāršais veselais saprāts. Tādējādi, kā pareizi apgalvo V. Jadovs, “izlases lielums (apjoms) ir atkarīgs no pētāmo objektu viendabīguma vai neviendabīguma līmeņa. Jo viendabīgāki tie ir, jo mazāki skaitļi var sniegt statistiski ticamus secinājumus.

Izlases lieluma noteikšana ir atkarīga arī no pieļaujamās statistiskās kļūdas ticamības intervāla līmeņa. Šeit mēs domājam tā saukto nejauši kļūdas, kas saistītas ar jebkādu statistisko kļūdu raksturu. UN. Paniotto sniedz šādus aprēķinus reprezentatīvam paraugam ar 5% kļūdu (2.9. tabula):

2.9. tabula

Reprezentatīvā parauga aprēķini

Tas nozīmē, ka, ja jūs, aptaujājot, teiksim, 400 cilvēkus reģionālā pilsētā, kur pieaugušie maksātspējīgie iedzīvotāji ir 100 tūkstoši cilvēku, konstatējāt, ka 33% aptaujāto pircēju dod priekšroku vietējās gaļas kombināta produkcijai, tad ar 95% ar varbūtību var teikt, ka regulāri šo produktu pircēji ir 33±5% (t.i. no 28 līdz 38%) šīs pilsētas iedzīvotāju.

Varat arī izmantot Gallup aprēķinus, lai novērtētu sakarību starp izlases lielumu un izlases kļūdu (skatiet iepriekš).

Mūsdienās daudzus sarežģītus aprēķinus veic tehnoloģija, un statistikas programmas var iegūt internetā. Tātad, veicot izlases aprēķinu, slinkajam sociologam tika dota šāda iespēja Analītiskā centra “Bizness un mārketings” vietnē (http://www.bma.ru/enter.htm), kur lietotājam ir nepieciešams tikai lai ievadītu nepieciešamos datus, un pēc tam noklikšķiniet uz pogas "Aprēķināt".

Pirms tiešas izlases novērošanas veikšanas vienmēr tiek atrisināts jautājums par to, cik pētāmās populācijas vienības ir jāatlasa izlasei. Formulas tā skaita noteikšanai tiek iegūtas no maksimālo paraugu ņemšanas kļūdu formulām saskaņā ar šādiem sākumpunktiem:

piedāvātā parauga veids;
atlases metode (atkārtota vai neatkārtota);
parametru novērtējuma izvēle (vidējā vērtība vai proporcija).

Turklāt iepriekš ir jānosaka ticamības varbūtības vērtība, kas atbilstu informācijas patērētājam, un pieļaujamās maksimālās izlases kļūdas lielums. D un I iestatīšana (atbilstoši ticamības varbūtībai) parasti nesagādā nekādas īpašas grūtības, jo tās ir saistītas ar pētāmās populācijas raksturu.

Tomēr jāatceras, ka liela ticamības varbūtība ievērojami palielina izlases lielumu. Līdzīga situācija ir ar izlases robežkļūdu: tās samazināšana uz pusi četrkāršo izlases lielumu. Jautājums par to, kāda precizitāte apmierina pētnieku, kļūst būtisks, ja citas novērošanas vienības pārbaude rada lielas finansiālas un materiālas izmaksas (ņemot vērā novērojumu vienību teritoriālo attālumu, savākto datu konfidencialitāti, novērošanas programmas sarežģītību utt.), nav svarīgi, ja vienas vienības uzmērīšanas izmaksas ir salīdzinoši nelielas.

Formulas vajadzīgā izlases lieluma aprēķināšanai Dažādi ceļi izvēle ir parādīta tabulā. 13.10.

Izmantojot tabulā norādītās formulas, ir ieteicams iegūto izlases lielumu noapaļot uz augšu, lai nodrošinātu noteiktu precizitātes “robežu”.

Turklāt statistikas praksē izplatīta iespēja ir, kad maksimālās izlases kļūdas vērtība tiek norādīta procentos (relatīvā maksimālā izlases kļūda). Šajā gadījumā kļūdas absolūto vērtību dala ar raksturlieluma vidējo vērtību un reizina ar 100%. Pēc tam, lai lietotu tabulas formulas, ir jāatrod maksimālās kļūdas absolūtā vērtība šādi:

13.10. tabula

Formulas izlases lieluma noteikšanai

Atlases metode	Atkārtota atlase	Neatkārtota atlase
Novērtējot vidējo
Pareizi nejauši
Mehānisks
Tipiski
Seriāls ar vienādām sērijām
Novērtējot daļu
Pareizi nejauši
Mehānisks

Beigas

Atlases metode	Atkārtota atlase	Neatkārtota atlase
Tipiski
Seriāls ar vienādām sērijām

Ja sākotnējie parametri izlases lieluma noteikšanai ir relatīvā kļūda D% un variācijas koeficients

no pētītās pazīmes, kas aprēķināta kā F„=^100%, tad formula

Faktisko izlases paraugu atkārtotas atlases laikā var pārveidot šādi:

Patiesās grūtības izlases lieluma noteikšanā ir atribūta variācijas lieluma noteikšana - dispersija. Praksē šī vērtība visbiežāk paliek nezināma līdz aptaujas veikšanai. Kā rīkoties katrā konkrētajā gadījumā, izlemj pats pētnieks.

Dažreiz dispersiju aprēķina tiešā veidā:

pirms galvenā novērojuma sākuma veic plašas pārbaudes, lai noteiktu o 2 vērtību;
viņi nosacīti pieņem dispersijas vērtību no iepriekšējām līdzīgām aptaujām (praksē visbiežāk izmantotā metode). Šāda pieeja ir attaisnojama, ja kopējo populāciju savas būtības dēļ neapstiprina būtiski dinamiski procesi vai to izpausmes nav tik spilgtas.

Ir arī vairākas “netiešas” metodes, lai atrastu pētāmā raksturlieluma dispersiju, kas ir noteiktas matemātiskas metodes, kuru pamatā ir statistisko kopu īpašības. Tā kā vairumam no tiem sadalījumi ir tuvi parastajam likumam, dispersijas vērtību var aptuveni noteikt šādi.

Tā kā visas atribūta varianta vērtības saskaņā ar normālā sadalījuma likumu ir novietotas uz 3 vienā vai otrā virzienā no vidējā, pastāv aptuvens vienāds. R«6a, kur R- pazīmes variāciju diapazons, kas definēts kā R= x max - x min .

Tāpēc

Praksē, lai iegūtu noteiktu parauga vienību “rezervi”, lai nodrošinātu nepieciešamo precizitāti, viņi bieži izvēlas izmantot attiecību

Vērtības x max un x min, uzraugot sociāli ekonomiskos procesus, parasti ir zināmas vai noteiktas spēkā esošajos tiesību aktos. Piemēram, vidējais darbinieku skaits mazajos uzņēmumos ir stingri ierobežots ar likumu.

Sociāli ekonomiskajām parādībām, ja kaut kādā veidā (piemēram, no pagātnes apsekojumu datiem) ir zināma vidējā vērtība, sakarību izmanto, lai tuvinātu standartnovirzi.

Alternatīva raksturlieluma dispersija ir atkarīga no to vienību īpatsvara, kurām ir pētītais raksturlielums (īpašība) w. Ja šī daļa nav zināma, tiek ņemta maksimālā iespējamā dispersijas vērtība - 0,25, kas sasniegta plkst w = 0,5.

No tabulā esošajām formulām. 13.10. no tā izriet, ka izlases lielums ir tieši proporcionāls pētāmā raksturlieluma dispersijai. Patiešām, pieaugot vienību mainīgumam, lai aptvertu variācijas, atlasei un iekļaušanai izlasē ir nepieciešams arvien lielāks to skaits.

Tātad, mēs esam apsvēruši iespēju noteikt izlases lielumu vienam novērojamam raksturlielumam. Bet ko darīt, ja ir vairākas raksturīgas pazīmes un šo pazīmju variācija ir atšķirīga vai dažas no tām ir alternatīvas. Būtu loģiski izvēlēties raksturlielumu, kuram aprēķini rada lielāko izlases lielumu starp pārējiem (šim raksturlielumam ir nepieciešams iegūt mazāko relatīvo izlases kļūdu ar tādu pašu ticamības varbūtību). Patiešām, šajā gadījumā citu raksturlielumu vispārīgo parametru noteikšana tiks papildināta ar lielāku precizitāti nekā nepieciešams, t.i. būs zināma precizitātes "robeža".

Tāpat jāatzīmē, ka praksē izlases lielums nereti tiek koriģēts atbilstoši pieejamajiem finanšu un cilvēkresursiem, tad tiek ņemta vērā nepieciešamība panākt optimālu izmaksu līdzsvaru un rezultātu precizitāti. Ja ir grūtības ar statistisko novērojumu finansēšanu, īpaši, ja izmaksu samazinājums notiek diezgan būtiski ar pieņemamiem precizitātes zudumiem, šāds solis ir vairāk nekā attaisnojams.

Izlases lieluma noteikšanu ietekmē arī ļoti izplatīta parādība statiskajos novērojumos, kas saistīta ar aptaujāto vienību neatbildēšanu. Lielu populāciju gadījumā, ko mēra simtos vai miljonos (piemēram, valsts iedzīvotāju skaits), var veikt dažas korekcijas saistībā ar nereaģēšanu, palielinot izlases lielumu. Taču, apstrādājot aptauju rezultātus un īpaši izmantojot uz tiem balstītus konkrētus ieteikumus, jāatceras datu vākšanas laikā izdarītie pieņēmumi.

Apskatīsim problēmu piemērus, lai noteiktu nepieciešamo izlases kopas lielumu.

13. piemērs. 7. Cik objektu no kopumā 507 firmām nodokļu inspekcijai ir jāpārbauda, lai ar varbūtību 0,997 noteiktu to firmu īpatsvaru, kurām ir pārkāpumi nodokļu maksāšanā? Saskaņā ar iepriekšējo aptauju standartnovirze bija 0,15; izlases kļūdu lielums nedrīkst būt lielāks par 0,15.

Atkārtojot izlases veida atlasi, jums jāpārbauda

Atkārtotas nejaušas atvienošanas gadījumā ir jāpārbauda

Kā redzam, neatkārtotas izlases izmantošana noved pie daudz mazāka objektu skaita pārbaudes.

Piemērs 13.8. Vienas no Krievijas Federācijas veidojošajām vienībām administrācija nolēma veikt 366 mazo uzņēmumu izlases aptauju, kuras laikā bija plānots noteikt:

cilvēku ar augstāko izglītību īpatsvars, kas strādā mazos uzņēmumos (maksimālās kļūdas lielums nedrīkst pārsniegt 0,1);
mazos uzņēmumos strādājošo sieviešu īpatsvars (maksimālās kļūdas lielums nedrīkst pārsniegt 0,12);
mazo uzņēmumu darbinieku vidējais vecums (maksimālās kļūdas lielums nedrīkst pārsniegt divus gadus).

Mazo uzņēmumu sadalījums pa tautsaimniecības nozarēm ir šāds:

Pilsētas vadība pieļauj, ka pētāmo pazīmju nozīme būtiski atšķiras atkarībā no uzņēmuma nozares, tāpēc tika izvēlēta tipiska izlase, proporcionāla tipisko grupu lielumam.

Noteiksim, kādam jābūt tās skaitam un cik novērojumu vienību jāizņem no katras tipiskās grupas ar ticamības varbūtību 0,954. Pirmās divas zīmes ir alternatīvas, tad nezināmās dispersijas novērtējums ir tās maksimālā vērtība - 0,25.

Nepieciešamajam izlases lielumam, novērtējot cilvēku ar augstāko izglītību īpatsvaru, būs šāda vērtība:

Lai novērtētu strādājošo sieviešu īpatsvaru, nepieciešama aptauja

Tūlīt būtu iespējams noteikt, uz kāda pamata būtu jāveic aprēķini. Tā vienmēr ir lielāka precizitāte (mazāka kļūda vienam un tam pašam ticamības līmenim). Tomēr trešā zīme mūsu piemērā ir kvantitatīva. Noteiksim, kāds izlases lielums ir nepieciešams, lai to novērtētu. Mēs iegūstam aptuveno dispersijas vērtību, pamatojoties uz normālā sadalījuma īpašībām:

(ar maksimālo un minimālo vecumu attiecīgi 60 un 18 gadi, kas ir visticamākais diapazons).

No kurienes nāk st. 2 = 49?

Veiksim aprēķinu:

Tātad, lai sasniegtu noteiktu precizitāti visiem novērotajiem raksturlielumiem, jāizvēlas maksimālais iegūtais skaits visiem trim rādītājiem, t.i. n = 65 uzņēmumi.

Ekonomikas nozare		Izlasē atlasīto uzņēmumu skaits
Rūpniecība
Lauksaimniecība
Būvniecība
Transports un sakari
Tirdzniecība un ēdināšana
Vispārējā uzņēmējdarbība
Mājokļu un komunālie pakalpojumi un ar ražošanu nesaistīti patēriņa pakalpojumu veidi iedzīvotājiem

Citas nozares

Neformalizētas paraugu ņemšanas metodes. Jautājums par optimālo izlases lielumu vienmēr ir bijis strīdīgs pētnieku vidū. Lēmums par izlases kopas lielumu tiek pieņemts, ņemot vērā vairākus faktorus, no kuriem nozīmīgākā loma ir diviem: 1) pētījuma rezultātā iegūtās informācijas vērtībai un novitātei; 2) pētījuma veikšanas izmaksas (ieskaitot laiku) noteiktam izlases apjomam.

Daudzos gadījumos var vadīties pēc iedibinātas prakses, t.i. līdzīgos pētījumos izmantotais izlases lielums. Turklāt izlases kopas lieluma noteikšanai ir šādi vienkārši noteikumi.

Izlases lielums pieaug Ja:

nepieciešams iegūt datus par atsevišķām apakšgrupām (apakšizlases lielumi tiek summēti un izlase kopumā aug proporcionāli apakšgrupu skaitam);
Jau pieejamā informācija par galvenajiem jautājumiem ir nepietiekama, un nenoteiktība ir būtiska.

Turklāt daudzu pētījumu prakse jau ir izstrādājusi “tipiskus” izlases lielumus. Tādējādi valsts iedzīvotāju aptaujās šie apjomi svārstās no 1000 līdz 2500 respondentiem (atkarībā no analizēto grupu skaita). Reģionālajiem apsekojumiem un īpašu populāciju apsekojumiem - no 200 līdz 500 (analizējot daudzas apakšgrupas, reģionālās vai īpašās populācijas izlases lielums parasti palielinās līdz vismaz 1000 cilvēkiem). Norādītās vērtības, protams, var kalpot tikai kā vispārīgas vadlīnijas noteikšanai optimālais izmērs paraugi.

Praksē lemšana par izlases lielumu ir kompromiss starp pieņēmumu par aptaujas rezultātu precizitāti un to praktiskas īstenošanas iespējamību (t.i., pamatojoties uz aptaujas veikšanas izmaksām).

Praksē izlases lieluma noteikšanai tiek izmantotas vairākas pieejas. Pievērsīsim uzmanību vienkāršākajiem no tiem. Pirmo no tiem sauc par nejaušu pieeju, un tā pamatā ir “īkšķa noteikuma” piemērošana.

Piemēram, bez pierādījumiem tiek pieņemts, ka, lai iegūtu precīzus rezultātus, izlasei ir jābūt 5% no populācijas. Šī pieeja ir vienkārša un viegli īstenojama, taču neļauj iegūt precīzus rezultātus. Tās priekšrocība ir salīdzinoši zemās izmaksas. Otrajā pieejā izlases lielumu var iestatīt, pamatojoties uz iepriekš noteiktiem nosacījumiem. Mārketinga pētījumu pasūtītājs, piemēram, zina, ka, pētot sabiedrisko domu, izlase parasti ir 1000 - 1200 cilvēku, tāpēc viņš iesaka pētniekam pieturēties pie šī skaitļa.

Trešā pieeja nozīmē, ka dažos gadījumos galvenais apsvērums, nosakot izlases lielumu, var būt aptaujas veikšanas izmaksas. Lai gan netiek ņemta vērā saņemtās informācijas vērtība un ticamība.

Ceturtajā pieejā izlases lielumu nosaka, pamatojoties uz statistisko analīzi. Šī pieeja ietver minimālā izlases lieluma noteikšanu, ņemot vērā prasības attiecībā uz iegūto rezultātu ticamību un derīgumu.

Piektā pieeja tiek uzskatīta par teorētiski pamatotāko un pareizā pieeja parauga lieluma noteikšanā. Tas ir balstīts uz ticamības intervāla aprēķinu.

Ticamības intervāls ir diapazons, kura galējie punkti raksturo noteiktu atbilžu procentuālo daļu uz jautājumu. Šis mīklas jēdziens ir saistīts ar jēdzienu “iegūtā raksturlieluma standarta novirze vispārējā populācijā”. Jo lielāks tas ir, jo plašākam ir jābūt ticamības intervālam, lai iekļautu, piemēram, 9,5% atbilžu.

No normālā sadalījuma līknes īpašībām izriet, ka ticamības intervāla beigu punkti, kas vienādi, piemēram, ar 9,5%, tiek definēti kā reizinājums no: 1,96 (normalizētā novirze) un standartnovirzes.

Skaitļi 1,96 un 2,58 (99% ticamības intervālam) ir apzīmēti ar z.

Ir tabulas “Varbūtības integrāļa vērtība”, kas ļauj noteikt z vērtības dažādiem ticamības intervāliem. Veicot mārketinga pētījumus, ticamības intervāls ir 95% vai 99%.

Piemēram, tika veikts pētījums par automašīnu īpašnieku apmeklējumu skaitu servisa darbnīcās gadā. Tika aprēķināts, ka ticamības intervāls vidējam apmeklējumu skaitam ir 5–7 apmeklējumi ar 99% ticamības līmeni. Tas nozīmē, ka, ja būs iespējams patstāvīgi veikt izlases pētījumus 100 reizes, tad 99 izlases pētījumiem vidējais apmeklējumu skaits būs robežās no 5 līdz 7. Citiem vārdiem sakot, 99% automašīnu īpašnieku iekritīs ticamības intervāls.

Pieņemsim, ka pētījums tika veikts līdz pat 50 neatkarīgiem paraugiem. Šo paraugu vidējie rādītāji veidoja normālā sadalījuma līkni, ko sauc paraugu ņemšanas sadalījums.

Vidējais vērtējums populācijai kopumā ir vienāds ar sadalījuma līknes vidējo punktu skaitu. Jēdziens “izlases sadalījums” tiek uzskatīts arī par vienu no V izlases definīcijas pamatā esošās teorētiskās koncepcijas pamatjēdzieniem.

Dabiski, ka neviens uzņēmums nespēj izveidot 10, 20, 50 neatkarīgus paraugus. Parasti tiek izmantots tikai viens paraugs.

Matemātiskā statistika ļauj iegūt informāciju par izlases sadalījumu, iegūstot precīzus datus par vienas izlases variāciju.

Rādītājs, kas norāda, cik lielā mērā aprēķins, kas ir patiess visai populācijai, atšķiras no tā, kas paredzēts tipiskam paraugam vidējā kvadrātiskā kļūda. Piemēram, tiek pētīts patērētāju viedoklis par jaunu produktu un klientu šis pētījums norādīja, ka būtu apmierināts ar iegūto rezultātu precizitāti, kas vienāda ar plus vai mīnus 5%.

Pieņemsim, ka 30% izlases ir par labu jaunajam produktam. Tas nozīmē, ka iespējamo aplēšu diapazons visai populācijai ir 25 – 35%. Turklāt, jo lielāks ir izlases lielums, jo mazāka ir kļūda. Liela variācijas vērtība rada lielu kļūdas vērtību un otrādi.

Noteiksim izlases lielumu, pamatojoties uz ticamības intervāla aprēķinu. Sākotnējā informācija, kas nepieciešama šīs pieejas ieviešanai, ir:

· variāciju apjoms, kāds tiek uzskatīts par populāciju;
· vēlamā precizitāte;
· uzticamības līmenis, kam jāatbilst aptaujas rezultātiem.

Kad ieslēgts uzdots jautājums Ir tikai divi atbilžu varianti, izteikti procentos (tiek izmantots procentuālais mērs), izlases lielumu nosaka pēc šādas formulas:

kur n ir izlases lielums;

z – normalizētā novirze, kas noteikta, pamatojoties uz izvēlēto ticamības līmeni (7. tabula);

p – paraugam atrastā variācija;

q = (100 – p);

e – pieļaujamā kļūda.

7. tabula

z rādītāja normalizētās novirzes vērtība no vidējās vērtības

atkarībā no iegūtā rezultāta ticamības varbūtības (a).

Piemēram, riepu ražošanas uzņēmums veic autobraucēju aptauju, kuri izmanto radiālās riepas.

Tāpēc uz jautājumu: "Vai jūs izmantojat radiālās riepas?" Ir iespējamas tikai 2 atbildes: “Jā” vai “Nē”. Ja pieņemam, ka auto entuziastu populācijai ir zems variācijas koeficients, tas nozīmē, ka gandrīz visi aptaujātie izmanto radiālās riepas. IN šajā gadījumā var izveidot pietiekami mazu izlases lielumu. Formulā (1) reizinājums pg izsaka populācijai raksturīgās variācijas. Piemēram, pieņemsim, ka 90% iedzīvotāju izmanto radiālās riepas. Tas nozīmē, ka pg = 900. Ja pieņemam, ka variācijas koeficients ir lielāks (p = 70%), tad pg = 2100. Vislielākā variācija tiek sasniegta, kad puse iedzīvotāju (50%) izmanto radiālās riepas, bet pārējie ne. Šajā gadījumā produkts sasniedz vērtību, kas vienāda ar 2500.

Veicot aptauju, ir svarīgi norādīt iegūto aplēšu precizitāti. Piemēram, noskaidrots, ka 44% aptaujāto izmanto radiālās riepas. Mērījumu rezultāti jānorāda formā: to autobraucēju procentuālais daudzums, kuri izmanto radiālās riepas, ir 44 plus mīnus %. Pieļaujamās kļūdas apmēru iepriekš kopīgi nosaka pētījuma pasūtītājs un darbuzņēmējs.

Pārliecības līmenis mārketinga pētījumos parasti tiek novērtēts, pamatojoties uz divām vērtībām: 95% vai 99%. Pirmā vērtība atbilst vērtībai z = 1,96; otrais – z = 2,58. Ja tiek izvēlēts 99% ticamības līmenis, tas nozīmē sekojošo: mēs esam 99% pārliecināti (citiem vārdiem sakot, ticamības līmenis ir 0,99), ka iedzīvotāju procentuālais daudzums, kas ietilpst diapazonā plus - mīnus e% ir vienāds ar to izlases dalībnieku procentuālais daudzums, kas ietilpst tajā pašā kļūdu diapazonā. Pieņemot, ka variācija ir 50%, precizitāte 10% ar 95% ticamības līmeni, mēs aprēķinām izlases lielumu:

n = 1,962 (50 x 50)/102 = 96.

Ar ticamības līmeni 99% un e = ±3%, n = 1067.

Nosakot variācijas indeksu konkrētai populācijai, vēlams veikt pētāmās populācijas iepriekšēju kvalitatīvu analīzi un noteikt populācijas vienību līdzību demogrāfiskos, sociālajos un citos pētnieku interesējošos aspektos. Izlases lielumu var noteikt, izmantojot līdzekļus, nevis procentus. Pieņemsim, ka ticamības līmenis ir izvēlēts 95% (z = 1,96,), standarta novirze (S) tiek aprēķināta kā 100 un vēlamā precizitāte (novirze) ir ±10. Tad izlases lielums būs

Reāli praksē, ja izlase tiek veidota no jauna un līdzīgas aptaujas nav veiktas, S nav zināms.

Šajā gadījumā kļūdu e ieteicams iestatīt standartnovirzes daļās. Aprēķina formula tiek pārveidota un iegūst šādu formu:

Mēs galvenokārt runājām par ļoti liela izmēra apkopojumiem, kas raksturo patēriņa preču tirgus. Bet dažos gadījumos agregāti nav tik lieli, un, piemēram, tirgos atsevišķas sugas rūpnieciskie izstrādājumi.

Parasti, ja izlase ir mazāka par 5% no populācijas, populācija tiek uzskatīta par lielu, un aprēķini tiek veikti saskaņā ar iepriekšminētajiem noteikumiem.

Ja izlases V pārsniedz 5% no populācijas, tad pēdējo uzskata par mazu, un iepriekš minētajās formulās tiek ieviests korekcijas koeficients. Šajā gadījumā izlases lielumu nosaka šādi:

kur n1 ir izlases lielums nelielai populācijai,

n – izlases lielums (procentiem vai vidējiem rādītājiem), kas aprēķināts, izmantojot iepriekš minētās formulas,

N ir kopējās populācijas apjoms.

Piemēram, tiek pētīts 1000 uzņēmumu iedzīvotāju viedoklis par ķīmiskās rūpnīcas celtniecību Tomskas pilsētas robežās. Tā kā trūkst informācijas par variāciju, tiek pieņemts sliktākais gadījums: 50:50. Pētnieks nolēma izmantot 95% ticamības līmeni. Pētījuma pasūtītājs norādīja, ka būtu apmierināts ar rezultātu precizitāti plus mīnus 5%. Šajā gadījumā tiek izmantota šāda procentuālā mēra formula:

Šo pieeju V izlases veidošanai ar zināmām atrunām var izmantot arī, aprēķinot žūrijas un ekspertu grupas lielumu.

Dotās izlases aprēķinu formulas ir balstītas uz pieņēmumu, ka ir ievēroti visi izlases noteikumi, un vienīgā kļūda ir kļūda tās lieluma dēļ.

Nodaļa no grāmatas "Mārketinga pētījumi"

Psiholoģija: personība un bizness

	Apdzīvoto objektu apzināšana

	Pārbaudes metodes izvēle

Pilnīga pārbaude			Aptaujas paraugs


		Paraugu ņemšanas procedūras izvēle		Parauga lieluma aprēķins


	Paraugu ņemšanas plāna īstenošana

Rīsi. 4.3. Izlases plānošana

Paraugu ņemšanas plānošana ietver šādas procedūras (4.3. attēls):

Vispārējās populācijas objektu identificēšana.

Pārbaudes metodes noteikšana.

Paraugu ņemšanas procedūras noteikšana.

Izlases lieluma noteikšana.

Objektu identifikācija vispārējā populācijā

Populācija ir visu vienību kopums, kas ir pētījuma objekti.

Šajā pētījuma sagatavošanas posmā ir jānosaka, kuri subjekti veido pētāmo populāciju. Parasti vispārējā populācijā iekļautie subjekti ir neviendabīgi, tāpēc, nosakot tipiskus pētījuma objekta pārstāvjus, dažas grupas var palaist garām. Īpaši grūti ir pārstāvēt visus sabiedrības, kas sastāv no organizācijām, elementus, jo ne visi uzņēmumi reklamē savu darbību. Vispārējo populāciju var definēt kā tirgu kopumā, tirgus segmentu vai subjektu mērķa grupu.

Pārbaudes metodes noteikšana

Atkarībā no populācijas lieluma un pētījuma mērķiem var izmantot nepārtrauktas vai izlases aptaujas metodes.

Nepārtrauktas pārbaudes metode sastāv no visu vispārējās populācijas vienību izpētes. Metode ir saistīta ar augstām izpētes izmaksām, tās izmantošana ir pamatota, piemēram, ja kādu segmentu pārstāv neliels patērētāju skaits vai gadījumā, ja konkrēta klienta pirkumu apjoms veido būtisku tirgus daļu jaudu kopumā.

Paraugs- šī ir izpētes objektu grupa, kas raksturo visas vispārējās populācijas vienības, piemēram, patērētāju grupa, kas pārstāv visa mērķa tirgus intereses un gaumi.

Izlases aptaujas metode nodrošina mazāku precizitāti salīdzinājumā ar nepārtrauktās aptaujas metodi, taču tā ir mazāk darbietilpīga. Šo metodi ieteicams izmantot liela skaita viendabīgu vispārējās populācijas vienību klātbūtnē.

Paraugu ņemšanas metode sniedz informāciju par populāciju, pamatojoties tikai uz tās daļas aptauju, tāpēc izlases apsekojuma laikā iegūtajiem datiem ir varbūtības raksturs. Praksē tas nozīmē, ka pētījuma rezultātā tiek noteikta nevis konkrēta vērtība, bet gan intervāls, kurā atrodas vēlamā vērtība. Tiek izsaukta varbūtība, ar kādu var apgalvot, ka izlases kļūda nepārsniegs noteiktu noteiktu vērtību ticamības varbūtība.

Izlases īpašību atspoguļot kopas īpašības sauc par reprezentativitāti. Atšķirību starp vispārējās un izlases populācijas raksturlielumiem sauc par izlases kļūdu, kas ir atkarīga no izvēlētās izlases procedūras.

Paraugu ņemšanas procedūras

Paraugu ņemšanas procedūra ir respondentu atlases secība izlasei.

Respondentu atlasi var pavadīt sistemātiskas un nejaušas kļūdas. Sistemātiskas kļūdas rodas, ja paraugu ņemšanas procedūra ir izvēlēta nepareizi. Nejaušas kļūdas vienmēr pastāv, jo tie ir saistīti ar grūti paredzamu faktoru ietekmi. Nejaušības ietekmi nevar pilnībā novērst, bet nejaušās kļūdas lielumu var noteikt, izmantojot statistikas metodes. Neobjektivitāti nevar novērtēt, bet to var novērst, mainot paraugu ņemšanas procedūru.

Ņemot vērā divu veidu kļūdu klātbūtni izlases veidošanā, izšķir nejaušas (varbūtības) un negadījuma (deterministiskas) atlases procedūras.

Nejaušas paraugu ņemšanas procedūras

Nejauši Izlases procedūrās, izmantojot pašu izlases procesu, tiek veikta nejauša respondentu atlase, kuru viedoklis var atšķirties no vispārējās populācijas viedokļa, tādējādi izraisot nejaušas (sistemātiskas) datu kļūdas klātbūtni pētījuma rezultātos. . Izmantojot negadījuma procedūras, respondentu atlase izlasē tiek veikta, pamatojoties uz jebkuriem pieņemtiem nosacījumiem, kas ierobežo iespējamo pētījuma dalībnieku loku. Piemēram, izlasē tiek atlasīti tikai tie respondenti, kuriem pieder dators vai kuri devās uz veikalu laikā no pulksten 10 līdz 11.

Ir iespējami šādi nejaušu paraugu veidi:

Izlases ņemšana nejauši - elementi tiek atlasīti bez plāna, nejauši; metode ir lēta un ērta, bet rada neprecizitāti un nereprezentativitāti;

tipisks paraugs - kopa ir ierobežota tikai ar raksturīgiem (tipiskiem) vispārējās populācijas elementiem; izmanto, piemēram, veidojot fokusa grupas; taču tam nepieciešama informācija par pētāmo objektu tipiskumu;

kvotu izlase - izlases struktūra tiek veidota pēc analoģijas ar noteiktu pazīmju sadalījumu vispārējā populācijā; No katras vispārējās populācijas grupas tiek atlasīti pētījuma dalībnieki, kuru skaits ir proporcionāls grupas pārstāvībai vispārējā populācijā.

Nejaušas paraugu ņemšanas procedūras

Plkst veidojot nejaušu paraugu Tiek piemērotas šādas procedūras.

vienkārša atlase - elementi tiek atlasīti, izmantojot nejauši skaitļi; izmantojot šo pieeju, tiek pieņemts, ka visām vispārējās populācijas vienībām varbūtība tikt atlasītai izlases populācijā ir vienāda (varbūtības vērtība ir vienāda ar izlases lieluma attiecību pret vispārējās populācijas lielumu). Metode ir ļoti darbietilpīga, un tai ir nepieciešams saraksts ar visām vispārējās populācijas vienībām;

sistemātiskā (mehāniskā) izlases ņemšana - pirmais elements tiek atlasīts, izmantojot nejaušus skaitļus, pārējie izlases elementi tiek atlasīti vienādos intervālos (lēciena intervāls), kas ir vienādi ar populācijas lieluma attiecību pret izlases lielumu. Šī izlases procedūra ievērojami vienkāršo procedūru, bet var radīt izkropļojumus izlases struktūrā, ja kopa ir sakārtota atbilstoši jebkuram atribūtam.

Ja vispārējā populācija ir sakārtota pēc būtiska raksturlieluma (pazīme tiek uzskatīta par nozīmīgu, ja tā nosaka pētāmā rādītāja stāvokli), tad, lai samazinātu izlases raksturlieluma izkropļojumus, izlases vienības jāizvēlas no noteiktā intervāla vidus. Tas pats tiek darīts gadījumā, ja vispārējā populācija tiek sakārtota pēc sekundāra rakstura, kas daļēji ietekmē pētāmo objektu.

Ja vispārējā populācija ir sakārtota pēc neitrāla raksturlieluma (kas neietekmē pētāmā objekta uzvedību), tad izlasē ir pieļaujams iekļaut jebkuru vispārējās populācijas vienību no noteiktā intervāla;

Stratificētā (tipiskā vai grupu) izlase - vispārējā populācija tiek sadalīta grupās ar noteiktu pazīmju kopumu (segmenti vai slāņi), kurās katrā tiek veidota sava izlase, izmantojot nejaušu atlasi; katra slāņa svara koeficients kopējais apjoms paraugs tam atbilst īpaša gravitāte vispārējā populācijā; klasteru (sērijveida) paraugu ņemšana - vispārējā populācija tiek sadalīta identiskās grupās (ligzdās, puķu dobēs vai puduros). Klasteriem jābūt pēc iespējas līdzīgākiem; klastera sastāvam jābūt līdzīgam vispārējai populācijai. Vairākas grupas tiek nejauši atlasītas no vispārējās populācijas un tiek pakļautas pilnīgai aptaujai (viena posma pieeja). Iespējama arī divpakāpju pieeja, kad paraugs sākotnēji tiek veidots no klasteriem, un no tā nejauši tiek atlasītas pētāmās vienības (t.i., iepriekšējā posma izlases vienība kļūst par kopējo kopu nākamajam). Šīs paraugu ņemšanas procedūras trūkums ir tāds, ka klasteri savā starpā var būt neviendabīgi, taču šī procedūra ir vienkārša un ekonomiska.

Daudzpakāpju paraugu ņemšana

Jebkāda veida paraugu ņemšana var būt viena vai vairāku posmu. Daudzpakāpju izlase tiek izmantota gadījumos, kad ir grūti tieši iegūt paraugu no vispārējās kopas, savukārt visas izlases vienības katrā posmā ir līdzvērtīgas apsekojumam.

Daudzpakāpju atlases savienošana dažādas procedūras paraugu ņemšana, padara paraugu apvienotu. Šī izlases iespēja ļauj sasniegt racionālākos un ekonomiskākos apstākļus datu vākšanai atbilstoši mērķiem.

Izlases lieluma noteikšana

Izlases lieluma noteikšana ir kompromiss starp pētījuma rezultātu precizitātes teoriju un tās praktiskās īstenošanas iespēju informācijas vākšanas izmaksu ziņā.

Visvairāk piemērojams šādas metodes parauga lieluma noteikšana:

1. Patvaļīga aprēķina metode; šajā gadījumā izlases lielumu nosaka 5-10% no kopējās populācijas līmenī.

Tradicionālā aprēķina metode; ietver periodisku ikgadēju aptauju veikšanu, piemēram, 500, 1000 vai 1500 respondentu.

Statistiskā aprēķina metode; ir balstīta uz informācijas statistiskās ticamības noteikšanu.

Aprēķina metode, izmantojot nomogrammas.

Empīriskā metode; šajā gadījumā izlase tiek uzskatīta par pietiekamu, ja visa jaunā informācija ievieš tikai nelielas izmaiņas (kuras var neņemt vērā) jau savāktajos pētījuma rezultātos.

Izmaksu metode; pamatojoties uz izdevumu apjomu, ko var tērēt pētījumu veikšanai.

Statistiskā metode izlases lieluma aprēķināšanai

Statistiskās izlases lielumu ietekmē šādi faktori:

Informācijas pieejamība par populācijas lielumu un tās viendabīguma pakāpi.

Nepieciešamā rezultātu precizitāte, ko regulē reprezentativitātes maksimālās pieļaujamās kļūdas vērtība un ticamības līmeņa vērtība, ar kuru tiek izdarīts secinājums par pētījuma rezultātu ticamību.

Informācijas pieejamība par vispārējās populācijas vidējiem rādītājiem pētāmajai pazīmei vai par raksturlieluma variācijas intervālu (dispersiju).

Iespēja atkārtoti iekļaut populācijas vienību izlasē.

Nosakot izlases lielumu lielām populācijām (ja izlases lielums ir mazāks par 5% populācija) var izmantot šādas formulas:

a) atkārtota izlases ņemšana (ja ir iespējams izlasē atkārtoti iekļaut vispārējās populācijas vienību) ar nezināmu kopējās kopas lielumu, bet zināms sadalījums kontrolēta zīme:

Kur t- normalizēta novirze, ko nosaka izvēlētais ticamības līmenis (pie 95% ticamības līmeņa t= 1,96; ar 99% ticamības līmeni t= 2,58); R - konstatētās vispārējās populācijas izmaiņas, % vai daļās; q= 100 - R; D - pieļaujamā kļūda, procentos vai daļās;

b) atkārtota paraugu ņemšana ar zināmu pētāmā raksturlieluma dispersiju (o):

c) neatkārtota paraugu ņemšana (izņemot iespēju atkārtoti iekļaut vispārējās populācijas vienību izlasē) ar zināmu vispārējās kopas apjomu un zināmu kontrolētās pazīmes sadalījumu:

Kur N- ;

d) neatkārtota paraugu ņemšana ar zināmu pētāmā raksturlieluma dispersiju:

Izlasi uzskata par mazu, ja tās lielums pārsniedz 5% no kopējās populācijas, un tādā gadījumā izlases lielumu var pielāgot:

Kur P" - izlases lielums nelielai populācijai, P - statistiskais izlases lielums, N- kopējās populācijas lielums.

Statistiskās izlases ar normalizētu novirzi aprēķins t= 2 un pieļaujamā kļūda 5% (sk. 4.2. tabulu) parāda, ka lielām populācijām izlases lielumu var noteikt jebkurā veidā, jo praktiskie paņēmieni mēdz pārvērtēt aptaujātās populācijas lielumu.

4.2. tabula Izlases lieluma atkarība no populācijas lieluma*

Iedzīvotāju lielums
Parauga lielums

* ar normalizētu novirzi t= 2 un pieļaujamā kļūda 5%.

No galda 4.2 ir skaidrs, ka, ja populācijas lielums ir lielāks par 5000, tā vērtība neietekmē izlases lielumu, tāpēc formulai var būt šāda forma (vērtība 1/ N var neņemt vērā):

(4.6)

Piemēram, no iepriekšējiem pētījumiem zināms, ka atbilžu sadalījums uz pētnieku interesējošo jautājumu (piemēram, par lietotāja statusu) bija 60% un 40% (60% respondentu apstiprinoši atbildēja uz jautājumu par lietojot produktu un 40% atbildēja noraidoši). Mērķa respondentu īpatsvars kopējā respondentu skaitā ir 70%. Vairāk detalizēta analīze jums jāsaņem 100 pozitīvas atbildes. Lai iegūtu šo rezultātu, jums jāaptauj 238 cilvēki:

Tādējādi, ja nav precīzas informācijas par populācijas lielumu un īpašībām (ar nosacījumu, ka tas ir vismaz 5000), pietiek ar 400 tās pārstāvju iekļaušanu izlasē. Tomēr jāatzīmē, ka, ja mēs gatavojamies kontrolēt izlases struktūru pēc vairākiem parametriem, tad izlases lielums būs daudz lielāks. G. A. Čērčils savā darbā “Mārketinga pētījumi” sniedz noteikumu šajā sakarā: “Izlases lielumam jānodrošina vismaz 100 novērojumi katrai primārajai un vismaz 20-50 novērojumi katrai sekundārajai klasifikācijas komponentei”; Jāpieņem arī iespēja, ka atsevišķi izlasē iekļautie respondenti var būt nesasniedzami vai var atteikties piedalīties pētījumā.1

Respondentu skaitu, kurus nepieciešams intervēt, lai iegūtu nepieciešamo pozitīvu atbilžu skaitu uz interesējošo jautājumu, var aprēķināt, izmantojot formulu:

Kur P - analīzei nepieciešamo pozitīvo atbilžu skaits; Pj - pozitīvu atbilžu īpatsvars; R 2 - dalīties mērķa grupas, ko aprēķina kā visu to respondentu daļu reizinājumu, kuri atbilst noteiktajām prasībām (vecums, dzimums, lietotāja statuss utt.).

Nomogrammu izmantošana izlases lieluma aprēķināšanai

Vēlme vienkāršot izlases lieluma aprēķināšanas procedūru noved pie tabulu, skalu vai programmu izveides, kas ir vērstas uz informācijas statistiskās ticamības nodrošināšanu, bet neapgrūtina lietotāju ar zināšanām par īpašām formulām no statistikas jomas. Piemēram, ir izlases kalkulators (www. shortway. to/few/calculator, htm), Gallup vietnē (www. gallup. ru) var atrast tabulu, kurā sasaista izlases lieluma, atbilžu sadalījuma rādītāji ar standarta kļūdu. (4.3. tabula).

4.3. tabula Saistība starp izlases lieluma rādītājiem un atbilžu sadalījumu un standarta kļūda

Atbilžu sadale,			Parauga lielums
Atbilžu sadale,

Nomogramma ir grafisks veids, kā noteikt parauga lielumu. Nomogramma ietver trīs skalas (4.4. att.). Kreisajā pusē esošajā skalā ir iestatīts standartnovirzes indikatora marķējums vai raksturlieluma daļas sadalījums. Labajā skalā mērījumu precizitāte ir atzīmēta pieņemamas kļūdas veidā (puse no intervāla) ar noteiktu ticamības varbūtību 95 vai 99%. Atzīmes tiek veiktas vidējā skalā, kas atbilst vajadzīgajam parauga izmēram. Labajā un kreisajā skalā tiek veiktas atzīmes vēlamo indikatora vērtību līmenī (rakstzīmes daļa un pieļaujamā kļūda). Šīs divas atzīmes ir savienotas ar lineālu, lineāla krustpunktā ar vidējo skalu tiek veikta parauga tilpumam atbilstoša atzīme, kas atbilst pētnieka vēlmēm.

Rīsi. 4.4. Nomogramma izlases lieluma noteikšanai (95% ticamības līmenis)"

4.5. Izlases lieluma noteikšana

Paraugu ņemšanas plāna procedūra ietveršādu trīs uzdevumu secīgs risinājums:

Pētījuma objekta definīcija;

Izlases struktūras noteikšana;

Izlases lieluma noteikšana.

Parasti, mārketinga pētījumu objekts ir novērošanas objektu kopums, kas var būt patērētāji, uzņēmuma darbinieki, starpnieki u.c. Ja šī populācija ir tik maza, ka pētnieku grupai ir nepieciešamie darbaspēka, finanšu un laika resursi, lai izveidotu kontaktu ar katru tās elementu, tad ir pilnīgi iespējams veikt nepārtrauktu visas populācijas izpēti. Šajā gadījumā pēc pētījuma objekta noteikšanas varat pāriet pie nākamās procedūras (datu vākšanas metodes, pētījuma instrumenta un saziņas ar auditoriju metodes izvēle).

Tomēr praksē bieži vien nav iespējams vai nav ieteicams veikt visaptverošu pētījumu par visu iedzīvotāju skaitu. Tam var būt šādi iemesli:

Nespēja nodibināt kontaktu ar dažiem kopuma elementiem;

Nepamatoti augstas izmaksas nepārtraukta pētījuma veikšanai vai finansiālu ierobežojumu esamība, kas neļauj veikt pilnīgu pētījumu;

Īsais pētniecībai atvēlētais laiks ir saistīts ar informācijas aktualitātes zudumu laika gaitā vai citu iemeslu dēļ, un tas neļauj vākt, sistematizēt un analizēt plašus datus par visu iedzīvotāju skaitu.

Tāpēc lielas un izkliedētas populācijas bieži tiek pētītas, izmantojot izlasi, kas, kā zināms, tiek saprasta kā populācijas daļa, kas paredzēta, lai pārstāvētu populāciju kopumā.

Precizitāte, ar kādu izlase atspoguļo populāciju kopumā, ir atkarīga no parauga struktūra un lielums.

Izlases veidošanai ir divas pieejas- varbūtiskā un deterministiskā.

Varbūtības pieeja izlases veidošanai pieņem, ka jebkuru kopas elementu var atlasīt ar noteiktu (ne nulles) varbūtību. Pastāv Dažādi paraugi, kuru pamatā ir varbūtības teorija (tipiski, ligzdoti utt.). Vienkāršākā un praksē visizplatītākā ir vienkārša nejauša izlase, kurā katram kopas elementam ir vienāda iespēja tikt izvēlētam pētniecībai.

Varbūtības izlase ir precīzāka un ļauj pētniekam novērtēt viņa savākto datu ticamības pakāpi, lai gan tā ir sarežģītāka un dārgāka nekā deterministiskā izlase.

Deterministiska pieeja uz paraugu ņemšanas rāmi pieņem, ka populācijas elementu atlase tiek veikta ar metodēm, kuru pamatā ir ērtības apsvērumi, vai pētnieka lēmums, vai iespējamās grupas.

ērtības labad, sastāv no jebkuru populācijas elementu atlases, pamatojoties uz to, cik viegli ar tiem nodibināt kontaktu. Šīs metodes nepilnības, iespējams, ir saistītas ar iegūtā parauga zemo reprezentativitāti, jo pētniekam ērtie populācijas elementi var nebūt pietiekami reprezentatīvi populācijas pārstāvji to nejaušās un nepamatotās atlases dēļ.

Taču, no otras puses, ar šo metodi veikto pētījumu vienkāršība, ekonomiskums un efektivitāte ir izpelnījusies diezgan plašu pielietojumu praksē un, galvenokārt, provizoriskajos pētījumos, kuru mērķis ir noskaidrot galvenās problēmas.

Pamatojoties uz izlases metodi par pētnieka lēmumu, sastāv no populācijas elementu atlases, kas, viņaprāt, ir tās raksturīgie pārstāvji. Šī metode ir progresīvāka par iepriekšējo, jo tā ir balstīta uz orientāciju uz pētāmās populācijas raksturīgajiem pārstāvjiem, lai gan izvēlēta, pamatojoties uz pētnieku subjektīvajiem priekšstatiem par to.

Paraugu ņemšanas metode, kuras pamatā ir iespējamos standartus, sastāv no populācijas raksturīgo elementu atlases atbilstoši iepriekš iegūtajām populācijas pazīmēm kopumā. Šos raksturlielumus var iegūt, veicot iepriekšēju izpēti, un atšķirībā no iepriekšējās metodes tie nav subjektīvi. Līdz ar to šī metode ir progresīvāka, tā ļauj iegūt izlases kopas ne mazāk reprezentatīvas kā varbūtības izlases par ievērojami zemākām aptaujas veikšanas izmaksām.

Izvēloties izlases struktūru (pieeju tās veidošanai, varbūtiskās vai deterministiskās izlases veidu), pētniekam būs jānosaka apjoms, t.i. elementu skaits izlases populācijā.

Parauga lielums nosaka informācijas ticamību viņas pētījuma rezultātā iegūtās, kā arī pētījuma veikšanai nepieciešamās izmaksas. Parauga lielums ir atkarīgs par pētāmo objektu viendabīguma vai daudzveidības līmeni.

Jo lielāks ir izlases lielums, jo augstāka ir tās precizitāte un lielākas ir aptaujas veikšanas izmaksas. Izmantojot varbūtības pieeju izlases struktūrai, tās apjomu var noteikt, izmantojot labi zināmas statistikas formulas, pamatojoties uz noteiktām prasībām attiecībā uz tā precizitāti.

Praksē izlases lieluma noteikšanai tiek izmantotas vairākas pieejas:

1. Brīva pieeja pamatojoties uz "īkšķa noteikuma" piemērošanu. Piemēram, bez pierādījumiem tiek pieņemts, ka, lai iegūtu precīzus rezultātus, izlasei ir jābūt 5% no populācijas. Šī pieeja ir vienkārša un viegli īstenojama, taču nav iespējams noteikt iegūto rezultātu precizitāti. Pie pietiekami liela iedzīvotāju skaita tas var būt arī diezgan dārgi.

Izlases lielumu var iestatīt, pamatojoties uz noteiktiem iepriekš saskaņotiem nosacījumiem. Piemēram, mārketinga pētījumu pasūtītājs zina, ka, pētot sabiedrisko domu, izlase parasti ir 1000-1200 cilvēku, tāpēc viņš iesaka pētniekam pieturēties pie šī skaitļa. Ja ikgadējais pētījums tiek veikts noteiktā tirgū, tad katru gadu tiek izmantota tāda paša izmēra izlase. Atšķirībā no pirmās pieejas, šeit, nosakot izlases lielumu, tiek izmantota labi zināma loģika, kas tomēr ir ļoti neaizsargāta.

Piemēram, veicot noteiktus pētījumus, var būt nepieciešama mazāka precizitāte nekā pētot sabiedrisko domu, un iedzīvotāju skaits var būt daudzkārt mazāks nekā pētot sabiedrisko domu. Tādējādi šī pieeja neņem vērā pašreizējos apstākļus un var būt diezgan dārga.

Dažos gadījumos aptaujas veikšanas izmaksas tiek izmantotas kā galvenais arguments, nosakot izlases lielumu. Tādējādi mārketinga pētījumu budžetā ir paredzētas atsevišķu aptauju veikšanas izmaksas, kuras nevar pārsniegt. Acīmredzot netiek ņemta vērā saņemtās informācijas vērtība. Tomēr dažos gadījumos neliels paraugs var dot diezgan precīzus rezultātus.

Šķiet saprātīgi izmaksas izvērtēt nevis absolūtos skaitļos, bet gan saistībā ar veiktajās aptaujās iegūtās informācijas lietderību. Klientam un pētniekam jāņem vērā dažādi izlases lielumi un datu vākšanas metodes, izmaksas un citi faktori

2. Izlases lielums no pieļaujamās kļūdas ticamības intervāla līmeņa; ko, kā jau minēts, nosaka gala vispārinājumu lietderīgā precizitāte: no palielināta uz indikatīvu. Tomēr tas attiecas uz tā sauktajām nejaušajām kļūdām, kas saistītas ar jebkādu statistisko kļūdu raksturu. Tās tiek aprēķinātas kā kļūdas varbūtības paraugu reprezentativitātē.

V.I.Paniotto sniedz šādus aprēķinus reprezentatīvai izlasei ar pieņēmumu par 5 procentu kļūdu (4.2.tabula).

4.2. tabula

Aprēķinu tabulas paraugs

Populācijai, kas lielāka par 100 000, izlases lielums ir 400 vienības. Ja paturam prātā vispārējās populācijas 5 tūkstošus un vairāk, tad pēc tā paša autora aprēķiniem var norādīt faktiskās izlases kļūdas lielumu atkarībā no tās apjoma, kas mums ir ļoti svarīgi, paturot prātā, ka pieļaujamās kļūdas lielums ir atkarīgs no mērķa pētījuma, un tam nav jābūt tuvu 5 procentu līmenim.

4.3. tabula

Aprēķinu tabula

Līdzās nejaušām kļūdām ir iespējamas sistemātiskas kļūdas. Tie ir atkarīgi no izlases veida aptaujas organizācijas. Tās ir dažādas izlases novirzes pret vienu no izlases parametra poliem.

3. Izlases lielums, pamatojoties uz statistisko analīzi . Šīs pieejas pamatā ir minimālā izlases lieluma noteikšana, pamatojoties uz noteiktām prasībām attiecībā uz iegūto rezultātu ticamību un derīgumu. To izmanto arī, analizējot rezultātus, kas iegūti atsevišķām izlasē izveidotajām apakšgrupām pēc dzimuma, vecuma, izglītības līmeņa utt. Atsevišķu apakšgrupu rezultātu ticamības un precizitātes prasības nosaka noteiktas prasības izlases lielumam kopumā.

Teorētiski pamatotākā un pareizākā pieeja izlases lieluma noteikšanai ir balstīta uz ticamu intervālu aprēķināšanu. Variācijas jēdziens raksturo respondentu atbilžu atšķirību (līdzības) apjomu uz noteiktu jautājumu. Stingrāk sakot, raksturlieluma vērtību variācijas kopumā ir atšķirības tās vērtībās starp dažādām konkrētās populācijas vienībām vienā un tajā pašā periodā vai brīdī. Aptaujas atbilžu rezultāti parasti tiek parādīti sadalījuma līknes veidā (4.1. attēls). Ja atbilžu līdzība ir augsta, mēs runājam par zemu variāciju (šaura sadalījuma līkne), un, ja atbilžu līdzība ir zema, mēs runājam par lielu variāciju (plaša sadalījuma līkne).

Kā variācijas mērs parasti tiek ņemta standartnovirze, kas raksturo vidējo attālumu no katra respondenta atbilžu vidējā vērtējuma uz konkrētu jautājumu.

Neliela variācija

Augsta Variācija

Rīsi. 4.1. Variāciju un sadalījuma līknes

Tā kā visi mārketinga lēmumi tiek pieņemti nenoteiktības apstākļos, šo apstākli ieteicams ņemt vērā, nosakot izlases lielumu. Tā kā pētāmo vērtību noteikšana populācijai šaurā veidā tiek veikta, pamatojoties uz izlases statistiku, ir jānosaka diapazons (uzticamības intervāls), kurā paredzams, ka aplēses visai populācijai kritums un kļūda to noteikšanā.

Uzticamības intervāls ir diapazons, kura galējie punkti atbilst noteiktam procentuālam noteiktu atbilžu uz jautājumu. Ticamības intervāls ir cieši saistīts ar pētāmā raksturlieluma standarta novirzi populācijā: jo lielāks tas ir, jo plašākam ir jābūt ticamības intervālam, lai iekļautu noteiktu atbilžu procentu.

Veicot tirgus izpēti, ticamības intervāls ir 95% vai 99%. Neviens uzņēmums neveic mārketinga pētījumus, izmantojot vairākus paraugus. UN matemātikas statistikaļauj iegūt kādu informāciju par izlases sadalījumu, ja ir dati tikai par vienas izlases variāciju.

Rādītājs, kas norāda, cik lielā mērā aprēķins, kas ir patiess visai populācijai, atšķiras no novērtējuma, kas paredzēts tipiskam paraugam, ir vidējā kvadrātiskā kļūda. Turklāt, jo lielāks ir izlases lielums, jo mazāka ir kļūda. Liela variācijas vērtība rada lielu kļūdas vērtību un otrādi.

Ja uz doto jautājumu ir tikai divas iespējamās atbildes, kas izteiktas procentos (tiek izmantots procentuālais mērs), izlases lielumu nosaka pēc šādas formulas:

kur n ir izlases lielums; z – normalizētā novirze, kas noteikta, pamatojoties uz izvēlēto ticamības līmeni; p – paraugam atrastā variācija; g – (100-r); e – pieļaujamā kļūda.

Nosakot variācijas indeksu noteiktai populācijai, vispirms ir ieteicams veikt pētāmās populācijas iepriekšēju kvalitatīvu analīzi, pirmkārt, lai noteiktu iedzīvotāju vienību līdzību demogrāfiskos, sociālajos un citos interesējošos aspektos. pētnieks. Ir iespējams veikt pilotpētījumu, izmantojot līdzīgu agrāk veiktu pētījumu rezultātus. Izmantojot mainīguma procentuālo mēru, tiek ņemts vērā, ka maksimālā mainība tiek sasniegta pie p = 50%, kas ir sliktākais gadījums. Turklāt šis rādītājs radikāli neietekmē izlases lielumu. Tiek ņemts vērā arī pētījuma pasūtītāja viedoklis par izlases lielumu.

Izlases lielumu var noteikt, izmantojot līdzekļus, nevis procentus.

kur s ir standarta novirze.

Praksē, ja izlase ir no jauna izveidota un līdzīgas aptaujas nav veiktas, tad s nav zināms. Šajā gadījumā kļūdu e ieteicams iestatīt standartnovirzes daļās. Aprēķina formula tiek pārveidota un iegūst šādu formu:

Kur .

Iepriekš tika runāts par ļoti lielu izmēru agregātiem. Tomēr dažos gadījumos agregāti nav lieli. Parasti, ja izlase ir mazāka par pieciem procentiem no populācijas, populācija tiek uzskatīta par lielu un aprēķini tiek veikti saskaņā ar iepriekšminētajiem noteikumiem. Ja izlases lielums pārsniedz 5% no populācijas, tad pēdējo uzskata par mazu un iepriekš minētajās formulās ievada korekcijas koeficientu.

Šajā gadījumā izlases lielumu nosaka šādi:

Varbūtības izlases lieluma noteikšana

Apjoms varbūtības izlase tiek noteikta, izmantojot īpašas formulas, atkarībā no dotā uzticamība, precizitāte pētījumi un dispersijas vispārējā populācija.

Izlases aptaujas izmantošanas iespējas teorētiskā bāze lai novērtētu īpašības iedzīvotāju skaits ir centrālā robežu teorēma.

Centrālās robežas teorēma stāvokļi: vienkāršiem nejaušiem paraugiem tilpums n, izolēts no vispārējās populācijas ar patieso vidējo μ Un dispersija σ2, Priekš liels parauga vidējo n sadalījums tuvojas normai ar centru, kas vienāds ar patieso vidējo un dispersiju, kas vienāda ar populācijas dispersijas attiecību pret izlases lielumu, tas ir:

Teorēma ir patiesa jebkuram biežuma sadalījumam populācijā, bet jo tuvāk sadalījums populācijā ir normālam, jo mazāks ir izlases lielums, kas nepieciešams, lai sasniegtu līdzvērtīgu pētījuma ticamību un precizitāti.

Praksē pētnieks no kopas veido tikai vienu izlasi un viņam jāzina, kādam jābūt izlases lielumam, lai saglabātu noteiktos ticamības un precizitātes parametrus. Formula izlases lieluma noteikšanai vērtējot vidējo var iegūt, pamatojoties uz centrālās robežu teorēmas noteikumiem, un tam ir šāda forma:

n- nepieciešamais izlases lielums;

z- intervālu skaits, kas raksturo pētījuma ticamības prasību;

H- nepieciešamā pētījuma precizitātes vērtība;

σ2- iedzīvotāju izkliede.

Sīkāk apskatīsim parametrus vienādojuma labajā pusē.

Uzticamība raksturo varbūtību, ka konkrēta izlases veida izlase adekvāti atspoguļo populācijas īpašības.

Pārliecība 99% nozīmē, ka 99 paraugos no 100 populācijas vidējais būs izlases pētījuma rezultātā iegūtā vidējā intervālā.

Piemērs . Piemēram, tika veikti trīs neatkarīgi izlases pētījumi par iedzīvotāju ienākumu līmeni konkrētā reģionā. Tika iegūti šādi dati par vidējo ienākumu līmeni: 300 10 UAH, 310 10 UAH, 305 10 UAH, patiesā vidējā vērtība ir 302 UAH.

Kā redzam, patiesā vidējā vērtība ir iekļauta visos trīs intervālos.

Ar uzticamību 99% un noteikto precizitāti 10 UAH. 99 paraugos no simts izlases vidējā vērtība būs robežās no 292 līdz 312 UAH. Vienā gadījumā no simts mēs iegūsim rezultātu zem 292 UAH vai vairāk nekā 312 UAH. Šāda pētījuma rezultāti būs neuzticami, jo vispārējās populācijas vidējais netiks iekļauts izlases pētījuma rezultātā iegūtās vidējās vērtības koridorā.

Uzrādītajā formulā uzticamību raksturo z vērtība, kas tiek noteikta no z sadalījuma tabulas atkarībā no norādītās ticamības procentos.

Mēs sniedzam atbilstību tikai dažām tipiskām varbūtībām: 68,26% (z=1), 95,45% (z=2), 99,73% (z=3).

z-distribution – Standarta normālais (Z) sadalījums

z vērtība ir standarta kļūdu skaits, ar kurām punkts tiek noņemts no vidējā.

Tabulas vietā, lai aprēķinātu trāpījuma varbūtību nejaušais mainīgais iezīmētajā (ēnotajā) diapazonā

Varat izmantot šādu EXCEL formulu:

2*NORMSDIST(z)-1

aizvietojot tajā nepieciešamo z vērtību. Piemēram:

Precizitāte nosaka pētnieks, pamatojoties uz konkrēto veicamo uzdevumu.

Ja pētāmā vērtība ir absolūta, tad precizitāte ir jāattēlo kā absolūta, nevis relatīva vērtība. Nosakot procentus (akcijas), precizitāte tiek noteikta procentos.

Nosakot precizitāti, pētniekam jāņem vērā iespējamais pētījums rādītāja dinamika.

Piemērs . Piemēram, ja ar precizitāti 10 UAH. Pētījuma rezultāti pērn noteica vidējos ienākumus 300 UAH, un šogad tie ir 305 UAH. Ir nepareizi izdarīt secinājumus par ienākumu pieaugumu, jo izmaiņu lielums ir norādītajā precizitātes intervālā (mazāk par 10 UAH).

Sarežģītākā lieta, aprēķinot izlases lielumu, ir noteikt dispersijas . Novērtējot vidējo, rodas divi galvenie gadījumi:

1) populācijas dispersija ir zināma, pamatojoties uz iepriekšējiem pētījumiem;

2) populācijas dispersija nav zināma.

Izmantošanas iespēja dispersija, kas iegūta no iepriekšējiem pētījumiem, ir balstīts uz faktu, ka šis populācijas parametrs ir inerciālāks par vidējo. Proti, tas mainās lēnāk un līdz ar to, ja, piemēram, katru gadu pēta iedzīvotāju ienākumu līmeni, var izmantot pagājušā gada pētījumos iegūto dispersijas apjomu.

Izlases lieluma aprēķina piemērs.

Pirmkārt, izlases lielumu ietekmē pārliecības līmenis α, ko izmanto, lai noteiktu, izmantojot īpašu tabulu normalizēta novirze z. Piemēram, gadījumam α = 99%, no tabulas atrodam z = 2,58.

Otrkārt, tas ietekmē variācijas līmenis (koeficients). . Ņemsim, piemēram, variācijas koeficientu = 50%.

Treškārt, izlases lielumu ietekmē nepieciešamais precizitāte (pieļaujamā kļūda)

Ja Jūs neko nezināt par vispārējo līmeni, tad dispersijas līmeņa novērtēšanai var izmantot trīs sigmas noteikumi . Ar normālu sadalījumu 99% raksturlielumu parametriem jābūt šajā intervālā plus vai mīnus trīs sigmas no patiesā vidējā. Veicot pētījumu, jums vajadzētu novērtēt tipisko augšējo ( b) un zemāks (a ) parametru līmeņi, intervāls starp kuriem ir sešas sigmas. Sigmas vērtība būs parametru līmeņu starpība, kas dalīta ar 6.

Izkliede vai variācija var:

Kur ba– attiecīgi parametra augšējās un apakšējās vērtības.

Sigma ir vidējā kvadrātiskā novirze (standarta novirze):

Piemērs . Piemēram, pētot ienākumu līmenis parametra apakšējā vērtība tiek ņemta 0 UAH līmenī, bet augšējā vērtība, pieņemsim, 6000 UAH. Šajā gadījumā vērtība vidējā kvadrātiskā (standarta) novirze būs: (6000-0)/6=1000.

Jāpiebilst, ja pētnieks patiešām ir gatavs veikt pētījumu, tad nosakot tipiskos zemākos un augšējā robeža parametri nav īpaši grūti.

Strādājot ar mārketinga skalām, pieņemtais dispersijas apjoms ir atkarīgs no skalas punktu skaita un frekvenču sadalījuma veida.

Mārketinga izpētē tiek aplūkots sliktākais gadījums (kas atbilst maksimālajai dispersijai). vienmērīgs sadalījums atbildes starp skalas punktiem. Labākais ir normāls ar maksimālo atbilžu biežumu skalas vidū.

5.1. tabula. Tipiski izkliedes diapazoni atkarībā no skalas punktu skaita

Diapazona zemākie līmeņi atbilst normālais sadalījums frekvences, augšējās – vienotas.

Tiek piemērota iepriekš aprakstītā izlases lieluma noteikšanas formula aplēšot vidējos rādītājus.

Ja pētnieks strādā ar procentiem vai daļām, tad formula tiek pārveidota šādā formā:

kur p ir to cilvēku īpatsvars, kuri uz jautājumu atbild pozitīvi vai negatīvi.

Strādājot ar procentiem, formulā aizstājiet 100, nevis vienu.

Acīmredzot reizinātāja (1-р)р maksimālā vērtība rodas ar vienādu pozitīvo un negatīvo atbilžu proporciju un ir 0,25, strādājot ar akcijām, un 2500, strādājot ar procentiem. Taču rezultāts, strādājot ar akcijām vai procentiem, būs ir līdzvērtīgi, jo arī precizitātes kvadrāta skaitliskā vērtība saucējā atšķirsies par 10 000.

Izņemot gadījumus, kad tiek piemērots galīgais populācijas korekcijas koeficients. Tas var šķist neticami, bet, ja tā padomā, šim apgalvojumam ir jēga. Piemēram, ja visu kopas elementu pētītie raksturlielumi ir identiski, tad vidējā lieluma aprēķināšanai pilnīgi pietiek ar paraugu, kas sastāv no viena elementa. Tas attiecas arī uz gadījumiem, kad populācija sastāv no 50, 500, 5000 vai 50 000 elementiem.

Tajā pašā laikā populācijas raksturlielumu mainīgums tieši ietekmē izlases lielumu. Šī mainība tiek ņemta vērā, aprēķinot izlases lielumu, izmantojot populācijas dispersiju σ2 vai izlases dispersiju s2.

Piemērs (N.B. Safronova, I.E. Korņejeva). Aprēķināsim paraugu mārketinga pētījumam par patērētāju informētību par zīmolu. Varbūtības vērtība P = 0,954, šī pētījuma maksimālā pieļaujamā kļūda nedrīkst pārsniegt 5%. Cik respondentu būtu jāaptauj, lai šo problēmu atrisinātu, izmantojot nejaušu atkārtotu izlasi, ņemot vērā, ka nav datu par raksturlielumu sadalījumu?

Risinājums . Tā kā atribūta daļa nav zināma, pieņemsim, ka 50% patērētāju zina preču zīme, un 50% - nē. Mēs izmantojam formulu izlases aprēķināšanai, ņemot vērā raksturlieluma daļu:

= = 400 cilvēki

Ja analīzes procesā tiek izmantota dubultā vai trīskāršā tabula, ir nepieciešamas sarežģītākas metodes izlases lieluma aprēķināšanai. Tas ir saistīts ar to, ka ticamība un precizitāte, kas sasniegta ar aprēķināto izlases lielumu paraugam kopumā, netiek sasniegta atsevišķām tā daļām, kurās paraugs tiek sadalīts tabulēšanas procesā.

Piemērs . Piemēram, nosakot iedzīvotāju vidējo ienākumu līmeni, var pietikt ar noteiktu izlases lielumu, bet ar to nepietiek, lai noteiktu vīriešu un sieviešu vidējo ienākumu līmeni (ar doto precizitāti un ticamību). Tas ir viegli saprotams, jo vīriešu un sieviešu skaits, kas piedalījās aptaujā atsevišķi, ir mazāks nekā visu respondentu skaits. Taču, zinot vīriešu un sieviešu attiecību, ir viegli noteikt, ar kādu precizitāti katrai no aplūkojamajām grupām tiek aprēķināts vidējo ienākumu līmenis.

Izlases lieluma noteikšana: vidējais

Uzticamības intervāla izveidošanai izmantoto metodi var modificēt, lai noteiktu izlases lielumu, pamatojoties uz vēlamo ticamības intervālu. Pieņemsim, ka vēlaties precīzāk novērtēt mājsaimniecības ikmēneša universālveikala tēriņus, lai rezultāts būtu ±5,00 ASV dolāru robežās no patiesā iedzīvotāju vidējā rādītāja. Kādam jābūt izlases lielumam? Tabulā 12.2 sniedz nepieciešamo darbību sarakstu, kas jums jāveic.

1. Nosakiet precizitātes pakāpi. Šī ir maksimālā pieļaujamā atšķirība (D) starp izlases vidējo un populācijas vidējo. Mūsu piemērā D=± 5,00 USD.

2. Norādiet ticamības līmeni. Pieņemsim, ka vēlamais ticamības līmenis ir 95%.

3. Izmantojot tabulu, nosakiet r vērtību, kas saistīta ar doto ticamības līmeni. 2 pielikumā "Statistikas tabulas". Pie 95% ticamības līmeņa varbūtība, ka populācijas vidējais izkritīs ārpus vienpusējā intervāla, ir 0,025 (0,05/2). Atbilstošā r vērtība ir 1,96.

4. Noteikt populācijas vidējā standarta novirzi. To var iegūt no sekundāriem avotiem vai aprēķināt, veicot izmēģinājuma pētījumu. Turklāt, pamatojoties uz pētnieka viedokli, var iestatīt standarta novirzi. Piemēram, normāli sadalīta mainīgā diapazons ir aptuveni seši standarta novirzes(trīs pa kreisi un pa labi no vidējā). Tādējādi standarta novirzi var aprēķināt, dalot visa diapazona vērtību ar 6. Pētnieks bieži var noteikt diapazona lielumu, pamatojoties uz savu izpratni par analizējamajām parādībām.

5. Nosakiet izlases lielumu, izmantojot vidējās formulas standarta kļūdu:

Mūsu piemērā

(noapaļots līdz tuvākajam veselajam skaitlim).

5. parauga standartnovirze ir 50,00. Tad koriģētais ticamības intervāls būs

Ņemiet vērā, ka iegūtais ticamības intervāls ir šaurāks par paredzēto. Tas ir tāpēc, ka populācijas standartnovirze ir palielināta, pamatojoties uz izlases raksturlielumiem.

8. Dažkārt precizitāte tiek definēta relatīvā, nevis absolūtā izteiksmē. Citiem vārdiem sakot, var būt zināms, ka aprēķina rezultātam jābūt plus vai mīnus R% no vidējā. Tas nozīmē, ka D = rm.

Šajā gadījumā izlases lielumu var noteikt kā

Iedzīvotāju lielums N tiešā veidā neietekmē izlases lielumu, ja vien netiek piemērots galīgais populācijas korekcijas koeficients. Tas var šķist neticami, bet, ja tā padomā, šim apgalvojumam ir jēga. Piemēram, ja visu pētāmās populācijas elementu raksturlielumi ir identiski, tad vidējā lieluma aprēķināšanai pietiek ar paraugu, kas sastāv no viena elementa. Tas attiecas arī uz gadījumiem, kad populācija sastāv no 50 500 5000 vai 50 000 elementiem. Tajā pašā laikā populācijas raksturlielumu mainīgums tieši ietekmē izlases lielumu. Šī mainīgums tiek ņemts vērā, aprēķinot izlases lielumu, izmantojot populācijas dispersiju s2 vai izlases dispersiju s2.

Kopējais novērojamo objektu skaits (cilvēki, mājsaimniecības, uzņēmumi, apdzīvotas vietas u.c.) ar noteiktu pazīmju kopumu (dzimums, vecums, ienākumi, skaits, apgrozījums u.c.), ierobežots telpā un laikā. Populāciju piemēri

Visi Maskavas iedzīvotāji (10,6 miljoni cilvēku pēc 2002. gada tautas skaitīšanas)
Vīrieši maskavieši (4,9 miljoni cilvēku pēc 2002. gada tautas skaitīšanas)
Krievijas juridiskās personas (2,2 miljoni 2005. gada sākumā)
Pārtikas preču mazumtirdzniecības vietas (2008. gada sākumā 20 tūkst.) u.c.

Paraugs (izlases populācija)

Daļa no populācijas, kas atlasīta pētījumam, lai izdarītu secinājumus par visu populāciju. Lai slēdziens, kas iegūts, izpētot izlasi, tiktu attiecināts uz visu populāciju, izlasei ir jāpiemīt reprezentativitātes īpašībai.

Izlases reprezentativitāte

Izlases īpašība pareizi atspoguļot kopu. Viens un tas pats paraugs var būt reprezentatīvs un nereprezentatīvs dažādām populācijām.
Piemērs:

Izlase, kas sastāv tikai no maskaviešiem, kuriem pieder automašīna, neatspoguļo visus Maskavas iedzīvotājus.
Krievijas uzņēmumu izlase ar līdz 100 darbiniekiem nepārstāv visus uzņēmumus Krievijā.
Maskaviešu paraugs, kas iepērkas tirgū, neatspoguļo visu maskaviešu iepirkšanās paradumus.

Tajā pašā laikā šie paraugi (saskaņā ar citiem nosacījumiem) var lieliski attēlot maskaviešus, kuri ir mazo un vidējo automašīnu īpašnieki. Krievijas uzņēmumi un pircēji, kas iepērkas attiecīgi tirgos.
Ir svarīgi saprast, ka izlases reprezentativitāte un izlases kļūda ir atšķirīgas parādības. Reprezentativitāte, atšķirībā no kļūdas, nekādā veidā nav atkarīga no izlases lieluma.
Piemērs:
Lai cik palielinātu aptaujāto maskaviešu skaitu, kas ir auto īpašnieki, visus maskaviešus ar šo izlasi nevarēsim pārstāvēt.

Iztveršanas kļūda (uzticamības intervāls)

Izlases novērojumu rezultātā iegūto rezultātu novirze no kopējās populācijas patiesajiem datiem.
Ir divu veidu izlases kļūdas – statistiskā un sistemātiskā. Statistiskā kļūda ir atkarīga no izlases lieluma. Jo lielāks izlases lielums, jo mazāks tas ir.
Piemērs:
Vienkāršai nejaušai 400 vienību izlasei maksimālā statistiskā kļūda (ar 95% ticamības līmeni) ir 5%, 600 vienību izlasei - 4%, 1100 vienību izlasei - 3% Parasti, runājot par izlasi. kļūda, tie nozīmē statistisku kļūdu.
Sistemātiska kļūda ir atkarīga no dažādiem faktoriem, kas pastāvīgi ietekmē pētījumu un novirza pētījuma rezultātus noteiktā virzienā.
Piemērs:

Izmantojot jebkādus varbūtības paraugus, par zemu tiks novērtēts to cilvēku īpatsvars ar augstiem ienākumiem, kuri piekopj aktīvu dzīvesveidu. Tas notiek tāpēc, ka šādus cilvēkus ir daudz grūtāk atrast jebkurā konkrētā vietā (piemēram, mājās).
Problēma, ka respondenti atsakās atbildēt uz jautājumiem (“refuseniku” īpatsvars Maskavā dažādās aptaujās svārstās no 50% līdz 80%)

Dažos gadījumos, kad ir zināmi patiesie sadalījumi, sistemātisko kļūdu var izlīdzināt, ieviešot kvotas vai pārsverot datus, taču vairumā reālo pētījumu var būt diezgan problemātiski to pat novērtēt.

Paraugu veidi

Paraugi ir sadalīti divos veidos:

varbūtības
bez varbūtības

1. Varbūtību izlases
1.1. Nejauša izlase (vienkārša nejauša izlase)
Šāda izlase pieņem populācijas viendabīgumu, vienādu visu elementu pieejamības varbūtību un visu elementu pilnīga saraksta pieejamību. Izvēloties elementus, parasti tiek izmantota nejaušu skaitļu tabula.
1.2. Mehāniskā (sistemātiskā) paraugu ņemšana
Nejaušas izlases veids, kas sakārtots pēc kāda rakstura (alfabēta secība, tālruņa numurs, dzimšanas datums utt.). Pirmais elements tiek atlasīts nejauši, pēc tam ar soli 'n' tiek atlasīts katrs 'k' elements. Iedzīvotāju skaits, šajā gadījumā – N=n*k
1.3. Stratificēts (zonēts)
To izmanto populācijas neviendabīguma gadījumā. Vispārējā populācija ir sadalīta grupās (slāņos). Katrā slānī atlase tiek veikta nejauši vai mehāniski.
1.4. Sērijveida (kopu vai klasteru) paraugu ņemšana
Sērijveida izlasē atlases vienības ir nevis paši objekti, bet gan grupas (kopas vai ligzdas). Grupas tiek atlasītas nejauši. Objekti grupās tiek pārbaudīti masveidā.

2. Nevarbūtības izlases
Atlase šādā izlasē tiek veikta nevis pēc nejaušības principiem, bet gan pēc subjektīviem kritērijiem - pieejamība, tipiskums, vienāda reprezentācija utt.
2.1. Kvotu izlase
Sākotnēji tiek identificētas vairākas objektu grupas (piemēram, vīrieši vecumā no 20-30 gadiem, 31-45 gadi un 46-60 gadi; personas ar ienākumiem līdz 30 tūkstošiem rubļu, ar ienākumiem no 30 līdz 60 tūkstošiem rubļu un ar ienākumiem virs 60 tūkstošiem rubļu ) Katrai grupai ir norādīts objektu skaits, kas jāpārbauda. Objektu skaits, kam jāiekļaujas katrā no grupām, visbiežāk tiek noteikts vai nu proporcionāli iepriekš zināmajai grupas daļai vispārējā populācijā, vai arī vienāds katrai grupai. Grupu ietvaros objekti tiek atlasīti nejauši. Kvotu izlase tiek izmantota diezgan bieži.
2.2. Sniega bumbas metode
Paraugs ir izveidots šādi. Katram respondentam, sākot ar pirmo, tiek lūgta viņa draugu, kolēģu, paziņu kontaktinformācija, kuri atbilstu atlases nosacījumiem un varētu piedalīties pētījumā. Tādējādi, izņemot pirmo soli, izlase tiek veidota, piedaloties pašiem pētījuma objektiem. Metode bieži tiek izmantota, ja nepieciešams atrast un intervēt grūti sasniedzamas respondentu grupas (piemēram, respondenti ar augstiem ienākumiem, respondenti, kas pieder vienai profesionālajai grupai, respondenti ar līdzīgiem hobijiem/interesēm u.c.)
2.3. Spontāna paraugu ņemšana
Tiek intervēti pieejamākie respondenti. Tipiski piemēri spontāni paraugi - laikrakstos/žurnālos, doti respondentiem pašu aizpildīšanai, lielākā daļa tiešsaistes aptauju. Spontāno paraugu lielums un sastāvs nav iepriekš zināmi, un to nosaka tikai viens parametrs - respondentu aktivitāte.
2.4. Tipisku gadījumu paraugs
Tiek atlasītas vispārējās populācijas vienības, kurām ir vidējā (tipiskā) raksturlieluma vērtība. Tas rada problēmas ar objekta atlasi un tās tipiskās vērtības noteikšanu.