Dom Usnoj šupljini Uzorci. Tipovi uzoraka

Usnoj šupljini

Uzorci. Tipovi uzoraka

Ispod formule za izračun veličina uzorka koristi se u slučajevima kada se ispitanicima postavlja samo jedno pitanje, na koje postoje samo dva moguća odgovora. Na primjer, "Da" i "Ne"; „Koristim“ i „Ne koristim“. svakako, ovu formulu može se koristiti samo za jednostavna istraživanja. Ako trebate odrediti veličinu uzorka kada provodite veće studije, kao što su upitnici, onda biste trebali koristiti druge formule.

Jednostavna formula za izračunavanje veličine uzorka

gdje: n- veličina uzorka;

z– normalizovano odstupanje, određeno na osnovu izabranog nivoa pouzdanosti. Ovaj indikator karakteriše mogućnost, vjerovatnoću da odgovori padaju u poseban interval povjerenja. U praksi se za nivo pouzdanosti često uzima 95% ili 99%. Tada će z vrijednosti biti 1,96 odnosno 2,58;

str– varijacija za uzorak, u udjelima. U suštini, p je vjerovatnoća da će ispitanici izabrati jednu ili drugu opciju odgovora. Recimo da ako vjerujemo da će četvrtina ispitanika izabrati odgovor „Da“, onda će p biti jednako 25%, odnosno p = 0,25;

q= (1 – p);

e– dozvoljena greška, u razlomcima.

Primjer izračuna veličine uzorka

Kompanija planira održati sociološko istraživanje kako bi se utvrdio udio pušača u gradskoj populaciji. Da bi to učinili, zaposlenici kompanije će postaviti prolaznicima jedno pitanje: "Da li pušite?" Moguće opcije Dakle, postoje samo dva odgovora: „Da“ i „Ne“.

Veličina uzorka u ovom slučaju se izračunava na sljedeći način. Nivo pouzdanosti se uzima kao 95%, a zatim normalizovano odstupanje z = 1,96. Uzimamo varijaciju od 50%, odnosno uslovno pretpostavljamo da polovina ispitanika na pitanje puši li može odgovoriti „Da“. Onda p = 0,5. Odavde nalazimo q = 1 – p = 1 – 0,5 = 0,5 . Uzimamo dozvoljenu grešku uzorkovanja na 10%, tj e = 0,1.

Zamjenjujemo ove podatke u formulu i izračunavamo:

Dobivanje veličine uzorka n = 96 ljudi.

Opseg primjene ove formule

Kada provodite jednostavno istraživanje, kada trebate dobiti odgovor na samo jedno jednostavno pitanje. U ovom slučaju, skala odgovora je, po pravilu, dihotomna. Odnosno, ponuđene su (ili se podrazumijevaju) opcije odgovora kao što su “Da” - “Ne”, “Crno” – “Bijelo” itd.

Karakteristike ove formule za izračunavanje veličine uzorka

Galyautdinov R.R.

Ukupan broj objekata posmatranja (ljudi, domaćinstva, preduzeća, naselja itd.), koji posjeduju određeni skup karakteristika (pol, starost, prihod, broj, promet itd.), ograničen u prostoru i vremenu. Primjeri populacija

Svi stanovnici Moskve (10,6 miliona ljudi prema popisu iz 2002.)
Moskovljani (4,9 miliona ljudi prema popisu iz 2002.)
Pravna lica Rusija (2,2 miliona na početku 2005.)
Maloprodajni objekti za prodaju prehrambenih proizvoda (20 hiljada početkom 2008. godine) itd.

Uzorak (uzorak populacije)

Neki predmeti iz stanovništva odabrani za proučavanje kako bi se izveli zaključci o cjelokupnoj populaciji. Da bi se zaključak dobijen proučavanjem uzorka proširio na cijelu populaciju, uzorak mora imati svojstvo reprezentativnosti.

Reprezentativnost uzorka

Svojstvo uzorka da ispravno odražava populaciju. Isti uzorak može biti reprezentativan i nereprezentativan za različite populacije.
primjer:

Uzorak koji se u potpunosti sastoji od Moskovljana koji posjeduju automobil ne predstavlja cjelokupnu populaciju Moskve.
Uzorak ruskih preduzeća sa do 100 zaposlenih ne predstavlja sva preduzeća u Rusiji.
Uzorak Moskovljana koji kupuju na pijaci ne predstavlja kupovno ponašanje svih Moskovljana.

Istovremeno, ovi uzorci (podložni drugim uvjetima) mogu savršeno predstavljati Moskovljane koji su vlasnici malih i srednjih automobila. Ruska preduzeća i kupci koji kupuju na pijacama, respektivno.
Važno je shvatiti da su reprezentativnost uzorka i greška uzorkovanja različite pojave. Reprezentativnost, za razliku od greške, ni na koji način ne zavisi od veličine uzorka.
primjer:
Koliko god da povećamo broj ispitanih Moskovljana koji su vlasnici automobila, nećemo moći da predstavimo sve Moskovljane ovim uzorkom.

Greška uzorkovanja (interval pouzdanosti)

Odstupanje rezultata dobijenih posmatranjem uzorka od istinitih podataka opšte populacije.
Postoje dvije vrste greške uzorkovanja – statistička i sistematska. Statistička greška zavisi od veličine uzorka. Što je veći uzorak, to je manji.
primjer:
Za jednostavan slučajni uzorak od 400 jedinica, maksimalna statistička greška (sa nivoom pouzdanosti od 95%) je 5%, za uzorak od 600 jedinica - 4%, za uzorak od 1100 jedinica - 3% Obično, kada se govori o greška uzorkovanja, oni znače statističku grešku.
Sistematska greška zavisi od razni faktori, pružanje stalna izloženost na istraživanje i pomeranje rezultata istraživanja u određenom pravcu.
primjer:

Korištenje bilo kojeg uzorka vjerovatnoće će potcijeniti udio ljudi s visokim prihodima koji vode aktivan životni stil. To se događa zbog činjenice da je mnogo teže pronaći takve ljude na bilo kojem određenom mjestu (na primjer, kod kuće).
Problem odbijanja ispitanika da odgovore na pitanja (udio „odbijača“ u Moskvi, za različita istraživanja, kreće se od 50% do 80%)

U nekim slučajevima, kada su poznate prave distribucije, sistematska greška se može izravnati uvođenjem kvota ili ponovnom ponderacijom podataka, ali u većini stvarnih studija može biti prilično problematično čak i procijeniti je.

Tipovi uzoraka

Uzorci su podijeljeni u dvije vrste:

vjerovatnoća
nevjerovatni

1. Uzorci vjerovatnoće
1.1 Slučajno uzorkovanje (jednostavno nasumično uzorkovanje)
Takav uzorak pretpostavlja homogenost opće populacije, istu vjerovatnoću dostupnosti svih elemenata, prisutnost puna lista svi elementi. Prilikom odabira elemenata obično se koristi tabela slučajni brojevi.
1.2 Mehaničko (sistematsko) uzorkovanje
Vrsta slučajnog uzorka, poredanog prema nekim karakteristikama (abecedni red, broj telefona, datum rođenja, itd.). Prvi element se bira nasumično, zatim, korakom 'n', svaki 'k' element se bira. Veličina populacije, u ovom slučaju – N=n*k
1.3 Stratificirano (zonirano)
Koristi se u slučaju heterogenosti populacije. Opća populacija je podijeljena u grupe (stratume). U svakom stratumu selekcija se vrši nasumično ili mehanički.
1.4 Serijsko (klaster ili klaster) uzorkovanje
U serijskom uzorkovanju, jedinice selekcije nisu sami objekti, već grupe (klasteri ili gnijezda). Grupe se biraju nasumično. Objekti unutar grupa se ispituju na veliko.

2. Nevjerovatni uzorci
Odabir u takvom uzorku se ne vrši prema principima slučajnosti, već prema subjektivnim kriterijima - dostupnosti, tipičnosti, jednakoj zastupljenosti itd.
2.1. Uzorkovanje kvota
U početku se identifikuje niz grupa objekata (na primjer, muškarci u dobi od 20-30 godina, 31-45 godina i 46-60 godina; osobe s prihodom do 30 hiljada rubalja, s prihodom od 30 do 60 godina hiljada rubalja i sa prihodom od preko 60 hiljada rubalja ) Za svaku grupu naveden je broj objekata koji se moraju ispitati. Broj objekata koji treba da spadaju u svaku od grupa najčešće se postavlja ili proporcionalno prethodno poznatom udelu grupe u opštoj populaciji, ili isti za svaku grupu. Unutar grupa, objekti se biraju nasumično. Uzorkovanje kvota se koristi prilično često.
2.2. Metoda grudve snijega
Uzorak je konstruiran na sljedeći način. Od svakog ispitanika, počevši od prvog, traže se kontakt podaci njegovih prijatelja, kolega, poznanika koji bi odgovarali uslovima selekcije i koji bi mogli učestvovati u istraživanju. Dakle, sa izuzetkom prvog koraka, uzorak se formira uz učešće samih subjekata istraživanja. Metoda se često koristi kada je potrebno pronaći i intervjuisati teško dostupne grupe ispitanika (npr. ispitanici s visokim primanjima, ispitanici koji pripadaju istom profesionalna grupa, ispitanici koji imaju slične hobije/interesovanja, itd.)
2.3 Spontano uzorkovanje
Intervjuisani su najpristupačniji ispitanici. Tipični primjeri spontani uzorci - u novinama/časopisima, dati ispitanicima na samostalno popunjavanje, većina onlajn anketa. Veličina i sastav spontanih uzoraka nije unaprijed poznat, a određen je samo jednim parametrom – aktivnošću ispitanika.
2.4 Uzorak tipičnih slučajeva
Odabiru se jedinice opće populacije koje imaju prosječnu (tipičnu) vrijednost karakteristike. Ovo postavlja problem odabira karakteristike i određivanja njene tipične vrijednosti.

Kurs predavanja iz teorije statistike

Više detaljne informacije za uzorke zapažanja se mogu dobiti pregledom.

Opis kalkulatora:

Na terenu "Veličina populacije" trebate unijeti nenegativan cijeli broj jednak broju objekata u populaciji iz koje se vrši odabir uzorak populacije. Na primjer, to može biti broj dokumenata u nizu ili, češće, broj ljudi koji žive na određenoj teritoriji, ili broj ljudi u ciljna grupa. U praksi se često dešavaju situacije kada je populacija uzorka 100 ili više puta manja od opće populacije. U ovom slučaju, populacija se smatra kvazi-beskonačnom. Ovo parametar je zadano postavljen(simbol «∞» u polju„Veličina populacije» ).

Zatim morate odabrati (klikom na lijevu tipku miša, postaviti tačku u željeni krug) nivo pouzdanosti za koji će se procijeniti greška uzorkovanja ili njen volumen, odnosno klikom na lijevu tipku miša postaviti tačku u željenom krugu. Što je viši specificirani nivo pouzdanosti, to će biti manje šanse da će stvarna greška premašiti teorijsku procjenu ili da će izračunata veličina uzorka biti nedovoljna za procjenu s tačnošću koja ne prelazi navedenu grešku. Ako je vjerovatnoća povjerenja označena P , zatim vjerovatnoća da će procjena greške ili zapremine biti netačna jednaka 1-R. At P =0,95 vjerovatnoća greške jednak 0,05 (1 šansa u 20); at P =0,99, ista vjerovatnoća je 0,01 (1 šansa u 100).

Ako želite izračunati grešku uzorkovanja određene veličine, onda u polju "Veličina uzorka» treba uneti nenegativan broj, jednaka količini objekata u uzorku. Nakon toga, lijevom tipkom miša kliknete na dugme za izračunavanje, koje bi trebalo da postane zeleno nakon što ste ispravno uneli početne podatke. Na terenu « Teorijska statistička greška» bit će prikazan broj veći od 0 i manji od jedan, u kojem se umjesto zareza koristi tačka. (tačno do 3 decimale). Ako ovu grešku želite pretvoriti u postotak, jednostavno pomnožite broj sa 100 - mentalno pomjerite decimalni zarez dva mjesta udesno. Dakle, u datom primjeru rezultati proračuna pokazuju da teorijska statistička greška slučajnog uzorka vjerovatnoće od 1600 jedinica iz kvazi-beskonačne populacije sa vjerovatnoćom povjerenja od 0,99 ne prelazi 0,032 (3,2%).

U slučaju kada je potrebno izračunati veličinu populacije uzorka iz kvazi beskonačne populacije dovoljnu da osigura teorijsku statističku grešku ne veću od navedene, potrebno je popuniti polje "Teorijska statistička greška"(broj od 0 do 1, umjesto decimalnog zareza "," - decimalni zarez«.» ; procenti se moraju pretvoriti u razlomke jedan : 3,2%=0,032 itd.). Također biste trebali postaviti nivo pouzdanosti tako što ćete kliknuti lijevom tipkom miša na tačku u željenom krugu desno od natpisa “ Vjerovatnoća povjerenja " Nakon toga, samo trebate kliknuti lijevom tipkom miša na zeleno dugme "Izračun" i na terenu" Veličina uzorka" Vidjet ćete rezultat.

Za unos novih podataka i ponovno izračunavanje, pritisnite crno dugme “ Jasno» .

Broj potrebnih ispitanika zavisi od svrhe istraživanja i koliko je važna pouzdanost rezultata. Što je veća pouzdanost koju želite da postignete, to bi trebalo da bude niža granica dozvoljene greške.

Definicije

Veličina populacije

Veličina populacije je veličina cijele grupe koju želite predstavljati u anketi.

Totalnost: cijela grupa o kojoj želite izvući zaključke.
Uzorak: Grupa koju intervjuišete.

Razmislite o potencijalnoj veličini vaše ciljne populacije. Na primjer, ako šaljete anketu muškim korisnicima iPhonea u određenoj regiji, možda biste željeli napraviti istraživanje kako biste utvrdili koliko muškaraca ispunjava te kriterije.

Granica greške

Margina greške pokazuje koliko rezultati odstupaju od stvarnih vrijednosti. To je postotak koji pokazuje kolika je vjerovatnoća da će mišljenja i ponašanje uzorka ankete odstupiti od mišljenja i ponašanja opće populacije. Da biste izračunali svoju marginu greške, koristite naš kalkulator margine greške.

Što je manja margina greške, to će odgovor biti tačniji na određenom nivou pouzdanosti.

IN opšti slučaj, što je veća veličina uzorka, to je manja margina greške. Što je veličina uzorka bliža veličini populacije, rezultati će biti reprezentativniji. I zato, gledajući donju tabelu, možete vidjeti da kako se preporučena veličina uzorka smanjuje, dozvoljena greška raste.

Recimo da smo pitali 400 ljudi da li podržavaju predsjednika svoje zemlje, a 55% je odgovorilo potvrdno. Ako je nivo pouzdanosti 95%, a margina greške ±5%, onda kada bi se istraživanje ponovilo sto puta pod istim uslovima, 95 puta od 100 odgovor bi bio između 50% i 60%.

Nivo povjerenja

Nivo pouzdanosti pokazuje koliko su pouzdani dobijeni rezultati. Općenito prihvaćeni standardi koje koriste istraživači su 90%, 95% i 99%.

Nivo pouzdanosti od 95% znači da ako ponovite istu anketu pod istim uslovima 100 puta, 95 puta od 100 rezultati će biti približno unutar granice greške.

Z-score nivoa pouzdanosti koristi se za određivanje veličine uzorka. Z-skor je mjera standardna devijacija određeni dio prosjeka.

Nivo povjerenja
90%	1,65
95%	1,96
99%	2,58

Procentualna vrijednost

Zahtjevi za veličinu uzorka mogu varirati ovisno o postotku uzorka koji daje određeni odgovor. Na primjer, ako je prethodna anketa pokazala da je 75% kupaca zadovoljno vašim proizvodom, a vi želite ponovo provesti anketu, možete koristiti p = 0,75 da biste izračunali potrebnu veličinu uzorka.

Ako se anketa provodi prvi put, budući da ankete obično sadrže više od jednog pitanja (i stoga zahtijevaju više od jednog postotka za procjenu), preporučujemo korištenje p = 0,5 za izračunavanje optimalna veličina uzorci. Ovo nam daje približnu veličinu uzorka koja nije ni previše konzervativna ni previše liberalna.

Ispod je tabela koja prikazuje preporučene vrijednosti veličine populacije* za marginu greške na nivou pouzdanosti od 95%.

Veličina populacije	Veličina uzorka za marginu greške






100.000 ili više

*Izračunali smo preporučene veličine uzoraka koristeći gornju formulu. U nekim slučajevima, veličine uzorka su zaokružene na 5 ili 10. Za više tačan proračun koristite naš kalkulator veličine uzorka.

Roditeljima djece u vašoj školi šaljete anketu da li podržavaju proširenje. školski dan. Pitanje ima opcije odgovora “Da” i “Ne”.

Ukupan broj roditelja (veličina populacije) je 10.000, a vi ste zadovoljni marginom greške od ±10%. Iz gornje tabele možete utvrditi da najmanje 100 ljudi mora učestvovati u anketi.

70% od 100 ispitanih roditelja reklo je da se slaže da produži školski dan. Dakle, može se pretpostaviti da kada bi svih 10.000 roditelja učestvovalo u anketi, 60-80% ljudi bi podržalo produženje školskog dana.

Koliko ljudi treba zamoliti da popune anketu?

Može odrediti koliko ljudi treba poslati anketu. Što je veća stopa odgovora, potrebno je manje ljudi zamoliti da popune anketu.

Na primjer, ako vam je potrebno 100 ispitanika i očekujete da će 25% ljudi pozvanih da pristupi anketi da odgovori, trebali biste pozvati 400 ljudi.

SAVJET. Ako vam je potreban zagarantovan broj ispitanika, kupite odgovore na anketu od SurveyMonkey Audience. Vi navedete potreban broj odgovora, a mi ćemo pronaći ispitanike koji ispunjavaju kriterijume vaše ciljne publike.

Veličinu uzorka treba odrediti prije početka većine kvantitativnih studija. Određivanje veličine uzorka nije potrebno za kvalitativno istraživanje (imajte na umu da se ovo odnosi na formalno kvantitativne metode kao što je analiza sadržaja; jednostavni deskriptivni dizajni se smatraju kvantitativnim). Proračuni veličine uzorka se možda neće izvršiti prije nego što se provedu preliminarne, pilot studije (međutim, takve se studije obično izvode prije stvarnog planiranja naučno istraživanje). Kada ste u nedoumici, svakako provjerite s institucijom koja finansira studiju ili je uključuje u svoj istraživački plan - nedostatak podataka o veličini uzorka je jedan od najvećih uobičajeni razlozi odbijanje odobravanja teme

Zašto je veličina uzorka važna za istraživača?

Kada se provode studije koje određuju prevalenciju neke karakteristike u populaciji (na primjer, prevalenciju astme kod djece), kalkulacije veličine uzorka su neophodne kako bi se osiguralo da rezultirajuće procjene imaju željeni stepen preciznosti. Na primjer, prevalencija bolesti od 10% dobijena iz uzorka od 20 ljudi imat će 95% interval pouzdanosti od 1% do 31%, što se ne može smatrati ni tačnom ni informativnom procjenom. S druge strane, prevalencija bolesti od 10% dobijena iz uzorka od 400 ljudi imala bi interval pouzdanosti od 95% od 7% do 13%, što bi se moglo smatrati prilično preciznim rezultatom. procjena veličine uzorka izbjegava prvu od ove dvije opcije.

U studijama osmišljenim za otkrivanje efekta (npr. razlika u djelotvornosti između dva tretmana, relativni rizik od bolesti u prisustvu ili odsustvu faktora rizika), procjena veličine uzorka je važna kako bi se osiguralo da ako klinički ili biološki važan učinak postoji, biće otkriven sa velikim stepenom verovatnoće, drugim rečima, analiza će dati statistički značajne rezultate. Ako je veličina uzorka mala, čak i ako postoje značajne razlike između grupa, biće nemoguće dokazati da su one uzrokovane bilo čim drugim osim varijabilnosti uzorka.

Informacije potrebne za izračunavanje veličine uzorka

Metode za procjenu veličine uzorka opisane su u brojnim statističkim udžbenicima, uključujući Altman, 1991; Bland, 2000; Armitage, Berry i Matthews, 2002. Dvije knjige specijalizirane su za opisivanje metoda za procjenu veličine uzoraka u različite situacije. Za kvalitativne parametre treba konsultovati rad Manchina et al. (1998), za kvalitativne - Lemeshow et al. (1996). Obje knjige sadrže tabele koje će vam pomoći da izračunate veličinu uzoraka. U slučaju sekvencijalnog testiranja, treba se obratiti na Whitehead (1997.). Stvarni proračuni veličine uzorka mogu se izvesti pomoću jednog od brojnih kompjuterskih programa. Dakle, Stata vam omogućava da analizirate veličinu uzorka potrebnu za upoređivanje srednjih vrijednosti i proporcija, kao i za analizu prevalencije. Značajno više opcija nude specijalizovani paketi kao što su nQuery Advisor ili UnifyPow.

Izračun veličine uzorka zavisi od sledeći faktori, što će se morati prijaviti konsultantskom statističaru:

Varijable proučavane u studiji, uključujući njihove tipove
Potrebna istraživačka snaga
Potreban nivo statistički značaj
Veličina efekta koja je klinički značajna
Standardna devijacija za kvantitativne varijable
Hoće li se koristiti jednostrani ili dvostrani test značajnosti?
Dizajn studije, drugim riječima, je studija:

Randomizirano kontrolirano ispitivanje
Klaster randomizirano ispitivanje
Istraživanje ekvivalencije
Nerandomizirano interventno ispitivanje
Opservacijska studija
Studija prevalencije
Proučavanje osjetljivosti i specifičnosti testa

Ovo će zahtijevati odgovore na brojna dodatna pitanja:

Da li studija uključuje uparene podatke?
Hoće li studija više puta mjeriti iste varijable kod iste osobe?
Da li su grupe uključene u studiju jednake veličine?
Da li su podaci hijerarhijski?

Treba uzeti u obzir da nerandomizirane studije razlika ili povezanosti obično zahtijevaju značajne veća veličina uzorke kako bi se uzeo u obzir uticaj trećih varijabli u analizi. Istovremeno, istraživač je zainteresovan za apsolutna veličina uzorak, a ne procenat koji predstavlja u populaciji kao cjelini.

Koji se statistički termini koriste za opisivanje procesa planiranja veličine uzorka?

Nulte i alternativne hipoteze

Mnoge vrste statističkih analiza imaju za cilj upoređivanje dvaju vrste tretmana, procedure ili grupe pacijenata. Numerička vrijednost koja sumira razlike od interesa za istraživača naziva se efekt. U drugim studijama, efekat može biti koeficijent korelacije, odnos šansi ili relativni rizik. Zatim formuliramo nultu i alternativnu hipotezu. Obično nulta hipoteza kaže da nema efekta (razlika između grupa je nula, relativni rizik je jedan, koeficijent korelacije jednaka nuli), alternativna hipoteza pretpostavlja da postoji efekat.

Vjerovatnoća povjerenja (p-score)

P-skor je vjerovatnoća zapažanja istog ili većeg efekta u studiji, s obzirom na nultu hipotezu. Obično se izražava kao proporcija (npr. p=0,03)

Nivo značaja

Nivo značajnosti je granična vrijednost za p-skor ispod koje treba odbaciti nultu hipotezu i zaključiti da postoje dokazi o efektu. Obično je nivo značajnosti postavljen na 5% (Nivo značajnosti, iako je direktno povezan sa p-skorom, izražen je u procentima: nivo značajnosti od 5% je ekvivalentan p=0,05). Ako je promatrana vrijednost manja od 5%, onda postoji mala šansa da bi studija dobila iste rezultate da nije bilo pravog efekta. Stoga je hipoteza o prisutnosti efekta prihvaćena

Nivo značajnosti od 5% takođe znači da postoji skoro 5% šanse da se zaključi da postoji efekat kada ga u stvari nema. Ponekad je prikladnije koristiti nivo značajnosti od 1%, posebno ako je važno izbjeći zaključak da efekat postoji kada u stvari ne postoji.

Snaga

Moć je vjerovatnoća da će nulta hipoteza biti na odgovarajući način odbačena, odnosno kada zaista postoje dokazi o stvarnoj razlici ili odnosu. Može se zamisliti kao "100 posto minus šansa da se propusti pravi efekat." stoga, što je veća snaga, manja je vjerovatnoća da će se propustiti pravi efekat. Snaga je obično fiksna na 80%, 90% ili 95%. Snaga ne smije biti manja od 80%. Ako je kritično da studija ne propusti postojeći efekat, trebalo bi da ima za cilj postizanje snage od 90% ili više.

Klinički važna veličina efekta

Ovo su najmanje razlike između grupnih srednjih vrijednosti ili postotaka događaja unutar njih (za omjer šanse, rizik najbliži jedinici) koje se još uvijek mogu smatrati biološki ili klinički značajnim. Veličina uzorka mora biti odabrana tako da ukoliko postoje takve razlike, studija će dati statistički značajne rezultate.

Jednostrani ili dvostrani test značajnosti

U dvostranom testu, nulta hipoteza je da nema razlike, a alternativna hipoteza je da razlike između grupa mogu ići u oba smjera. U jednostranom testu, alternativna hipoteza specificira očekivani smjer razlike, na primjer to terapija je bolja nego placebo, a nulta hipoteza uključuje situacije u kojima lijek i placebo imaju isti učinak i gdje lijek proizvodi lošiji ishod od placeba.

Ako ne ozbiljnih razloga da se to ne bi dogodilo, treba koristiti dvostranu hipotezu. Očekivati da će razlike ići u jednom ili drugom smjeru nije dovoljan razlog za korištenje jednostranog testa. Medicinski istraživači su često iznenađeni kada je nalaz suprotan onome što se očekivalo. Jednostrani test to ne dozvoljava. Za primjere situacija u kojima bi jednostrani test mogao biti prikladan, vidi Bland i Altman (1994).

Koje varijable treba uzeti u obzir pri izračunavanju veličine uzorka?

Proračun veličine uzorka treba da se zasniva na analizi primarne varijable ishoda u studiji.

Ako će studija uključiti dodatne varijable koje se takođe smatraju od naučnog značaja, veličina uzorka treba da bude takva da omogući adekvatnu analizu ovih varijabli. Za sve naučno važne varijable moraju se izvršiti proračuni veličine uzorka i prijaviti ih.

Obračunavanje stope odgovora i gubitka posmatranja

Procijenjena veličina uzorka ukazuje na broj pacijenata u završnoj grupi analiziranoj na kraju studije. Stoga, broj ispitanika koji će biti uključeni u studiju treba povećati u skladu s očekivanim odgovorom, gubitkom praćenja, nepoštovanjem protokola i drugim mogućim razlozima gubitka eksperimentalnih subjekata. Odnos između očekivanog broja učesnika i veličine uzorka treba jasno opisati.

Usklađenost sa ciljevima studija i metodama statističke analize

Adekvatnost veličine uzorka također treba procijeniti u skladu sa svrhom studije. Na primjer, ako je cilj studije pokazati da je novi lijek bolji od postojećeg, veličina uzorka mora biti dovoljno velika da otkrije klinički značajne razlike između dva tretmana. Međutim, ponekad je potrebno pokazati da su dva lijeka klinički ekvivalentna. Ova vrsta studije se često naziva testom ekvivalencije ili "negativnim" testom. Razmatranje veličine uzorka za ove studije detaljno je opisano u Pococku (1983). Veličina uzorka studija dizajniranih da pokažu ekvivalentnost lijekova je veća od uzorka studija dizajniranih da otkriju razlike u djelotvornosti. Važno je osigurati da su proračuni veličine uzorka povezani sa ciljevima i ciljevima studije i zasnovani na podacima o primarnoj varijabli ishoda.

Veličine uzoraka također trebaju biti adekvatne metodama analize koje se koriste u studiji, jer i veličina uzorka i analiza zavise od odabranog dizajna studije. Važno je osigurati da su predložene metode analize i proračuni veličine uzorka međusobno kompatibilni.

Primjeri izračuna veličine uzorka.

Ako planirana studija zahtijeva procjenu jedne pojedinačne frekvencije, upoređivanje dvije srednje vrijednosti ili poređenje dvije frekvencije, proračuni veličine uzorka su (obično) relativno jednostavni i stoga su predstavljeni u nastavku. Međutim, preporučujemo da se uvijek konsultujete sa statističarem u vezi izračunavanja veličine uzorka.

Procjena jedne pojedinačne frekvencije

Napomena: formula u nastavku je zasnovana na tzv. "metoda približne normalna distribucija" i, osim ako je planiran vrlo veliki uzorak, ne preporučuje se za procjenu frekvencija blizu 0 ili 1 (0: ili 100%. U takvim slučajevima treba koristiti "precizne" metode. Slična situacija se može uočiti kada se proučava osjetljivost i specifičnost nove metode dijagnostike, gdje se pretpostavlja prisustvo frekvencija blizu 1 (100%). u ovom slučaju Trebalo bi da se obratite statističaru ili, u najmanju ruku, koristite specijalizovane kompjuterske programe.

Scenarij: Koristeći poštanski upitnik, procijenite prevalenciju poremećaja disanja kod pacijenata sa bronhijalna astma pod medicinskim nadzorom opšta praksa(Thomas et al., 2001.)

Potrebne informacije:

Glavna varijabla ishoda = prisustvo ili odsustvo problema s disanjem
Procijenjena stopa prekršaja = 30% (0,3)
Potrebna širina 95% interval povjerenja= 10% (tj. +/-5% ili od 25% do 35%)

Formula za procjenu veličine uzorka jedne pojedinačne frekvencije je:

n=15,4*p*(1-p)/W 2

gdje je n potrebna veličina uzorka, p je očekivana učestalost rezultata (u ovom slučaju 0,3) i W je širina intervala povjerenja (u ovom slučaju 0,1)

Zamjenom vrijednosti u formulu dobijamo:

n=15,4*0,3*(1-0,3)/0,1 2 =324

"Da bi se dobio +/-5% interval pouzdanosti oko procjene prevalencije od 30%, bila bi potrebna veličina uzorka od 324. S obzirom na stopu odgovora od 70% za učešće u studiji, 480 upitnika bi bilo podijeljeno."

Poređenje dvije frekvencije

Scenarij: Planirano je randomizirano, placebom kontrolirano ispitivanje djelotvornosti faktora koji stimulira koloniju za smanjenje rizika od sepse kod nedonoščadi. Ranija studija je pokazala da je incidencija sepse kod ove novorođenčadi bila 50% unutar 2 sedmice od rođenja, a istraživači vjeruju da bi smanjenje ove incidence na 34% bilo klinički značajno.

Potrebne informacije:

Glavna varijabla ishoda=prisustvo ili odsustvo neonatalne sepse 14 dana nakon rođenja (terapija se primjenjuje maksimalno 72 sata nakon rođenja). Ovo je kvalitativna varijabla predstavljena frekvencijama.
Magnituda značajne razlike = 16% ili 0,16 (tj. 50%-34%)
Nivo značajnosti=5%
Snaga=80%
Test=dvostrano

Formula za izračunavanje veličine uzorka prilikom poređenja dvije frekvencije je sljedeća:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

gdje je n=veličina uzorka za svaku grupu (ukupna veličina uzorka je dvostruko veća)

p 1 = prva frekvencija - u ovom slučaju 0,50

p 2 = druga frekvencija - u ovom slučaju 0,34

p 1 -p 2 = klinički značajne razlike, u ovom slučaju 0,16

Tabela vrijednosti za A i B
Nivo značaja



Snaga

Zamjenom vrijednosti u formulu dobijamo:

n= 2 *[(0,5*0,5+(0,34*0,66)]/ 2 =146

Ovo nam daje broj zapažanja koji je potreban za uključivanje u svaku grupu. Ukupna veličina uzorka će biti dvostruko veća, tj. 292 djece

Opis rezultata izračuna veličine uzorka može izgledati ovako:

"Veličina uzorka od 292 novorođenčadi (146 u liječenoj i placebo grupama) bila bi dovoljna da otkrije razliku u incidenci sepse od 16% sa 80% snage na nivou pouzdanosti od 5%. Razlika od 16% jednaka je razlika između 50% incidencije sepse 14. dana praćenja u placebo grupi i 34% učestalosti u liječenoj grupi."

Poređenje dva prosjeka

Napomena: Izračuni u nastavku se primjenjuju samo kada su dvije grupe iste veličine.

Scenario: randomizirano kontrolirano ispitivanje koje upoređuje kratkoročno psihološki tretman u poređenju sa uobičajenim tretmanom za borbu protiv suicidalnih tendencija kod pacijenata hospitalizovanih nakon pokušaja samoubilačkog trovanja. Suicidalne tendencije se mjere pomoću Beckovog inventara. Standardna devijacija za rezultate na ovoj skali je 7,7 (podaci iz prethodnih studija) i razlike od 5 bodova na Beck skali se smatraju klinički značajnim. Očekuje se da će do trećine pacijenata napustiti terapijsku grupu (Guthrie et al., 2001.)

Potrebne informacije:

Glavna varijabla ishoda= Beckova skala suicidalnosti. Kontinuirana varijabla opisana prosječnim vrijednostima
Standardna devijacija=7,7 bodova
Klinički značajna veličina efekta = 5 bodova
Nivo značajnosti=5%
Snaga=80%
Test=dvostrano

Formula za izračunavanje veličine uzorka prilikom poređenja dvaju srednjih vrijednosti je sljedeća:

n= 2 *2*SD 2 /DIFF 2

gdje je n=veličina uzorka za svaku grupu (ukupna veličina uzorka je dvostruko veća)

SD= standardna devijacija za glavnu varijablu ishoda, u ovom slučaju 7.7

DIFF=klinički važan efekat, u ovom slučaju 5.0

A - zavisi od nivoa značajnosti (vidi tabelu) - u ovom slučaju 1,96

B - zavisi od snage (vidi tabelu) - u ovom slučaju 0,84

Tabela vrijednosti za A i B
Nivo značaja



Snaga

Zamjenom traženih vrijednosti u formulu dobijamo:

n= 2 *2*7,7 2 /5,0 2 =38

Ovo nam daje broj zapažanja koji je potreban za uključivanje u svaku grupu. Ukupna veličina uzorka će biti dvostruko veća, tj. 76 ljudi.

Adekvatan opis procjene veličine uzorka bi izgledao ovako:

"Da bi se otkrila razlika od 5 poena na Beckovom popisu sklonosti samoubistvu na nivou značajnosti od 5% sa 80% snage, uz pretpostavku standardne devijacije od 7,7 poena, bilo bi potrebno 38 ljudi u interventnim i kontrolnim grupama. Ovaj broj je povećan na 60 u grupi ( ukupno zapažanja 120), kako bi se nadoknadili gubici tokom posmatranja, koji obično iznose oko trećine ispitanika"

Primjeri neadekvatnih opisa potrebnih procjena veličine uzorka

Primjer 1

"Prethodna studija u ovoj oblasti koristila je uzorak od 150 ljudi i pronašla visoko značajne rezultate (p=0,014), tako da ova studija uključuje sličan broj pacijenata."

Prethodne studije su možda jednostavno imale "sreću" u smislu da su značajni rezultati koje su otkrili nastali zbog nasumičnih varijacija u srednjim vrijednostima uzorka. Potrebno je izračunati veličinu uzorka za ovu studiju- uključujući detalje kao što su snaga studije, nivo značajnosti, primarna varijabla od interesa, klinički značajna veličina efekta, standardna devijacija (za kvantitativne varijable) i veličina svake grupe ako studija ima više grupa

Primjer 2.

"Izračun veličine uzorka nije izvršen jer nije bilo preliminarnih informacija za njegovu procjenu"

Literatura se mora pažljivo pregledati kako bi se pronašle informacije potrebne za izračunavanje veličine uzorka. Ako takve informacije nisu dostupne, može se poduzeti mala istraživačka studija za prikupljanje ovih informacija.

Ako vrijednost standardne devijacije nije dostupna, procjene veličine uzorka mogu biti veće opšti pogled, na primjer, razlike koje su klinički učinkovite možda neće biti opisane u apsolutne vrijednosti, i u jedinicama standardne devijacije.

Međutim, ako se piše prijedlog granta za financiranje pilot studije za prikupljanje informacija potrebnih za izračunavanje veličine uzorka sljedeće veće studije, prijedlog ne uključuje izračun veličine uzorka.

„Klinika prima 50 pacijenata sa ovom bolešću tokom godine, njih oko 10% može odbiti da učestvuje u studiji, tako da će u roku od dve godine biti moguće regrutovati uzorak od 90 ljudi.

Iako većina studija treba da uravnoteži dizajn i snagu, veličina uzorka ne bi se trebala određivati samo na osnovu broja pacijenata dostupnih za studiju.

U situacijama kada je broj pacijenata ograničavajući faktor u veličini uzorka, i dalje se moraju napraviti proračuni kako bi se utvrdila a) snaga studije sa datim brojem pacijenata u odnosu na klinički važne razlike ili b) veličina efekta koji može se otkriti u studiji date veličine (s obzirom na njenu snagu).

U slučajevima kada je raspoloživi broj pacijenata premali da bi se otkrile klinički značajne razlike, može se razmotriti povećanje trajanja studije ili provođenje multicentričnog ispitivanja sa više istraživača.

Književnost

Altman DG. (1991) Praktična statistika za medicinska istraživanja. Chapman and Hall, London.
Armitage P, Berry G, Matthews JNS. (2002) Statističke metode u medicinskim istraživanjima, 4. izd. Blackwell, Oksford.
Bland JM i Altman DG. (1994). Jednostrani i dvostrani testovi značaja. British Medical Journal 309 248.
Bland M. (2000) Uvod u medicinsku statistiku, 3. ed. Oxford University Press, Oxford.
Elashoff JD. (2000) nQuery Advisor Verzija 4.0 Priručnik za korisnike Los Angeles, CA.
Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) Randomizirano kontrolirano ispitivanje kratke psihološke intervencije nakon namjerno samotrovanje. British Medical Journal 323, 135-138.
Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Adekvatnost veličine uzorka u zdravstvenim studijama. John Wiley & Sons, Chichester.
Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Statistical Tables for the Design of Clinical Studies, Second Edition Blackwell, Oxford.
Pocock SJ. (1983) Clinical Trials: A Practical Approach. John Wiley and Sons, Chichester.
Thomas M, McKinley RK, Freeman E, Foy C. (2001) Prevalencija disfunkcionalnog disanja kod pacijenata liječenih od astme u primarnoj zdravstvenoj zaštiti: ispitivanje poprečnog presjeka. British Medical Journal 322, 1098-1100.
Whitehead, J. (1997) Dizajn i analiza sekvencijalnih kliničkih ispitivanja, revidirano 2. ed. Chichester, Wiley.