Rumah Perawatan gigi Menentukan besar kecilnya populasi sampel. Ukuran sampel - metode pengambilan sampel penelitian sosiologi

Menentukan besar kecilnya populasi sampel. Ukuran sampel - metode pengambilan sampel penelitian sosiologi

Perhitungan ukuran sampel

Dari semua pertanyaan yang diajukan kepada lembaga jajak pendapat Gallup yang terkenal, yang paling populer adalah: Bagaimana Anda bisa menilai apa yang dipikirkan 250 juta orang Amerika setelah mewawancarai 1.000 orang?

Untuk menjawab pertanyaan ini, perlu disebutkan tidak hanya kualifikasi tinggi dan pengalaman praktis yang luas dari para karyawan, namun juga penggunaan statistik dan matematika. Jika metode survei tidak berdasarkan ilmu pengetahuan, hasilnya mungkin menyesatkan.

Dalam statistik, batasan ukuran sampel berikut diterima. Ukuran sampel yang cukup untuk menghilangkan keacakan dan memperoleh karakteristik statistik yang bersifat teratur adalah 30. Sampel dengan ukuran ini disebut kecil Sifat sebaran nilai atribut pada sampel kecil mendekati normal seiring dengan bertambahnya jumlah pengujian. Ukuran sampel minimum yang memungkinkan seseorang memperoleh nilai rata-rata suatu karakteristik dengan indikasi probabilitas kepercayaan adalah 5. Sampel dengan ukuran ini disebut sangat kecil. Sebaran nilai atribut pada sampel tersebut ditandai dengan sebaran Student. Namun yang paling sering dalam sosiologi adalah ukuran sampel yang jauh lebih besar.

Saat merencanakan survei sampel, ada saatnya Anda perlu memutuskan berapa banyak orang yang akan diwawancarai, yaitu. berapa ukuran sampel yang seharusnya? Keputusan ini sangat penting, karena sampel yang terlalu besar akan menimbulkan biaya yang tidak perlu, dan terlalu kecil akan menurunkan kualitas hasil.

Ukuran sampel- jumlah total unit observasi yang termasuk dalam populasi sampel.

Karena populasi sampel merupakan suatu bagian populasi, dipilih menggunakan metode khusus, - penting agar bagian ini tidak mendistorsi gagasan keseluruhan, mis. mewakili dia. Sosiolog yang sering melakukan penelitian empiris selalu disibukkan dengan pertanyaan berapa banyak orang yang perlu diwawancarai untuk memperoleh informasi yang dapat dipercaya? Gallup Institute di AS melakukan jajak pendapat rutin terhadap sampel nasional yang berjumlah 1,5 ribu orang dan mencapai akurasi yang luar biasa (kesalahan pengambilan sampel berkisar antara 1 hingga 1,5%). Pusat Sosio-Ekspres dari Institut Sosiologi Akademi Ilmu Pengetahuan Rusia melakukan penelitian terhadap sampel 2 ribu orang, dan kesalahan pengambilan sampel tidak melebihi 3% 31 .

Para ahli percaya bahwa sampel terbaik belum tentu berukuran besar. Tentu saja, semakin besar ukuran sampelnya, semakin tinggi keakuratan hasilnya. Namun, bahkan sampel yang besar pun tidak menjamin keberhasilan jika populasinya “tercampur secara buruk”, yaitu bersifat heterogen. Homogen suatu himpunan di mana karakteristik yang dikendalikan didistribusikan secara merata dan tidak membentuk rongga atau kondensasi dianggap. Dalam hal ini, dengan mewawancarai beberapa orang, Anda dapat memperoleh informasi akurat tentang sebaran karakteristik tersebut pada populasi umum.

Dengan demikian, keterwakilan data tidak dipengaruhi oleh karakteristik kuantitatif populasi sampel (volumenya), tetapi oleh karakteristik kualitatif populasi umum – derajat homogenitasnya.

Dalam sosiologi, formula tunggal dan jelas belum ditemukan, yang dapat digunakan untuk menghitung ukuran optimal populasi sampel - formula seperti itu tidak ada di alam. Dan ini dijelaskan dengan sangat sederhana. Faktanya adalah menentukan ukuran populasi sampel bukanlah masalah statistik melainkan masalah substantif. Dengan kata lain, besar kecilnya populasi sampel bergantung pada banyak faktor, termasuk maksud dan tujuan, model teoritis, hipotesis dan metode penelitian, derajat homogenitas populasi, dan terakhir, keakuratan informasi yang diperlukan.

Kita harus selalu ingat bahwa setiap persentase peningkatan keakuratan informasi dalam suatu penelitian mengarah pada peningkatan tajam biaya pelaksanaannya. Gallup Institute yang terkenal, yang telah melakukan jajak pendapat di Amerika Serikat selama beberapa dekade, menemukan bahwa dengan sampel nasional sebanyak 100 orang, kesalahan pengambilan sampel akan berada dalam kisaran ±11%; 200 orang - ±8%; 400 - ±6%; 600 - ±5%; 750 -±4%; 1000 - ±4%; 1500 - ±3%; 4000 orang - ±2%. Itu sebabnya dia melakukan survei nasional di Amerika Serikat terhadap sampel 1500-2000 orang. Seperti yang bisa dilihat, dia lebih memilih peningkatan kesalahan sebesar 1% daripada peningkatan biaya penelitian yang berlipat ganda.

Praktek menunjukkan bahwa bagi banyak sosiolog, pembenaran ukuran sampel merupakan batu sandungan, meskipun banyak literatur yang membahas tentang metode pengambilan sampel dan, khususnya, perhitungan ukuran sampel. Ada beberapa alasan: 1) kekurangan literatur khusus di pinggiran; 2) kurangnya waktu untuk pendidikan mandiri; 3) ketidakmampuan menggunakan peralatan matematika. Dalam hal ini, terdapat kebutuhan untuk menguraikan strategi dan taktik untuk membenarkan ukuran sampel tanpa rumus matematika yang rumit.

Prosedur penghitungan ukuran sampel merupakan rangkaian kompromi tanpa akhir antara keinginan akan akurasi dan keterbatasan sumber daya, kurangnya waktu, dan informasi yang tidak lengkap tentang fenomena yang diteliti. Pada saat yang sama, ini adalah ilmu dan seni, yang pengetahuannya dapat diakses oleh setiap orang. Namun untuk itu perlu diketahui strategi penghitungan besar sampel (perhitungan awal, strategi sekuensial dan gabungan), serta faktor-faktor yang mempengaruhi besarnya sampel (ukuran populasi, variasi jawaban responden, ketepatan estimasi, sifat distribusi jawaban yang diharapkan, metode penelitian, prosedur pengolahan).

Strategi pra-perhitungan adalah ukuran sampel ditentukan sebelum penelitian utama dilakukan. Dalam kasus yang paling sederhana, Anda dapat menggunakan pengalaman yang sudah terakumulasi, misalnya dari Gallup Institute, yang menggunakan ukuran sampel sekitar 1500-2000 orang. Untuk penelitian di dalam negeri rata-rata, ukuran sampelnya sekitar 400-600 orang.

Untuk menghitung besarnya sampel acak, Anda perlu mengetahui keakuratan estimasi yang diinginkan, besarnya risiko jawaban yang dihasilkan, dan derajat variabilitas jawaban. Secara tradisional, akurasi estimasi diambil sebesar 5%, dan nilai risiko sebesar 0,95. Dengan kata lain, jika menurut studi sampel, 60% responden puas dengan pekerjaannya, maka dapat dikatakan bahwa dalam populasi umum proporsi mereka yang puas adalah 55 hingga 65% dalam 95% kasus, dan pada 5% kasus, proporsi ini mungkin berada di luar interval ini. Dengan asumsi akurasi 5% dan nilai risiko 0,95, maka besar sampelnya adalah sebagai berikut (Tabel 2.4).

Meja 2.4 Ketergantungan ukuran sampel pada ukuran populasi



Hasilnya ditunjukkan pada tabel. 2.4, membuktikan kesalahpahaman umum bahwa ukuran sampel adalah persentase tetap dari populasi umum, sama dengan 10. Sebenarnya, nilai ini bukanlah sebuah konstanta, melainkan variabel yang berubah dalam kondisi tertentu. Besar kecilnya sampel juga bergantung pada pertanyaan apa yang digunakan dalam kuesioner. Angka-angka di tabel. 2.4 hanya berlaku untuk satu kasus - jika menyangkut pertanyaan dikotomis, yang mana penyebaran jawaban maksimumnya adalah 50 hingga 50%. Tanpa informasi awal tentang penyebaran perkiraan, sosiolog seolah-olah mengasuransikan dirinya terlebih dahulu dan percaya bahwa penyebaran ini akan mencapai 50 hingga 50%. Jika informasi tersebut tersedia, maka ukuran sampelnya adalah sebagai berikut.

Tabel 2.5 Ketergantungan ukuran sampel pada distribusi respon dikotomis

Di meja Gambar 2.5 menunjukkan sebaran jawaban pertanyaan kualitatif. Perhitungan ukuran sampel untuk pertanyaan kuantitatif yang mencakup usia dan gaji", didasarkan pada koefisien variasi (Tabel 2.6), yang menunjukkan berapa persentase simpangan baku dari rata-rata aritmatika, dan memungkinkan Anda membandingkan karakteristik apa pun satu sama lain (dalam hal derajat variasi).

Tabel 2.6 Ketergantungan ukuran sampel pada koefisien variasi

Koefisien variasi, %
Ukuran sampel

Jika kondisi kerja, hubungan dalam tim, upah, dll dipelajari. menggunakan skala lima anggota, koefisien variasi di sini bervariasi dari 27 hingga 62%, dan ketika menggunakan skala tujuh anggota - dari 78 hingga 113%. Oleh karena itu, semakin panjang skalanya, semakin tinggi koefisien variasinya dan semakin besar ukuran sampelnya. Jika seorang sosiolog ingin bertahan dengan sampel yang kecil, maka pertanyaannya harus dirumuskan dengan lebih sederhana. Terkadang ada anggapan bahwa semakin panjang skalanya, semakin akurat pengukurannya. Namun keunggulan skala tujuh poin dibandingkan skala lima poin belum terbukti.

Ada kepercayaan umum di kalangan sosiolog bahwa semakin besar ukuran sampel, semakin akurat hasilnya, dan ini memaksa mereka untuk menambah jumlah responden secara berlebihan. Kenyataannya, situasinya berbeda: tabel. Gambar 2.7, berdasarkan data Gallup, menunjukkan hubungan antara ukuran sampel dan akurasi estimasi dalam persentase. Oleh karena itu, seiring bertambahnya ukuran sampel, keakuratannya meningkat, tetapi hingga batas tertentu. Dengan 600 responden, tingkat akurasi 5% yang diinginkan telah tercapai. Oleh karena itu, 600 orang merupakan ukuran sampel yang dapat diterima.

Tidak ada kontradiksi antara angka 400 dan 600 orang. Pada kasus pertama, ukuran sampel dihitung berdasarkan asumsi distribusi jawaban responden yang normal, dan pada kasus kedua, berdasarkan asumsi praktik. Kesenjangan antara teori dan praktik disebabkan karena dalam situasi nyata distribusi penilaian berbeda dari biasanya, sehingga ukuran sampel harus dihitung dengan mempertimbangkan keadaan khusus tersebut; Cara paling efektif untuk mengurangi ukuran sampel adalah dengan mengurangi koefisien variasi estimasi.

Tabel 2.7 Hubungan antara ukuran sampel dan akurasi estimasi

Ketika menghitung ukuran sampel, sosiolog sering melakukan kesalahan berikut: setelah menghitung ukuran sampel yang diperlukan untuk populasi secara keseluruhan dengan menggunakan rumus yang ada, mereka kemudian menempatkannya secara proporsional di antara unit pengambilan sampel individu, misalnya bengkel, perusahaan, kabupaten, kota. , dan jenis keluarga. Setelah itu pada tahap pengolahan data dianalisis perbedaan antar departemen itu sendiri. Namun, lebih tepat untuk menghitung ukuran sampel secara terpisah untuk setiap departemen, dan kemudian menjumlahkan volume masing-masing. Katakanlah perhitungan ukuran sampel untuk tiga lokakarya (dengan mempertimbangkan dimensi skala, jumlah karyawan, sifat distribusi penilaian yang diharapkan) memungkinkan untuk menetapkan bahwa pada lokakarya pertama perlu ditanyakan 384 orang, kedua - 222, dan ketiga - 600. Maka jumlah sampel totalnya adalah 384 + 222 + 600 = 1206 orang.

Jika seorang sosiolog perlu mewawancarai suatu kategori pekerja (misalnya, supir bus), yang hanya diketahui bahwa karyawan kesepuluh dari suatu perusahaan termasuk dalam kategori tersebut, dan dia memutuskan untuk menanyakan 139 supir bus, dan total ukuran sampel untuk perusahaan akan berjumlah 1.390 orang, itu. dengan kata lain, dengan memilih secara acak 1.390 responden dari suatu perusahaan, sesuai dengan teori pengambilan sampel, kami berharap dapat mengidentifikasi 139 orang dalam spesialisasi yang kami minati.

Saat menghitung sampel kuota, sosiolog sering kali secara sewenang-wenang menentukan ukurannya yaitu 1000 orang, berdasarkan kemudahan penghitungan kuota. Tapi Anda bisa dengan mudah mengambil angka bulat lainnya. Pendekatan yang lebih masuk akal adalah menghitung ukuran sampel kuota secara acak. Pilihan lain untuk menghitung ukuran sampel kuota adalah dengan menggunakan teori sampel kecil. Esensinya: jika tujuannya bukan untuk memberikan analisis yang berbeda berdasarkan kelompok pekerja, maka kalikan jumlah gradasi permasalahan yang akan dipelajari dengan 25 (ukuran kelompok minimum yang signifikan secara statistik). Misalnya, tiga variabel dipelajari: jenis kelamin - dua kategori, usia - dua kategori (di bawah 30 tahun dan di atas 30 tahun), kepuasan kerja - diukur pada skala lima poin. Maka ukuran sampel yang dibutuhkan untuk contoh ini adalah 2x2x5x25 = 500 orang. Ukuran sampel meningkat 2,5 kali lipat. Jelas bahwa dengan bertambahnya jumlah variabel dan jumlah gradasi, ukuran sampel bisa menjadi sangat besar. Hanya ada satu jalan keluar: studi mendetail tentang masalah awal, yang memungkinkan Anda menghilangkan pertanyaan yang tidak perlu dalam kuesioner, meninggalkan pertanyaan yang paling penting. Jika suatu penelitian menguji beberapa hipotesis, ukuran sampel untuk menguji setiap hipotesis dihitung secara terpisah. Oleh karena itu, bila menggunakan pengambilan sampel, jumlah pertanyaan dalam kuesioner dan hipotesis harus minimal.

Jadi, kami telah menghitung ukuran sampel yang dibutuhkan. Sekarang, dan hanya sekarang, perlu diperiksa apakah nilai yang dihasilkan sesuai dengan sumber daya yang dialokasikan. Kesalahan Umum Bagi banyak sosiolog terapan, ketika menghitung ukuran sampel, sumber daya yang tersedia diutamakan, atau, lebih buruk lagi, sosiolog secara pasif menerima semua kondisi yang ditentukan oleh pelanggan. Hal ini pada dasarnya salah karena beberapa alasan. Pertama, menghitung ukuran sampel memungkinkan Anda memperoleh wawasan lebih dalam tentang esensi subjek yang diteliti dan spesifikasi metode penelitian, yang berarti Anda dapat meminta lebih banyak sumber daya atau membuat keputusan yang tepat untuk mengurangi ukuran sampel. Jika pemerintah menolak sumber daya tambahan, dan tujuan penelitian tidak memungkinkan pengurangan ukuran sampel (yaitu, sosiolog tidak dapat menerima keputusan pemerintah), maka perlu untuk beralih ke desain penelitian lain. Kedua, perhitungan ukuran sampel yang masuk akal menunjukkan profesionalisme sosiolog dan membuat pelanggan memperlakukannya dengan lebih hormat.

Strategi perhitungan berurutan ukuran sampel. Saat menghitung ukuran sampel, diinginkan untuk mengetahui sebaran estimasi dan beberapa parameter lainnya. Namun, mereka biasanya tidak diketahui. Untuk mencegah kesalahan, sebaiknya diasumsikan sudah maksimal. Akibat dari ketidaktahuan kita adalah peningkatan ukuran sampel melebihi jumlah yang diperlukan dan tambahan biaya finansial dan waktu (kita harus mewawancarai lebih banyak orang). Untuk menghemat biaya, digunakan strategi yang konsisten - ukuran sampel tidak dihitung terlebih dahulu, tetapi bergantung pada hasil akhir penelitian. Misalnya, mereka mewawancarai 100 orang, kemudian menentukan sebaran perkiraan dan, bergantung pada hal ini, menghitung ukuran sampel yang diperlukan. Jika ternyata cukup 100 orang, maka penelitian berakhir. Jika tidak, jumlah responden yang dibutuhkan akan mencapai angka tersebut, namun tidak sampai tak terhingga. Ada contoh terkenal dari praktik J. Gallup, yang pada awal karirnya aktif bereksperimen dengan ukuran sampel. Pada tahun 1936, orang Amerika ditanya: “Apakah Anda ingin Undang-Undang Pemulihan Industri Nasional diperbarui?” Paradoks aneh muncul: J. Gallup mula-mula mensurvei 500 orang dan mengukur kesalahan pengambilan sampel, lalu berturut-turut menambah jumlah responden menjadi 30 ribu. Sayangnya, ia menemukan bahwa penambahan 29,5 ribu responden meningkatkan keakuratan informasi kurang dari 1%. Akibatnya, survei bisa dihentikan setelah 500 responden. Contoh ini menunjukkan bahwa dengan menerapkan strategi sekuensial, dimungkinkan untuk mencapai pengurangan yang signifikan dalam jumlah observasi yang diperlukan dibandingkan dengan penghitungan ukuran sampel awal.

Namun, strategi perhitungan ukuran sampel sekuensial membawa hasil yang sama hasil yang diinginkan hanya jika sosiolog dapat membuat perhitungan yang diperlukan selama survei itu sendiri, misalnya survei telepon, dengan menggunakan sistem komputer. Sosiolog memasukkan jawaban responden ke komputer pribadinya, yang kemudian hasilnya segera dikirim ke komputer direktur penelitian, diproses, dan tampilan layar memberikan informasi tidak hanya tentang frekuensi satu dimensi yang didistribusikan pada isu tertentu, tetapi juga tentang kebutuhan. ukuran sampel.

Jika ada bahaya bahwa ukuran sampel bisa menjadi sangat besar, maka perlu menggabungkan kedua jenis strategi - pendahuluan dan berurutan, yaitu. menerapkan strategi gabungan. Dengan menghitung sampel menurut strategi pendahuluan, kita memperoleh nilai atas yang diizinkan untuk strategi sekuensial atau, dengan kata lain, nilai ukuran sampel, setelah mencapai mana jajak pendapat menurut strategi sekuensial dihentikan.

Pendekatan yang paling masuk akal dan benar untuk menentukan ukuran sampel didasarkan pada perhitungan interval kepercayaan, yang didasarkan pada sejumlah konsep dasar statistik matematika (variasi, deviasi standar, interval kepercayaan, mean square error).

Untuk menghitung ukuran sampel yang diperlukan penelitian kuantitatif Dua konsep statistik yang paling sering digunakan - interval kepercayaan dan probabilitas kepercayaan. Interval kepercayaan mewakili kesalahan pengambilan sampel yang Anda tentukan sebelumnya. Misalnya, jika Anda menetapkan interval kepercayaan sebesar 3% dan jawaban spesifik terhadap pertanyaan penelitian tertentu adalah 48%, ini berarti bahwa meskipun Anda mensurvei seluruh populasi, nilai sebenarnya akan berada di antara 45 (48 - 3) dan 51. % (48+3). Kemungkinan kepercayaan diri menunjukkan seberapa yakin Anda terhadap hasil yang diperoleh, bahwa karakteristik sampel sesuai dengan karakteristik seluruh populasi - dengan kata lain, seberapa besar kemungkinan jawaban acak berada dalam interval kepercayaan. Biasanya, tingkat kepercayaan 95 dan 99% yang digunakan. Yang paling umum digunakan adalah 95% - ini sudah cukup di sebagian besar penelitian. Jika kita menggabungkan probabilitas kepercayaan dan interval kepercayaan, kita dapat mengatakan bahwa jawaban atas pertanyaan tersebut memiliki probabilitas 95% untuk berada di antara 45 dan 51%.

Perkiraan kasar mengenai keandalan hasil survei sampel berikut ini sangat berguna. Peningkatan keandalan memungkinkan kesalahan pengambilan sampel hingga 3%, biasa - dari 3 hingga 10% (interval kepercayaan distribusi pada tingkat 0,03-0,1), perkiraan - dari 10 hingga 20%, perkiraan - dari 20 hingga 40%, dan diperkirakan - lebih dari 40%.

Berdasarkan konsep-konsep ini dan dengan mempertimbangkan sejumlah asumsi, diperoleh rumus untuk menghitung ukuran sampel, yang mengasumsikan bahwa keterwakilan dijamin dengan menggunakan prosedur pengambilan sampel probabilistik yang benar.

Dalam beberapa kasus, biaya pelaksanaan survei dijadikan argumen utama dalam menentukan ukuran sampel. Dengan demikian, anggaran riset pemasaran menyediakan biaya pelaksanaan survei tertentu, yang tidak dapat dilampaui, dan jelas bahwa nilai informasi yang diperoleh tidak diperhitungkan. Namun, dalam beberapa kasus, sampel kecil dapat memberikan hasil yang cukup akurat.

Praktik penelitian menyarankan aturan berikut: ukuran sampel harus menyediakan setidaknya 100 observasi untuk setiap primer dan setidaknya 20-50 observasi untuk setiap komponen klasifikasi sekunder. 11 komponen klasifikasi primer sesuai dengan yang paling kritis, dan komponen sekunder sesuai dengan sel paling tidak kritis dari klasifikasi silang yang diadopsi dalam penelitian ini 34. Perhitungan dan praktik teoretis membuktikan bahwa untuk memperoleh data yang dapat diandalkan tentang pendapat dan preferensi penduduk kota besar seperti St. Petersburg, cukup mensurvei 700-800 orang. Namun sebagian besar survei populasi di sini dilakukan pada sampel hingga 1,5 ribu orang.

Kesalahan pengambilan sampel

Seperti yang telah kita ketahui, keterwakilan adalah sifat suatu populasi sampel untuk mewakili ciri-ciri populasi secara umum. Jika tidak ada kecocokan, kata mereka kesalahan keterwakilan- sejauh mana struktur statistik sampel menyimpang dari struktur populasi umum yang bersangkutan. Mari kita asumsikan bahwa pendapatan keluarga bulanan rata-rata pensiunan pada populasi umum adalah 2 ribu rubel, dan pada populasi sampel - 6 ribu rubel. Ini berarti bahwa sosiolog hanya mewawancarai sebagian pensiunan yang kaya, dan kesalahan keterwakilan menyusup ke dalam studinya. Dengan kata lain disebut kesalahan keterwakilan kesenjangan antara dua populasi- umum, yang menjadi tujuan minat teoretis sosiolog dan gagasan tentang sifat-sifat yang pada akhirnya ingin diperolehnya, dan selektif, yang menjadi tujuan minat praktis sosiolog, yang bertindak baik sebagai objek survei maupun sebagai sarana memperoleh informasi mengenai masyarakat umum.

Selain istilah “kesalahan keterwakilan”, istilah lain juga dapat ditemukan dalam literatur domestik: “kesalahan pengambilan sampel”. Terkadang keduanya digunakan secara bergantian, dan terkadang "kesalahan pengambilan sampel" digunakan sebagai pengganti "kesalahan representatif" sebagai konsep yang secara kuantitatif lebih tepat.

Kesalahan pengambilan sampel- penyimpangan rata-rata karakteristik populasi sampel dari rata-rata karakteristik populasi umum.

Dalam praktiknya, kesalahan pengambilan sampel ditentukan dengan membandingkan karakteristik populasi yang diketahui dengan rata-rata sampel. Dalam sosiologi, ketika mensurvei populasi orang dewasa, data dari sensus penduduk, statistik terkini, dan hasil survei sebelumnya paling sering digunakan. Karakteristik sosio-demografis biasanya digunakan sebagai parameter kontrol. Perbandingan rata-rata populasi umum dan sampel, atas dasar penentuan kesalahan pengambilan sampel dan pengurangannya disebut kontrol keterwakilan. Karena perbandingan data sendiri dan data orang lain dapat dilakukan setelah selesai penelitian, maka cara pengendalian ini disebut sebuah posteriori, itu. dilakukan setelah pengalaman tersebut.

Dalam jajak pendapat Gallup, keterwakilan dikontrol menggunakan data yang tersedia dalam sensus nasional mengenai distribusi penduduk berdasarkan jenis kelamin, usia, pendidikan, pendapatan, profesi, ras, tempat tinggal, dan ukuran pemukiman. Pusat Studi Opini Publik Seluruh Rusia (VTsIOM) untuk tujuan tersebut menggunakan indikator seperti jenis kelamin, usia, pendidikan, jenis pemukiman, status perkawinan, bidang pekerjaan, status pekerjaan responden, yang dipinjam dari Komite Negara Statistik Federasi Rusia. Dalam kedua kasus tersebut, populasinya diketahui. Kesalahan pengambilan sampel tidak dapat ditentukan jika nilai variabel dalam sampel dan populasi tidak diketahui.

Spesialis VTsIOM memastikan perbaikan sampel secara hati-hati selama analisis data untuk meminimalkan penyimpangan yang muncul pada tahap tersebut kerja lapangan. Bias yang sangat kuat terlihat terutama dalam hal gender dan usia. Hal ini dijelaskan oleh fakta bahwa perempuan dan orang-orang dengan pendidikan tinggi menghabiskan lebih banyak waktu di rumah dan lebih mudah melakukan kontak dengan pewawancara, yaitu. adalah kelompok yang mudah dijangkau dibandingkan dengan laki-laki dan orang-orang yang “tidak berpendidikan”.

Kesalahan pengambilan sampel disebabkan oleh dua faktor: metode pengambilan sampel dan ukuran sampel.

Kesalahan pengambilan sampel dibagi menjadi dua jenis - acak dan sistematis. Kesalahan acak - adalah probabilitas bahwa mean sampel akan (atau tidak akan) berada di luar interval tertentu. Kesalahan acak mencakup kesalahan statistik yang melekat pada metode pengambilan sampel itu sendiri. Jumlah tersebut menurun seiring bertambahnya ukuran sampel (Tabel 2.8).

Tabel 2.8

Ketergantungan ukuran sampel pada kesalahannya 36 (ukuran populasi umum 20 ribu unit)

Kesalahan pengambilan sampel, %
Ukuran sampel, unit

Jenis kesalahan pengambilan sampel yang kedua adalah kesalahan sistematik. Jika seorang sosiolog memutuskan untuk mengetahui pendapat semua penduduk kota tentang kebijakan sosial yang diambil oleh otoritas lokal, dan hanya mensurvei mereka yang memiliki telepon, maka ada bias yang disengaja dalam sampel yang berpihak pada strata kaya, yaitu. kesalahan sistematik.

Dengan demikian, kesalahan sistematik merupakan akibat dari aktivitas peneliti itu sendiri. Mereka paling berbahaya karena menimbulkan bias yang cukup signifikan pada hasil penelitian. Kesalahan sistematis dianggap lebih buruk daripada kesalahan acak juga karena tidak dapat dikontrol dan diukur.

Hal tersebut muncul ketika, misalnya: 1) sampel tidak sesuai dengan tujuan penelitian (sosiolog memutuskan untuk mempelajari hanya pensiunan yang bekerja, tetapi mewawancarai semua orang); 2) terdapat ketidaktahuan yang jelas tentang sifat masyarakat umum (sosiolog mengira 70% dari seluruh pensiunan tidak bekerja, tetapi ternyata hanya 10% yang tidak bekerja); 3) hanya elemen “pemenang” dari masyarakat umum yang dipilih (misalnya, hanya pensiunan kaya).

Perhatian!Berbeda dengan kesalahan acak, kesalahan sistematis tidak berkurang seiring bertambahnya ukuran sampel.

Setelah merangkum semua kasus di mana kesalahan sistematis terjadi, para ahli metodologi menyusun daftar kesalahan tersebut. Mereka percaya bahwa faktor-faktor berikut mungkin menjadi sumber distorsi yang tidak terkendali dalam distribusi sampel observasi:

♦ aturan metodologis dan metodologis untuk melakukan penelitian sosiologi;

♦ metode yang tidak memadai untuk membentuk populasi sampel, metode pengumpulan dan penghitungan data yang dipilih;

♦ unit observasi yang dibutuhkan diganti dengan unit observasi lain yang lebih mudah dijangkau;

♦ Cakupan populasi sampel yang tidak lengkap dicatat (penerimaan kuesioner tidak mencukupi, pengisian kuesioner tidak lengkap, tidak dapat diaksesnya unit observasi).

Seorang sosiolog jarang membuat kesalahan yang disengaja. Lebih sering kesalahan muncul karena fakta bahwa sosiolog kurang menyadari struktur populasi umum: distribusi orang berdasarkan usia, profesi, pendapatan, dll.

Kesalahan sistematis lebih mudah dicegah (dibandingkan kesalahan acak), tetapi sangat sulit dihilangkan. Cara terbaik untuk mencegah kesalahan sistematis adalah dengan mengantisipasi sumbernya secara akurat terlebih dahulu - di awal penelitian.

Ini beberapa cara untuk menghindari kesalahan:

♦ setiap unit dalam populasi harus mempunyai probabilitas yang sama untuk dimasukkan ke dalam sampel;

♦ disarankan untuk memilih dari populasi yang homogen;

♦ Anda perlu mengetahui karakteristik masyarakat secara umum;

♦ ketika menyusun populasi sampel, kesalahan acak dan sistematis harus diperhitungkan.

Jika populasi sampel (atau sekadar sampel) disusun dengan benar, maka sosiolog memperoleh hasil yang dapat diandalkan yang menjadi ciri seluruh populasi. Jika disusun secara tidak benar, maka kesalahan yang timbul pada tahap pengambilan sampel akan dikalikan pada setiap tahap penelitian sosiologi selanjutnya dan pada akhirnya mencapai nilai yang melebihi nilai penelitian yang dilakukan. Mereka mengatakan bahwa penelitian semacam itu lebih banyak ruginya daripada manfaatnya.

Kesalahan seperti itu hanya dapat terjadi pada populasi sampel. Untuk menghindari atau mengurangi kemungkinan kesalahan, cara termudah adalah dengan meningkatkan ukuran sampel (dan idealnya dengan ukuran populasi umum: jika kedua populasi cocok, kesalahan pengambilan sampel akan hilang sama sekali). Secara ekonomi, cara ini tidak mungkin dilakukan. Masih ada cara lain - untuk meningkatkan metode matematis dalam pengambilan sampel. Mereka digunakan dalam praktik. Ini adalah saluran pertama penetrasi ke dalam sosiologi matematika. Saluran kedua adalah pengolahan data matematika.

Masalah kesalahan menjadi sangat penting dalam riset pemasaran, yang menggunakan sampel kecil. Biasanya jumlahnya beberapa ratus, lebih jarang - seribu responden. Di sini, titik awal penghitungan sampel adalah pertanyaan tentang penentuan besarnya populasi sampel. Besar kecilnya sampel bergantung pada dua faktor: I) biaya pengumpulan informasi dan 2) keinginan untuk memperoleh tingkat kepercayaan statistik tertentu terhadap hasil yang diharapkan diperoleh peneliti. Tentu saja, bahkan orang yang tidak berpengalaman dalam statistik dan sosiologi secara intuitif memahami bahwa semakin besar ukuran sampel, maka semakin besar pula ukuran sampelnya. Semakin dekat ukurannya dengan jumlah populasi secara keseluruhan, semakin dapat diandalkan dan valid data yang diperoleh. Namun demikian, telah kita bahas di atas tentang ketidakmungkinan praktis untuk melakukan survei berkelanjutan jika dilakukan pada objek yang jumlahnya melebihi puluhan, ratusan ribu, atau bahkan jutaan. Jelas bahwa biaya pengumpulan informasi (termasuk pembayaran untuk replikasi alat, tenaga pembuat kuesioner, manajer lapangan, dan operator input komputer) bergantung pada jumlah yang bersedia dialokasikan oleh pelanggan, dan sedikit bergantung pada peneliti. Adapun faktor kedua, kami akan membahasnya lebih detail.

Jadi, semakin besar ukuran sampel, semakin kecil kemungkinan kesalahannya. Meskipun perlu dicatat bahwa jika Anda ingin menggandakan akurasi, Anda harus menambah sampel bukan dua, tetapi empat. Misalnya, untuk membuat estimasi data yang diperoleh dari survei terhadap 400 orang menjadi dua kali lebih akurat, Anda perlu mensurvei 1.600 orang, bukan 800 orang. Namun, riset pemasaran sepertinya tidak memerlukan akurasi 100%. Jika seorang pembuat bir perlu mengetahui berapa proporsi konsumen bir yang lebih menyukai mereknya dibandingkan merek pesaingnya - 60% atau 40% - maka rencananya tidak akan terpengaruh sama sekali oleh perbedaan antara 57%, 60, atau 63%.

Kesalahan pengambilan sampel mungkin tidak hanya bergantung pada ukurannya, tetapi juga pada tingkat perbedaan antara unit-unit individu dalam populasi yang kita pelajari. Misalnya, jika kita ingin mengetahui berapa banyak bir yang dikonsumsi, kita akan mengetahui tingkat konsumsi dalam populasi kita orang yang berbeda berbeda secara signifikan (heterogen populasi umum). Dalam kasus lain, kita akan mempelajari konsumsi roti dan menemukan bahwa variasinya tidak terlalu signifikan di antara orang-orang (homogen populasi umum). Semakin besar variasi (atau heterogenitas) dalam suatu populasi, semakin besar kemungkinan kesalahan pengambilan sampel. Pola ini hanya menegaskan apa yang dikatakan akal sehat sederhana kepada kita. Jadi, seperti yang ditegaskan dengan tepat oleh V. Yadov, “Besarnya (volume) sampel tergantung pada tingkat homogenitas atau heterogenitas objek yang diteliti. Semakin homogen angka-angka tersebut, semakin kecil angka-angka yang dapat memberikan kesimpulan yang dapat dipercaya secara statistik.”

Penentuan besar sampel juga bergantung pada tingkat selang kepercayaan kesalahan statistik yang diperbolehkan. Di sini yang kami maksud adalah apa yang disebut acak kesalahan yang terkait dengan sifat kesalahan statistik. DALAM DAN. Paniotto memberikan perhitungan berikut untuk sampel yang representatif dengan asumsi kesalahan 5% (Tabel 2.9):

Tabel 2.9

Perhitungan sampel yang representatif

Ini berarti bahwa jika Anda, setelah mensurvei, katakanlah, 400 orang di suatu kota regional, di mana populasi pelarut dewasa berjumlah 100 ribu orang, menemukan bahwa 33% pembeli yang disurvei lebih menyukai produk dari pabrik pengolahan daging lokal, maka dengan 95% Kemungkinannya Anda dapat mengatakan bahwa pembeli tetap produk ini adalah 33±5% (yaitu dari 28 hingga 38%) dari penduduk kota ini.

Anda juga dapat menggunakan penghitungan Gallup untuk memperkirakan hubungan antara ukuran sampel dan kesalahan pengambilan sampel (lihat di atas).

Saat ini, banyak perhitungan sulit yang dilakukan oleh teknologi, dan program statistik dapat diperoleh di Internet. Jadi, dengan perhitungan sampel, sosiolog yang malas diberi kesempatan seperti itu di situs web Pusat Analisis “Bisnis dan Pemasaran” (http://www.bma.ru/enter.htm), di mana pengguna hanya membutuhkan untuk memasukkan data yang diperlukan dan kemudian klik tombol "Hitung."

Sebelum melakukan observasi sampel secara langsung, pertanyaan tentang berapa unit populasi yang diteliti harus dipilih untuk diambil sampelnya selalu terjawab. Rumus penentuan jumlahnya diturunkan dari rumus kesalahan pengambilan sampel maksimum sesuai dengan titik tolak sebagai berikut:

  • jenis sampel yang diusulkan;
  • metode seleksi (berulang atau tidak berulang);
  • pilihan estimasi parameter (nilai rata-rata atau proporsi).

Selain itu, perlu ditentukan terlebih dahulu nilai probabilitas kepercayaan yang sesuai dengan konsumen informasi, dan besarnya kesalahan pengambilan sampel maksimum yang diperbolehkan. Menetapkan D dan I (sesuai dengan probabilitas kepercayaan), sebagai suatu peraturan, tidak menimbulkan kesulitan khusus, karena keduanya terkait dengan sifat populasi yang diteliti.

Namun, kita harus ingat bahwa probabilitas kepercayaan yang besar akan sangat meningkatkan ukuran sampel. Situasinya serupa dengan kesalahan pengambilan sampel marjinal: menguranginya hingga setengahnya, melipatgandakan ukuran sampel. Pertanyaan tentang keakuratan apa yang memuaskan peneliti menjadi mendasar jika pemeriksaan terhadap unit observasi lain menimbulkan biaya finansial dan material yang besar (mengingat keterpencilan wilayah unit observasi, kerahasiaan data yang dikumpulkan, kompleksitas program observasi, dll.), dan tidak penting jika biaya survei satu unit relatif kecil.

Rumus untuk menghitung ukuran sampel yang diperlukan untuk cara yang berbeda pilihan ditunjukkan pada tabel. 13.10.

Saat menggunakan rumus yang diberikan dalam tabel, disarankan untuk membulatkan ukuran sampel yang dihasilkan untuk memastikan “margin” akurasi tertentu.

Selain itu, dalam praktik statistik, pilihan yang umum adalah ketika nilai kesalahan pengambilan sampel maksimum ditentukan dalam persentase (kesalahan pengambilan sampel maksimum relatif). Dalam hal ini, nilai absolut kesalahan dibagi dengan nilai rata-rata karakteristik dan dikalikan 100%. Kemudian, untuk menerapkan rumus tabel, Anda harus mencari nilai absolut dari kesalahan maksimum sebagai berikut:

Tabel 13.10

Rumus untuk mencari ukuran sampel

Metode seleksi

Seleksi ulang

Seleksi berulang

Saat memperkirakan rata-rata

Benar-benar acak

Mekanis

Khas

Serial dengan seri yang sama

Saat memperkirakan bagiannya

Benar-benar acak

Mekanis

Akhir

Metode seleksi

Seleksi ulang

Seleksi berulang

Khas

Serial dengan seri yang sama

Jika parameter awal penentuan ukuran sampel adalah kesalahan relatif D% dan koefisien variasi

dari sifat yang diteliti, dihitung F„=^100%, lalu rumusnya

Sampel acak sebenarnya selama seleksi berulang dapat diubah sebagai berikut:

Kesulitan sebenarnya dalam menentukan ukuran sampel adalah menentukan besar kecilnya variasi atribut – penyebarannya. Dalam praktiknya, nilai ini sering kali masih belum diketahui hingga survei dilakukan. Apa yang harus dilakukan dalam setiap kasus ditentukan oleh peneliti sendiri.

Terkadang varians diperkirakan dengan cara langsung:

  • melakukan pemeriksaan ekstensif sebelum dimulainya pengamatan utama untuk menentukan nilai o 2;
  • mereka secara kondisional menerima nilai varians dari survei serupa sebelumnya (metode yang paling sering digunakan dalam praktik). Pendekatan ini dibenarkan jika populasi umum, karena sifatnya, tidak didukung oleh proses dinamis yang signifikan atau manifestasinya tidak begitu jelas.

Ada juga sejumlah metode “tidak langsung” untuk mencari varians dari karakteristik yang diteliti, yaitu teknik matematika tertentu yang didasarkan pada sifat-sifat populasi statistik. Karena sebagian besar distribusinya mendekati hukum normal, maka nilai dispersi dapat ditentukan secara kasar sebagai berikut.

Karena semua nilai varian atribut menurut hukum distribusi normal ditempatkan pada 3 dalam satu arah atau yang lain dari rata-rata, terdapat persamaan perkiraan R« 6a, dimana R- kisaran variasi suatu sifat, didefinisikan sebagai R= x maks - x menit .

Karena itu,

Dalam praktiknya, untuk mendapatkan “cadangan” tertentu dari unit sampel untuk memastikan keakuratan yang diperlukan, mereka sering kali lebih suka menggunakan relasi

Nilai x max dan x min dalam pemantauan proses sosial ekonomi biasanya diketahui atau ditentukan oleh peraturan perundang-undangan yang berlaku. Misalnya, jumlah rata-rata pekerja di perusahaan kecil dibatasi secara ketat oleh undang-undang.

Untuk fenomena sosio-ekonomi, jika dalam beberapa hal (misalnya, dari data survei sebelumnya) nilai mean diketahui, maka relasi tersebut digunakan untuk memperkirakan deviasi standar.

Varians suatu karakteristik alternatif bergantung pada proporsi unit yang memiliki karakteristik (properti) yang dipelajari w. Jika pecahan ini tidak diketahui, diambil nilai dispersi maksimum yang mungkin - 0,25, dicapai pada w = 0,5.

Dari rumus pada Tabel. 13.10 maka ukuran sampel berbanding lurus dengan varians karakteristik yang diteliti. Memang benar, seiring dengan meningkatnya variabilitas unit, untuk menangkap variasi tersebut, diperlukan peningkatan jumlah unit untuk diseleksi dan dimasukkan ke dalam sampel.

Jadi, kita telah mempertimbangkan untuk menentukan ukuran sampel untuk satu karakteristik yang dapat diamati. Namun bagaimana jika terdapat beberapa ciri khas dan variasi ciri tersebut berbeda-beda atau ada yang bersifat alternatif. Adalah logis untuk memilih karakteristik yang perhitungannya menghasilkan ukuran sampel terbesar di antara karakteristik lainnya (karakteristik ini akan menjadi karakteristik yang diperlukan untuk mendapatkan kesalahan pengambilan sampel relatif terkecil pada probabilitas kepercayaan yang sama). Memang dalam hal ini penentuan parameter umum karakteristik lain akan disertai dengan akurasi yang lebih besar dari yang dibutuhkan, yaitu. akan ada “margin” akurasi.

Perlu juga dicatat bahwa dalam praktiknya, ukuran sampel seringkali disesuaikan dengan sumber daya keuangan dan manusia yang tersedia, kemudian kebutuhan untuk mencapai keseimbangan biaya yang optimal dan keakuratan hasil juga diperhitungkan. Jika terdapat kesulitan dalam membiayai observasi statistik, terutama jika pengurangan biaya terjadi cukup signifikan dengan hilangnya akurasi yang dapat diterima, langkah tersebut lebih dari cukup.

Penentuan ukuran sampel juga dipengaruhi oleh fenomena yang sangat umum dalam observasi statis terkait dengan non-respons unit yang disurvei. Dalam kasus populasi besar yang diukur dalam ratusan atau jutaan (misalnya, populasi suatu negara), beberapa penyesuaian jika tidak ada respons dapat dilakukan dengan meningkatkan ukuran sampel. Namun, ketika memproses hasil survei dan terutama ketika menggunakan rekomendasi spesifik berdasarkan hasil tersebut, kita harus mengingat asumsi yang dibuat saat mengumpulkan data.

Mari kita lihat contoh permasalahan untuk menentukan ukuran populasi sampel yang diperlukan.

Contoh 13. 7. Berapa banyak objek dari total 507 perusahaan yang harus diperiksa oleh inspektorat pajak untuk menentukan, dengan probabilitas 0,997, bagian perusahaan yang melakukan pelanggaran pembayaran pajak? Berdasarkan survei sebelumnya, standar deviasinya adalah 0,15; ukuran kesalahan pengambilan sampel tidak boleh lebih tinggi dari 0,15.

Saat mengulangi pengambilan sampel acak, Anda harus memeriksa

Jika terjadi pemutusan yang tidak disengaja berulang kali, perlu dilakukan pemeriksaan

Seperti yang bisa kita lihat, penggunaan sampling non-repetitif menghasilkan pemeriksaan objek dalam jumlah yang jauh lebih kecil.

Contoh 13.8. Administrasi salah satu entitas konstituen Federasi Rusia memutuskan untuk melakukan survei sampel terhadap 366 perusahaan kecil, di mana direncanakan untuk menentukan:

  • proporsi penduduk dengan pendidikan tinggi yang bekerja di perusahaan kecil (ukuran kesalahan maksimum tidak boleh melebihi 0,1);
  • proporsi perempuan yang bekerja di perusahaan kecil (ukuran kesalahan maksimum tidak boleh melebihi 0,12);
  • usia rata-rata pekerja di perusahaan kecil (ukuran kesalahan maksimum tidak boleh lebih dari dua tahun).

Sebaran usaha kecil menurut sektor ekonomi adalah sebagai berikut:

Pemerintah kota berasumsi bahwa arti dari karakteristik yang diteliti sangat bervariasi tergantung pada industri perusahaan, sehingga sampel yang khas dipilih, sebanding dengan ukuran kelompok yang khas.

Mari kita tentukan berapa jumlahnya dan berapa banyak unit observasi yang harus diambil dari setiap kelompok tipikal dengan probabilitas kepercayaan 0,954. Dua tanda pertama bersifat alternatif, maka estimasi varians yang tidak diketahui adalah nilai maksimumnya - 0,25.

Ukuran sampel yang diperlukan ketika memperkirakan jumlah penduduk dengan pendidikan tinggi akan memiliki nilai sebagai berikut:

Memperkirakan jumlah perempuan yang bekerja memerlukan survei

Dimungkinkan untuk segera menentukan atas dasar apa perhitungan harus dilakukan. Itu selalu yang memiliki akurasi lebih besar (kesalahan lebih kecil untuk tingkat kepercayaan yang sama). Namun, tanda ketiga dalam contoh kita bersifat kuantitatif. Mari kita tentukan ukuran sampel yang diperlukan untuk memperkirakannya. Kami memperoleh perkiraan nilai dispersi berdasarkan sifat-sifat distribusi normal:

(dengan usia maksimum dan minimum masing-masing 60 dan 18 tahun, yang merupakan kisaran yang paling mungkin).

Pasal 2 = 49 berasal dari mana?

Mari kita lakukan perhitungan:

Jadi, untuk mencapai akurasi tertentu untuk semua karakteristik yang diamati, seseorang harus memilih jumlah maksimum yang diperoleh untuk ketiga indikator tersebut, yaitu. n = 65 perusahaan.

Cabang perekonomian

Jumlah perusahaan yang dipilih dalam populasi sampel

Industri

Pertanian

Konstruksi

Transportasi dan komunikasi

Perdagangan dan katering

Kegiatan bisnis umum

Layanan perumahan dan komunal dan jenis layanan konsumen non-produksi untuk penduduk

Industri lainnya

Metode pengambilan sampel yang tidak formal. Masalah ukuran sampel yang optimal selalu menjadi kontroversi di kalangan peneliti. Keputusan mengenai ukuran populasi sampel dibuat dengan mempertimbangkan sejumlah faktor, di antaranya dua faktor yang paling berperan penting: 1) nilai dan kebaruan informasi yang diperoleh sebagai hasil penelitian; 2) biaya pelaksanaan penelitian (termasuk waktu) untuk ukuran sampel tertentu.

Dalam banyak kasus, seseorang dapat dibimbing oleh praktik yang sudah ada, yaitu. ukuran sampel yang digunakan dalam penelitian serupa. Selain itu, ada aturan sederhana berikut untuk menentukan besarnya populasi sampel.

Ukuran sampel semakin bertambah Jika:

  • perlu untuk memperoleh data untuk masing-masing subkelompok (ukuran subsampel dijumlahkan dan sampel secara keseluruhan bertambah sebanding dengan jumlah subkelompok);
  • Informasi yang tersedia mengenai isu-isu utama tidak memadai dan ketidakpastiannya sangat besar.

Selain itu, praktik berbagai penelitian telah menghasilkan ukuran sampel yang “tipikal”. Jadi, untuk survei kependudukan nasional, volumenya bervariasi antara 1000-2500 responden (tergantung pada jumlah kelompok yang dianalisis). Untuk survei regional dan survei populasi khusus - dari 200 hingga 500 (saat menganalisis banyak subkelompok, ukuran sampel populasi regional atau khusus biasanya meningkat menjadi setidaknya 1000 orang). Nilai-nilai yang ditunjukkan tentu saja hanya dapat berfungsi sebagai pedoman umum dalam menentukannya ukuran optimal sampel.

Dalam praktiknya, keputusan mengenai ukuran sampel merupakan kompromi antara asumsi keakuratan hasil survei dan kelayakan pelaksanaan praktisnya (yaitu berdasarkan biaya pelaksanaan survei).

Dalam praktiknya, beberapa pendekatan digunakan untuk menentukan ukuran sampel. Mari kita perhatikan yang paling sederhana. Yang pertama disebut pendekatan acak dan didasarkan pada penerapan “aturan praktis”.

Misalnya, diterima tanpa bukti bahwa untuk memperoleh hasil yang akurat, sampel harus berjumlah 5% dari populasi. Pendekatan ini sederhana dan mudah diterapkan, tetapi tidak memungkinkan diperolehnya hasil yang akurat. Keuntungannya adalah biayanya yang relatif rendah. Pada pendekatan kedua, ukuran sampel dapat diatur berdasarkan kondisi yang telah ditentukan sebelumnya. Pelanggan riset pemasaran, misalnya, mengetahui bahwa ketika mempelajari opini publik, sampelnya biasanya 1000 - 1200 orang, sehingga ia menyarankan agar peneliti tetap berpegang pada angka tersebut.

Pendekatan ketiga berarti bahwa dalam beberapa kasus, pertimbangan utama dalam menentukan ukuran sampel mungkin adalah biaya pelaksanaan survei. Meskipun nilai dan keandalan informasi yang diterima tidak diperhitungkan.

Pada pendekatan keempat, ukuran sampel ditentukan berdasarkan analisis statistik. Pendekatan ini melibatkan penentuan ukuran sampel minimum, dengan mempertimbangkan persyaratan reliabilitas dan validitas hasil yang diperoleh.

Pendekatan kelima dianggap paling berbasis teori dan pendekatan yang tepat dalam menentukan ukuran sampel. Hal ini didasarkan pada perhitungan interval kepercayaan.

Interval kepercayaan adalah rentang yang titik ekstrimnya mencirikan persentase jawaban tertentu terhadap suatu pertanyaan. Konsep adonan ini dikaitkan dengan konsep “deviasi standar dari karakteristik yang dihasilkan pada populasi umum”. Semakin besar skalanya, semakin lebar interval kepercayaannya agar dapat mencakup, misalnya, 9,5% tanggapan.

Dari sifat-sifat kurva distribusi normal dapat disimpulkan bahwa titik-titik akhir selang kepercayaan, misalnya sebesar 9,5%, didefinisikan sebagai hasil kali: 1,96 (deviasi ternormalisasi) dan deviasi standar.

Angka 1,96 dan 2,58 (untuk interval kepercayaan 99%) ditetapkan z.

Terdapat tabel “Nilai integral probabilitas”, yang memungkinkan untuk menentukan nilai z untuk berbagai interval kepercayaan. Interval kepercayaan 95% atau 99% adalah standar ketika melakukan riset pemasaran.

Misalnya saja dilakukan penelitian terhadap jumlah kunjungan pemilik mobil ke bengkel servis per tahun. Interval kepercayaan untuk jumlah rata-rata kunjungan dihitung sebesar 5–7 kunjungan pada tingkat kepercayaan 99%. Artinya jika studi sampel dapat dilakukan secara mandiri sebanyak 100 kali, maka untuk 99 sampel studi, rata-rata jumlah kunjungan akan berkisar antara 5 hingga 7 kunjungan. Dengan kata lain, 99% pemilik mobil akan termasuk dalam kategori tersebut. interval kepercayaan.

Katakanlah sebuah penelitian dilakukan terhadap hingga 50 sampel independen. Skor rata-rata untuk sampel ini membentuk kurva distribusi normal yang disebut distribusi pengambilan sampel.

Skor rata-rata populasi secara keseluruhan sama dengan skor rata-rata kurva distribusi. Konsep “distribusi sampling” juga dianggap sebagai salah satu konsep dasar dari konsep teoritis yang mendasari definisi V sampel.

Tentu saja, tidak ada perusahaan yang mampu membentuk 10, 20, 50 sampel independen. Biasanya hanya satu sampel yang digunakan.

Statistik matematika memungkinkan Anda memperoleh beberapa informasi tentang distribusi pengambilan sampel dengan memiliki data akurat tentang variasi sampel tunggal.

Indikator sejauh mana perkiraan yang benar untuk populasi secara keseluruhan berbeda dari perkiraan untuk sampel pada umumnya adalah kesalahan akar rata-rata kuadrat. Misalnya, pendapat konsumen tentang suatu produk baru dipelajari dan pelanggan pelajaran ini menunjukkan bahwa ia akan puas dengan keakuratan hasil yang diperoleh sebesar plus atau minus 5%.

Anggaplah 30% sampel mendukung produk baru. Artinya kisaran perkiraan yang mungkin untuk seluruh populasi adalah 25 – 35%. Selain itu, semakin besar ukuran sampel, semakin kecil kesalahannya. Nilai variasi yang tinggi menyebabkan nilai error yang tinggi dan sebaliknya.

Mari kita tentukan ukuran sampel berdasarkan perhitungan interval kepercayaan. Informasi awal yang diperlukan untuk menerapkan pendekatan ini adalah:

  • · jumlah variasi yang diyakini dimiliki suatu populasi;
  • · akurasi yang diinginkan;
  • · tingkat keandalan yang harus dipenuhi oleh hasil survei.

Saat aktif pertanyaan yang diajukan Pilihan jawaban hanya ada dua, dinyatakan dalam persentase (digunakan ukuran persentase), besarnya sampel ditentukan dengan rumus sebagai berikut:

dimana n adalah ukuran sampel;

z – deviasi ternormalisasi, ditentukan berdasarkan tingkat kepercayaan yang dipilih (Tabel 7);

p – variasi yang ditemukan untuk sampel;

q = (100 – hal);

e – kesalahan yang diizinkan.

Tabel 7

Nilai deviasi ternormalisasi skor z dari nilai mean

tergantung pada probabilitas kepercayaan (a) dari hasil yang diperoleh

Misalnya, sebuah perusahaan pembuat ban melakukan survei terhadap pengendara yang menggunakan ban radial.

Oleh karena itu, untuk pertanyaan: “Apakah Anda menggunakan ban radial?” Hanya 2 jawaban yang mungkin: “Ya” atau “Tidak”. Jika diasumsikan populasi penggemar mobil memiliki koefisien variasi yang rendah, berarti hampir semua orang yang disurvei menggunakan ban radial. DI DALAM pada kasus ini ukuran sampel yang cukup kecil dapat dibentuk. Dalam rumus (1), hasil kali pg menyatakan variasi yang melekat pada populasi. Misalnya, 90% unit populasi menggunakan ban radial. Artinya pg = 900. Jika diasumsikan koefisien variasinya lebih tinggi (p = 70%), maka pg = 2100. Variasi terbesar dicapai ketika separuh populasi (50%) menggunakan ban radial dan sebagian lainnya menggunakan ban radial. tidak. Dalam hal ini, produk mencapai nilai sebesar 2500.

Saat melakukan survei, penting untuk menunjukkan keakuratan perkiraan yang diperoleh. Misalnya saja, ditemukan bahwa 44% responden menggunakan ban radial. Hasil pengukuran harus disajikan dalam bentuk: persentase pengendara yang menggunakan ban radial adalah 44 plus minus %. Besarnya kesalahan yang diperbolehkan ditentukan bersama-sama terlebih dahulu oleh pelanggan riset dan kontraktor.

Tingkat kepercayaan dalam riset pemasaran biasanya dinilai berdasarkan dua nilai: 95% atau 99%. Nilai pertama sesuai dengan nilai z = 1,96; yang kedua – z = 2,58. Jika tingkat kepercayaan yang dipilih adalah 99%, maka ini berarti sebagai berikut: kita yakin 99% (dengan kata lain, tingkat kepercayaan adalah 0,99) bahwa persentase anggota populasi yang berada dalam kisaran plus - minus e% adalah sama dengan persentase anggota sampel, yang berada dalam rentang kesalahan yang sama. Dengan asumsi variasi 50%, akurasi 10% pada tingkat kepercayaan 95%, kami menghitung ukuran sampel:

n = 1,962 (50 x 50) / 102 = 96.

Dengan tingkat kepercayaan 99%, dan e = ±3%, n = 1067.

Saat menentukan indeks variasi untuk populasi tertentu, disarankan untuk melakukan analisis kualitatif awal terhadap populasi yang diteliti dan menetapkan kesamaan unit populasi dalam hal demografi, sosial, dan hal lain yang menarik bagi peneliti. Ukuran sampel dapat ditentukan dengan menggunakan cara, bukan persentase. Asumsikan tingkat kepercayaan yang dipilih adalah 95% (z = 1,96,), standar deviasi (S) dihitung sebesar 100, dan presisi (bias) yang diinginkan adalah ±10. Maka ukuran sampelnya adalah

Kenyataannya, dalam praktiknya, jika sampel dibentuk baru dan survei serupa belum dilakukan, S tidak diketahui.

Dalam hal ini, disarankan untuk menetapkan kesalahan e dalam pecahan standar deviasi. Rumus perhitungan diubah dan mengambil bentuk berikut:

Kita sebagian besar telah membicarakan tentang agregasi berukuran sangat besar yang menjadi ciri pasar barang konsumsi. Namun dalam beberapa kasus, agregatnya tidak begitu besar, misalnya di pasar spesies individu produk industri.

Biasanya, jika sampel kurang dari 5% populasi, maka populasi tersebut dianggap besar, dan perhitungan dilakukan sesuai aturan di atas.

Jika V sampel melebihi 5% populasi, maka populasi tersebut dianggap kecil, dan faktor koreksi dimasukkan ke dalam rumus di atas. Besarnya sampel dalam hal ini ditentukan sebagai berikut:

dimana n1 adalah ukuran sampel untuk populasi kecil,

n – ukuran sampel (baik untuk ukuran persentase atau rata-rata), dihitung menggunakan rumus di atas,

N adalah volume populasi umum.

Misalnya, pendapat anggota populasi yang terdiri dari 1000 perusahaan sedang dipelajari mengenai pembangunan pabrik kimia di dalam batas kota Tomsk. Karena kurangnya informasi mengenai variasi, kasus terburuk diasumsikan: 50:50. Peneliti memutuskan untuk menggunakan tingkat kepercayaan 95%. Pelanggan penelitian menyatakan bahwa dia akan puas dengan keakuratan hasil plus atau minus 5%. Dalam hal ini, rumus ukuran persentase berikut digunakan:

Pendekatan pembentukan sampel V ini, dengan syarat tertentu, juga dapat digunakan saat menghitung ukuran panel dan kelompok ahli.

Rumus penghitungan sampel yang diberikan didasarkan pada asumsi bahwa semua aturan pengambilan sampel telah diikuti, dan satu-satunya kesalahan adalah kesalahan karena ukurannya.

Bab dari buku "Riset Pemasaran"

  • Psikologi: kepribadian dan bisnis

Identifikasi objek populasi

Pemilihan metode pemeriksaan

Pemeriksaan lengkap

Survei sampel

Memilih prosedur pengambilan sampel

Perhitungan ukuran sampel

Implementasi rencana pengambilan sampel

Beras. 4.3. Perencanaan pengambilan sampel

Perencanaan pengambilan sampel mencakup prosedur berikut (Gambar 4.3):

    Identifikasi objek masyarakat umum.

    Penentuan metode pemeriksaan.

    Menentukan prosedur pengambilan sampel.

    Menentukan ukuran sampel.

Identifikasi objek pada populasi umum

Populasi adalah himpunan semua satuan yang menjadi objek kajian.

Pada tahap persiapan penelitian ini perlu ditentukan subjek mana saja yang menjadi populasi yang diteliti. Biasanya, subjek yang termasuk dalam populasi umum bersifat heterogen, oleh karena itu, ketika menentukan perwakilan khas objek penelitian, beberapa kelompok mungkin terlewatkan. Sangat sulit untuk mewakili semua elemen populasi organisasi, karena tidak semua perusahaan mengiklankan aktivitas mereka. Populasi umum dapat didefinisikan sebagai pasar secara keseluruhan, segmen pasar, atau kelompok sasaran.

Penentuan metode pemeriksaan

Tergantung pada ukuran populasi dan tujuan penelitian, metode survei berkelanjutan atau sampel dapat digunakan.

Metode pemeriksaan berkelanjutan terdiri dari mempelajari semua unit populasi umum. Metode ini dikaitkan dengan biaya penelitian yang tinggi; penggunaannya dibenarkan, misalnya, dalam kasus sejumlah kecil konsumen yang mewakili suatu segmen, atau dalam kasus ketika volume pembelian klien tertentu merupakan pangsa pasar yang signifikan. kapasitas secara keseluruhan.

Sampel- merupakan sekelompok objek penelitian yang mempunyai ciri-ciri seluruh unit populasi umum, misalnya sekelompok konsumen yang mewakili minat dan selera seluruh pasar sasaran.

Metode survei sampel memberikan akurasi yang lebih rendah dibandingkan dengan metode survei berkelanjutan, namun tidak memerlukan banyak tenaga kerja. Dianjurkan untuk menggunakan metode ini jika terdapat sejumlah besar unit homogen dari populasi umum.

Metode pengambilan sampel memberikan informasi tentang suatu populasi berdasarkan survei terhadap sebagian saja, sehingga data yang diperoleh selama survei sampel bersifat probabilistik. Dalam prakteknya, ini berarti bahwa sebagai hasil penelitian, yang ditentukan bukanlah nilai tertentu, melainkan interval di mana nilai yang diinginkan itu berada. Probabilitas yang dapat menyatakan bahwa kesalahan pengambilan sampel tidak akan melebihi nilai tertentu disebut probabilitas kepercayaan.

Sifat sampel yang mencerminkan karakteristik populasi disebut keterwakilan. Perbedaan antara karakteristik populasi umum dan sampel disebut kesalahan pengambilan sampel, yang bergantung pada prosedur pengambilan sampel yang dipilih.

Prosedur pengambilan sampel

Prosedur pengambilan sampel adalah urutan pemilihan responden untuk dijadikan sampel.

Pemilihan responden mungkin disertai dengan kesalahan sistematis dan acak. Kesalahan sistematis muncul ketika prosedur pengambilan sampel dipilih secara tidak benar. Kesalahan acak selalu ada karena terkait dengan pengaruh faktor-faktor yang sulit diprediksi. Pengaruh keacakan tidak dapat dihilangkan seluruhnya, namun besarnya kesalahan acak dapat ditentukan dengan menggunakan metode statistik. Bias tidak dapat diperkirakan tetapi dapat dihilangkan dengan mengubah prosedur pengambilan sampel.

Mengingat adanya dua jenis kesalahan dalam pengambilan sampel, jenis prosedur pengambilan sampel acak (probabilistik) dan non-acak (deterministik) dibedakan.

Prosedur pengambilan sampel non-acak

Tidak acak Prosedur pengambilan sampel dengan proses pengambilan sampel itu sendiri melibatkan pemilihan responden yang tidak acak, yang pendapatnya mungkin berbeda dengan pendapat masyarakat umum secara keseluruhan, sehingga menimbulkan adanya kesalahan data yang tidak acak (sistematis) dalam hasil penelitian. . Saat menggunakan prosedur non-acak, pemilihan responden untuk sampel dilakukan berdasarkan kondisi yang diterima yang membatasi jumlah kemungkinan partisipan dalam penelitian. Misalnya, hanya responden yang memiliki komputer atau pergi ke toko antara jam 10 dan 11 yang dipilih sebagai sampel.

Jenis sampel non-acak berikut ini dimungkinkan:

Pengambilan sampel acak - elemen dipilih tanpa rencana, secara sembarangan; metode ini tidak mahal dan mudah digunakan, namun menimbulkan ketidakakuratan dan tidak representatif;

    sampel tipikal - himpunan hanya terbatas pada elemen karakteristik (tipikal) dari populasi umum; digunakan, misalnya, ketika membentuk kelompok fokus; namun memerlukan informasi tentang kekhasan objek yang diteliti;

    pengambilan sampel kuota - struktur pengambilan sampel dibangun dengan analogi dengan distribusi karakteristik tertentu dalam populasi umum; Dari setiap kelompok populasi umum dipilih partisipan penelitian yang jumlahnya sebanding dengan keterwakilan kelompok tersebut dalam populasi umum.

Prosedur pengambilan sampel acak

Pada membentuk sampel acak Prosedur berikut ini berlaku.

    seleksi sederhana - elemen dipilih menggunakan nomor acak; dengan pendekatan ini diasumsikan bahwa untuk semua unit populasi umum peluang terpilih menjadi populasi sampel adalah sama (nilai probabilitas sama dengan perbandingan besar sampel dengan besarnya populasi umum). Metode ini sangat memakan waktu dan memerlukan daftar semua unit dalam populasi umum;

    pengambilan sampel sistematis (mekanis) - elemen pertama dipilih menggunakan angka acak, elemen sampel yang tersisa dipilih pada interval yang sama (interval lompatan), yang sama dengan rasio ukuran populasi dengan ukuran sampel. Prosedur pengambilan sampel ini sangat menyederhanakan prosedur, namun dapat menyebabkan distorsi pada struktur pengambilan sampel jika populasi diurutkan berdasarkan atribut apa pun.

Jika populasi umum diurutkan berdasarkan suatu karakteristik esensial (suatu karakteristik dianggap signifikan jika menentukan keadaan indikator yang diteliti), maka untuk mengurangi distorsi dalam karakteristik sampel, unit pengambilan sampel harus dipilih dari tengah interval yang telah ditetapkan. Hal yang sama dilakukan ketika populasi umum diurutkan menurut karakteristik sekunder yang sebagian mempengaruhi objek yang diteliti.

Jika populasi umum diurutkan menurut sifat netral (yang tidak mempengaruhi perilaku objek yang diteliti), maka diperbolehkan untuk memasukkan ke dalam sampel setiap unit populasi umum dari interval yang ditetapkan;

Pengambilan sampel bertingkat (tipikal atau kelompok) - populasi umum dibagi menjadi beberapa kelompok dengan serangkaian karakteristik tertentu (segmen atau strata), yang masing-masing sampelnya dibentuk melalui seleksi acak; koefisien bobot setiap strata di volume keseluruhan sampel cocok dengan itu berat jenis pada populasi umum; pengambilan sampel cluster (serial) - populasi umum dibagi menjadi kelompok-kelompok yang identik (sarang, hamparan bunga, atau cluster). Cluster harus semirip mungkin; komposisi cluster harus serupa dengan populasi umum. Beberapa kelompok dipilih secara acak dari populasi umum dan dilakukan survei lengkap (pendekatan satu tahap). Pendekatan dua tahap juga dimungkinkan, ketika sampel awalnya dibentuk dari cluster, dan unit penelitian dipilih secara acak (yaitu, unit sampling dari tahap sebelumnya menjadi populasi umum untuk tahap berikutnya). Kerugian dari prosedur pengambilan sampel ini adalah bahwa cluster mungkin heterogen satu sama lain, namun prosedur ini sederhana dan ekonomis.

Pengambilan sampel multi-tahap

Semua jenis pengambilan sampel dapat berupa tahap tunggal atau multi-tahap. Pengambilan sampel multitahap digunakan dalam kasus di mana sulit untuk mengambil sampel secara langsung dari populasi umum, sementara semua unit pengambilan sampel pada setiap tahap setara untuk survei.

Koneksi seleksi multi-tahap berbagai prosedur sampling, membuat sampel digabungkan. Opsi pengambilan sampel ini memungkinkan kami mencapai kondisi pengumpulan data yang paling rasional dan ekonomis sesuai dengan tujuan.

Menentukan ukuran sampel

Penentuan ukuran sampel merupakan kompromi antara teori keakuratan hasil penelitian dan kemungkinan penerapan praktisnya dalam hal biaya pengumpulan informasi.

Paling bisa diterapkan metode berikut penentuan ukuran sampel:

1. Metode perhitungan sewenang-wenang; dalam hal ini ukuran sampel ditentukan pada tingkat 5-10% dari populasi umum.

    Metode perhitungan tradisional; melibatkan pelaksanaan survei tahunan berkala terhadap, misalnya, 500, 1000, atau 1500 responden.

    Metode perhitungan statistik; didasarkan pada penentuan keandalan statistik informasi.

    Metode perhitungan menggunakan nomogram.

    metode empiris; dalam hal ini, sampel dianggap cukup bila semua informasi baru hanya membawa perubahan kecil (yang dapat diabaikan) pada hasil penelitian yang telah dikumpulkan.

    Metode biaya; berdasarkan besarnya biaya yang dapat dikeluarkan untuk melakukan penelitian.

Metode statistik untuk menghitung ukuran sampel

Faktor-faktor berikut mempengaruhi ukuran sampel statistik:

    Ketersediaan informasi tentang jumlah penduduk dan derajat homogenitasnya.

    Keakuratan hasil yang diperlukan, diatur oleh nilai kesalahan keterwakilan maksimum yang diperbolehkan dan nilai tingkat kepercayaan yang dapat diambil kesimpulan tentang keandalan hasil penelitian.

    Tersedianya informasi tentang rata-rata indikator populasi umum untuk karakteristik yang diteliti atau tentang interval variasi karakteristik (varians).

    Kemungkinan dimasukkannya kembali suatu unit populasi ke dalam sampel.

Saat menentukan ukuran sampel untuk populasi besar (bila ukuran sampel kurang dari 5% populasi) rumus berikut dapat digunakan:

a) pengambilan sampel berulang (jika suatu unit populasi umum dapat dimasukkan kembali ke dalam sampel) dengan ukuran populasi umum yang tidak diketahui, tetapi distribusi yang diketahui tanda terkontrol:

Di mana T- deviasi ternormalisasi, yang ditentukan oleh tingkat kepercayaan yang dipilih (pada tingkat kepercayaan 95%). T= 1,96; pada tingkat kepercayaan 99%. T= 2,58); R - ditemukan variasi populasi umum, dalam % atau dalam porsi; Q= 100 - R; D - kesalahan yang diizinkan, dalam% atau dalam pecahan;

b) pengambilan sampel berulang dengan varian yang diketahui dari sifat yang diteliti (o):

c) pengambilan sampel yang tidak berulang (dengan pengecualian kemungkinan pemasukan berulang suatu unit populasi umum ke dalam sampel) dengan volume populasi umum yang diketahui dan distribusi karakteristik terkontrol yang diketahui:

Di mana N- ;

d) pengambilan sampel tidak berulang dengan varian yang diketahui dari karakteristik yang diteliti:

Suatu sampel dianggap kecil jika ukurannya melebihi 5% dari populasi umum, dalam hal ini besar sampel dapat disesuaikan:

Di mana P" - ukuran sampel untuk populasi kecil, P - ukuran sampel statistik, N- ukuran populasi umum.

Perhitungan sampling statistik dengan deviasi ternormalisasi T= 2 dan kesalahan yang dapat diterima sebesar 5% (lihat Tabel 4.2) menunjukkan bahwa untuk populasi besar, ukuran sampel dapat ditentukan dengan cara apa pun, karena teknik praktis yang digunakan cenderung melebih-lebihkan ukuran populasi yang disurvei.

Tabel 4.2 Ketergantungan ukuran sampel pada ukuran populasi*

Ukuran populasi

Ukuran sampel

* dengan deviasi yang dinormalisasi T= 2 dan kesalahan yang diperbolehkan 5%.

Dari meja 4.2 jelas bahwa bila jumlah populasi lebih dari 5000, nilainya tidak mempengaruhi jumlah sampel, sehingga rumusnya dapat berbentuk sebagai berikut (nilai 1/ N dapat diabaikan):

(4.6)

Misalnya dari penelitian sebelumnya diketahui bahwa sebaran jawaban atas pertanyaan yang menarik bagi peneliti (misalnya tentang status pengguna) adalah 60% dan 40% (60% responden menjawab setuju pada pertanyaan tentang menggunakan produk dan 40% menjawab negatif). Pangsa responden sasaran terhadap total jumlah responden adalah 70%. Untuk lebih analisis rinci Anda perlu mendapatkan 100 jawaban positif. Untuk mendapatkan hasil ini, Anda perlu mensurvei 238 orang:

Oleh karena itu, jika tidak ada informasi yang akurat mengenai jumlah dan karakteristik populasi (asalkan jumlahnya paling sedikit 5.000 orang), maka cukup dengan memasukkan 400 orang wakilnya ke dalam sampel. Namun perlu diperhatikan bahwa jika kita ingin mengontrol struktur sampel berdasarkan beberapa parameter, maka ukuran sampel akan jauh lebih besar. G. A. Churchill dalam karyanya “Marketing Research” memberikan aturan dalam hal ini: “Ukuran sampel harus menyediakan setidaknya 100 observasi untuk setiap primer dan setidaknya 20-50 observasi untuk setiap komponen klasifikasi sekunder”; Penyisihan juga harus diberikan untuk kemungkinan bahwa masing-masing responden yang termasuk dalam sampel mungkin tidak dapat dijangkau atau menolak untuk berpartisipasi dalam penelitian ini.1

Jumlah responden yang perlu diwawancarai untuk memperoleh jumlah jawaban positif yang diperlukan atas pertanyaan yang diminati dapat dihitung dengan menggunakan rumus:

Di mana P - jumlah tanggapan positif yang diperlukan untuk analisis; Pj - proporsi jawaban positif; R 2 - membagikan target grup, dihitung sebagai produk dari seluruh bagian responden yang memenuhi persyaratan yang ditetapkan (usia, jenis kelamin, status pengguna, dll.).

Menggunakan nomogram untuk menghitung ukuran sampel

Keinginan untuk menyederhanakan prosedur penghitungan ukuran sampel mengarah pada pembuatan tabel, skala atau program yang berfokus pada memastikan keandalan informasi statistik, tetapi tidak membebani pengguna dengan pengetahuan tentang rumus-rumus khusus dari bidang statistik. Misalnya, ada kalkulator pengambilan sampel (www.shortway.to/few/calculator, htm), di situs web Gallup (www.galup.ru) Anda dapat menemukan tabel yang menghubungkan indikator ukuran sampel, distribusi respons dengan kesalahan standar (Tabel 4.3).

Tabel 4.3 Hubungan antara indikator ukuran sampel dan distribusi respon dan kesalahan standar

Distribusi jawaban,

Ukuran sampel

Nomogram adalah cara grafis untuk menentukan ukuran sampel. Nomogram mencakup tiga skala (Gbr. 4.4). Pada skala di sebelah kiri, penandaan indikator standar deviasi atau distribusi bagian karakteristik ditetapkan. Pada skala yang tepat, keakuratan pengukuran ditandai sebagai kesalahan yang dapat diterima (setengah interval) pada probabilitas kepercayaan tertentu sebesar 95 atau 99%. Penandaan dilakukan pada skala tengah sesuai dengan ukuran sampel yang dibutuhkan. Penandaan dibuat pada skala kanan dan kiri pada tingkat nilai indikator yang diinginkan (bagian karakteristik dan kesalahan yang diizinkan). Kedua tanda ini dihubungkan dengan penggaris, pada perpotongan penggaris dengan skala tengah dibuat tanda sesuai dengan volume sampel yang memenuhi keinginan peneliti.

Beras. 4.4. Nomogram untuk menentukan ukuran sampel (tingkat kepercayaan 95%)"

4.5. Menentukan ukuran sampel

Prosedur rencana pengambilan sampel meliputi solusi berurutan dari tiga tugas berikut:

Pengertian objek penelitian;

Penentuan struktur pengambilan sampel;

Menentukan ukuran sampel.

Biasanya, objek riset pemasaran adalah sekumpulan objek pengamatan yang dapat berupa konsumen, pegawai perusahaan, perantara, dan lain-lain. Jika populasi ini sangat kecil sehingga tim peneliti memiliki sumber daya tenaga kerja, keuangan, dan waktu yang diperlukan untuk menjalin kontak dengan masing-masing elemennya, maka sangat mungkin untuk melakukan penelitian berkelanjutan terhadap seluruh populasi. Dalam hal ini, setelah menentukan objek penelitian, Anda dapat melanjutkan ke prosedur selanjutnya (memilih metode pengumpulan data, instrumen penelitian, dan metode komunikasi dengan audiens).

Namun, dalam praktiknya, seringkali tidak mungkin atau tidak disarankan untuk melakukan studi komprehensif terhadap seluruh populasi. Mungkin ada alasan berikut untuk ini:

Ketidakmampuan untuk menjalin kontak dengan beberapa elemen populasi;

Biaya yang terlalu tinggi untuk melakukan penelitian berkelanjutan atau adanya keterbatasan keuangan yang tidak memungkinkan dilakukannya penelitian secara menyeluruh;

Pendeknya jangka waktu yang dialokasikan untuk penelitian disebabkan oleh hilangnya relevansi informasi dari waktu ke waktu atau alasan lain dan tidak memungkinkan pengumpulan, sistematisasi, dan analisis data ekstensif untuk seluruh populasi.

Oleh karena itu, populasi yang besar dan tersebar seringkali dipelajari dengan menggunakan sampel, yang sebagaimana diketahui dipahami sebagai bagian dari populasi yang dimaksudkan untuk mewakili populasi secara keseluruhan.

Keakuratan sampel yang mencerminkan populasi secara keseluruhan bergantung pada struktur dan ukuran sampel.

Ada dua pendekatan untuk desain pengambilan sampel- probabilistik dan deterministik.

Pendekatan probabilistik untuk desain pengambilan sampel mengasumsikan bahwa setiap elemen populasi dapat dipilih dengan probabilitas tertentu (bukan nol). Ada jenis yang berbeda sampel berdasarkan teori probabilitas (tipikal, bersarang, dll.). Cara paling sederhana dan paling umum dalam praktiknya adalah pengambilan sampel acak sederhana, di mana setiap elemen populasi mempunyai peluang yang sama untuk dipilih untuk penelitian.

Pengambilan sampel probabilitas lebih akurat dan memungkinkan peneliti menilai tingkat keandalan data yang dikumpulkannya, meskipun pengambilan sampel ini lebih kompleks dan lebih mahal daripada pengambilan sampel deterministik.

Pendekatan deterministik ke kerangka sampling mengasumsikan bahwa pemilihan elemen populasi dilakukan dengan metode berdasarkan pertimbangan kenyamanan, atau keputusan peneliti, atau kelompok kontingen.

karena alasan kenyamanan, terdiri dari pemilihan elemen populasi berdasarkan kemudahan menjalin kontak dengan mereka. Ketidaksempurnaan metode ini kemungkinan disebabkan oleh rendahnya keterwakilan sampel yang dihasilkan, karena elemen populasi yang sesuai bagi peneliti mungkin tidak cukup mewakili populasi karena seleksinya yang tidak acak dan tidak berdasar.

Namun di sisi lain, kesederhanaan, keekonomian dan efisiensi penelitian yang dilakukan dengan metode ini telah membuatnya digunakan secara luas dalam praktik dan, terutama, selama penelitian pendahuluan yang bertujuan untuk memperjelas permasalahan utama.

Berdasarkan metode pengambilan sampel atas keputusan peneliti, terdiri dari pemilihan elemen-elemen populasi, yang menurutnya merupakan perwakilan karakteristiknya. Metode ini lebih maju dari metode sebelumnya, karena didasarkan pada orientasi terhadap karakteristik perwakilan populasi yang diteliti, meskipun dipilih berdasarkan gagasan subjektif peneliti tentangnya.

Metode pengambilan sampel berdasarkan standar kontingen, terdiri dari pemilihan unsur-unsur ciri penduduk sesuai dengan ciri-ciri penduduk secara keseluruhan yang diperoleh sebelumnya. Ciri-ciri tersebut dapat diperoleh dengan melakukan penelitian pendahuluan dan tidak bersifat subjektif, berbeda dengan metode sebelumnya. Oleh karena itu, metode ini lebih maju; metode ini memungkinkan diperolehnya populasi sampel yang tidak kurang mewakili sampel probabilitas dengan biaya yang jauh lebih rendah untuk melakukan survei.

Setelah memilih struktur sampel (pendekatan pembentukannya, jenis pengambilan sampel probabilistik atau deterministik), peneliti harus menentukan volumenya, yaitu. jumlah elemen dalam populasi sampel.

Ukuran sampel menentukan keandalan informasi diperoleh dari hasil penelitiannya, serta biaya yang diperlukan untuk melaksanakan penelitian tersebut. Ukuran sampel tergantung pada tingkat homogenitas atau keragaman objek yang diteliti.

Semakin besar ukuran sampel, semakin tinggi keakuratannya dan semakin tinggi biaya pelaksanaan surveinya. Dengan pendekatan probabilistik terhadap struktur sampel, volumenya dapat ditentukan dengan menggunakan rumus statistik yang terkenal, berdasarkan persyaratan tertentu untuk keakuratannya.

Dalam praktiknya, beberapa pendekatan digunakan untuk menentukan ukuran sampel:

1. Pendekatan gratis berdasarkan penerapan “rule of thumb”. Misalnya, diterima tanpa bukti bahwa untuk memperoleh hasil yang akurat, sampel harus berjumlah 5% dari populasi. Pendekatan ini sederhana dan mudah diterapkan, tetapi keakuratan hasil yang diperoleh tidak dapat ditentukan. Dengan populasi yang cukup besar, biayanya juga bisa jadi cukup mahal.

Besaran sampel dapat diatur berdasarkan kondisi tertentu yang telah disepakati sebelumnya. Misalnya, pelanggan riset pemasaran mengetahui bahwa ketika mempelajari opini publik, sampelnya biasanya 1000-1200 orang, jadi dia menyarankan agar peneliti tetap berpegang pada angka ini. Jika penelitian tahunan dilakukan pada pasar tertentu, maka digunakan sampel dengan ukuran yang sama pada setiap tahunnya. Berbeda dengan pendekatan pertama, di sini, ketika menentukan ukuran sampel, digunakan logika terkenal, namun sangat rentan.

Misalnya, saat melakukan penelitian tertentu, akurasi yang diperlukan mungkin lebih sedikit dibandingkan saat mempelajari opini publik, dan ukuran populasi mungkin jauh lebih kecil dibandingkan saat mempelajari opini publik. Oleh karena itu, pendekatan ini tidak mempertimbangkan keadaan saat ini dan bisa memakan biaya yang cukup mahal.

Dalam beberapa kasus, biaya pelaksanaan survei dijadikan argumen utama dalam menentukan ukuran sampel. Dengan demikian, anggaran riset pemasaran menyediakan biaya pelaksanaan survei tertentu, yang tidak dapat dilampaui. Jelasnya, nilai informasi yang diterima tidak diperhitungkan. Namun, dalam beberapa kasus, sampel kecil dapat memberikan hasil yang cukup akurat.

Tampaknya masuk akal untuk mempertimbangkan biaya bukan secara absolut, namun dalam kaitannya dengan kegunaan informasi yang diperoleh dari survei yang dilakukan. Klien dan peneliti harus mempertimbangkan ukuran sampel dan metode pengumpulan data yang berbeda, biaya, dan faktor lainnya

2. Ukuran sampel dari tingkat selang kepercayaan kesalahan yang diperbolehkan, yang, sebagaimana telah disebutkan, ditentukan oleh keakuratan generalisasi akhir: dari meningkat menjadi indikatif. Namun, ini mengacu pada apa yang disebut kesalahan acak yang terkait dengan sifat kesalahan statistik. Kesalahan tersebut dihitung sebagai kesalahan dalam keterwakilan sampel probabilitas.

V.I.Paniotto memberikan perhitungan berikut untuk sampel representatif dengan asumsi kesalahan 5 persen (Tabel 4.2).

Tabel 4.2

Contoh tabel perhitungan

Untuk populasi lebih dari 100.000, ukuran sampelnya adalah 400 unit. Jika kita mengingat populasi umum yang berjumlah 5 ribu atau lebih, maka menurut perhitungan penulis yang sama, kita dapat menunjukkan besarnya kesalahan pengambilan sampel yang sebenarnya tergantung pada volumenya, yang sangat penting bagi kami, mengingat bahwa besarnya kesalahan yang diperbolehkan tergantung pada tujuan penelitian dan tidak harus mendekati tingkat 5 persen.

Tabel 4.3

Tabel perhitungan

Selain kesalahan acak, kesalahan sistematis juga mungkin terjadi. Mereka bergantung pada organisasi survei sampel. Ini adalah berbagai bias pengambilan sampel terhadap salah satu kutub parameter sampel.

3. Ukuran sampel berdasarkan analisis statistik . Pendekatan ini didasarkan pada penentuan ukuran sampel minimum berdasarkan persyaratan tertentu untuk reliabilitas dan validitas hasil yang diperoleh. Ini juga digunakan ketika menganalisis hasil yang diperoleh untuk masing-masing subkelompok yang dibentuk dalam sampel berdasarkan jenis kelamin, usia, tingkat pendidikan, dll. Persyaratan keandalan dan keakuratan hasil untuk masing-masing subkelompok menentukan persyaratan tertentu untuk ukuran sampel secara keseluruhan.

Pendekatan yang paling berdasar secara teoritis dan benar untuk menentukan ukuran sampel didasarkan pada penghitungan interval kredibel. Konsep variasi mencirikan besarnya ketidaksamaan (similarity) jawaban responden terhadap suatu pertanyaan tertentu. Dalam arti yang lebih sempit, variasi nilai suatu karakteristik secara agregat adalah perbedaan nilainya di antara unit-unit berbeda dari suatu populasi tertentu pada periode atau titik waktu yang sama. Hasil respon survei biasanya disajikan dalam bentuk kurva distribusi (Gambar 4.1). Ketika kesamaan jawaban tinggi, kita menyebutnya variasi rendah (kurva distribusi sempit), dan jika kesamaan jawaban rendah, kita menyebutnya variasi tinggi (kurva distribusi lebar).

Sebagai ukuran variasi, biasanya diambil standar deviasi, yang mencirikan jarak rata-rata dari rata-rata penilaian jawaban setiap responden terhadap suatu pertanyaan tertentu.

Variasi kecil

Variasi Tinggi

Beras. 4.1. Kurva variasi dan distribusi

Karena semua keputusan pemasaran dibuat dalam kondisi ketidakpastian, maka disarankan untuk mempertimbangkan keadaan ini saat menentukan ukuran sampel. Karena penentuan nilai-nilai yang diteliti untuk suatu populasi secara sempit dilakukan berdasarkan statistik sampel, maka perlu ditetapkan rentang (interval kepercayaan) yang diharapkan dapat memperkirakan perkiraan untuk populasi secara keseluruhan. jatuh, dan kesalahan dalam penentuannya.

Interval kepercayaan adalah rentang yang titik ekstremnya sesuai dengan persentase tertentu dari jawaban tertentu terhadap suatu pertanyaan. Interval kepercayaan berkaitan erat dengan deviasi standar dari karakteristik yang dipelajari dalam populasi: semakin besar interval kepercayaannya, semakin lebar pula interval kepercayaannya agar dapat mencakup persentase tanggapan tertentu.

Interval kepercayaan 95% atau 99% adalah standar saat melakukan riset pasar. Tidak ada perusahaan yang melakukan riset pemasaran dengan menggunakan banyak sampel. DAN statistik matematika memungkinkan untuk memperoleh beberapa informasi tentang distribusi pengambilan sampel, hanya dengan memiliki data tentang variasi sampel tunggal.

Indikator sejauh mana perkiraan yang benar untuk populasi secara keseluruhan berbeda dari perkiraan yang diharapkan untuk sampel pada umumnya adalah kesalahan kuadrat rata-rata. Selain itu, semakin besar ukuran sampel, semakin kecil kesalahannya. Nilai variasi yang tinggi menyebabkan nilai error yang tinggi dan sebaliknya.

Jika hanya ada dua kemungkinan jawaban atas suatu pertanyaan, yang dinyatakan dalam persentase (digunakan ukuran persentase), ukuran sampel ditentukan dengan rumus berikut:

dimana n adalah ukuran sampel; z – deviasi yang dinormalisasi, ditentukan berdasarkan tingkat kepercayaan yang dipilih; p – variasi yang ditemukan untuk sampel; g – (100-r); e – kesalahan yang diizinkan.

Dalam menentukan indeks variasi untuk suatu populasi tertentu, pertama-tama disarankan untuk melakukan analisis kualitatif awal terhadap populasi yang diteliti, pertama-tama, untuk menetapkan kesamaan unit populasi dalam demografi, sosial, dan hal-hal lain yang menarik bagi populasi tersebut. peneliti. Penelitian percontohan dapat dilakukan dengan menggunakan hasil penelitian serupa yang dilakukan di masa lalu. Saat menggunakan ukuran persentase variabilitas, diperhitungkan bahwa variabilitas maksimum dicapai pada p = 50%, yang merupakan kasus terburuk. Selain itu, indikator ini tidak mempengaruhi ukuran sampel secara radikal. Pendapat pelanggan riset mengenai ukuran sampel juga diperhitungkan.

Ukuran sampel dapat ditentukan dengan menggunakan cara, bukan persentase.

di mana s adalah simpangan baku.

Dalam praktiknya, jika sampel baru dibentuk dan survei serupa belum pernah dilakukan, maka s tidak diketahui. Dalam hal ini, disarankan untuk menetapkan kesalahan e dalam pecahan standar deviasi. Rumus perhitungan diubah dan mengambil bentuk berikut:

Di mana .

Di atas ada pembicaraan tentang agregat berukuran sangat besar. Namun, dalam beberapa kasus, agregatnya tidak besar. Biasanya, jika sampelnya kurang dari lima persen dari populasi, maka populasi tersebut dianggap besar dan perhitungannya dilakukan sesuai aturan di atas. Jika ukuran sampel melebihi 5% dari populasi, maka populasi dianggap kecil dan faktor koreksi dimasukkan ke dalam rumus di atas.

Besarnya sampel dalam hal ini ditentukan sebagai berikut:

,

Menentukan Ukuran Sampel Probabilitas

Volume pengambilan sampel probabilitas ditentukan dengan menggunakan rumus khusus, tergantung pada yang diberikan keandalan, ketepatan penelitian dan varians populasi umum.

Landasan teori kemungkinan penggunaan survei sampel untuk mengevaluasi karakteristik populasi adalah teorema limit pusat.

Teorema limit pusat menyatakan: untuk sampel acak sederhana volume n, diisolasi dari populasi umum dengan mean sebenarnya μ Dan dispersi σ2, Untuk n distribusi rata-rata sampel yang besar mendekati normal dengan pusat sama dengan mean sebenarnya dan varians sama dengan rasio varians populasi terhadap ukuran sampel, yaitu:

Teorema ini berlaku untuk distribusi frekuensi apa pun dalam populasi, namun semakin dekat distribusi dalam populasi ke normal, semakin kecil ukuran sampel yang diperlukan untuk mencapai keandalan dan keakuratan penelitian yang setara.

Dalam praktiknya, peneliti hanya membentuk satu sampel dari populasi dan perlu mengetahui berapa ukuran sampel yang seharusnya untuk mempertahankan parameter keandalan dan akurasi yang ditentukan. Rumus untuk menentukan ukuran sampel saat menilai rata-rata dapat diturunkan berdasarkan ketentuan teorema limit pusat, dan berbentuk:

N- ukuran sampel yang dibutuhkan;

z- jumlah interval yang mencirikan persyaratan keandalan penelitian;

H- nilai akurasi penelitian yang diperlukan;

σ2- penyebaran populasi umum.

Mari kita lihat lebih dekat parameter di sisi kanan persamaan.

Kredibilitas mencirikan probabilitas bahwa sampel acak tertentu cukup mencerminkan karakteristik populasi.

Keyakinan 99% berarti bahwa dalam 99 sampel dari 100, mean populasi akan berada dalam interval mean yang diperoleh dari hasil penelitian sampel.

Contoh . Misalnya, tiga studi sampel independen mengenai tingkat pendapatan penduduk di suatu wilayah tertentu telah dilakukan. Diperoleh data tingkat pendapatan rata-rata sebagai berikut: 300 10 UAH, 310 10 UAH, 305 10 UAH, nilai rata-rata sebenarnya adalah 302 UAH.

Seperti yang bisa kita lihat, nilai rata-rata sebenarnya disertakan dalam ketiga interval.

Dengan keandalan 99% dan akurasi yang ditentukan sebesar 10 UAH. dalam 99 sampel dari seratus, rata-rata sampel akan berkisar antara 292 hingga 312 UAH. Dalam satu dari seratus kasus, kita akan mendapatkan hasil di bawah 292 UAH atau lebih dari 312 UAH. Hasil penelitian semacam itu tidak dapat diandalkan karena rata-rata populasi umum tidak akan termasuk dalam koridor nilai rata-rata yang diperoleh dari hasil penelitian sampel.

Dalam rumus yang disajikan, reliabilitas dicirikan oleh nilai z, yang ditentukan dari tabel distribusi z tergantung pada reliabilitas yang ditentukan sebagai persentase.

Kami menyajikan korespondensi hanya untuk beberapa probabilitas tipikal: 68,26% (z=1), 95,45% (z=2), 99,73% (z=3).

distribusi-z – Distribusi normal standar (Z).

nilai z adalah jumlah kesalahan standar yang menghilangkan suatu titik dari mean.

Alih-alih tabel untuk menghitung kemungkinan terjadinya pukulan variabel acak ke dalam rentang yang ditandai (diarsir).

Anda dapat menggunakan rumus EXCEL berikut:

2*NORMSDIST(z)-1

mengganti nilai z yang diperlukan ke dalamnya. Misalnya:

Ketepatan ditentukan oleh peneliti berdasarkan tugas spesifik yang ada.

Jika nilai yang diteliti bersifat absolut, maka akurasi harus direpresentasikan sebagai nilai absolut dan bukan nilai relatif. Saat menentukan persentase (bagian), akurasi ditentukan sebagai persentase.

Saat menentukan keakuratan, peneliti harus mempertimbangkan penelitian yang mungkin dinamika indikator.

Contoh . Misalnya jika dengan akurasi 10 UAH. Hasil penelitian tahun lalu menentukan pendapatan rata-rata sebesar UAH 300, dan tahun ini sebesar UAH 305. Menarik kesimpulan tentang peningkatan pendapatan adalah salah, karena besarnya perubahan berada dalam interval akurasi yang ditentukan (kurang dari 10 UAH).

Hal tersulit dalam menghitung ukuran sampel adalah menentukan varians . Saat memperkirakan rata-rata, muncul dua kasus utama:

1) diketahui varians populasi berdasarkan penelitian terdahulu;

2) varians populasi tidak diketahui.

Kemungkinan penggunaan varians yang diperoleh dari penelitian sebelumnya, didasarkan pada fakta bahwa parameter populasi ini lebih inersia dibandingkan rata-rata. Dengan kata lain, perubahannya lebih lambat dan oleh karena itu, jika Anda, misalnya, mempelajari tingkat pendapatan penduduk setiap tahun, Anda dapat menggunakan jumlah varians yang diperoleh dalam penelitian tahun lalu.

Contoh perhitungan ukuran sampel.

Pertama, ukuran sampel dipengaruhi oleh tingkat kepercayaan diri α, yang ditentukan dengan menggunakan tabel khusus deviasi yang dinormalisasi z. Misalnya, untuk kasus α = 99%, dari tabel kita mendapatkan z = 2,58.

Kedua, itu mempengaruhi tingkat (koefisien) variasi . Mari kita ambil contoh koefisien variasi = 50%.

Ketiga, ukuran sampel dipengaruhi oleh kebutuhan akurasi (kesalahan yang diijinkan)

Jika Anda tidak tahu apa pun tentang level umum, maka untuk memperkirakan tingkat penyebarannya dapat digunakan aturan tiga sigma . Dengan distribusi normal, 99% parameter karakteristik harus berada dalam interval plus atau minus tiga sigma dari rata-rata sebenarnya. Saat melakukan penelitian, Anda harus melakukannya memperkirakan tipikal atas ( B) dan lebih rendah (A ) tingkat parameter, interval antara enam sigma. Nilai sigmanya adalah selisih level parameter dibagi 6.

Penyebaran atau variasi var:

,

Di mana b,a– masing-masing nilai parameter atas dan bawah.

Sigma adalah akar rata-rata deviasi kuadrat (deviasi standar):

.

Contoh . Misalnya saja ketika melakukan penelitian tingkat pendapatan nilai parameter yang lebih rendah diambil pada level 0 UAH, dan nilai atas, katakanlah, pada level 6000 UAH. Dalam hal ini nilainya deviasi akar rata-rata kuadrat (standar). akan menjadi: (6000-0)/6=1000.

Perlu diperhatikan bahwa apabila peneliti benar-benar siap untuk melakukan penelitian, maka penentuan tipikalnya lebih rendah dan batas atas parameternya tidak terlalu sulit.

Saat bekerja dengan skala pemasaran, jumlah varians yang diterima bergantung pada jumlah titik skala dan jenis distribusi frekuensi.

Kasus terburuk dalam riset pemasaran (sesuai dengan varian maksimum) dipertimbangkan distribusi seragam tanggapan antar titik pada skala. Yang terbaik adalah normal dengan frekuensi jawaban maksimum berada di tengah skala.

Tabel 5.1. Kisaran dispersi yang khas tergantung pada jumlah titik skala

Tingkat kisaran yang lebih rendah sesuai dengan distribusi normal frekuensi, yang atas – seragam.

Rumus untuk menentukan ukuran sampel yang dibahas di atas diterapkan ketika memperkirakan rata-rata.

Jika peneliti sedang bekerja dengan persentase atau pembagian, maka rumus tersebut diubah menjadi bentuk berikut:

,

dimana p adalah proporsi orang yang menjawab pertanyaan secara positif atau negatif.

Saat menggunakan persentase, gantikan 100 dengan rumusnya, bukan satu.

Jelasnya, nilai pengali maksimum (1-р)р muncul dengan proporsi jawaban positif dan negatif yang sama yaitu 0,25 saat mengerjakan bagian, dan 2500 saat mengerjakan persentase.Namun, hasil saat bekerja dengan bagian atau persentase akan setara, karena nilai numerik kuadrat ketelitian pada penyebutnya juga akan berbeda sebesar 10.000 kali.

Kecuali jika faktor penyesuaian populasi akhir diterapkan. Ini mungkin tampak luar biasa, tetapi jika dipikir-pikir, pernyataan ini masuk akal. Misalnya, jika ciri-ciri yang diteliti dari semua unsur populasi adalah sama, maka sampel yang terdiri dari satu unsur sudah cukup untuk menghitung rata-rata. Hal ini juga berlaku jika populasi terdiri dari 50, 500, 5000, atau 50000 elemen.

Pada saat yang sama, variabilitas karakteristik populasi secara langsung mempengaruhi ukuran sampel. Variabilitas ini diperhitungkan ketika menghitung ukuran sampel menggunakan varians populasi σ2 atau varians sampel s2.

Contoh (N.B. Safronova, I.E. Korneeva). Mari kita hitung sampel untuk studi pemasaran tentang kesadaran konsumen terhadap merek. Nilai probabilitas P = 0,954, kesalahan maksimum yang diperbolehkan dalam penelitian ini tidak boleh melebihi 5%. Berapa banyak responden yang perlu disurvei untuk mengatasi masalah ini dengan menggunakan pengambilan sampel ulang secara acak, mengingat tidak ada data tentang sebaran karakteristik?

Larutan . Karena bagian dari atribut tersebut tidak diketahui, mari kita asumsikan bahwa 50% konsumen mengetahuinya merek dagang, dan 50% - tidak. Kami menggunakan rumus untuk menghitung sampel dengan mempertimbangkan bagian karakteristik:

= =400 orang

Metode yang lebih canggih untuk menghitung ukuran sampel diperlukan ketika tabulasi ganda atau tiga kali lipat digunakan dalam proses analisis. Hal ini disebabkan oleh kenyataan bahwa keandalan dan keakuratan yang dicapai dengan ukuran sampel yang dihitung untuk sampel secara keseluruhan tidak tercapai untuk masing-masing bagian yang menjadi tempat sampel dibagi selama proses tabulasi.

Contoh . Misalnya, ketika menentukan tingkat pendapatan rata-rata suatu populasi, ukuran sampel tertentu mungkin cukup, namun tidak cukup untuk menentukan tingkat pendapatan rata-rata laki-laki dan perempuan (dengan akurasi dan keandalan tertentu). Hal ini mudah dipahami karena jumlah laki-laki dan perempuan yang mengikuti survei secara terpisah lebih sedikit dibandingkan jumlah seluruh responden. Namun, mengetahui rasio laki-laki dan perempuan, mudah untuk menentukan seberapa akurat tingkat pendapatan rata-rata dihitung untuk masing-masing kelompok yang dipertimbangkan.

Penentuan ukuran sampel: rata-rata

Metode yang digunakan untuk membuat interval kepercayaan dapat dimodifikasi untuk menentukan ukuran sampel berdasarkan interval kepercayaan yang diinginkan. Misalkan Anda ingin memperkirakan pengeluaran bulanan suatu rumah tangga di department store dengan lebih akurat sehingga hasilnya berada dalam ±$5,00 dari rata-rata populasi sebenarnya. Berapa ukuran sampel yang seharusnya? Di meja 12.2 memberikan daftar tindakan penting yang harus Anda lakukan.

1. Tentukan derajat ketelitiannya. Ini adalah perbedaan maksimum yang diperbolehkan (D) antara mean sampel dan mean populasi. Dalam contoh kita D=±$5,00.

2. Tentukan tingkat kepercayaannya. Asumsikan tingkat kepercayaan yang diinginkan adalah 95%.

3. Tentukan nilai r yang berhubungan dengan tingkat kepercayaan tertentu menggunakan tabel. 2 pada Lampiran "Tabel Statistik". Pada tingkat kepercayaan 95%, peluang rata-rata populasi berada di luar interval satu sisi adalah 0,025 (0,05/2). Nilai r yang sesuai adalah 1,96.

4. Tentukan simpangan baku mean populasi. Hal ini dapat diperoleh dari sumber sekunder atau dihitung dengan melakukan studi percontohan. Selain itu, standar deviasi dapat ditetapkan berdasarkan pendapat peneliti. Misalnya, kisaran variabel yang terdistribusi normal kira-kira enam deviasi standar(tiga di kiri dan kanan rata-rata). Dengan demikian, simpangan baku dapat dihitung dengan membagi nilai seluruh rentang dengan 6. Peneliti seringkali dapat menentukan besarnya rentang berdasarkan pemahamannya sendiri terhadap fenomena yang dianalisis.

5. Tentukan ukuran sampel menggunakan standar error dari rumus mean:

Dalam contoh kita

(dibulatkan ke bilangan bulat terdekat).

simpangan baku sampel 5 adalah 50,00. Maka interval kepercayaan terkoreksinya adalah

Perhatikan bahwa interval kepercayaan yang dihasilkan lebih sempit dari yang diharapkan. Hal ini karena deviasi standar populasi meningkat berdasarkan karakteristik sampel.

8. Terkadang akurasi didefinisikan secara relatif dan bukan absolut. Dengan kata lain, dapat diketahui bahwa hasil perhitungannya harus plus atau minus R% dari rata-rata. Artinya D = rm.

Dalam hal ini, ukuran sampel dapat ditentukan sebagai

Ukuran populasi N tidak secara langsung mempengaruhi ukuran sampel kecuali faktor penyesuaian populasi akhir diterapkan. Ini mungkin tampak luar biasa, tetapi jika dipikir-pikir, pernyataan ini masuk akal. Misalnya, jika ciri-ciri semua unsur dalam populasi yang diteliti adalah sama, maka sampel yang terdiri dari satu unsur saja sudah cukup untuk menghitung rata-ratanya. Hal ini juga berlaku jika populasinya terdiri dari 50.500.5000 atau 50.000 elemen. Pada saat yang sama, variabilitas karakteristik populasi secara langsung mempengaruhi ukuran sampel. Variabilitas ini diperhitungkan ketika menghitung ukuran sampel menggunakan varians populasi s2 atau varians sampel s2.

Jumlah keseluruhan objek pengamatan (orang, rumah tangga, perusahaan, pemukiman, dan lain-lain) yang memiliki seperangkat karakteristik tertentu (jenis kelamin, umur, pendapatan, jumlah, omzet, dan lain-lain), terbatas dalam ruang dan waktu. Contoh populasi

  • Seluruh penduduk Moskow (10,6 juta orang menurut sensus 2002)
  • Laki-laki Moskow (4,9 juta orang menurut sensus 2002)
  • Badan hukum Rusia (2,2 juta pada awal tahun 2005)
  • Gerai ritel yang menjual produk makanan (20 ribu awal 2008), dll.

Sampel (Populasi Sampel)

Sebagian dari populasi dipilih untuk diteliti guna menarik kesimpulan tentang keseluruhan populasi. Agar kesimpulan yang diperoleh dari penelitian sampel dapat meluas ke seluruh populasi, maka sampel harus mempunyai sifat keterwakilan.

Keterwakilan sampel

Properti sampel untuk mencerminkan populasi dengan benar. Sampel yang sama bisa mewakili dan tidak mewakili populasi yang berbeda.
Contoh:

  • Sampel yang seluruhnya terdiri dari warga Moskow yang memiliki mobil tidak mewakili seluruh penduduk Moskow.
  • Sampel perusahaan Rusia yang memiliki hingga 100 karyawan tidak mewakili semua perusahaan di Rusia.
  • Sampel orang Moskow yang berbelanja di pasar tidak mewakili perilaku pembelian semua orang Moskow.

Pada saat yang sama, sampel ini (tergantung pada kondisi lain) dapat dengan sempurna mewakili warga Moskow yang merupakan pemilik mobil berukuran kecil dan menengah. perusahaan Rusia dan pembeli berbelanja di pasar, masing-masing.
Penting untuk dipahami bahwa keterwakilan sampel dan kesalahan pengambilan sampel adalah fenomena yang berbeda. Keterwakilan, tidak seperti kesalahan, tidak bergantung pada ukuran sampel.
Contoh:
Tidak peduli seberapa besar kami meningkatkan jumlah warga Moskow yang merupakan pemilik mobil yang disurvei, kami tidak akan dapat mewakili semua warga Moskow dengan sampel ini.

Kesalahan pengambilan sampel (interval kepercayaan)

Penyimpangan hasil diperoleh dengan menggunakan observasi sampel dari data sebenarnya dari populasi umum.
Ada dua jenis kesalahan pengambilan sampel - statistik dan sistematis. Kesalahan statistik bergantung pada ukuran sampel. Semakin besar ukuran sampelnya, semakin rendah nilainya.
Contoh:
Untuk sampel acak sederhana sebanyak 400 unit, kesalahan statistik maksimum (dengan tingkat kepercayaan 95%) adalah 5%, untuk sampel 600 unit - 4%, untuk sampel 1100 unit - 3% Biasanya, ketika berbicara tentang pengambilan sampel kesalahan, maksudnya kesalahan statistik.
Kesalahan sistematis bergantung pada berbagai faktor yang terus-menerus mempengaruhi penelitian dan membiaskan hasil penelitian ke arah tertentu.
Contoh:

  • Menggunakan sampel probabilitas apa pun akan meremehkan proporsi masyarakat berpenghasilan tinggi yang menjalani gaya hidup aktif. Hal ini terjadi karena jauh lebih sulit menemukan orang-orang seperti itu di tempat tertentu (misalnya, di rumah).
  • Masalah penolakan responden untuk menjawab pertanyaan (jumlah “refusenik” di Moskow, menurut survei yang berbeda, berkisar antara 50% hingga 80%)

Dalam beberapa kasus, ketika distribusi sebenarnya diketahui, kesalahan sistematis dapat diatasi dengan menerapkan kuota atau melakukan pembobotan ulang data, namun dalam sebagian besar studi nyata, bahkan untuk memperkirakannya bisa menjadi masalah.

Jenis sampel

Sampel dibagi menjadi dua jenis:

  • probabilistik
  • non-probabilistik

1. Sampel probabilitas
1.1 Pengambilan sampel secara acak (simple random sampling)
Sampel seperti itu mengasumsikan homogenitas populasi, probabilitas ketersediaan semua elemen yang sama, dan ketersediaan daftar lengkap semua elemen. Saat memilih elemen, biasanya, tabel angka acak digunakan.
1.2 Pengambilan sampel mekanis (sistematis).
Suatu jenis sampel acak, diurutkan berdasarkan beberapa karakteristik (urutan abjad, nomor telepon, tanggal lahir, dll). Elemen pertama dipilih secara acak, kemudian, dengan langkah 'n', setiap elemen ke-k' dipilih. Besarnya populasi, dalam hal ini – N=n*k
1.3 Berstrata (dikategorikan)
Ini digunakan jika terjadi heterogenitas populasi. Populasi umum dibagi menjadi beberapa kelompok (strata). Pada setiap strata, seleksi dilakukan secara acak atau mekanis.
1.4 Pengambilan sampel serial (cluster atau cluster).
Dalam pengambilan sampel serial, unit seleksinya bukanlah objek itu sendiri, melainkan kelompok (cluster atau sarang). Kelompok dipilih secara acak. Objek dalam kelompok diperiksa secara massal.

2. Sampel non-probabilitas
Pemilihan sampel semacam itu dilakukan tidak berdasarkan prinsip keacakan, tetapi berdasarkan kriteria subjektif - ketersediaan, kekhasan, keterwakilan yang setara, dll.
2.1. Pengambilan sampel kuota
Awalnya, sejumlah kelompok objek diidentifikasi (misalnya, laki-laki berusia 20-30 tahun, 31-45 tahun, dan 46-60 tahun; orang dengan pendapatan hingga 30 ribu rubel, dengan pendapatan 30 hingga 60 ribu rubel dan dengan pendapatan lebih dari 60 ribu rubel ) Untuk setiap kelompok, jumlah objek yang harus diperiksa ditentukan. Jumlah objek yang harus dimasukkan ke dalam masing-masing kelompok paling sering ditentukan secara proporsional dengan bagian kelompok yang diketahui sebelumnya dalam populasi umum, atau sama untuk setiap kelompok. Dalam kelompok, objek dipilih secara acak. Pengambilan sampel kuota cukup sering digunakan.
2.2. Metode bola salju
Sampel dibuat sebagai berikut. Setiap responden, mulai dari yang pertama, dimintai informasi kontak teman, kolega, kenalannya yang sesuai dengan kondisi seleksi dan dapat mengikuti penelitian. Jadi, kecuali langkah pertama, sampel dibentuk dengan partisipasi objek penelitian itu sendiri. Metode ini sering digunakan ketika diperlukan untuk mencari dan mewawancarai kelompok responden yang sulit dijangkau (misalnya responden yang berpenghasilan tinggi, responden yang berasal dari kelompok profesi yang sama, responden yang memiliki hobi/minat yang sama, dll.)
2.3 Pengambilan sampel secara spontan
Responden yang paling mudah diakses diwawancarai. Contoh tipikal sampel spontan - di surat kabar/majalah, diberikan kepada responden untuk diisi sendiri, sebagian besar survei online. Ukuran dan komposisi sampel spontan tidak diketahui sebelumnya, dan hanya ditentukan oleh satu parameter – aktivitas responden.
2.4 Contoh kasus yang umum
Unit-unit populasi umum yang mempunyai nilai rata-rata (tipikal) dari suatu karakteristik dipilih. Hal ini menimbulkan masalah dalam memilih fitur dan menentukan nilai tipikalnya.

Mata kuliah teori statistika

Lagi Informasi rinci untuk sampel observasi dapat diperoleh dengan melihat.



Baru di situs

>

Paling populer