Rumah stomatitis Interval kepercayaan sama dengan. Interval kepercayaan

Interval kepercayaan sama dengan. Interval kepercayaan

Ada dua jenis perkiraan dalam statistik: titik dan interval. Perkiraan poin mewakili statistik sampel terpisah yang digunakan untuk memperkirakan parameter populasi. Misalnya, mean sampel adalah perkiraan poin ekspektasi matematis populasi, dan varians sampel S 2- estimasi titik varians populasi σ 2. telah ditunjukkan bahwa mean sampel adalah perkiraan ekspektasi matematis populasi yang tidak bias. Rata-rata sampel disebut tidak bias karena rata-rata seluruh mean sampel (dengan ukuran sampel yang sama) N) sama dengan ekspektasi matematis masyarakat umum.

Agar varians sampel S 2 menjadi estimasi varians populasi yang tidak bias σ 2, penyebut varians sampel harus ditetapkan sama dengan N – 1 , tapi tidak N. Dengan kata lain, varians populasi adalah rata-rata dari semua varians sampel yang mungkin terjadi.

Saat memperkirakan parameter populasi, perlu diingat bahwa statistik sampel seperti , bergantung pada sampel tertentu. Untuk mempertimbangkan fakta ini, untuk memperoleh estimasi interval ekspektasi matematis dari populasi umum, menganalisis distribusi rata-rata sampel (untuk lebih jelasnya, lihat). Interval yang dibangun dicirikan oleh tingkat kepercayaan tertentu, yang mewakili probabilitas bahwa parameter populasi sebenarnya diestimasi dengan benar. Interval kepercayaan serupa dapat digunakan untuk memperkirakan proporsi suatu karakteristik R dan sebagian besar penduduk yang terdistribusi.

Unduh catatan dalam atau format, contoh dalam format

Membangun interval kepercayaan untuk ekspektasi matematis populasi dengan deviasi standar yang diketahui

Membangun interval kepercayaan untuk bagian suatu karakteristik dalam populasi

Bagian ini memperluas konsep interval kepercayaan ke data kategorikal. Hal ini memungkinkan kita untuk memperkirakan bagian karakteristik dalam populasi R menggunakan berbagi sampel RS= X/N. Seperti yang ditunjukkan, jika jumlahnya NR Dan N(1 – hal) melebihi angka 5, maka distribusi binomial dapat diperkirakan seperti biasa. Oleh karena itu, untuk memperkirakan bagian suatu karakteristik dalam populasi R adalah mungkin untuk membangun interval yang tingkat kepercayaannya sama (1 – α)х100%.


Di mana PS- proporsi sampel dari karakteristik sama dengan X/N, yaitu jumlah keberhasilan dibagi dengan ukuran sampel, R- bagian karakteristik dalam populasi umum, Z- nilai kritis yang terstandarisasi distribusi normal, N- ukuran sampel.

Contoh 3. Mari kita asumsikan itu dari sistem Informasi mengekstraksi sampel yang terdiri dari 100 faktur yang diisi di dalamnya bulan lalu. Katakanlah 10 faktur ini dibuat dengan kesalahan. Dengan demikian, R= 10/100 = 0,1. Tingkat kepercayaan 95% sesuai dengan nilai kritis Z = 1,96.

Jadi, kemungkinan antara 4,12% dan 15,88% faktur mengandung kesalahan adalah 95%.

Untuk ukuran sampel tertentu, interval kepercayaan yang memuat proporsi karakteristik dalam populasi tampak lebih lebar dibandingkan dengan kontinu variabel acak. Hal ini karena pengukuran variabel acak kontinu mengandung lebih banyak informasi daripada pengukuran data kategorikal. Dengan kata lain, data kategorikal yang hanya mengambil dua nilai mengandung informasi yang tidak cukup untuk memperkirakan parameter distribusinya.

DI DALAMmenghitung perkiraan yang diambil dari populasi yang terbatas

Estimasi ekspektasi matematis. Faktor koreksi untuk populasi akhir ( fpc) digunakan untuk mengurangi kesalahan standar dengan suatu faktor. Saat menghitung interval kepercayaan untuk estimasi parameter populasi, faktor koreksi diterapkan dalam situasi di mana sampel diambil tanpa dikembalikan. Dengan demikian, selang kepercayaan untuk ekspektasi matematis yang mempunyai tingkat kepercayaan sama dengan (1 – α)х100%, dihitung dengan rumus:

Contoh 4. Untuk mengilustrasikan penggunaan faktor koreksi untuk populasi terbatas, mari kita kembali ke masalah penghitungan interval kepercayaan untuk jumlah rata-rata faktur, yang dibahas di atas dalam Contoh 3. Misalkan sebuah perusahaan menerbitkan 5.000 faktur per bulan, dan X=110,27 dolar, S= $28,95 N = 5000, N = 100, α = 0,05, t 99 = 1,9842. Dengan menggunakan rumus (6) kita memperoleh:

Estimasi pangsa suatu fitur. Saat memilih tanpa pengembalian, interval kepercayaan untuk bagian atribut yang memiliki tingkat kepercayaan sama dengan (1 – α)х100%, dihitung dengan rumus:

Interval kepercayaan dan masalah etika

Saat mengambil sampel suatu populasi dan menarik kesimpulan statistik, masalah etika sering kali muncul. Yang utama adalah bagaimana interval kepercayaan dan estimasi titik statistik sampel selaras. Menerbitkan perkiraan titik tanpa menentukan interval kepercayaan terkait (biasanya pada tingkat kepercayaan 95%) dan ukuran sampel dari mana perkiraan tersebut berasal dapat menimbulkan kebingungan. Hal ini dapat memberikan kesan kepada pengguna bahwa estimasi titik tersebut tepat sesuai dengan kebutuhannya untuk memprediksi properti seluruh populasi. Oleh karena itu, perlu dipahami bahwa dalam penelitian apa pun, fokusnya tidak boleh pada estimasi titik, tetapi pada estimasi interval. Di samping itu, Perhatian khusus harus diberikan pilihan yang tepat ukuran sampel.

Paling sering, objek manipulasi statistik adalah hasil survei sosiologis terhadap populasi tertentu masalah politik. Dalam hal ini, hasil survei dimuat di halaman depan surat kabar, dan kesalahannya survei sampel dan metodologi analisis statistik dicetak di tengah-tengah. Untuk membuktikan validitas estimasi titik yang diperoleh, perlu ditunjukkan ukuran sampel yang menjadi dasar perolehannya, batas interval kepercayaan, dan tingkat signifikansinya.

Catatan selanjutnya

Bahan yang digunakan adalah dari buku Levin et al.Statistik untuk Manajer. – M.: Williams, 2004. – hal. 448–462

Teorema limit pusat menyatakan bahwa dengan ukuran sampel yang cukup besar, distribusi mean sampel dapat didekati dengan distribusi normal. Properti ini tidak tergantung pada jenis distribusi populasi.

Pada subbagian sebelumnya kita membahas masalah estimasi parameter yang tidak diketahui A satu nomor. Ini disebut perkiraan “titik”. Dalam sejumlah tugas, Anda tidak hanya perlu mencari parameternya A nilai numerik yang sesuai, tetapi juga untuk mengevaluasi keakuratan dan keandalannya. Anda perlu mengetahui kesalahan apa yang dapat terjadi saat mengganti parameter A perkiraan titiknya A dan seberapa yakin kita dapat berharap bahwa kesalahan-kesalahan ini tidak akan melebihi batas yang diketahui?

Masalah semacam ini sangat relevan dengan sejumlah kecil observasi, ketika estimasi titik dan masuk sebagian besar bersifat acak dan perkiraan penggantian a dengan a dapat menyebabkan kesalahan serius.

Untuk memberikan gambaran tentang keakuratan dan keandalan perkiraan A,

V statistik matematika Mereka menggunakan apa yang disebut interval kepercayaan dan probabilitas kepercayaan.

Biarkan untuk parameternya A perkiraan tidak bias yang diperoleh dari pengalaman A. Kami ingin memperkirakan kemungkinan kesalahan dalam kasus ini. Mari kita tetapkan probabilitas p yang cukup besar (misalnya, p = 0,9, 0,95, atau 0,99) sedemikian rupa sehingga suatu peristiwa dengan probabilitas p dapat dianggap dapat diandalkan secara praktis, dan temukan nilai s yang

Kemudian kisaran nilai praktis yang mungkin dari kesalahan yang timbul selama penggantian A pada A, akan menjadi ± s; besar oleh nilai mutlak kesalahan hanya akan muncul dengan probabilitas rendah a = 1 - p. Mari kita tulis ulang (14.3.1) menjadi:

Kesetaraan (14.3.2) artinya dengan probabilitas p nilai yang tidak diketahui parameter A jatuh dalam interval tersebut

Satu keadaan perlu diperhatikan. Sebelumnya, kita telah berulang kali mempertimbangkan kemungkinan suatu variabel acak masuk ke dalam interval non-acak tertentu. Di sini situasinya berbeda: besarnya A tidak acak, tetapi interval / p acak. Posisinya pada sumbu x bersifat acak, ditentukan oleh pusatnya A; Secara umum, panjang interval 2s juga acak, karena nilai s biasanya dihitung dari data eksperimen. Oleh karena itu di pada kasus ini akan lebih baik untuk menafsirkan nilai p bukan sebagai probabilitas “mencapai” suatu titik A dalam interval / p, dan sebagai probabilitas bahwa interval acak / p akan mencakup titik tersebut A(Gbr. 14.3.1).

Beras. 14.3.1

Probabilitas p biasanya disebut probabilitas kepercayaan, dan interval / p - interval kepercayaan. Batasan interval Jika. ax = a- pasir sebuah 2 = sebuah + dan dipanggil batasan kepercayaan.

Mari kita berikan interpretasi lain terhadap konsep interval kepercayaan: ini dapat dianggap sebagai interval nilai parameter A, kompatibel dengan data eksperimen dan tidak bertentangan dengannya. Memang, jika kita setuju untuk mempertimbangkan suatu peristiwa dengan probabilitas a = 1-p secara praktis tidak mungkin, maka nilai parameter a yang A A> s harus diakui sebagai data eksperimen yang bertentangan, dan data yang |a - A di na 2.

Biarkan untuk parameternya A ada perkiraan yang tidak bias A. Jika kita mengetahui hukum distribusi besaran A, tugas mencari selang kepercayaan akan sangat sederhana: cukup mencari nilai s yang mana

Kesulitannya terletak pada hukum distribusi perkiraan A bergantung pada hukum distribusi kuantitas X dan, oleh karena itu, pada parameternya yang tidak diketahui (khususnya, pada parameter itu sendiri A).

Untuk mengatasi kesulitan ini, Anda dapat menggunakan teknik perkiraan kasar berikut: ganti parameter yang tidak diketahui dalam ekspresi s dengan perkiraan titiknya. Dengan jumlah percobaan yang relatif banyak P(sekitar 20...30) teknik ini biasanya memberikan hasil yang memuaskan dari segi akurasi.

Sebagai contoh, perhatikan masalah interval kepercayaan untuk ekspektasi matematis.

Biarkan itu diproduksi P X, yang karakteristiknya adalah ekspektasi matematis T dan varians D- tidak dikenal. Estimasi berikut diperoleh untuk parameter ini:

Diperlukan untuk membangun interval kepercayaan / p yang sesuai probabilitas kepercayaan p, untuk ekspektasi matematis T jumlah X.

Saat memecahkan masalah ini, kita akan menggunakan fakta kuantitas T mewakili jumlahnya P variabel acak independen yang terdistribusi secara identik Xh dan menurut teorema limit pusat, untuk nilai yang cukup besar P hukum distribusinya mendekati normal. Dalam praktiknya, meskipun dengan jumlah suku yang relatif kecil (sekitar 10...20), hukum distribusi penjumlahan tersebut kira-kira dapat dianggap normal. Kami akan berasumsi bahwa nilainya T didistribusikan menurut hukum normal. Karakteristik hukum ini - ekspektasi matematis dan varians - masing-masing adalah sama T Dan

(lihat bab 13 ayat 13.3). Mari kita berasumsi bahwa nilainya D kita tahu dan akan menemukan nilai Ep yang mana

Dengan menggunakan rumus (6.3.5) Bab 6, kita nyatakan probabilitas di ruas kiri (14.3.5) melalui fungsi distribusi normal

di mana deviasi standar estimasi T.

Dari Persamaan.

tentukan nilai Sp:

dimana arg Ф* (х) adalah fungsi invers dari Ф* (X), itu. nilai argumen di mana fungsi normal distribusinya sama dengan X.

Penyebaran D, melalui mana kuantitas dinyatakan A 1P, kami tidak tahu persisnya; sebagai nilai perkiraannya, Anda dapat menggunakan perkiraan tersebut D(14.3.4) dan masukkan kira-kira:

Dengan demikian, masalah membangun interval kepercayaan kira-kira telah terpecahkan, yaitu sama dengan:

dimana gp ditentukan oleh rumus (14.3.7).

Untuk menghindari interpolasi terbalik dalam tabel fungsi * (l) saat menghitung s p, akan lebih mudah untuk membuat tabel khusus (Tabel 14.3.1), yang memberikan nilai kuantitas

tergantung pada r. Nilai (p menurut hukum normal menentukan banyaknya simpangan baku yang harus diplot ke kanan dan kiri dari pusat dispersi sehingga peluang masuk ke daerah yang dihasilkan sama dengan p.

Dengan menggunakan nilai 7 p, interval kepercayaan dinyatakan sebagai:

Tabel 14.3.1

Contoh 1. 20 percobaan dilakukan pada kuantitas X; hasilnya ditunjukkan pada tabel. 14.3.2.

Tabel 14.3.2

Diperlukan untuk menemukan perkiraan dari ekspektasi matematis kuantitas X dan buatlah interval kepercayaan yang sesuai dengan probabilitas kepercayaan p = 0,8.

Larutan. Kita punya:

Memilih l: = 10 sebagai titik acuan, dengan menggunakan rumus ketiga (14.2.14) kita mencari estimasi yang tidak bias D :

Menurut tabel 14.3.1 kita temukan

Batas kepercayaan:

Interval kepercayaan:

Nilai parameter T, terletak pada interval ini sesuai dengan data eksperimen yang diberikan dalam tabel. 14.3.2.

Interval kepercayaan untuk varians dapat dibuat dengan cara yang sama.

Biarkan itu diproduksi P percobaan independen pada variabel acak X dengan parameter yang tidak diketahui untuk A dan dispersi D perkiraan yang tidak bias diperoleh:

Diperlukan kira-kira pembuatan interval kepercayaan untuk varians tersebut.

Dari rumus (14.3.11) jelas besaran D mewakili

jumlah P variabel acak berbentuk . Nilai-nilai ini tidak

independen, karena salah satunya mencakup kuantitas T, bergantung pada orang lain. Namun hal tersebut dapat ditunjukkan dengan semakin meningkatnya P hukum distribusi jumlahnya juga mendekati normal. Hampir pukul P= 20...30 sudah bisa dianggap normal.

Mari kita asumsikan memang demikian, dan mari kita temukan ciri-ciri hukum ini: ekspektasi matematis dan dispersi. Sejak penilaian D- tidak memihak, kalau begitu M[D] = D.

Perhitungan varians DD dikaitkan dengan perhitungan yang relatif rumit, jadi kami menyajikan ekspresinya tanpa turunan:

di mana q 4 adalah yang keempat titik tengah jumlah X.

Untuk menggunakan ekspresi ini, Anda perlu mengganti nilai = 4 dan D(setidaknya yang dekat). Alih-alih D Anda dapat menggunakan penilaiannya D. Pada prinsipnya momen sentral keempat juga dapat diganti dengan perkiraan, misalnya nilai berbentuk:

tetapi penggantian seperti itu akan memberikan akurasi yang sangat rendah, karena secara umum, dengan jumlah percobaan yang terbatas, momennya pesanan tinggi ditentukan dari kesalahan besar. Namun dalam prakteknya sering terjadi hukum distribusi jenis kuantitas X diketahui sebelumnya: hanya parameternya yang tidak diketahui. Kemudian Anda dapat mencoba menyatakan μ 4 melalui D.

Mari kita ambil kasus yang paling umum, ketika nilainya X didistribusikan menurut hukum normal. Kemudian momen sentral keempatnya dinyatakan dalam dispersi (lihat Bab 6, ayat 6.2);

dan rumus (14.3.12) memberi atau

Mengganti yang tidak diketahui di (14.3.14) D penilaiannya D, kita mendapatkan: dari mana

Momen μ 4 dapat dinyatakan melalui D juga dalam beberapa kasus lain, ketika distribusi nilai X tidak normal, tetapi penampakannya diketahui. Misalnya saja untuk bidang hukum kepadatan seragam(lihat bab 5) kita memiliki:

dimana (a, P) adalah interval dimana hukum tersebut ditentukan.

Karena itu,

Dengan menggunakan rumus (14.3.12) kita memperoleh: kira-kira di mana kita dapat menemukannya

Dalam hal jenis hukum distribusi besaran 26 tidak diketahui, ketika membuat perkiraan nilai a/) tetap disarankan untuk menggunakan rumus (14.3.16), kecuali ada alasan khusus untuk meyakini bahwa hukum ini sangat berbeda dari yang normal (memiliki kurtosis positif atau negatif yang nyata).

Jika nilai perkiraan a/) diperoleh dengan satu atau lain cara, maka kita dapat membuat interval kepercayaan untuk varians dengan cara yang sama seperti kita membangunnya untuk ekspektasi matematis:

dimana nilai tergantung pada probabilitas p yang diberikan ditemukan menurut tabel. 14.3.1.

Contoh 2. Temukan interval kepercayaan sekitar 80% untuk varians suatu variabel acak X pada kondisi contoh 1, jika diketahui nilainya X didistribusikan menurut hukum mendekati normal.

Larutan. Nilainya tetap sama seperti di tabel. 14.3.1:

Menurut rumus (14.3.16)

Dengan menggunakan rumus (14.3.18) kita mencari selang kepercayaan:

Interval nilai rata-rata yang sesuai deviasi persegi: (0,21; 0,29).

14.4. Metode yang tepat untuk membangun interval kepercayaan untuk parameter variabel acak yang terdistribusi menurut hukum normal

Pada subbagian sebelumnya, kita memeriksa secara kasar metode perkiraan untuk membangun interval kepercayaan untuk ekspektasi dan varians matematis. Di sini kami akan memberikan gambaran tentang metode yang tepat untuk menyelesaikan masalah yang sama. Kami tekankan bahwa untuk mencari selang kepercayaan secara akurat, mutlak perlu diketahui terlebih dahulu bentuk hukum distribusi besaran. X, sedangkan untuk penerapan metode perkiraan hal ini tidak diperlukan.

Ide metode yang tepat membangun interval kepercayaan adalah sebagai berikut. Setiap interval kepercayaan ditemukan dari suatu kondisi yang menyatakan kemungkinan terpenuhinya pertidaksamaan tertentu, termasuk estimasi yang kita minati. A. Hukum distribusi penilaian A V kasus umum tergantung pada parameter kuantitas yang tidak diketahui X. Namun, terkadang ada kemungkinan untuk memasukkan pertidaksamaan dari variabel acak A ke beberapa fungsi lain dari nilai yang diamati X hal X 2, ..., X hal. hukum distribusi yang tidak bergantung pada parameter yang tidak diketahui, tetapi hanya bergantung pada jumlah percobaan dan jenis hukum distribusi besaran X. Variabel acak semacam ini memainkan peran penting dalam statistik matematika; mereka telah dipelajari secara paling rinci untuk kasus distribusi kuantitas yang normal X.

Misalnya terbukti dengan distribusi nilai yang normal X nilai acak

mematuhi apa yang disebut Hukum distribusi siswa Dengan P- 1 derajat kebebasan; kepadatan hukum ini memiliki bentuk

dimana G(x) adalah fungsi gamma yang diketahui:

Variabel acak juga telah terbukti

memiliki "distribusi%2" dengan P- 1 derajat kebebasan (lihat Bab 7), yang kepadatannya dinyatakan dengan rumus

Tanpa memikirkan derivasi distribusi (14.4.2) dan (14.4.4), kami akan menunjukkan bagaimana keduanya dapat diterapkan saat membangun interval kepercayaan untuk parameter kamu D.

Biarkan itu diproduksi P percobaan independen pada variabel acak X, terdistribusi normal dengan parameter yang tidak diketahui KE. Untuk parameter ini, estimasi diperoleh

Diperlukan untuk membangun interval kepercayaan untuk kedua parameter yang sesuai dengan probabilitas kepercayaan p.

Pertama-tama mari kita buat interval kepercayaan untuk ekspektasi matematis. Wajar jika interval ini dianggap simetris terhadap T; misalkan s p menunjukkan setengah panjang interval. Nilai s p harus dipilih agar kondisinya terpenuhi

Mari kita coba berpindah ke sisi kiri persamaan (14.4.5) dari variabel acak T ke variabel acak T, didistribusikan menurut hukum Siswa. Caranya, kalikan kedua ruas pertidaksamaan |m-w?|

dengan nilai positif: atau, menggunakan notasi (14.4.1),

Mari kita cari bilangan /p sedemikian rupa sehingga nilai /p dapat dicari dari kondisi tersebut

Dari rumus (14.4.2) jelas bahwa (1) - bahkan berfungsi, jadi (14.4.8) memberi

Kesetaraan (14.4.9) menentukan nilai /p tergantung p. Jika Anda memiliki tabel nilai integral

maka nilai /p dapat dicari dengan interpolasi terbalik pada tabel. Namun, akan lebih mudah jika membuat tabel nilai /p terlebih dahulu. Tabel tersebut diberikan dalam Lampiran (Tabel 5). Tabel ini menunjukkan nilai-nilai yang bergantung pada tingkat kepercayaan p dan jumlah derajat kebebasan P- 1. Setelah ditentukan / p dari tabel. 5 dan asumsi

kita akan mencari setengah lebar selang kepercayaan /p dan selang itu sendiri

Contoh 1.5 percobaan independen dilakukan pada variabel acak X, terdistribusi normal dengan parameter yang tidak diketahui T dan tentang. Hasil percobaan diberikan dalam tabel. 14.4.1.

Tabel 14.4.1

Temukan peringkat T untuk ekspektasi matematis dan buatlah interval kepercayaan 90% / p untuknya (yaitu, interval yang sesuai dengan probabilitas kepercayaan p = 0,9).

Larutan. Kita punya:

Menurut tabel 5 aplikasi untuk P - 1 = 4 dan p = 0,9 kita temukan Di mana

Interval kepercayaannya adalah

Contoh 2. Untuk kondisi contoh 1 ayat 14.3, dengan asumsi nilai X berdistribusi normal, tentukan selang kepercayaan yang tepat.

Larutan. Menurut tabel 5 dari lampiran kita menemukan kapan P - 1 = 19ir =

0,8 / hal = 1,328; dari sini

Dibandingkan dengan solusi contoh 1 sub-bagian 14.3 (ep = 0,072), kami yakin bahwa perbedaannya sangat kecil. Jika kita menjaga keakuratan hingga desimal kedua, maka interval kepercayaan yang ditemukan dengan metode eksak dan perkiraan adalah sama:

Mari kita lanjutkan dengan membangun interval kepercayaan untuk variansnya. Pertimbangkan penduga varians yang tidak bias

dan nyatakan variabel acaknya D melalui besarnya V(14.4.3), berdistribusi x 2 (14.4.4):

Mengetahui hukum distribusi besaran V, Anda dapat menemukan interval /(1) di mana ia berada dengan probabilitas tertentu p.

Hukum distribusi kn_x(v) besarnya I 7 memiliki bentuk yang ditunjukkan pada Gambar. 14.4.1.

Beras. 14.4.1

Timbul pertanyaan: bagaimana cara memilih interval /p? Jika hukum distribusi besaran V simetris (seperti hukum normal atau distribusi Student), wajar jika interval /p dianggap simetris terhadap ekspektasi matematis. Dalam hal ini hukum k p_x (v) asimetris. Mari kita sepakat untuk memilih interval /p sehingga probabilitas nilainya ada V di luar interval ke kanan dan kiri (daerah yang diarsir pada Gambar 14.4.1) adalah sama dan setara

Untuk membuat interval /p dengan properti ini, kita menggunakan tabel. 4 aplikasi: berisi angka kamu) seperti yang

untuk nilainya V, memiliki x 2 -distribusi dengan r derajat kebebasan. Dalam kasus kami r = n- 1. Mari kita perbaiki r = n- 1 dan temukan di baris tabel yang sesuai. 4 dua arti x 2 - yang satu sesuai dengan probabilitas, yang lain - probabilitas. Mari kita nyatakan ini

nilai-nilai di 2 Dan xl? Intervalnya sudah kamu 2, dengan kirimu, dan kamu ~ ujung kanan.

Sekarang mari kita cari dari interval / p interval kepercayaan yang diinginkan /|, untuk dispersi dengan batas D, dan D2, yang mencakup intinya D dengan probabilitas p:

Mari kita buat sebuah interval / (, = (?> ь А) yang mencakup titik tersebut D jika dan hanya jika nilainya V jatuh ke dalam interval /r. Mari kita tunjukkan intervalnya

memenuhi kondisi ini. Memang benar adanya kesenjangan setara dengan kesenjangan

dan pertidaksamaan ini dipenuhi dengan probabilitas p. Dengan demikian, selang kepercayaan untuk varians telah ditemukan dan dinyatakan dengan rumus (14.4.13).

Contoh 3. Tentukan selang kepercayaan varians pada kondisi contoh 2 ayat 14.3, jika diketahui nilainya X terdistribusi secara normal.

Larutan. Kita punya . Menurut tabel 4 lampiran

kita temukan di r = n - 1 = 19

Dengan menggunakan rumus (14.4.13) kita mencari interval kepercayaan untuk variansnya

Interval yang sesuai untuk deviasi standar adalah (0,21; 0,32). Interval ini hanya sedikit melebihi interval (0,21; 0,29) yang diperoleh pada contoh 2 ayat 14.3 dengan menggunakan metode perkiraan.

  • Gambar 14.3.1 memperlihatkan selang kepercayaan yang simetris terhadap a. Secara umum, seperti yang akan kita lihat nanti, hal ini tidak perlu.

Interval kepercayaan.

Perhitungan interval kepercayaan didasarkan pada kesalahan rata-rata dari parameter yang bersangkutan. Interval kepercayaan menunjukkan dalam batas berapa probabilitas (1-a) terletak nilai sebenarnya dari parameter yang diestimasi. Di sini a adalah tingkat signifikansi, (1-a) disebut juga probabilitas keyakinan.

Pada bab pertama kita telah menunjukkan bahwa, misalnya, untuk mean aritmatika, mean populasi sebenarnya pada sekitar 95% kasus terletak pada 2 kesalahan standar dari mean tersebut. Dengan demikian, batas selang kepercayaan 95% untuk mean akan menjadi dua kali lebih jauh dari mean sampel kesalahan rata-rata rata-rata, yaitu kita mengalikan kesalahan rata-rata dari mean dengan koefisien tertentu tergantung pada tingkat kepercayaan. Untuk rata-rata dan selisih rata-rata diambil koefisien Student (nilai kritis uji Student), untuk bagian dan selisih bagian diambil nilai kritis kriteria z. Produk dari koefisien dan kesalahan rata-rata dapat disebut kesalahan maksimum dari suatu parameter tertentu, yaitu. maksimal yang bisa kita peroleh saat menilainya.

Interval kepercayaan untuk rata-rata aritmatika : .

Berikut adalah contoh meannya;

Kesalahan rata-rata dari mean aritmatika;

S - standar deviasi sampel;

N

f = n-1 (Koefisien Siswa).

Interval kepercayaan untuk perbedaan cara aritmatika :

Berikut perbedaan antara mean sampel;

- kesalahan rata-rata selisih antara rata-rata aritmatika;

s 1 , s 2 – contoh deviasi standar;

n1,n2

Nilai kritis Uji t Student untuk tingkat signifikansi a dan jumlah derajat kebebasan tertentu f=n 1 +n 2-2 (Koefisien Siswa).

Interval kepercayaan untuk saham :

.

Di sini d adalah fraksi sampel;

– kesalahan pecahan rata-rata;

N– ukuran sampel (ukuran kelompok);

Interval kepercayaan untuk perbedaan saham :

Berikut perbedaan sampel sahamnya;

– kesalahan rata-rata selisih antara rata-rata aritmatika;

n1,n2– volume sampel (jumlah kelompok);

Nilai kritis kriteria z pada tingkat signifikansi tertentu a ( , , ).

Dengan menghitung interval kepercayaan untuk selisih antar indikator, pertama-tama kita melihat secara langsung nilai yang mungkin efeknya, dan bukan hanya itu perkiraan titik. Kedua, kita dapat menarik kesimpulan tentang diterima atau ditolaknya hipotesis nol dan ketiga, kita dapat menarik kesimpulan tentang kekuatan pengujian.

Saat menguji hipotesis menggunakan interval kepercayaan, Anda harus mematuhi aturan berikut:

Jika selang kepercayaan 100(1-a) persen perbedaan rata-rata tidak mengandung nol, maka perbedaan tersebut signifikan secara statistik pada tingkat signifikansi a; sebaliknya, jika interval ini mengandung nol, maka perbedaannya tidak signifikan secara statistik.

Memang benar, jika interval ini mengandung nol, berarti indikator yang dibandingkan mungkin lebih besar atau lebih kecil pada salah satu kelompok dibandingkan dengan kelompok lainnya, yaitu. perbedaan yang diamati disebabkan oleh kebetulan.

Kekuatan tes dapat dinilai dari letak angka nol dalam selang kepercayaan. Jika nol mendekati lebih rendah atau batas atas interval, maka mungkin dengan jumlah kelompok yang dibandingkan lebih banyak, perbedaannya akan tercapai signifikansi statistik. Jika nol mendekati pertengahan interval, berarti kenaikan dan penurunan indikator pada kelompok eksperimen memiliki kemungkinan yang sama, dan mungkin memang tidak ada perbedaan.

Contoh:

Untuk membandingkan angka kematian akibat pembedahan dengan menggunakan dua jenis anestesi yang berbeda: 61 orang dioperasi dengan anestesi jenis pertama, 8 orang meninggal, dengan tipe kedua – 67 orang, 10 orang meninggal.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Selisih tingkat kematian metode yang dibandingkan akan berada pada kisaran (-0,018 - 0,122; -0,018 + 0,122) atau (-0,14; 0,104) dengan probabilitas 100(1-a) = 95%. Intervalnya berisi nol, mis. hipotesis tentang kematian yang sama pada dua orang jenis yang berbeda Anestesi tidak bisa ditolak.

Dengan demikian, angka kematian dapat dan akan turun menjadi 14% dan meningkat menjadi 10,4% dengan probabilitas 95%, yaitu. nol kira-kira berada di tengah-tengah interval, sehingga dapat dikatakan bahwa, kemungkinan besar, kedua metode ini sebenarnya tidak berbeda dalam hal mematikan.

Pada contoh yang telah dibahas sebelumnya, rata-rata waktu penekanan pada saat tes sadap dibandingkan pada empat kelompok siswa yang berbeda nilai ujiannya. Mari kita hitung selang kepercayaan rata-rata waktu menekan siswa yang lulus ujian dengan nilai 2 dan 5 dan selang kepercayaan selisih rata-rata tersebut.

Koefisien Student dicari dengan menggunakan tabel distribusi Student (lihat lampiran): untuk kelompok pertama: = t(0,05;48) = 2,011; untuk kelompok kedua: = t(0,05;61) = 2,000. Jadi selang kepercayaan kelompok pertama: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6), untuk kelompok kedua (156.55- 2.000*1.88 ; 156.55+2.000*1.88) = (152.8 ; 160.3). Jadi, bagi mereka yang lulus ujian dengan 2, rata-rata waktu menekan berkisar antara 157,8 ms hingga 166,6 ms dengan probabilitas 95%, bagi mereka yang lulus ujian dengan 5 – dari 152,8 ms hingga 160,3 ms dengan probabilitas 95% .

Anda juga dapat menguji hipotesis nol menggunakan interval kepercayaan untuk rata-rata, dan bukan hanya untuk perbedaan rata-rata. Misalnya, seperti dalam kasus kita, jika interval kepercayaan untuk rata-rata tumpang tindih, maka hipotesis nol tidak dapat ditolak. Untuk menolak hipotesis pada tingkat signifikansi yang dipilih, interval kepercayaan yang bersangkutan tidak boleh tumpang tindih.

Mari kita cari selang kepercayaan selisih rata-rata waktu menekan pada kelompok yang lulus ujian dengan nilai 2 dan 5. Selisih rata-rata: 162,19 – 156,55 = 5,64. Koefisien siswa: = t(0.05;49+62-2) = t(0.05;109) = 1.982. Simpangan baku kelompok akan sama dengan: ; . Kami menghitung kesalahan rata-rata dari selisih rata-rata: . Interval kepercayaan: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33).

Jadi, selisih rata-rata waktu menekan pada kelompok yang lulus ujian dengan 2 dan 5 berkisar antara -0,044 ms hingga 11,33 ms. Interval ini mencakup nol, mis. Rata-rata waktu mendesak bagi mereka yang lulus ujian dengan baik dapat bertambah atau berkurang dibandingkan dengan mereka yang lulus ujian dengan kurang memuaskan, yaitu. hipotesis nol tidak dapat ditolak. Namun angka nol sangat mendekati batas bawah, dan waktu menekannya kemungkinan besar akan berkurang bagi mereka yang lulus dengan baik. Dengan demikian, kita dapat menyimpulkan bahwa masih terdapat perbedaan rata-rata waktu pengepresan antara mereka yang melewati 2 dan 5, hanya saja kita tidak dapat mendeteksinya mengingat perubahan waktu rata-rata, penyebaran waktu rata-rata dan ukuran sampel.



Kekuatan suatu tes adalah probabilitas menolak hipotesis nol yang salah, yaitu menemukan perbedaan di tempat yang sebenarnya ada.

Kekuatan tes ditentukan berdasarkan tingkat signifikansi, besarnya perbedaan antar kelompok, penyebaran nilai dalam kelompok dan besarnya sampel.

Untuk ujian Siswa dan analisis varians Anda dapat menggunakan diagram sensitivitas.

Kekuatan kriteria dapat digunakan untuk menentukan terlebih dahulu jumlah kelompok yang dibutuhkan.

Interval kepercayaan menunjukkan dalam batas mana nilai sebenarnya dari parameter yang diestimasi terletak pada probabilitas tertentu.

Dengan menggunakan interval kepercayaan, Anda dapat menguji hipotesis statistik dan menarik kesimpulan tentang sensitivitas kriteria.

LITERATUR.

Glanz S. – Bab 6,7.

Rebrova O.Yu. – hal.112-114, hal.171-173, hal.234-238.

Sidorenko E.V. – hal.32-33.

Pertanyaan untuk menguji diri siswa.

1. Apa kekuatan kriterianya?

2. Dalam hal apa perlunya mengevaluasi kekuatan kriteria?

3. Metode penghitungan daya.

6. Bagaimana cara menguji hipotesis statistik menggunakan interval kepercayaan?

7. Apa yang dapat dikatakan tentang kekuatan kriteria ketika menghitung selang kepercayaan?

Tugas.

Misalkan kita mempunyai sejumlah besar barang dengan distribusi normal dari beberapa karakteristik (misalnya, gudang penuh sayuran dari jenis yang sama, ukuran dan beratnya bervariasi). Anda ingin mengetahui karakteristik rata-rata seluruh batch barang, tetapi Anda tidak punya waktu maupun keinginan untuk mengukur dan menimbang setiap sayuran. Anda memahami bahwa ini tidak perlu. Tapi berapa banyak barang yang perlu diambil untuk pemeriksaan mendadak?

Sebelum memberikan beberapa rumus yang berguna untuk situasi ini, mari kita ingat beberapa notasi.

Pertama, jika kita mengukur seluruh gudang sayuran (kumpulan elemen ini disebut populasi umum), maka kita akan mengetahui dengan akurat berat rata-rata seluruh batch. Sebut saja ini rata-rata X rata-rata .g en . - Rata-rata umum. Kita sudah mengetahui apa yang ditentukan secara lengkap jika nilai rata-rata dan deviasinya diketahui . Benar, meskipun kami bukan generasi X rata-rata S Kami tidak mengetahui populasi umum. Kita hanya dapat mengambil sampel tertentu, mengukur nilai yang kita perlukan dan menghitung untuk sampel ini baik nilai rata-rata X rata-rata dan simpangan baku S yang dipilih.

Diketahui jika pemeriksaan sampel kita mengandung sejumlah besar elemen (biasanya n lebih besar dari 30), dan diambil benar-benar acak, lalu s populasi umum hampir tidak akan berbeda dengan seleksi S..

Selain itu, untuk kasus berdistribusi normal kita dapat menggunakan rumus sebagai berikut:

Dengan kemungkinan 95%


Dengan kemungkinan 99%



DI DALAM pandangan umum dengan probabilitas P (t)


Hubungan antara nilai t dengan nilai probabilitas P(t) yang ingin kita ketahui selang kepercayaannya dapat diambil dari tabel berikut:


Jadi, kami telah menentukan di kisaran mana nilai rata-rata populasi berada (dengan probabilitas tertentu).

Kecuali kita mempunyai sampel yang cukup besar, kita tidak dapat mengatakan bahwa populasi tersebut mempunyai s = S pilih Selain itu, dalam hal ini kedekatan sampel dengan distribusi normal menjadi masalah. Dalam hal ini, kami juga menggunakan S select sebagai gantinya s dalam rumus:




tetapi nilai t untuk probabilitas tetap P(t) akan bergantung pada jumlah elemen dalam sampel n. Semakin besar n, semakin dekat interval kepercayaan yang dihasilkan dengan nilai yang diberikan oleh rumus (1). Nilai t dalam hal ini diambil dari tabel lain ( Uji-t siswa), yang kami sajikan di bawah ini:

Nilai uji-t Student untuk probabilitas 0,95 dan 0,99


Contoh 3. 30 orang dipilih secara acak dari karyawan perusahaan. Berdasarkan sampel, ternyata gaji rata-rata (per bulan) adalah 30 ribu rubel dengan standar deviasi 5 ribu rubel. Tentukan gaji rata-rata di perusahaan tersebut dengan probabilitas 0,99.

Larutan: Dengan syarat kita memiliki n = 30, X rata-rata. =30000, S=5000, P = 0,99. Untuk mencari selang kepercayaan, kita akan menggunakan rumus yang sesuai dengan uji t Student. Berdasarkan tabel untuk n = 30 dan P = 0,99 kita menemukan t = 2,756, oleh karena itu,


itu. wali yang dicari selang waktu 27484< Х ср.ген < 32516.

Jadi, dengan probabilitas 0,99 kita dapat mengatakan bahwa interval (27484; 32516) memuat rata-rata gaji di perusahaan tersebut.

Kami berharap Anda akan menggunakan metode ini, dan Anda tidak perlu selalu membawa meja. Perhitungan dapat dilakukan secara otomatis di Excel. Saat berada di file Excel, klik tombol fx di menu atas. Kemudian, pilih jenis "statistik" di antara fungsi-fungsi tersebut, dan dari daftar yang diusulkan di jendela - STUDAR. Kemudian, saat diminta, letakkan kursor di bidang "probabilitas", masukkan nilai probabilitas terbalik (yaitu dalam kasus kami, alih-alih probabilitas 0,95, Anda perlu mengetikkan probabilitas 0,05). Tampaknya lembar kerja dikompilasi sedemikian rupa sehingga hasilnya menjawab pertanyaan seberapa besar kemungkinan kita melakukan kesalahan. Demikian pula, di bidang Derajat Kebebasan, masukkan nilai (n-1) untuk sampel Anda.

Interval kepercayaan untuk ekspektasi matematis - ini adalah interval yang dihitung dari data yang, dengan probabilitas yang diketahui, berisi ekspektasi matematis dari populasi umum. Estimasi alami untuk ekspektasi matematis adalah rata-rata aritmatika dari nilai observasinya. Oleh karena itu, sepanjang pembelajaran kita akan menggunakan istilah “rata-rata” dan “nilai rata-rata”. Dalam soal penghitungan interval kepercayaan, jawaban yang paling sering dibutuhkan adalah seperti “Interval kepercayaan dari mean [nilai dalam soal tertentu] adalah dari [nilai yang lebih kecil] hingga [nilai yang lebih besar].” Dengan menggunakan interval kepercayaan, Anda tidak hanya dapat memperkirakan nilai rata-rata, tetapi juga proporsi karakteristik tertentu dari populasi umum. Rata-rata, varians, deviasi standar dan kesalahan-kesalahan yang menyebabkan kita sampai pada definisi dan rumus baru dibahas dalam pelajaran Karakteristik sampel dan populasi .

Estimasi titik dan interval mean

Jika nilai rata-rata populasi diperkirakan dengan suatu angka (titik), maka rata-rata tertentu, yang dihitung dari suatu sampel pengamatan, diambil sebagai perkiraan nilai rata-rata populasi yang tidak diketahui. Dalam hal ini, nilai mean sampel - variabel acak - tidak sesuai dengan nilai mean populasi umum. Oleh karena itu, ketika menunjukkan mean sampel, Anda harus secara bersamaan menunjukkan kesalahan pengambilan sampel. Ukuran kesalahan pengambilan sampel adalah kesalahan standar, yang dinyatakan dalam satuan yang sama dengan mean. Oleh karena itu, notasi berikut sering digunakan: .

Jika pendugaan rata-rata perlu dikaitkan dengan probabilitas tertentu, maka parameter kepentingan dalam populasi harus diestimasi bukan dengan satu angka, tetapi dengan suatu interval. Interval kepercayaan adalah interval dimana, dengan probabilitas tertentu P nilai indikator perkiraan populasi ditemukan. Interval kepercayaan yang memungkinkan terjadinya hal tersebut P = 1 - α variabel acak ditemukan, dihitung sebagai berikut:

,

α = 1 - P, yang dapat ditemukan di lampiran hampir semua buku statistik.

Dalam praktiknya, mean dan varians populasi tidak diketahui, sehingga varians populasi diganti dengan varians sampel, dan mean populasi diganti dengan mean sampel. Jadi, interval kepercayaan dalam banyak kasus dihitung sebagai berikut:

.

Rumus interval kepercayaan dapat digunakan untuk memperkirakan mean populasi jika

  • simpangan baku populasi diketahui;
  • atau simpangan baku populasi tidak diketahui, tetapi ukuran sampel lebih besar dari 30.

Rata-rata sampel adalah taksiran rata-rata populasi yang tidak bias. Pada gilirannya, varians sampel bukanlah perkiraan varians populasi yang tidak bias. Untuk memperoleh estimasi varians populasi yang tidak bias dalam rumus varians sampel, ukuran sampel N harus diganti dengan N-1.

Contoh 1. Informasi dikumpulkan dari 100 kafe yang dipilih secara acak di suatu kota tertentu bahwa rata-rata jumlah karyawan di dalamnya adalah 10,5 dengan standar deviasi 4,6. Tentukan selang kepercayaan 95% untuk jumlah pegawai kafe.

dimana adalah nilai kritis dari distribusi normal baku untuk tingkat signifikansi α = 0,05 .

Dengan demikian, interval kepercayaan 95% rata-rata jumlah pegawai kafe berkisar antara 9,6 hingga 11,4.

Contoh 2. Untuk sampel acak dari populasi 64 observasi, dihitung nilai total sebagai berikut:

jumlah nilai dalam observasi,

jumlah deviasi kuadrat nilai dari mean .

Hitung interval kepercayaan 95% untuk ekspektasi matematis.

Mari kita hitung deviasi standarnya:

,

Mari kita hitung nilai rata-ratanya:

.

Kami mengganti nilai ke dalam ekspresi interval kepercayaan:

dimana adalah nilai kritis dari distribusi normal baku untuk tingkat signifikansi α = 0,05 .

Kita mendapatkan:

Jadi, interval kepercayaan 95% untuk ekspektasi matematis sampel ini berkisar antara 7,484 hingga 11,266.

Contoh 3. Untuk sampel populasi acak sebanyak 100 observasi, mean yang dihitung adalah 15,2 dan deviasi standar adalah 3,2. Hitung interval kepercayaan 95% untuk nilai yang diharapkan, lalu interval kepercayaan 99%. Jika kekuatan sampel dan variasinya tetap tidak berubah dan koefisien kepercayaan meningkat, apakah interval kepercayaan akan menyempit atau melebar?

Kami mengganti nilai-nilai ini ke dalam ekspresi interval kepercayaan:

dimana adalah nilai kritis dari distribusi normal baku untuk tingkat signifikansi α = 0,05 .

Kita mendapatkan:

.

Dengan demikian, interval kepercayaan 95% untuk rata-rata sampel ini berkisar antara 14,57 hingga 15,82.

Kami kembali mengganti nilai-nilai ini ke dalam ekspresi interval kepercayaan:

dimana adalah nilai kritis dari distribusi normal baku untuk tingkat signifikansi α = 0,01 .

Kita mendapatkan:

.

Dengan demikian, interval kepercayaan 99% untuk rata-rata sampel ini berkisar antara 14,37 hingga 16,02.

Seperti yang bisa kita lihat, dengan meningkatnya koefisien kepercayaan, nilai kritis dari distribusi normal standar juga meningkat, dan akibatnya, titik awal dan akhir interval terletak lebih jauh dari mean, dan dengan demikian interval kepercayaan untuk ekspektasi matematis meningkat. .

Estimasi titik dan interval berat jenis

Bagian dari beberapa atribut sampel dapat diartikan sebagai estimasi titik berat jenis P mempunyai karakteristik yang sama pada populasi umum. Jika nilai ini perlu dikaitkan dengan probabilitas, maka interval kepercayaan berat jenis harus dihitung P karakteristik dalam populasi dengan probabilitas P = 1 - α :

.

Contoh 4. Di beberapa kota ada dua kandidat A Dan B mencalonkan diri sebagai walikota. 200 penduduk kota disurvei secara acak, 46% di antaranya menjawab bahwa mereka akan memilih kandidat tersebut A, 26% - untuk kandidat B dan 28% tidak tahu siapa yang akan mereka pilih. Tentukan selang kepercayaan 95% untuk proporsi penduduk kota yang mendukung kandidat tersebut A.



Baru di situs

>

Paling populer