Rumah Lidah berlapis Jika deret variasinya berbentuk. Variasi dan rangkaian variasi, ruang lingkup variasi

Jika deret variasinya berbentuk. Variasi dan rangkaian variasi, ruang lingkup variasi

Variasi disebut deret distribusi yang dibangun atas dasar kuantitatif. Nilai-nilai sifat kuantitatif pada satuan individu suatu populasi tidaklah konstan dan sedikit banyak berbeda satu sama lain.

Variasi- fluktuasi, perubahan nilai suatu karakteristik antar unit populasi. Memisahkan nilai numerik ciri-ciri yang terdapat pada populasi yang diteliti disebut pilihan nilai-nilai. Nilai rata-rata tidak mencukupi untuk karakteristik penuh populasi memaksa kita untuk melengkapi nilai rata-rata dengan indikator yang memungkinkan kita menilai kekhasan rata-rata tersebut dengan mengukur variabilitas (variasi) dari karakteristik yang dipelajari.

Adanya variasi tersebut disebabkan oleh pengaruh sejumlah besar faktor terhadap pembentukan tingkat sifat tersebut. Faktor-faktor ini bertindak dengan kekuatan yang berbeda dan dalam arah yang berbeda. Indeks variasi digunakan untuk menggambarkan ukuran variabilitas sifat.

Tugas studi statistik variasi:

  • 1) studi tentang sifat dan derajat variasi karakteristik pada masing-masing unit populasi;
  • 2) menentukan peranan faktor individu atau kelompoknya dalam variasi ciri-ciri tertentu suatu populasi.

Digunakan dalam statistik metode khusus studi variasi berdasarkan penggunaan sistem indikator, Dengan dimana variasi diukur.

Studi tentang variasi telah penting. Pengukuran variasi diperlukan pada saat melakukan pengambilan sampel, korelasi dan analisis varians dll. Ermolaev O.Yu. Statistik matematika untuk psikolog: Buku Teks [Teks]/ O.Yu. Ermolaev. - M.: Flint Publishing House dari Institut Psikologi dan Sosial Moskow, 2012. - 335 hal.

Berdasarkan tingkat variasinya, seseorang dapat menilai homogenitas populasi, stabilitas nilai karakteristik individu, dan kekhasan rata-rata. Atas dasar itu dikembangkan indikator keeratan hubungan antara karakteristik dan indikator untuk menilai keakuratan observasi sampel.

Perbedaan dibuat antara variasi ruang dan variasi waktu.

Variasi ruang dipahami sebagai fluktuasi nilai atribut antar unit populasi yang mewakili wilayah individu. Variasi dari waktu ke waktu berarti perubahan nilai suatu karakteristik periode yang berbeda waktu.

Untuk mempelajari variasi baris distribusi, seluruh varian nilai atribut disusun dalam urutan menaik atau menurun. Proses ini disebut pemeringkatan baris.

Yang paling tanda-tanda sederhana variasinya adalah minimum dan maksimum- paling sedikit dan nilai tertinggi tanda-tanda secara agregat. Banyaknya pengulangan masing-masing varian nilai fitur disebut frekuensi pengulangan (fi). Lebih mudah untuk mengganti frekuensi dengan frekuensi - wi. Frekuensi adalah indikator frekuensi relatif, yang dapat dinyatakan dalam pecahan satuan atau persentase dan memungkinkan Anda membandingkan rangkaian variasi dengan nomor yang berbeda pengamatan. Dinyatakan dengan rumus:

dimana Xmax, Xmin adalah nilai maksimum dan minimum dari karakteristik agregat; n - jumlah kelompok.

Untuk mengukur variasi suatu karakteristik, digunakan berbagai indikator absolut dan relatif. Indikator variasi absolut meliputi rentang variasi, rata-rata simpangan linier, dispersi, dan simpangan baku. Indikator osilasi relatif meliputi koefisien osilasi, deviasi linier relatif, dan koefisien variasi.

Menemukan contoh seri variasi

Latihan. Untuk sampel ini:

  • a) Temukan deret variasinya;
  • b) Membangun fungsi distribusi;

Tidak=42. Elemen sampel:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Larutan.

  • a) konstruksi rangkaian variasi peringkat:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) konstruksi deret variasi diskrit.

Mari kita hitung jumlah grup dalam deret variasi menggunakan rumus Sturgess:

Misalkan jumlah kelompoknya adalah 7.

Mengetahui jumlah kelompok, kami menghitung ukuran interval:

Untuk memudahkan pembuatan tabel, kita ambil jumlah kelompok sama dengan 8, intervalnya adalah 1.

Beras. 1 Volume penjualan barang oleh suatu toko selama jangka waktu tertentu

Variasi menentukan perbedaan nilai suatu karakteristik di antara unit-unit yang berbeda dari suatu populasi tertentu pada periode (titik waktu) yang sama. Variasi disebabkan oleh kondisi yang berbeda keberadaan unit-unit totalitas yang berbeda. Misalnya, bahkan anak kembar pun dalam perjalanan hidupnya mengalami perbedaan tinggi badan, berat badan, serta karakteristik seperti tingkat pendidikan, pendapatan, jumlah anak, dan lain-lain.

Variasi muncul sebagai akibat dari kenyataan bahwa nilai-nilai atribut itu sendiri terbentuk di bawah pengaruh total berbagai kondisi, yang digabungkan dengan cara yang berbeda dalam setiap kasus. Dengan demikian, nilai dari setiap pilihan adalah obyektif.

Variasi adalah ciri khasnya terhadap semua fenomena alam dan masyarakat tanpa kecuali, kecuali makna normatif yang ditetapkan secara hukum tentang ciri-ciri sosial individu. Studi variasi dalam statistik telah nilai yang besar, membantu untuk memahami esensi dari fenomena yang sedang dipelajari. Menemukan variasi, mencari tahu penyebabnya, mengidentifikasi pengaruh faktor individu informasi penting untuk implementasi keputusan manajemen berbasis ilmiah.

Nilai rata-rata memberikan gambaran umum tentang ciri-ciri suatu populasi, tetapi tidak mengungkapkan strukturnya. Nilai rata-rata tidak menunjukkan bagaimana letak varian-varian dari karakteristik yang dirata-ratakan di sekitarnya, apakah tersebar mendekati rata-rata atau menyimpang darinya. Rata-rata dalam dua populasi mungkin sama, tetapi dalam satu versi semua nilai individu berbeda secara signifikan, dan di versi lain, perbedaan ini besar, yaitu. dalam kasus pertama variasi karakteristiknya kecil, dan dalam kasus kedua variasinya besar; ini sangat penting untuk mengkarakterisasi signifikansi nilai rata-rata.

Agar pimpinan suatu organisasi, manajer, atau peneliti dapat mempelajari variasi dan mengelolanya, statistika telah mengembangkan metode khusus untuk mempelajari variasi (sistem indikator). Dengan bantuan mereka, variasi ditemukan dan sifat-sifatnya dikarakterisasi. Indikator variasi meliputi : rentang variasi, deviasi linier rata-rata, koefisien variasi.

Deret variasi dan bentuknya

Seri variasi- ini adalah distribusi unit-unit suatu populasi yang terurut, seringkali menurut peningkatan (lebih jarang penurunan) nilai suatu karakteristik dan penghitungan jumlah unit dengan nilai karakteristik tertentu. Ketika jumlah unit populasi besar, rangkaian peringkat menjadi rumit dan konstruksinya memakan waktu lama. Dalam situasi seperti itu, deret variasi dibangun dengan mengelompokkan unit-unit populasi menurut nilai-nilai karakteristik yang dipelajari.

Ada yang berikut ini bentuk deret variasi :

  1. Seri berperingkat mewakili daftar unit individu populasi dalam urutan menaik (menurun) dari karakteristik yang dipelajari.
  2. Seri variasi diskrit - ini adalah tabel yang terdiri dari dua garis atau grafik: nilai spesifik dari karakteristik yang bervariasi x dan jumlah unit populasi dengan nilai tertentu f - karakteristik frekuensi. Itu dibangun ketika atribut mengambil jumlah nilai terbesar.
  3. Seri interval.

Kisaran variasi ditentukan Bagaimana nilai mutlak selisih antara nilai (varian) maksimum dan minimum suatu karakteristik:

Kisaran variasi menunjukkan hanya penyimpangan ekstrim dari karakteristik dan tidak mencerminkan penyimpangan individu dari semua opsi dalam rangkaian. Ini mencirikan batas-batas perubahan dalam karakteristik yang bervariasi dan bergantung pada fluktuasi dua varian ekstrem dan sama sekali tidak terkait dengan frekuensi dalam rangkaian variasi, yaitu dengan sifat distribusi, yang memberikan nilai ini karakter acak. Untuk menganalisis variasi, diperlukan indikator yang mencerminkan semua fluktuasi karakteristik variasi dan memberikannya karakteristik umum. Indikator paling sederhana dari jenis ini adalah deviasi linier rata-rata.

Seri distribusi statistik– ini adalah distribusi unit-unit populasi yang tertata ke dalam kelompok-kelompok menurut karakteristik tertentu yang bervariasi.
Tergantung pada karakteristik yang mendasari pembentukan rangkaian distribusi, ada deret distribusi atributif dan variasional.

Adanya suatu kesamaan ciri menjadi dasar terbentuknya suatu populasi statistik, yang merepresentasikan hasil suatu deskripsi atau pengukuran fitur umum objek penelitian.

Pokok kajian dalam statistika adalah sifat atau sifat statistik yang berubah-ubah (bervariasi).

Jenis karakteristik statistik.

Deret distribusi disebut atributif dibangun sesuai dengan kriteria kualitas. Atributif– ini adalah tanda yang memiliki nama (misalnya profesi: penjahit, guru, dll).
Rangkaian distribusi biasanya disajikan dalam bentuk tabel. Di meja 2.8 menunjukkan rangkaian distribusi atribut.
Tabel 2.8 - Sebaran spesies bantuan hukum layanan yang diberikan oleh pengacara kepada warga negara salah satu wilayah Federasi Rusia.

Seri variasi– ini adalah nilai karakteristik (atau interval nilai) dan frekuensinya.
Deret variasi adalah deret distribusi, dibangun atas dasar kuantitatif. Setiap rangkaian variasi terdiri dari dua elemen: opsi dan frekuensi.
Varian dianggap sebagai nilai individual dari suatu karakteristik yang diperlukan dalam suatu rangkaian variasi.
Frekuensi adalah jumlah pilihan individu atau setiap kelompok rangkaian variasi, mis. Ini adalah angka yang menunjukkan seberapa sering opsi tertentu muncul dalam rangkaian distribusi. Jumlah semua frekuensi menentukan ukuran seluruh populasi, volumenya.
Frekuensi adalah frekuensi yang dinyatakan sebagai pecahan suatu satuan atau persentase dari total. Dengan demikian, jumlah frekuensinya sama dengan 1 atau 100%. Deret variasi memungkinkan kita memperkirakan bentuk hukum distribusi berdasarkan data aktual.

Tergantung pada sifat variasi sifat tersebut, ada deret variasi diskrit dan interval.
Contoh deret variasi diskrit diberikan dalam tabel. 2.9.
Tabel 2.9 - Distribusi keluarga berdasarkan jumlah kamar yang ditempati di apartemen individu pada tahun 1989 di Federasi Rusia.

Kolom pertama tabel menyajikan pilihan rangkaian variasi diskrit, kolom kedua berisi frekuensi rangkaian variasi, dan kolom ketiga berisi indikator frekuensi.

Seri variasi

DI DALAM populasi sifat kuantitatif tertentu sedang diselidiki. Sampel volume diekstraksi secara acak darinya N, yaitu jumlah elemen sampel sama dengan N. Pada tahap pertama pemrosesan statistik, mulai sampel, yaitu pemesanan nomor x 1 , x 2 , …, xn Naik. Setiap nilai yang diamati x saya ditelepon pilihan. Frekuensi saya adalah jumlah observasi dari nilai tersebut x saya dalam sampel. Frekuensi relatif (frekuensi) dengan saya adalah rasio frekuensi saya untuk ukuran sampel N: .
Saat mempelajari deret variasi, konsep frekuensi akumulasi dan frekuensi akumulasi juga digunakan. Membiarkan X beberapa nomor. Lalu jumlah pilihan , yang nilainya lebih kecil X, disebut frekuensi akumulasi: untuk x i N disebut frekuensi akumulasi w i max.
Suatu karakteristik disebut variabel diskrit jika nilai individualnya (varian) berbeda satu sama lain dengan nilai berhingga tertentu (biasanya bilangan bulat). Deret variasi dari sifat tersebut disebut deret variasi diskrit.

Tabel 1. Pandangan umum deret frekuensi variasi diskrit

Nilai-nilai karakteristikx saya x 1 x 2 xn
Frekuensisaya m 1 m 2 M N

Suatu karakteristik disebut bervariasi terus menerus jika nilainya berbeda satu sama lain dengan jumlah yang kecil, yaitu. suatu tanda dapat mengambil nilai berapa pun dalam interval tertentu. Deret variasi kontinu untuk suatu karakteristik disebut interval.

Tabel 2. Gambaran umum rangkaian variasi interval frekuensi

Tabel 3. Gambar grafis rangkaian variasi

BarisPoligon atau histogramFungsi distribusi empiris
Diskrit
Selang
Dengan meninjau hasil observasi, ditentukan berapa banyak nilai pilihan yang termasuk dalam setiap interval tertentu. Diasumsikan bahwa setiap interval milik salah satu ujungnya: baik dalam semua kasus kiri (lebih sering) atau dalam semua kasus kanan, dan frekuensi atau frekuensi menunjukkan jumlah opsi yang terdapat dalam batas yang ditentukan. Perbedaan aku – aku +1 disebut interval parsial. Untuk menyederhanakan perhitungan selanjutnya, deret variasi interval dapat diganti dengan deret diskrit bersyarat. Dalam hal ini, nilai rata-rata Saya-interval diambil sebagai pilihan x saya, dan frekuensi interval yang sesuai saya– untuk frekuensi interval ini.
Untuk representasi grafis deret variasi, yang paling umum digunakan adalah poligon, histogram, kurva kumulatif, dan fungsi distribusi empiris.

Di meja 2.3 (Pengelompokan penduduk Rusia berdasarkan pendapatan per kapita rata-rata pada bulan April 1994) disajikan seri variasi interval.
Lebih mudah untuk menganalisis rangkaian distribusi menggunakan gambar grafis, yang memungkinkan seseorang menilai bentuk distribusi. Representasi visual dari sifat perubahan frekuensi deret variasi diberikan oleh poligon dan histogram.
Poligon digunakan saat menggambarkan rangkaian variasi diskrit.
Sebagai contoh, mari kita gambarkan secara grafis distribusi persediaan perumahan menurut jenis apartemen (Tabel 2.10).
Tabel 2.10 - Distribusi persediaan perumahan di wilayah perkotaan menurut jenis apartemen (angka bersyarat).


Beras. Area distribusi perumahan


Tidak hanya nilai frekuensinya, tetapi frekuensi deret variasinya juga dapat diplot pada sumbu ordinat.
Histogram digunakan untuk menggambarkan rangkaian variasi interval. Saat membuat histogram, nilai interval diplot pada sumbu absis, dan frekuensi digambarkan oleh persegi panjang yang dibangun pada interval yang sesuai. Ketinggian kolom dalam hal interval yang sama harus sebanding dengan frekuensi. Histogram adalah grafik yang suatu deret digambarkan sebagai batang-batang yang berdekatan satu sama lain.
Mari kita gambarkan secara grafis deret distribusi interval yang diberikan dalam tabel. 2.11.
Tabel 2.11 - Distribusi keluarga berdasarkan luas tempat tinggal per orang (angka bersyarat).
Tidak hal/hal Kelompok keluarga berdasarkan ukuran ruang hidup per orang Jumlah keluarga dengan ukuran ruang hidup tertentu Jumlah kumulatif keluarga
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Beras. 2.2. Histogram sebaran keluarga menurut luas tempat tinggal per orang


Dengan menggunakan data dari rangkaian akumulasi (Tabel 2.11), kami membangun mengumpulkan distribusi.


Beras. 2.3. Distribusi kumulatif keluarga berdasarkan luas tempat tinggal per orang


Representasi deret variasi dalam bentuk kumulat sangat efektif untuk deret variasi yang frekuensinya dinyatakan sebagai pecahan atau persentase dari jumlah frekuensi deret tersebut.
Jika kita mengubah sumbu ketika secara grafis menggambarkan deret variasi dalam bentuk kumulatif, maka kita peroleh ogiva. Pada Gambar. 2.4 menunjukkan ogif yang dibuat berdasarkan data pada Tabel. 2.11.
Histogram dapat diubah menjadi poligon distribusi dengan mencari titik tengah sisi-sisi persegi panjang dan kemudian menghubungkan titik-titik tersebut dengan garis lurus. Poligon distribusi yang dihasilkan ditunjukkan pada Gambar. 2.2 dengan garis putus-putus.
Saat membuat histogram distribusi deret variasi dengan interval yang tidak sama, bukan frekuensi yang diplot sepanjang sumbu ordinat, tetapi kepadatan distribusi karakteristik dalam interval yang sesuai.
Kepadatan distribusi adalah frekuensi yang dihitung per satuan lebar interval, yaitu. berapa banyak satuan dalam setiap kelompok per satuan nilai interval. Contoh penghitungan kepadatan distribusi disajikan pada tabel. 2.12.
Tabel 2.12 - Distribusi perusahaan berdasarkan jumlah karyawan (angka bersyarat)
Tidak hal/hal Kelompok perusahaan berdasarkan jumlah karyawan, orang. Jumlah perusahaan Ukuran interval, kawan. Kepadatan distribusi
A 1 2 3=1/2
1 Sampai 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Dapat juga digunakan untuk representasi grafis dari rangkaian variasi kurva kumulatif. Dengan menggunakan cumulate (kurva penjumlahan), serangkaian frekuensi akumulasi digambarkan. Frekuensi kumulatif ditentukan dengan menjumlahkan frekuensi antar kelompok secara berurutan dan menunjukkan berapa banyak unit dalam populasi yang memiliki nilai atribut tidak lebih besar dari nilai yang dipertimbangkan.


Beras. 2.4. Ogive distribusi keluarga berdasarkan ukuran ruang hidup per orang

Saat membuat kumulat deret variasi interval, varian deret tersebut diplot sepanjang sumbu absis, dan frekuensi akumulasi diplot sepanjang sumbu ordinat.

Tempat khusus dalam analisis statistik adalah milik penentuan tingkat rata-rata dari karakteristik atau fenomena yang diteliti. Tingkat rata-rata suatu sifat diukur dengan nilai rata-rata.

Nilai rata-rata mencirikan tingkat kuantitatif umum dari karakteristik yang dipelajari dan merupakan properti kelompok dari populasi statistik. Ini meratakan, melemahkan penyimpangan acak dari pengamatan individu dalam satu arah atau lainnya dan menyoroti sifat utama dan khas dari karakteristik yang sedang dipelajari.

Rata-rata banyak digunakan:

1. Menilai status kesehatan penduduk: karakteristik perkembangan fisik (tinggi badan, berat badan, lingkar dada, dll), mengidentifikasi prevalensi dan durasi berbagai penyakit, menganalisis indikator demografi (pergerakan vital penduduk, rata-rata harapan hidup, reproduksi populasi, populasi rata-rata dan sebagainya.).

2. Mempelajari kegiatan institusi kesehatan, tenaga medis dan menilai mutu kerjanya, merencanakan dan menentukan kebutuhan penduduk akan berbagai jenis pelayanan kesehatan (rata-rata jumlah permintaan atau kunjungan per penduduk per tahun, rata-rata lama tinggal suatu pasien di rumah sakit, rata-rata lama pemeriksaan pasien, rata-rata ketersediaan dokter, tempat tidur, dan sebagainya).

3. Untuk mengkarakterisasi keadaan sanitasi dan epidemiologis (rata-rata kandungan debu udara di bengkel, rata-rata luas per orang, rata-rata konsumsi protein, lemak dan karbohidrat, dll).

4. Menentukan indikator medis dan fisiologis dalam kondisi normal dan patologis, saat mengolah data laboratorium, menetapkan keandalan hasil studi sampel dalam studi sosial, higienis, klinis, dan eksperimental.

Perhitungan nilai rata-rata dilakukan berdasarkan rangkaian variasi. Seri variasi adalah kumpulan statistik yang homogen secara kualitatif, yang unit-unit individualnya mencirikan perbedaan kuantitatif dari karakteristik atau fenomena yang sedang dipelajari.

Variasi kuantitatif dapat terdiri dari dua jenis: diskontinyu (diskrit) dan kontinu.

Atribut diskontinyu (diskrit) hanya dinyatakan sebagai bilangan bulat dan tidak boleh memiliki nilai perantara (misalnya, jumlah kunjungan, populasi situs, jumlah anak dalam keluarga, tingkat keparahan penyakit dalam poin , dll.).

Tanda kontinu dapat mengambil nilai apa pun dalam batas tertentu, termasuk nilai pecahan, dan hanya dinyatakan kira-kira (misalnya, berat badan - untuk orang dewasa dapat dibatasi hingga kilogram, dan untuk bayi baru lahir - gram; tinggi badan, tekanan darah, waktu dihabiskan menemui pasien, dan lain-lain).



Nilai digital dari setiap ciri atau fenomena individu yang termasuk dalam rangkaian variasi disebut varian dan dilambangkan dengan huruf V . Notasi lain juga ditemukan dalam literatur matematika, misalnya X atau kamu.

Rangkaian variasi, di mana setiap pilihan ditunjukkan satu kali, disebut sederhana. Seri tersebut digunakan dalam sebagian besar masalah statistik dalam hal pemrosesan data komputer.

Dengan bertambahnya jumlah observasi, nilai varian yang berulang cenderung terjadi. Dalam hal ini, itu dibuat seri variasi yang dikelompokkan, yang menunjukkan jumlah pengulangan (frekuensi, dilambangkan dengan huruf “ R »).

Seri variasi berperingkat terdiri dari pilihan-pilihan yang disusun dalam urutan menaik atau menurun. Seri sederhana dan berkelompok dapat dikompilasi dengan peringkat.

Seri variasi interval disusun untuk mempermudah perhitungan selanjutnya yang dilakukan tanpa menggunakan komputer, dengan jumlah satuan pengamatan yang sangat banyak (lebih dari 1000).

Seri variasi berkelanjutan menyertakan nilai opsi, yang dapat berupa nilai apa pun.

Jika dalam suatu deret variasi nilai-nilai suatu sifat (varian) diberikan dalam bentuk bilangan-bilangan tertentu, maka deret tersebut disebut terpisah.

Ciri-ciri umum dari nilai-nilai sifat yang tercermin dalam deret variasi adalah nilai rata-rata. Diantaranya yang paling banyak digunakan adalah: mean aritmatika M, mode Mo dan median Aku. Masing-masing karakteristik ini unik. Mereka tidak dapat saling menggantikan dan hanya bersama-sama mereka mewakili ciri-ciri rangkaian variasi secara lengkap dan dalam bentuk yang ringkas.

Mode (bulan) sebutkan nilai opsi yang paling sering muncul.

median (Aku) – ini adalah nilai opsi yang membagi rangkaian variasi peringkat menjadi dua (di setiap sisi median terdapat setengah opsi). Dalam kasus yang jarang terjadi, jika terdapat deret variasi simetris, modus dan mediannya sama satu sama lain dan bertepatan dengan nilai mean aritmatika.

Ciri paling khas dari nilai opsi adalah rata-rata aritmatika nilai( M ). Dalam literatur matematika itu dilambangkan .

Rata-rata aritmatika (M, ) adalah ciri kuantitatif umum dari ciri tertentu dari fenomena yang diteliti, yang merupakan populasi statistik yang homogen secara kualitatif. Ada rata-rata aritmatika sederhana dan tertimbang. Rata-rata aritmatika sederhana dihitung untuk rangkaian variasi sederhana dengan menjumlahkan semua opsi dan membagi jumlah ini dengan jumlah total opsi yang termasuk dalam rangkaian variasi ini. Perhitungan dilakukan sesuai dengan rumus:

,

Di mana: M - rata-rata aritmatika sederhana;

Σ V - pilihan jumlah;

N- jumlah observasi.

Dalam deret variasi berkelompok, mean aritmatika tertimbang ditentukan. Rumus untuk menghitungnya:

,

Di mana: M - rata-rata tertimbang aritmatika;

Σ Wakil - jumlah produk varian berdasarkan frekuensinya;

N- jumlah observasi.

Dengan jumlah observasi yang banyak, maka dalam hal perhitungan manual dapat digunakan metode momen.

Rata-rata aritmatika memiliki sifat-sifat berikut:

· jumlah penyimpangan dari rata-rata ( Σ D ) sama dengan nol (lihat Tabel 15);

· ketika mengalikan (membagi) semua pilihan dengan faktor (pembagi) yang sama, mean aritmatika dikalikan (dibagi) dengan faktor (pembagi) yang sama;

· jika Anda menambahkan (mengurangi) angka yang sama ke semua opsi, rata-rata aritmatika bertambah (berkurang) dengan angka yang sama.

Rata-rata aritmatika, yang diambil sendiri, tanpa memperhitungkan variabilitas deret yang digunakan untuk menghitungnya, mungkin tidak sepenuhnya mencerminkan sifat deret variasi, terutama bila diperlukan perbandingan dengan rata-rata lainnya. Rata-rata yang nilainya mendekati dapat diperoleh dari deret dengan derajat hamburan yang bervariasi. Semakin dekat pilihan individu satu sama lain dalam hal karakteristik kuantitatifnya, semakin sedikit dispersi (osilasi, variabilitas) seri, semakin khas rata-ratanya.

Parameter utama yang memungkinkan kita menilai variabilitas suatu sifat adalah:

· Ruang Lingkup;

· Amplitudo;

· Standar deviasi;

· Koefisien variasi.

Variabilitas suatu sifat dapat diperkirakan berdasarkan jangkauan dan amplitudo rangkaian variasi. Rentang menunjukkan opsi maksimum (V max) dan minimum (V min) dalam rangkaian. Amplitudo (A m) adalah selisih antara pilihan berikut: A m = V max - V min.

Ukuran utama variabilitas suatu deret variasi yang diterima secara umum adalah penyebaran (D ). Tetapi yang paling sering digunakan adalah parameter yang lebih mudah dihitung berdasarkan dispersi - standar deviasi ( σ ). Ini memperhitungkan besarnya deviasi ( D ) setiap deret variasi dari mean aritmatikanya ( d=V - M ).

Karena penyimpangan dari rata-rata dapat bernilai positif dan negatif, maka jika dijumlahkan akan menghasilkan nilai “0” (S d=0). Untuk menghindari hal ini, nilai deviasi ( D) dipangkatkan kedua dan dirata-ratakan. Jadi, dispersi suatu deret variasi adalah kuadrat rata-rata deviasi suatu varian dari mean aritmatika dan dihitung dengan rumus:

.

Ini adalah karakteristik variabilitas yang paling penting dan digunakan untuk menghitung banyak kriteria statistik.

Karena dispersi dinyatakan sebagai kuadrat deviasi, nilainya tidak dapat digunakan untuk membandingkan dengan mean aritmatika. Untuk tujuan ini digunakan deviasi standar, yang ditandai dengan tanda “Sigma” ( σ ). Ini mencirikan simpangan rata-rata semua varian deret variasi dari nilai rata-rata aritmatika dalam satuan yang sama dengan nilai rata-rata itu sendiri, sehingga dapat digunakan bersama-sama.

Simpangan baku ditentukan dengan rumus:

Rumus yang ditentukan diterapkan ketika jumlah observasi ( N ) lebih dari 30. Dengan angka yang lebih kecil N nilai deviasi standar akan memiliki kesalahan yang terkait dengan offset matematis ( N - 1). Dalam hal ini, hasil yang lebih akurat dapat diperoleh dengan memperhitungkan bias dalam rumus menghitung simpangan baku:

deviasi standar (S ) adalah perkiraan simpangan baku suatu variabel acak X relatif terhadap ekspektasi matematisnya berdasarkan estimasi variansnya yang tidak bias.

Dengan nilai-nilai N > 30 standar deviasi ( σ ) dan simpangan baku ( S ) akan tetap sama ( σ =s ). Oleh karena itu, dalam sebagian besar manual praktis, kriteria ini dianggap memiliki arti yang berbeda. Dalam sebuah program perhitungan excel simpangan baku dapat dilakukan dengan menggunakan fungsi =STDEV(range). Dan untuk menghitung simpangan baku, Anda perlu membuat rumus yang sesuai.

Rata-rata kuadrat atau deviasi standar memungkinkan Anda menentukan seberapa besar perbedaan nilai suatu karakteristik dari nilai rata-rata. Misalkan ada dua kota dengan suhu rata-rata harian yang sama di musim panas. Salah satu kota ini terletak di pesisir pantai, dan kota lainnya terletak di benua. Diketahui bahwa di kota-kota yang terletak di pesisir pantai, perbedaan suhu siang hari lebih kecil dibandingkan di kota-kota yang terletak di pedalaman. Oleh karena itu, standar deviasi suhu siang hari untuk kota pesisir akan lebih kecil dibandingkan kota kedua. Dalam prakteknya, ini berarti suhu udara rata-rata masing-masing hari tertentu di kota yang terletak di benua akan lebih berbeda dari rata-rata dibandingkan di kota di pesisir pantai. Selain itu, deviasi standar memungkinkan Anda memperkirakan kemungkinan penyimpangan suhu dari rata-rata dengan tingkat probabilitas yang diperlukan.

Menurut teori probabilitas, dalam fenomena yang mematuhi hukum distribusi normal, terdapat hubungan yang erat antara nilai mean aritmatika, deviasi standar, dan opsi ( aturan tiga sigma). Misalnya, 68,3% nilai karakteristik yang bervariasi berada dalam M ± 1 σ , 95,5% - dalam M ± 2 σ dan 99,7% - dalam M ± 3 σ .

Nilai deviasi standar memungkinkan kita untuk menilai sifat homogenitas rangkaian variasi dan kelompok belajar. Jika nilai simpangan bakunya kecil, maka hal ini menunjukkan homogenitas yang cukup tinggi dari fenomena yang diteliti. Rata-rata aritmatika dalam hal ini harus dianggap cukup khas untuk deret variasi tertentu. Namun, nilai sigma yang terlalu kecil membuat orang berpikir tentang seleksi observasi buatan. Dengan sigma yang sangat besar, mean aritmatika mencirikan rangkaian variasi pada tingkat yang lebih rendah, yang menunjukkan variabilitas yang signifikan dari karakteristik atau fenomena yang diteliti atau heterogenitas kelompok yang diteliti. Namun perbandingan nilai simpangan baku hanya dimungkinkan untuk fitur-fitur yang berdimensi sama. Memang jika kita membandingkan keragaman bobot anak baru lahir dan orang dewasa, kita akan selalu mendapatkan nilai sigma yang lebih tinggi pada orang dewasa.

Perbandingan variabilitas fitur dimensi yang berbeda dapat dilakukan dengan menggunakan koefisien variasi. Ini menyatakan keragaman sebagai persentase dari rata-rata, memungkinkan perbandingan berbagai tanda. Koefisien variasi dalam literatur kedokteran ditunjukkan dengan tanda “ DENGAN ", dan dalam matematika" ay"dan dihitung dengan rumus:

.

Nilai koefisien variasi kurang dari 10% menunjukkan hamburan kecil, dari 10 hingga 20% - tentang rata-rata, lebih dari 20% - tentang hamburan kuat di sekitar rata-rata aritmatika.

Rata-rata aritmatika biasanya dihitung berdasarkan data populasi sampel. Selama penelitian berulang-ulang, di bawah pengaruh fenomena acak, mean aritmatika dapat berubah. Hal ini disebabkan karena pada umumnya hanya sebagian dari kemungkinan unit observasi yang dipelajari, yaitu populasi sampel. Informasi tentang semua unit yang mungkin mewakili fenomena yang diteliti dapat diperoleh dengan mempelajari seluruh populasi, yang tidak selalu memungkinkan. Pada saat yang sama, untuk tujuan menggeneralisasi data eksperimen, nilai rata-rata populasi umum menjadi perhatian. Oleh karena itu, untuk merumuskan kesimpulan umum tentang fenomena yang diteliti, hasil yang diperoleh berdasarkan populasi sampel harus ditransfer ke populasi umum dengan menggunakan metode statistik.

Untuk menentukan tingkat kesesuaian antara suatu penelitian sampel dan populasi umum, perlu diperkirakan besarnya kesalahan yang pasti timbul selama observasi sampel. Kesalahan ini disebut " Kesalahan keterwakilan"atau" Kesalahan rata-rata dari mean aritmatika. Ini sebenarnya adalah perbedaan antara rata-rata yang diperoleh dari sampel pengamatan statistik, dan nilai-nilai serupa yang akan diperoleh selama studi berkelanjutan terhadap objek yang sama, yaitu. ketika mempelajari populasi umum. Karena rata-rata sampel adalah variabel acak, perkiraan tersebut dilakukan dengan tingkat probabilitas yang dapat diterima oleh peneliti. DI DALAM penelitian medis setidaknya 95%.

Kesalahan keterwakilan tidak bisa disamakan dengan kesalahan registrasi atau kesalahan perhatian (tergelincir, salah perhitungan, kesalahan ketik, dll.), yang harus diminimalkan dengan metode dan alat yang memadai yang digunakan selama percobaan.

Besarnya kesalahan keterwakilan bergantung pada ukuran sampel dan variabilitas sifat. Bagaimana jumlah yang lebih besar pengamatan, semakin dekat sampel dengan populasi dan semakin kecil kesalahannya. Semakin banyak variabel tandanya, semakin besar kesalahan statistiknya.

Dalam prakteknya, untuk menentukan kesalahan keterwakilan pada deret variasi digunakan rumus sebagai berikut:

,

Di mana: M – kesalahan keterwakilan;

σ – deviasi standar;

N– jumlah observasi dalam sampel.

Dari rumusnya jelas ukurannya kesalahan rata-rata berbanding lurus dengan simpangan baku, yaitu variabilitas karakteristik yang dipelajari, dan berbanding terbalik dengan akar kuadrat jumlah observasi.

Saat melakukan analisis statistik berdasarkan penghitungan nilai relatif, tidak diperlukan pembuatan rangkaian variasi. Dalam hal ini, penentuan kesalahan rata-rata untuk indikator relatif dapat dilakukan dengan menggunakan rumus yang disederhanakan:

,

Di mana: R– nilai indikator relatif, dinyatakan dalam persentase, ppm, dll.;

Q– kebalikan dari P dan dinyatakan sebagai (1-P), (100-P), (1000-P), dan seterusnya, bergantung pada dasar penghitungan indikator;

N– jumlah observasi dalam populasi sampel.

Namun, rumus yang ditentukan untuk menghitung kesalahan keterwakilan untuk nilai relatif hanya dapat diterapkan jika nilai indikator lebih kecil dari nilai dasarnya. Dalam beberapa kasus penghitungan indikator intensif, kondisi ini tidak terpenuhi, dan indikator tersebut dapat dinyatakan sebagai angka yang lebih dari 100% atau 1000%. Dalam situasi seperti itu, deret variasi dibuat dan kesalahan keterwakilan dihitung menggunakan rumus nilai rata-rata berdasarkan simpangan baku.

Peramalan nilai mean aritmatika dalam suatu populasi dilakukan dengan menunjukkan dua nilai – minimum dan maksimum. Nilai-nilai ekstrim ini kemungkinan penyimpangan, di mana nilai rata-rata populasi yang diinginkan dapat berfluktuasi disebut “ Batasan kepercayaan».

Postulat teori probabilitas telah membuktikan bahwa dengan distribusi suatu karakteristik yang normal dengan probabilitas 99,7%, nilai ekstrim penyimpangan rata-rata tidak akan lebih besar dari nilai tiga kali lipat kesalahan keterwakilan ( M ± 3 M ); dalam 95,5% – tidak lebih dari dua kali kesalahan rata-rata dari nilai rata-rata ( M ± 2 M ); di 68,3% – tidak lebih dari satu kesalahan rata-rata ( M ± 1 M ) (Gbr. 9).

P%

Beras. 9. Kepadatan probabilitas distribusi normal.

Perhatikan bahwa pernyataan di atas hanya berlaku untuk fitur yang mematuhi hukum distribusi Gaussian normal.

Mayoritas penelitian eksperimental, termasuk dalam bidang kedokteran, dikaitkan dengan pengukuran, yang hasilnya dapat mengambil hampir semua nilai dalam interval tertentu, oleh karena itu, biasanya digambarkan dengan model variabel acak kontinu. Dalam hal ini, sebagian besar metode statistik mempertimbangkan distribusi kontinu. Salah satu distribusi tersebut, yang memiliki peran mendasar dalam statistik matematika, adalah distribusi normal, atau Gaussian.

Hal ini disebabkan oleh beberapa alasan.

1. Pertama-tama, banyak pengamatan eksperimental yang berhasil dijelaskan dengan menggunakan distribusi normal. Perlu segera dicatat bahwa tidak ada distribusi data empiris yang benar-benar normal, karena terdistribusi normal nilai acak berada dalam kisaran dari hingga , yang tidak pernah terjadi dalam praktiknya. Namun, distribusi normal sering kali berfungsi dengan baik sebagai perkiraan.

Apakah pengukuran berat badan, tinggi badan, dan parameter fisiologis tubuh manusia lainnya dilakukan - di mana pun hasilnya dipengaruhi oleh sejumlah besar faktor acak ( penyebab alami dan kesalahan pengukuran). Selain itu, sebagai aturan, pengaruh masing-masing faktor ini tidak signifikan. Pengalaman menunjukkan bahwa hasil dalam kasus seperti ini akan berdistribusi normal.

2. Banyak distribusi yang terkait dengan pengambilan sampel acak menjadi normal seiring dengan meningkatnya volume pengambilan sampel acak.

3. Distribusi normal sangat cocok sebagai perkiraan distribusi kontinu lainnya (misalnya miring).

4. Distribusi normal mempunyai sejumlah menguntungkan sifat matematika, yang sebagian besar menyediakannya aplikasi yang luas dalam statistik.

Pada saat yang sama, perlu dicatat bahwa dalam data medis terdapat banyak distribusi eksperimental yang tidak dapat dijelaskan oleh model distribusi normal. Untuk keperluan tersebut, statistika telah mengembangkan metode yang biasa disebut “Nonparametrik”.

Pemilihan metode statistik yang cocok untuk mengolah data percobaan tertentu harus dilakukan tergantung pada apakah data yang diperoleh termasuk dalam hukum distribusi normal. Pengujian hipotesis subordinasi suatu tanda terhadap hukum distribusi normal dilakukan dengan menggunakan histogram distribusi frekuensi (grafik), serta sejumlah kriteria statistik. Diantara mereka:

Kriteria asimetri ( B );

Kriteria tes kurtosis ( G );

Uji Shapiro–Wilks ( W ) .

Analisis sifat sebaran data (disebut juga uji normalitas sebaran) dilakukan untuk setiap parameter. Untuk menilai dengan yakin apakah distribusi suatu parameter sesuai dengan hukum normal, diperlukan unit observasi dalam jumlah yang cukup besar (setidaknya 30 nilai).

Untuk berdistribusi normal, kriteria skewness dan kurtosis mengambil nilai 0. Jika distribusi digeser ke kanan B > 0 (asimetri positif), dengan B < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона G =0. Pada G > 0 kurva distribusi lebih tajam jika G < 0 пик более сглаженный, чем функция нормального распределения.

Untuk memeriksa normalitas menggunakan uji Shapiro – Wilks, Anda perlu mencari nilai kriteria ini menggunakan tabel statistik di tingkat yang diperlukan signifikansinya dan bergantung pada jumlah satuan pengamatan (derajat kebebasan). Lampiran 1. Hipotesis normalitas ditolak pada nilai kecil dari kriteria ini, sebagai aturan, di w <0,8.

Metode pengelompokan juga memungkinkan Anda melakukan pengukuran variasi(variabilitas, fluktuasi) tanda. Ketika jumlah unit dalam suatu populasi relatif kecil, variasi diukur berdasarkan peringkat jumlah unit yang membentuk populasi. Serial ini disebut peringkat, jika satuan-satuan tersebut disusun menurut urutan sifat menaik (menurun).

Namun, rangkaian peringkat cukup indikatif ketika diperlukan karakteristik komparatif dari variasi. Selain itu, dalam banyak kasus kita harus berhadapan dengan populasi statistik yang terdiri dari sejumlah besar unit, yang secara praktis sulit untuk direpresentasikan dalam bentuk rangkaian tertentu. Sehubungan dengan itu, untuk pengenalan umum awal terhadap data statistik dan khususnya untuk memudahkan kajian variasi karakteristik, fenomena dan proses yang diteliti biasanya digabungkan ke dalam kelompok-kelompok, dan hasil pengelompokannya disajikan dalam bentuk tabel kelompok.

Jika tabel grup hanya memiliki dua kolom - grup berdasarkan karakteristik yang dipilih (opsi) dan jumlah grup (frekuensi atau frekuensi), itu disebut dekat distribusi.

Rentang distribusi - jenis pengelompokan struktural yang paling sederhana berdasarkan satu karakteristik, ditampilkan dalam tabel grup dengan dua kolom yang berisi varian dan frekuensi karakteristik. Dalam banyak kasus, dengan pengelompokan struktural seperti itu, mis. Dengan disusunnya rangkaian distribusi, pembelajaran materi statistik awal dimulai.

Pengelompokan struktural yang berupa rangkaian distribusi dapat diubah menjadi pengelompokan struktural asli jika kelompok yang dipilih tidak hanya dicirikan oleh frekuensi, tetapi juga oleh indikator statistik lainnya. Tujuan utama deret distribusi adalah untuk mempelajari variasi karakteristik. Teori deret distribusi dikembangkan secara rinci oleh statistik matematika.

Seri distribusi dibagi menjadi atributif(pengelompokan menurut ciri-ciri atributif, misalnya membagi penduduk berdasarkan jenis kelamin, kebangsaan, status perkawinan, dll) dan variasional(pengelompokan berdasarkan karakteristik kuantitatif).

Seri variasi adalah tabel kelompok yang berisi dua kolom: pengelompokan unit menurut satu karakteristik kuantitatif dan jumlah unit dalam setiap kelompok. Interval pada deret variasi biasanya dibentuk sama dan tertutup. Rangkaian variasinya adalah pengelompokan penduduk Rusia berdasarkan pendapatan moneter rata-rata per kapita (Tabel 3.10).

Tabel 3.10

Distribusi penduduk Rusia menurut pendapatan per kapita rata-rata tahun 2004-2009.

Kelompok penduduk menurut pendapatan tunai rata-rata per kapita, gosok/bulan

Populasi dalam kelompok, % dari total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Lebih dari 25.000,0

Seluruh populasi

Deret variasi, pada gilirannya, dibagi menjadi diskrit dan interval. Diskrit seri variasi menggabungkan varian karakteristik diskrit yang bervariasi dalam batas sempit. Contoh rangkaian variasi diskrit adalah distribusi keluarga Rusia berdasarkan jumlah anak yang mereka miliki.

Selang seri variasi menggabungkan varian karakteristik kontinu atau karakteristik diskrit yang bervariasi dalam rentang yang luas. Interval adalah rangkaian variasi distribusi penduduk Rusia menurut pendapatan moneter per kapita rata-rata.

Deret variasi diskrit tidak terlalu sering digunakan dalam praktik. Sedangkan penyusunannya tidaklah sulit, karena komposisi kelompok ditentukan oleh varian-varian tertentu yang sebenarnya dimiliki oleh ciri-ciri pengelompokan yang diteliti.

Rangkaian variasi interval lebih luas. Saat menyusunnya, muncul pertanyaan sulit mengenai jumlah kelompok, serta ukuran interval yang harus ditetapkan.

Prinsip-prinsip untuk mengatasi masalah ini diuraikan dalam bab tentang metodologi pembuatan pengelompokan statistik (lihat paragraf 3.3).

Rangkaian variasi adalah sarana untuk meruntuhkan atau mengompresi berbagai informasi menjadi bentuk yang kompak; dari rangkaian tersebut seseorang dapat membuat penilaian yang cukup jelas tentang sifat variasi, dan mempelajari perbedaan karakteristik fenomena yang termasuk dalam himpunan yang diteliti. Tetapi arti terpenting dari rangkaian variasi adalah bahwa atas dasar rangkaian tersebut, karakteristik generalisasi khusus dari variasi dihitung (lihat Bab 7).



Baru di situs

>

Paling populer