Rumah gusi Seri distribusi. Ringkasan dan pengelompokan statistik

Seri distribusi. Ringkasan dan pengelompokan statistik

Bagian terpenting dari analisis statistik adalah konstruksi deret distribusi (pengelompokan struktural) untuk menonjolkan sifat dan pola karakteristik populasi yang diteliti. Bergantung pada fitur mana (kuantitatif atau kualitatif) yang dijadikan dasar pengelompokan data, jenis rangkaian distribusi dibedakan.

Jika suatu ciri kualitatif dijadikan dasar pengelompokannya, maka disebut deret distribusi seperti itu atributif(distribusi menurut jenis pekerjaan, gender, profesi, agama, kebangsaan, dll).

Jika suatu deret distribusi dibangun atas dasar kuantitatif, maka deret tersebut disebut variasional. Membangun deret variasi berarti mengatur sebaran kuantitatif satuan populasi berdasarkan nilai karakteristik, kemudian menghitung jumlah satuan populasi dengan nilai tersebut (membuat tabel kelompok).

Ada tiga bentuk deret variasi: deret berperingkat, deret diskrit, dan deret interval.

Seri berperingkat- ini adalah distribusi unit individu populasi dalam urutan menaik atau menurun dari karakteristik yang dipelajari. Pemeringkatan memungkinkan Anda dengan mudah membagi data kuantitatif ke dalam kelompok, segera mendeteksi yang terkecil dan nilai tertinggi karakteristiknya, soroti nilai-nilai yang paling sering diulang.

Bentuk rangkaian variasi lainnya adalah tabel kelompok yang disusun menurut sifat variasi nilai sifat yang dipelajari. Menurut sifat variasinya, sifat-sifat diskrit (terputus-putus) dan kontinu dibedakan.

Seri diskrit- ini adalah rangkaian variasi, yang konstruksinya didasarkan pada karakteristik dengan perubahan terputus-putus (karakteristik diskrit). Yang terakhir ini meliputi kategori tarif, jumlah anak dalam keluarga, jumlah karyawan di perusahaan, dll. Karakteristik ini hanya dapat mengambil sejumlah nilai spesifik yang terbatas.

Seri variasi diskrit mewakili tabel yang terdiri dari dua kolom. Kolom pertama menunjukkan nilai spesifik atribut, dan kolom kedua menunjukkan jumlah unit dalam populasi dengan nilai atribut tertentu.

Jika suatu karakteristik mengalami perubahan terus-menerus (jumlah pendapatan, masa kerja, biaya aset tetap perusahaan, dll., yang dalam batas-batas tertentu dapat bernilai berapa pun), maka untuk karakteristik tersebut perlu dibangun seri variasi interval.

Tabel grup di sini juga memiliki dua kolom. Yang pertama menunjukkan nilai atribut dalam interval “dari - ke” (pilihan), yang kedua menunjukkan jumlah unit yang termasuk dalam interval (frekuensi).

Frekuensi (frekuensi pengulangan) - jumlah pengulangan varian nilai atribut tertentu, dilambangkan dengan fi, dan jumlah frekuensi yang sama dengan volume populasi yang diteliti dilambangkan

di mana k adalah jumlah opsi untuk nilai atribut

Seringkali tabel dilengkapi dengan kolom di mana akumulasi frekuensi S dihitung, yang menunjukkan berapa banyak unit dalam populasi yang memiliki nilai karakteristik tidak lebih besar dari nilai ini.

Frekuensi deret f dapat diganti dengan frekuensi w yang dinyatakan dalam bilangan relatif (pecahan atau persentase). Mereka mewakili rasio frekuensi setiap interval terhadapnya jumlah total, yaitu:

Saat membuat deret variasi dengan nilai interval, pertama-tama perlu ditetapkan nilai interval i, yang didefinisikan sebagai rasio rentang variasi R dengan jumlah kelompok m:

dimana R = xmaks - xmin; m = 1 + 3,322 logn (rumus Sturgess); n adalah jumlah total unit dalam populasi.

Untuk menentukan struktur suatu populasi digunakan indikator rata-rata khusus yang meliputi median dan modus, atau biasa disebut rata-rata struktural. Jika mean aritmatika dihitung berdasarkan penggunaan seluruh varian nilai atribut, maka median dan modus mencirikan nilai varian yang menempati posisi rata-rata tertentu dalam pemeringkatan. seri variasi.

Median (Saya)- ini adalah nilai yang sesuai dengan opsi yang terletak di tengah rangkaian peringkat.

Untuk rangkaian peringkat dengan jumlah nilai individu ganjil (misalnya 1, 2, 3, 3, 6, 7, 9, 9, 10), mediannya adalah nilai yang terletak di tengah-tengah rangkaian tersebut. seri, yaitu magnitudo kelima.

Untuk rangkaian peringkat dengan jumlah nilai individu genap (misalnya, 1, 5, 7, 10, 11, 14), mediannya adalah nilai rata-rata aritmatika, yang dihitung dari dua nilai yang berdekatan.

Artinya, untuk mencari median, Anda harus menentukannya terlebih dahulu nomor seri(posisinya di rangking seri) sesuai rumus

di mana n adalah jumlah unit agregat.

Nilai numerik median ditentukan dari akumulasi frekuensi dalam rangkaian variasi diskrit. Untuk melakukan ini, Anda harus terlebih dahulu menunjukkan interval di mana median ditemukan dalam deret interval distribusi. Median adalah interval pertama dimana jumlah akumulasi frekuensi melebihi setengah observasi dari jumlah seluruh observasi.

Nilai numerik median

dimana xMe adalah batas bawah interval median; saya - nilai interval; S-1 adalah frekuensi akumulasi dari interval yang mendahului median; f adalah frekuensi interval median.

Mode (Bulan) Mereka menyebut nilai suatu karakteristik yang paling sering muncul dalam satuan populasi. Untuk rangkaian diskrit, mode akan menjadi pilihan dengan frekuensi tertinggi. Untuk menentukan mode seri interval Pertama, interval modal (interval yang memiliki frekuensi tertinggi) ditentukan. Kemudian, dalam interval tersebut ditemukan nilai fitur yang dapat menjadi mode.

Untuk mencari nilai mode tertentu, Anda perlu menggunakan rumus

dimana xMo adalah batas bawah interval modal; iMo adalah nilai interval modal; fMo - frekuensi interval modal; fMo-1 - frekuensi interval sebelum modal; fMo+1 - frekuensi interval setelah modal.

Fashion tersebar luas dalam kegiatan pemasaran ketika mempelajari permintaan konsumen, terutama ketika menentukan ukuran pakaian dan sepatu yang paling populer, dan ketika mengatur kebijakan harga.

Tujuan utama menganalisis rangkaian variasi adalah untuk mengidentifikasi pola distribusi, sekaligus mengecualikan pengaruh faktor acak pada distribusi tertentu. Hal ini dapat dicapai dengan meningkatkan volume populasi yang diteliti dan sekaligus mengurangi interval deretnya. Ketika kita mencoba menggambarkan data ini secara grafis, kita akan mendapatkan garis lengkung halus, yang akan menjadi batas tertentu untuk poligon frekuensi. Garis ini disebut kurva distribusi.

Dengan kata lain, kurva distribusi terdapat representasi grafis berupa garis kontinu perubahan frekuensi dalam suatu deret variasi, yang secara fungsional berkaitan dengan perubahan pilihan. Kurva distribusi mencerminkan pola perubahan frekuensi tanpa adanya faktor acak. Representasi grafis memfasilitasi analisis rangkaian distribusi.

Banyak sekali bentuk kurva distribusi yang diketahui yang dapat digunakan untuk menyelaraskan deret variasi, namun dalam praktek penelitian statistik, bentuk yang paling umum digunakan adalah distribusi normal dan distribusi Poisson.

Distribusi normal bergantung pada dua parameter: mean aritmatika dan deviasi standar. Kurvanya dinyatakan dengan persamaan

dimana y adalah ordinat kurva distribusi normal; - deviasi standar; e dan π adalah konstanta matematika; x - varian dari seri variasi; - nilai rata-ratanya; - standar deviasi.

Jika Anda perlu mendapatkan frekuensi teoretis f" saat menyelaraskan deret variasi sepanjang kurva distribusi normal, Anda dapat menggunakan rumus

dimana adalah jumlah seluruh frekuensi empiris deret variasi; h - ukuran interval dalam kelompok; - standar deviasi; - deviasi opsi yang dinormalisasi dari mean aritmatika; semua besaran lainnya mudah dihitung menggunakan tabel khusus.

Dengan menggunakan rumus ini kita peroleh distribusi teoretis (probabilitas)., menggantikannya distribusi empiris (aktual)., karakter mereka tidak boleh berbeda satu sama lain.

Namun, dalam beberapa kasus, jika deret variasi merupakan distribusi menurut karakteristik diskrit, sedangkan dengan meningkatnya nilai karakteristik x, frekuensi mulai menurun tajam, dan mean aritmatika, pada gilirannya, adalah sama ke atau mendekati nilai dispersi (), deret tersebut disejajarkan dengan kurva Poisson.

Kurva Poisson dapat dinyatakan dengan relasi

dimana Px adalah peluang terjadinya nilai individu x; - rata-rata aritmatika dari deret tersebut.

Saat menyamakan data empiris, frekuensi teoritis dapat ditentukan dengan rumus

di mana f" adalah frekuensi teoretis; N adalah jumlah unit rangkaian.

Membandingkan nilai yang diperoleh dari frekuensi teoritis f" dengan frekuensi empiris (aktual) f, kami yakin bahwa perbedaannya bisa sangat kecil.

Karakteristik obyektif dari korespondensi antara frekuensi teoritis dan empiris dapat diperoleh dengan menggunakan indikator statistik khusus, yang disebut kriteria kesepakatan.

Untuk menilai kedekatan frekuensi empiris dan teoretis, digunakan uji kesesuaian Pearson, uji kesesuaian Romanovsky, dan uji kesesuaian Kolmogorov.

Yang paling umum adalah Tes kecocokan K. Pearson, yang dapat direpresentasikan sebagai jumlah rasio selisih kuadrat antara f" dan f terhadap frekuensi teoretis:

Nilai kriteria yang dihitung harus dibandingkan dengan nilai tabulasi (kritis). Nilai tabel ditentukan dengan tabel khusus, tergantung pada probabilitas yang diterima P dan banyaknya derajat kebebasan k (dalam hal ini k = m - 3, dimana m adalah banyaknya kelompok pada deret distribusi untuk distribusi normal). Saat menghitung uji kesesuaian Pearson, hal-hal berikut harus diperhatikan: kondisi berikutnya: jumlah observasi harus cukup besar (n 50), dan jika dalam beberapa interval frekuensi teoritis< 5, то интервалы объединяют для условия > 5.

Jika , maka perbedaan antara distribusi frekuensi empiris dan teoritis mungkin bersifat acak dan asumsi bahwa distribusi empiris mendekati normal tidak dapat ditolak.

Jika tidak ada tabel untuk menilai keacakan perbedaan antara frekuensi teoritis dan empiris, Anda dapat menggunakan kriteria kesepakatan V.I. Romanovsky KR, yang dengan menggunakan nilai tersebut, mengusulkan untuk mengevaluasi kedekatan distribusi empiris dari kurva distribusi normal dengan menggunakan rasio

dimana m adalah jumlah kelompok; k = (m - 3) - jumlah derajat kebebasan saat menghitung frekuensi distribusi normal.

Jika hubungan di atas< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, maka perbedaannya bisa sangat signifikan dan hipotesis tentang distribusi normal harus ditolak.

Kriteria kesepakatan A.N. Kolmogorov digunakan dalam menentukan selisih maksimum antara frekuensi distribusi empiris dan teoritis, dihitung dengan rumus

dimana D adalah nilai maksimum selisih antara akumulasi frekuensi empiris dan teoritis; - jumlah frekuensi empiris.

Dengan menggunakan tabel nilai probabilitas, kriteria dapat digunakan untuk mencari nilai yang sesuai dengan probabilitas P. Jika nilai probabilitas P signifikan terhadap nilai yang ditemukan, maka kita dapat mengasumsikan bahwa perbedaan antara distribusi teoritis dan empiris adalah tidak signifikan.

Kondisi yang diperlukan saat menggunakan uji kesesuaian Kolmogorov adalah jumlah observasi yang cukup besar (setidaknya seratus).

produksi kentang diberi peringkat statistik

Berdasarkan indikator pada Tabel 2, kami menyusun baris peringkat produksi kentang per 100 hektar lahan subur; berdasarkan hasil kentang; dengan biaya. Kami menggambarkan hubungan antara indikator-indikator ini secara grafis.

Tahap pertama studi statistik variasi adalah konstruksi rangkaian variasi - distribusi unit populasi yang terurut menurut peningkatan (lebih sering) atau penurunan (lebih jarang) nilai suatu karakteristik.

Ada tiga bentuk deret variasi: deret berperingkat, deret diskrit, deret interval. Deret variasi sering disebut deret distribusi.

Seri peringkat adalah daftar unit individu suatu populasi dalam urutan menaik (menurun) dari karakteristik yang dipelajari

Pemeringkatan merupakan suatu tata cara penyusunan objek kajian yang dilakukan berdasarkan kesukaan. Rentang variasi menunjukkan seberapa besar perbedaan antar unit dalam populasi.

Peringkat adalah nomor urut nilai-nilai atribut, yang disusun dalam urutan nilainya menaik atau menurun. Jika nilai suatu sifat mempunyai penilaian kuantitatif yang sama, maka pangkat semua nilai tersebut dianggap sama dengan rata-rata aritmatika dari jumlah tempat yang ditentukan. Peringkat ini disebut terhubung.

Grafik dalam statistik adalah suatu cara untuk menampilkan indikator statistik secara visual dalam bentuk bentuk geometris dan tanda, gambar atau peta skema. Gambar visual memfasilitasi persepsi informasi, memungkinkan Anda menangkap serangkaian indikator yang saling berhubungan, mengidentifikasi tren perkembangan dan rasio khas indikator.

Untuk menampilkan indikator dinamika, disarankan menggunakan grafik garis atau diagram batang. Jadwal harus visual, mudah dimengerti, mudah dibaca dan, jika mungkin, dirancang secara artistik, yang akan menarik perhatian.

Saat membuat diagram sebar, sekumpulan titik digunakan sebagai sampel grafik; saat membuat garis linier - garis. Charting selalu merupakan proses kreatif. Beberapa pencarian diperlukan di sini. Baru setelah menyusun dan membandingkan beberapa versi draf Anda dapat menentukan komposisi grafik yang benar, mengatur skala dan letak tanda pada bidang grafik.

Dari rangkaian pemeringkatan produksi kentang per 100 hektar lahan garapan, kita dapat menarik kesimpulan sebagai berikut bahwa produksi terendah terdapat di distrik Balagansky, dan distrik Angarsky memiliki produktivitas kentang tertinggi per 100 hektar lahan garapan.

Hasil terendah terjadi di distrik Kachugsky - 10 c/ha, dan tertinggi di Usolsky - 195,5 c/ha.

Di wilayah Chunsky, dengan produksi kentang yang tinggi per 100 hektar lahan subur, biaya terendah sebesar 1 c adalah setara. Biaya maksimum diamati di wilayah Nizhne-Ilimsky. Kisaran variasi harga biaya seratus berat kentang sangat besar dan setara dengan 1.161,01 rubel.

Publikasi lainnya

Analisis kegiatan ekonomi perusahaan
Transisi ke ekonomi pasar mengharuskan perusahaan untuk meningkatkan efisiensi produksi, daya saing produk dan jasa berdasarkan penjualan bentuk yang efektif manajemen dan manajemen produksi, pencapaian kemajuan ilmu pengetahuan dan teknologi, pengaktifan...

Analisis kegiatan keuangan dan ekonomi JSC TransContainer
Analisis keuangan adalah proses yang didasarkan pada studi data kondisi keuangan perusahaan dan kinerja masa lalunya untuk menilai kondisi dan kinerja masa depan. Dengan demikian, tugas utama analisis keuangan adalah...

Mengirimkan karya bagus Anda ke basis pengetahuan itu sederhana. Gunakan formulir di bawah ini

Kerja bagus ke situs">

Pelajar, mahasiswa pascasarjana, ilmuwan muda yang menggunakan basis pengetahuan dalam studi dan pekerjaan mereka akan sangat berterima kasih kepada Anda.

Diposting pada http:// www. terbaik. ru/

Tugas No.1

Berdasarkan data pengamatan statistik diberikan dalam tabel, buatlah rangking, interval dan rangkaian kumulatif distribusi usaha pertanian menurut karakteristik faktornya, dan gambarkan secara grafis.

Melakukan ringkasan data. Dengan menggunakan metode pengelompokan, tentukan ketergantungan karakteristik efektif usaha pertanian pada faktor satu. Buatlah tabel dan grafik ketergantungan. Kesimpulan.

mengelompokkan faktor distribusi deret

Kualitas tanah, poin (x)

(kamu)

Larutan:

Konstruksiperingkatbaris distribusi melibatkan penataan semua varian rangkaian dalam urutan peningkatan karakteristik yang dipelajari (kualitas tanah). Penyortiran dilakukan pada program TP Excel dengan menggunakan fungsi “Sorting”.

Kualitas tanah

Produktivitas sayuran lapangan terbuka

Representasi grafis dari seri distribusi peringkat

Garis pada Gambar 1 disebut ogive Galton. Ogive ini cenderung tumbuh mulus dengan lompatan-lompatan kecil di beberapa titik. Untuk mengubah rangkaian peringkat menjadi rangkaian interval, lebih baik memecahnya menjadi beberapa grup secara manual.

Konstruksiselangbaris Pembagian usaha menurut karakteristik yang diteliti meliputi penentuan jumlah kelompok (interval).

Untuk menghitung jumlah kelompok kita menggunakan rumus:

n=2, dimana N adalah jumlah unit populasi yang diteliti.

n=2 Ig30 = 2,95424251?3.

Nilai interval yang sama dihitung dengan rumus:

saya = = = 16,33333

Kumulatifbaris- ini adalah rangkaian di mana akumulasi frekuensi dihitung. Ini menunjukkan berapa banyak unit populasi yang memiliki nilai karakteristik tidak lebih besar dari nilai ini, dan dihitung dengan menambahkan frekuensi interval berikutnya secara berurutan ke frekuensi interval pertama.

Seri interval dan kumulatif

frekuensi- jumlah perusahaan dalam kelompok;

Spesifik berat perusahaan V kelompok- ditemukan dengan rumus:

(nomorperusahaanVgrup*100%)/M, dimana m adalah jumlah data eksperimen;

Akumulasi frekuensi- ditemukan dengan rumus: nomorperusahaanVsebelumnyakelompok+frekuensidiberikankelompok.

Histogram frekuensi

Akumulasi distribusi kualitas tanah

Indikator ringkasan

Nomor grup

Jumlah perusahaan dalam grup

Produktivitas sayuran lahan terbuka (total berdasarkan kelompok)

Kualitas tanah (total berdasarkan kelompok)

II 61.33333-77.33333

III 77.33333-94.1

Karakteristik Kelompok Rata-rata

Grup No.

Produktivitas sayuran lapangan terbuka

Kualitas tanah

II 61.33333-77.33333

III 77.33333-94.1

Rata-rata

dimana, kolom “hasil sayur” dicari dengan rumus: kamukamuSaya(Vkelompok) / nomorperusahaanVkelompok;

kolom “Kualitas tanah” dicari dengan rumus: kamuXSaya(Vnomor grupperusahaanVkelompok.

Ketergantungan hasil sayuran lahan terbuka pada kualitas tanah.

Dalam contoh yang dibahas, kita dapat menyimpulkan: dengan meningkatnya kualitas tanah, hasil sayuran di lahan terbuka meningkat, oleh karena itu, kita dapat berasumsi bahwa ada hubungan langsung antara parameter yang dipertimbangkan.

Diposting di Allbest.ru

Dokumen serupa

    Pengelompokan analitis berdasarkan faktor. Konstruksi rangkaian frekuensi variasi dan distribusi kumulatif berdasarkan pengelompokan struktural interval yang sama dari atribut efektif - dividen yang diperoleh berdasarkan hasil kinerja.

    tes, ditambahkan 05/07/2009

    Indikator utama jumlah penduduk dan sebarannya di wilayah Kaluga. Konstruksi rangkaian distribusi ranking dan interval berdasarkan satu karakteristik faktor pengelompokan. Analisis kelompok tipikal berdasarkan indikator rata-rata populasi.

    tugas kursus, ditambahkan 10/11/2010

    Konstruksi menggunakan rumus Sturgess. Konstruksi deret distribusi dengan interval yang berubah-ubah. Membangun deret distribusi menggunakan standar deviasi. Klasifikasi seri distribusi. Perhitungan ciri-ciri utama variasi.

    tugas kursus, ditambahkan 22/11/2013

    Analisis, perhitungan dan konstruksi awal rangkaian waktu fitur-fungsi dan faktor-fitur. Perhitungan indikator variasi deret waktu. Pengukuran kuantitatif keeratan hubungan antara suatu fungsi sifat dan faktor sifat menggunakan metode korelasi berpasangan.

    tugas kursus, ditambahkan 24/09/2014

    Penilaian suatu populasi untuk homogenitasnya. Konstruksi deret distribusi ranking dan interval. Analisis deret waktu menggunakan metode pembesaran interval dan moving average, analisis penyelarasan menggunakan persamaan garis lurus dan parabola.

    tugas kursus, ditambahkan 09/10/2014

    Perhitungan rata-rata nilai akademik berdasarkan hasil sidang, penentuan indikator variasi tingkat pengetahuan dan struktur jumlah siswa berdasarkan prestasi akademik. Pembangunan rangkaian interval distribusi perusahaan. Estimasi koefisien korelasi.

    tes, ditambahkan 21/08/2009

    Konsep dan tipe pengelompokan statistik, dilakukan dengan tujuan untuk membangun hubungan dan pola statistik, mengidentifikasi struktur populasi yang diteliti. Konstruksi rangkaian interval distribusi perusahaan berdasarkan atribut “area penjualan”.

    tesis, ditambahkan 14/02/2016

    Kategori utama statistik. Pengelompokan merupakan dasar pengolahan ilmiah data statistik. Ringkasan konten dan agregat statistik. Konstruksi variasi, peringkat dan seri diskrit distribusi. Pengelompokan perusahaan berdasarkan jumlah pekerja.

    tes, ditambahkan 17/03/2015

    Perhitungan nilai absolut, relatif, rata-rata, koefisien regresi dan elastisitas, indikator variasi, dispersi, konstruksi dan analisis deret distribusi. Karakteristik penyelarasan analitis rangkaian rantai dan dinamika dasar.

    tugas kursus, ditambahkan 20/05/2010

    Melakukan percobaan penelitian statistik fenomena dan proses sosial-ekonomi di wilayah Smolensk berdasarkan indikator yang ditentukan. Konstruksi grafik statistik, deret distribusi, deret variasi, generalisasi dan evaluasinya.

Mereka disajikan dalam bentuk rangkaian distribusi dan disajikan dalam bentuk.

Seri distribusi adalah salah satu jenis pengelompokan.

Rentang distribusi— mewakili distribusi terurut dari unit-unit populasi yang diteliti ke dalam kelompok-kelompok menurut karakteristik tertentu yang bervariasi.

Tergantung pada karakteristik yang mendasari pembentukan rangkaian distribusi, mereka dibedakan atributif dan variasional baris distribusi:

  • Atributif— disebut rangkaian distribusi yang dibangun menurut karakteristik kualitatif.
  • Deret distribusi yang dibangun dalam urutan nilai suatu karakteristik kuantitatif menaik atau menurun disebut variasional.
Seri variasi distribusi terdiri dari dua kolom:

Kolom pertama berisi nilai kuantitatif dari karakteristik yang bervariasi, yang disebut pilihan dan ditunjuk. Opsi diskrit - dinyatakan sebagai bilangan bulat. Pilihan interval berkisar dari dan ke. Bergantung pada jenis opsi, Anda dapat membuat rangkaian variasi diskrit atau interval.
Kolom kedua berisi sejumlah pilihan tertentu, dinyatakan dalam frekuensi atau frekuensi:

Frekuensi- ini adalah angka absolut yang menunjukkan berapa kali nilai karakteristik tertentu muncul dalam agregat, yang menunjukkan . Jumlah seluruh frekuensi harus sama dengan jumlah unit seluruh populasi.

Frekuensi() adalah frekuensi yang dinyatakan sebagai persentase dari total. Jumlah semua frekuensi yang dinyatakan dalam persentase harus sama dengan 100% dalam pecahan satu.

Representasi grafis dari seri distribusi

Seri distribusi disajikan secara visual menggunakan gambar grafis.

Seri distribusi digambarkan sebagai:
  • Poligon
  • Histogram
  • terakumulasi
  • Ogive

Poligon

Saat membuat poligon sumbu horisontal(sumbu x) nilai-nilai karakteristik yang bervariasi diplot, dan pada sumbu vertikal (sumbu y) frekuensi atau frekuensi diplot.

Poligon pada Gambar. 6.1 didasarkan pada data sensus mikro penduduk Rusia pada tahun 1994.

6.1. Distribusi ukuran rumah tangga

Kondisi: Data disediakan tentang distribusi 25 karyawan salah satu perusahaan menurut kategori tarif:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tugas: Buatlah deret variasi diskrit dan gambarkan secara grafis sebagai poligon distribusi.
Larutan:
Dalam contoh ini, pilihannya adalah tingkat gaji karyawan. Untuk menentukan frekuensi perlu dihitung jumlah pegawai dengan kategori tarif yang sesuai.

Poligon digunakan untuk deret variasi diskrit.

Untuk membuat poligon distribusi (Gambar 1), kami memplot nilai kuantitatif dari berbagai karakteristik - varian - di sepanjang sumbu absis (X), dan frekuensi atau frekuensi di sepanjang sumbu ordinat.

Jika nilai suatu karakteristik dinyatakan dalam bentuk interval, maka deret tersebut disebut interval.
Seri interval distribusi digambarkan secara grafis dalam bentuk histogram, cumulate atau ogive.

Tabel statistik

Kondisi: Data jumlah simpanan diberikan 20 individu di satu bank (seribu rubel) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Tugas: Membangun deret variasi interval dengan interval yang sama.
Larutan:

  1. Populasi awal terdiri dari 20 unit (N = 20).
  2. Dengan menggunakan rumus Sturgess, kami menentukan jumlah grup yang diperlukan yang digunakan: n=1+3.322*lg20=5
  3. Mari kita hitung nilai interval yang sama: i=(152 - 2) /5 = 30 ribu rubel
  4. Mari kita bagi populasi awal menjadi 5 kelompok dengan interval 30 ribu rubel.
  5. Hasil pengelompokannya kami sajikan dalam tabel:

Dengan pencatatan sifat kontinu seperti itu, bila nilai yang sama muncul dua kali (sebagai batas atas suatu interval dan batas bawah interval yang lain), maka nilai tersebut termasuk dalam kelompok dimana nilai tersebut berperan sebagai batas atas.

grafik batang

Untuk membuat histogram, nilai batas interval ditunjukkan sepanjang sumbu absis dan, berdasarkan nilai tersebut, persegi panjang dibuat, yang tingginya sebanding dengan frekuensi (atau frekuensi).

Pada Gambar. 6.2. menunjukkan histogram sebaran penduduk Rusia pada tahun 1997 menurut kelompok umur.

Beras. 6.2. Distribusi populasi Rusia berdasarkan kelompok umur

Kondisi: Diberikan pembagian 30 karyawan perusahaan berdasarkan gaji bulanan upah

Tugas: Menampilkan rangkaian variasi interval secara grafis dalam bentuk histogram dan terakumulasi.
Larutan:

  1. Batas interval terbuka (pertama) yang tidak diketahui ditentukan oleh nilai interval kedua: 7000 - 5000 = 2000 rubel. Dengan nilai yang sama kita menemukan batas bawah interval pertama: 5000 - 2000 = 3000 rubel.
  2. Untuk membuat histogram dalam sistem koordinat persegi panjang, kita memplot sepanjang sumbu absis segmen yang nilainya sesuai dengan interval deret varises.
    Segmen-segmen ini berfungsi sebagai alas bawah, dan frekuensi (frekuensi) yang sesuai berfungsi sebagai tinggi persegi panjang yang dibentuk.
  3. Mari buat histogram:

Untuk membangun akumulasi, perlu dihitung akumulasi frekuensi (frekuensi). Mereka ditentukan dengan menjumlahkan secara berurutan frekuensi (frekuensi) dari interval sebelumnya dan diberi nama S. Akumulasi frekuensi menunjukkan berapa banyak unit populasi yang memiliki nilai karakteristik tidak lebih besar dari yang dipertimbangkan.

terakumulasi

Distribusi suatu karakteristik dalam suatu deret variasi pada frekuensi akumulasi (frekuensi) digambarkan dengan menggunakan kumulat.

terakumulasi atau kurva kumulatif, tidak seperti poligon, dibangun dari akumulasi frekuensi atau frekuensi. Dalam hal ini, nilai-nilai karakteristik ditempatkan pada sumbu absis, dan akumulasi frekuensi atau frekuensi ditempatkan pada sumbu ordinat (Gbr. 6.3).

Beras. 6.3. Akumulasi distribusi ukuran rumah tangga

4. Mari kita hitung akumulasi frekuensi:
Frekuensi kumulatif interval pertama dihitung sebagai berikut: 0+4=4, untuk interval kedua: 4+12=16; untuk yang ketiga: 4+12+8=24, dst.

Saat membuat kumulat, akumulasi frekuensi (frekuensi) dari interval yang sesuai ditetapkan ke batas atasnya:

Ogiva

Ogiva dibangun mirip dengan kumulat, dengan satu-satunya perbedaan adalah bahwa frekuensi akumulasi ditempatkan pada sumbu absis, dan nilai karakteristik ditempatkan pada sumbu ordinat.

Jenis akumulasi adalah kurva konsentrasi atau plot Lorentz. Untuk membuat kurva konsentrasi, skala skala dalam persentase dari 0 hingga 100 diplot pada kedua sumbu sistem koordinat persegi panjang, pada saat yang sama, frekuensi akumulasi dan nilai akumulasi bagian ditunjukkan pada sumbu absis (dalam persen) berdasarkan volume karakteristik ditunjukkan pada sumbu ordinat.

Distribusi karakteristik yang seragam sesuai dengan diagonal persegi pada grafik (Gbr. 6.4). Dengan distribusi yang tidak merata, grafik mewakili kurva cekung tergantung pada tingkat konsentrasi sifat.

6.4. Kurva konsentrasi

Konsep ringkasan, pengelompokan, klasifikasi

Ringkasan– sistematisasi dan kesimpulan: laporan cuaca, laporan lapangan. Ringkasan tidak memungkinkan Anda menganalisis informasi secara detail. Ringkasan apa pun harus didasarkan pada pengelompokan data, mis. mengelompokkan terlebih dahulu kemudian merangkum datanya.

Pengelompokan– pembagian populasi menjadi beberapa kelompok menurut ciri-ciri yang paling signifikan.

Ada pengelompokan kualitatif dan kuantitatif. Kualitas tinggi– atributif, kuantitatif– variasional. Pada gilirannya, variasi dibagi menjadi struktural dan analitis . Struktural pengelompokan melibatkan penghitungan berat jenis masing-masing kelompok. Contoh: di suatu perusahaan, 80% adalah pekerja, 20% adalah pekerja kantoran, 5% adalah manajer, 3% adalah pekerja kantoran, 12% adalah spesialis. Target analitis pengelompokan - untuk mengidentifikasi hubungan antara karakteristik: masa kerja dan pendapatan rata-rata, masa kerja dan keluaran, dan lain-lain.

Saat melakukan pengelompokan, perlu:

Melakukan analisis menyeluruh terhadap sifat fenomena yang diteliti;

Identifikasi karakteristik pengelompokan (satu atau lebih);

Tetapkan batas-batas kelompok sedemikian rupa sehingga kelompok-kelompok tersebut berbeda secara signifikan satu sama lain, dan unsur-unsur homogen digabungkan dalam setiap kelompok.

Menurut tingkat kerumitannya, pengelompokan dapat bersifat sederhana dan kombinasional (berdasarkan karakteristik).

Berdasarkan informasi awal, kelompok primer dan sekunder dibedakan, utama dilakukan berdasarkan data observasi awal, sekunder menggunakan data dari pengelompokan utama.

Jumlah kelompok ditentukan menurut rumus Sturgess:

Di mana N- jumlah kelompok, N- populasi umum.

Jika digunakan interval yang sama, Itu nilai interval sama dengan .

Interval mungkin sama atau tidak sama. Yang terakhir, pada gilirannya, dibagi menjadi perubahan menurut hukum aritmatika atau perkembangan geometri. Interval pertama dan terakhir bisa terbuka atau tertutup. Interval tertutup mencakup atau tidak mencakup batas interval.

Jika intervalnya tertutup dan tidak ada yang dikatakan tentang memasukkan batas atas, maka kita berasumsi demikian batas atas termasuk.

Jika intervalnya terbuka, maka kita fokus pada interval terakhir.

Karakteristik dalam interval ini dapat diukur secara terpisah dan terus menerus (yaitu dibagi). Dengan tanda kontinu, batas ditutup 1-10, 10-20, 20-30; jika sifat berubah secara terpisah, maka dapat digunakan notasi berikut: 1 – 10, 11 – 20, 21 – 30.

Jika intervalnya terbuka, maka nilai interval terakhir sama dengan nilai interval sebelumnya, dan nilai interval pertama sama dengan nilai interval kedua.

Klasifikasi– pengelompokan berdasarkan kualitas. Hal ini relatif stabil, terstandarisasi dan disetujui oleh badan statistik negara.


3.2. Seri distribusi: jenis dan karakteristik utama

Di bawah dekat distribusi mengacu pada serangkaian data yang mencirikan suatu fenomena sosial ekonomi berdasarkan satu karakteristik. Ini bentuk paling sederhana pengelompokan berdasarkan dua ciri.

Rangkaian sebarannya dibagi menjadi kualitatif dan kuantitatif, berperingkat dan tidak berperingkat, berkelompok dan tidak berkelompok, dengan sebaran sifat yang diskrit dan kontinyu.

Contoh rangkaian gaji yang tidak dikelompokkan dan tidak diberi peringkat adalah penggajian. Pada saat yang sama, daftar karyawan dapat diurutkan berdasarkan abjad atau berdasarkan nomor personel. Contoh seri rangking adalah daftar tim, rangking pemain tenis.

Seri berperingkat distribusi - serangkaian data yang disusun dalam urutan karakteristik menurun atau menaik.

Untuk rangkaian peringkat yang dikelompokkan dibedakan ciri-cirinya sebagai berikut: varian, frekuensi atau frekuensi, akumulasi dan kepadatan distribusi.

Pilihan()– nilai interval rata-rata dari karakteristik. Karena Saat membuat pengelompokan, prinsip harus diperhatikan distribusi seragam karakteristik pada setiap interval, maka variannya dapat dihitung sebagai setengah jumlah batas-batas interval tersebut.

Frekuensi() menunjukkan berapa kali nilai atribut tertentu muncul. Ekspresi frekuensi relatifnya adalah frekuensi(.) , yaitu membagikan, berat jenis dari jumlah frekuensi.

terakumulasi() – akumulasi frekuensi atau frekuensi, perhitungan berdasarkan akrual. Volume, biaya, pendapatan dihitung secara kumulatif, mis. hasil kinerja.

Tabel 1

Pengelompokan arus organisasi kredit
berdasarkan ukuran terdaftar modal dasar

pada tahun 2008 di Federasi Rusia



Baru di situs

>

Paling populer