Ev diş etleri Dağıtım serisi. İstatistiksel özet ve gruplandırma

Dağıtım serisi. İstatistiksel özet ve gruplandırma

İstatistiksel analizin en önemli kısmı, incelenen popülasyonun karakteristik özelliklerini ve modellerini vurgulamak amacıyla dağılım serilerinin (yapısal gruplandırma) oluşturulmasıdır. Verilerin gruplandırılmasında hangi özelliğin (niceliksel veya niteliksel) esas alındığına bağlı olarak dağılım serisi türleri buna göre ayırt edilir.

Gruplandırma için niteliksel bir özellik esas alınırsa, böyle bir dağılım serisine denir. niteliksel(iş türüne, cinsiyete, mesleğe, dine, uyruğa vb. göre dağılım).

Bir dağılım serisi niceliksel olarak oluşturulmuşsa, böyle bir seriye denir. varyasyonel. Bir varyasyon serisi oluşturmak, popülasyon birimlerinin niceliksel dağılımını karakteristik değerlere göre düzenlemek ve ardından bu değerlere sahip popülasyon birimlerinin sayısını saymak (bir grup tablosu oluşturmak) anlamına gelir.

Üç çeşit varyasyon serisi vardır: sıralı seriler, ayrık seriler ve aralık serileri.

Dereceli seri- bu, popülasyonun bireysel birimlerinin, incelenen özelliğin artan veya azalan sırasına göre dağılımıdır. Sıralama, niceliksel verileri kolayca gruplara ayırmanıza, en küçük ve en küçük verileri anında tespit etmenize olanak tanır. en yüksek değer karakteristik, en sık tekrarlanan değerleri vurgulayın.

Diğer varyasyon serileri biçimleri, incelenen özelliğin değerlerindeki varyasyonun niteliğine göre derlenen grup tablolarıdır. Değişimin doğasına göre ayrık (süreksiz) ve sürekli özellikler ayırt edilir.

Ayrık seri- bu, yapısı süreksiz değişime sahip özelliklere (ayrık özellikler) dayanan bir varyasyon serisidir. İkincisi, tarife kategorisini, ailedeki çocuk sayısını, işletmedeki çalışan sayısını vb. içerir. Bu özellikler yalnızca sınırlı sayıda spesifik değer alabilir.

Ayrık bir varyasyon serisi, iki sütundan oluşan bir tabloyu temsil eder. İlk sütun, özelliğin spesifik değerini gösterirken, ikinci sütun, popülasyondaki özelliğin belirli bir değerine sahip birimlerin sayısını gösterir.

Bir özelliğin sürekli bir değişimi varsa (belirli sınırlar dahilinde herhangi bir değer alabilen gelir miktarı, hizmet süresi, işletmenin sabit varlıklarının maliyeti vb.), o zaman bu özelliğin inşa edilmesi gerekir. aralık varyasyon serisi.

Buradaki grup tablosunda da iki sütun vardır. Birincisi, “başlangıçtan - bitişe” (seçenekler) aralığındaki özniteliğin değerini gösterir, ikincisi ise aralığa dahil edilen birim sayısını (frekans) gösterir.

Frekans (tekrarlama frekansı) - belirli bir nitelik değerleri varyantının tekrar sayısı fi ile gösterilir ve incelenen popülasyonun hacmine eşit frekansların toplamı gösterilir

burada k, nitelik değerlerine ilişkin seçeneklerin sayısıdır

Çoğu zaman tablo, popülasyondaki kaç birimin bu değerden daha büyük olmayan bir karakteristik değere sahip olduğunu gösteren, birikmiş frekansların (S) hesaplandığı bir sütunla desteklenir.

f serisinin frekansları, göreceli sayılarla (kesirler veya yüzdeler) ifade edilen w frekansları ile değiştirilebilir. Her aralığın frekanslarının kendi frekanslarına oranını temsil ederler. toplam tutar, yani:

Aralık değerlerine sahip bir varyasyon serisi oluştururken, öncelikle R varyasyon aralığının m grup sayısına oranı olarak tanımlanan i aralığının değerini belirlemek gerekir:

burada R = xmax - xmin; m = 1 + 3,322 logn (Sturgess formülü); n popülasyondaki toplam birim sayısıdır.

Bir popülasyonun yapısını belirlemek için medyan ve modu içeren özel ortalama göstergeler veya yapısal ortalamalar kullanılır. Aritmetik ortalama, nitelik değerlerinin tüm değişkenlerinin kullanımına dayalı olarak hesaplanırsa, medyan ve mod, sıralamada belirli bir ortalama konumu işgal eden değişkenin değerini karakterize eder. varyasyon serisi.

Medyan (Ben)- bu, sıralanan serinin ortasında yer alan seçeneğe karşılık gelen değerdir.

Tek sayıda bireysel değere sahip sıralanmış bir seri için (örneğin, 1, 2, 3, 3, 6, 7, 9, 9, 10), medyan, serinin merkezinde bulunan değer olacaktır. seriler, yani beşinci büyüklük.

Çift sayıda bireysel değere sahip sıralanmış bir seri için (örneğin, 1, 5, 7, 10, 11, 14), medyan, iki bitişik değerden hesaplanan aritmetik ortalama değer olacaktır.

Yani, medyanı bulmak için önce onu belirlemeniz gerekir. seri numarası(sıralanmış serideki konumu) formüle göre

burada n, toplamdaki birimlerin sayısıdır.

Medyanın sayısal değeri, ayrı bir varyasyon serisinde biriken frekanslardan belirlenir. Bunu yapmak için öncelikle dağılımın aralık serisinde medyanın bulunduğu aralığı belirtmeniz gerekir. Medyan, birikmiş frekansların toplamının, tüm gözlemlerin toplam sayısından gözlemlerin yarısını aştığı ilk aralıktır.

Medyanın sayısal değeri

burada xMe ortanca aralığın alt sınırıdır; i - aralık değeri; S-1, medyandan önceki aralığın birikmiş frekansıdır; f, medyan aralığın frekansıdır.

Moda (Ay) Popülasyonun birimlerinde en sık görülen bir özelliğin değerini çağırırlar. Ayrık bir seri için mod, en yüksek frekansa sahip seçenek olacaktır. Modayı belirlemek aralık serisiÖncelikle modal aralık (en yüksek frekansa sahip aralık) belirlenir. Daha sonra bu aralık içerisinde mod olabilecek özelliğin değeri bulunur.

Belirli bir mod değerini bulmak için formülü kullanmanız gerekir.

burada xMo modal aralığın alt sınırıdır; iMo modal aralığın değeridir; fMo - modal aralığın frekansı; fMo-1 - modal olandan önceki aralığın frekansı; fMo+1 - modal olanı takip eden aralığın frekansı.

Moda, tüketici talebini incelerken, özellikle giyim ve ayakkabıların en popüler bedenlerini belirlerken ve fiyatlandırma politikalarını düzenlerken pazarlama faaliyetlerinde yaygındır.

Değişim serilerini analiz etmenin temel amacı, belirli bir dağılım için rastgele faktörlerin etkisini hariç tutarak dağılım modelini tanımlamaktır. Bu, incelenen popülasyonun hacmini artırarak ve aynı zamanda serinin aralığını azaltarak başarılabilir. Bu verileri grafiksel olarak göstermeye çalıştığımızda, frekans poligonu için belirli bir sınır olacak düzgün bir eğri çizgi elde edeceğiz. Bu çizgiye dağılım eğrisi denir.

Başka bir deyişle, dağıtım eğrisi bir varyasyon serisindeki frekans değişikliklerinin sürekli bir çizgisi şeklinde grafiksel bir temsili vardır ve bu, işlevsel olarak seçenekteki değişiklikle ilişkilidir. Dağılım eğrisi, rastgele faktörlerin yokluğunda frekans değişikliklerinin modelini yansıtır. Grafiksel gösterim, dağılım serilerinin analizini kolaylaştırır.

Bir varyasyon serisinin hizalanabileceği çok sayıda dağılım eğrisi biçimi bilinmektedir, ancak istatistiksel araştırma pratiğinde en yaygın kullanılan biçimler normal dağılım ve Poisson dağılımıdır.

Normal dağılım iki parametreye bağlıdır: aritmetik ortalama ve standart sapma. Eğrisi denklemle ifade edilir

burada y normal dağılım eğrisinin ordinatıdır; - standartlaştırılmış sapmalar; e ve π matematiksel sabitlerdir; x - varyasyon serisinin çeşitleri; - ortalama değerleri; - standart sapma.

Varyasyon serilerini normal dağılım eğrisi boyunca hizalarken teorik f" frekanslarını elde etmeniz gerekiyorsa, formülü kullanabilirsiniz.

varyasyon serisinin tüm ampirik frekanslarının toplamı nerede; h - gruplardaki aralığın boyutu; - standart sapma; - seçeneklerin aritmetik ortalamadan normalleştirilmiş sapması; diğer tüm miktarlar özel tablolar kullanılarak kolayca hesaplanır.

Bu formülü kullanarak şunu elde ederiz teorik (olasılık) dağılımı, onların yerine ampirik (gerçek) dağılım karakter bakımından birbirlerinden farklı olmamalıdırlar.

Bununla birlikte, bazı durumlarda, eğer varyasyon serisi ayrı bir karakteristiğe göre bir dağılımsa, x karakteristiğinin değerleri arttıkça frekanslar keskin bir şekilde azalmaya başlar ve aritmetik ortalama da eşit olur. değer olarak dağılıma () yakın veya yakınsa, böyle bir seri Poisson eğrisi ile hizalanır.

Poisson eğrisi ilişki ile ifade edilebilir

burada Px, x'in bireysel değerlerinin ortaya çıkma olasılığıdır; - serinin aritmetik ortalaması.

Ampirik verileri eşitlerken teorik frekanslar formülle belirlenebilir.

burada f" teorik frekanslardır; N serinin toplam birim sayısıdır.

Teorik frekansların f" elde edilen değerlerini ampirik (gerçek) frekanslar f ile karşılaştırdığımızda, farklılıklarının çok küçük olabileceğine inanıyoruz.

Teorik ve ampirik frekanslar arasındaki yazışmanın nesnel bir özelliği, anlaşma kriterleri olarak adlandırılan özel istatistiksel göstergeler kullanılarak elde edilebilir.

Ampirik ve teorik frekansların yakınlığını değerlendirmek için Pearson uyum iyiliği testi, Romanovsky uyum iyiliği testi ve Kolmogorov uyum iyiliği testi kullanılmıştır.

En yaygın olanı K. Pearson'un uyum iyiliği testi f" ve f arasındaki karesel farkların teorik frekanslara oranlarının toplamı olarak temsil edilebilir:

Kriterin hesaplanan değeri tablodaki (kritik) değerle karşılaştırılmalıdır. Tablo değeriözel bir tabloyla belirlenir, kabul edilen P olasılığına ve k serbestlik derecesi sayısına bağlıdır (bu durumda k = m - 3, burada m, normal dağılım için dağılım serisindeki grup sayısıdır). Pearson uyum iyiliği testi hesaplanırken aşağıdakilere dikkat edilmelidir: sonraki koşul: gözlem sayısı yeterince büyük olmalıdır (n 50) ve teorik frekanslar bazı aralıklarla< 5, то интервалы объединяют для условия > 5.

Eğer öyleyse ampirik ve teorik frekans dağılımları arasındaki farklılıklar rastgele olabilir ve ampirik dağılımın normale yakın olduğu varsayımı reddedilemez.

Teorik ve ampirik frekanslar arasındaki tutarsızlığın rastgeleliğini değerlendirmek için tabloların bulunmaması durumunda, kullanabilirsiniz. anlaşma kriteri V.I. Romanovski Değeri kullanarak normal dağılım eğrisinin ampirik dağılımının yakınlığını oranı kullanarak değerlendirmeyi öneren KR

burada m grupların sayısıdır; k = (m - 3) - normal dağılımın frekanslarını hesaplarken serbestlik derecesi sayısı.

Yukarıdaki ilişki ise< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, o zaman tutarsızlıklar oldukça önemli olabilir ve hakkındaki hipotez normal dağılım reddedilmelidir.

Anlaşma kriteri A.N. Kolmogorov formülle hesaplanan ampirik ve teorik dağılımların frekansları arasındaki maksimum tutarsızlığın belirlenmesinde kullanılır

burada D, birikmiş ampirik ve teorik frekanslar arasındaki farkın maksimum değeridir; - ampirik frekansların toplamı.

Olasılık değerleri tabloları kullanılarak, kriter P olasılığına karşılık gelen değeri bulmak için kullanılabilir. Olasılık değeri P, bulunan değere göre anlamlıysa, o zaman teorik ve ampirik dağılımlar arasındaki tutarsızlıkların olduğunu varsayabiliriz. önemsiz.

Kolmogorov uyum iyiliği testini kullanırken gerekli bir koşul, yeterince fazla sayıda gözlemdir (en az yüz).

patates üretimi istatistiksel olarak sıralandı

Tablo 2'deki göstergelere dayanarak, 100 hektar ekilebilir arazi başına patates üretimine ilişkin sıralı sıraları derliyoruz; patates verimine göre; maliyetli. Bu göstergeler arasındaki ilişkiyi grafiksel olarak gösteriyoruz.

İlk aşama istatistiksel çalışma varyasyonlar, bir varyasyon serisinin inşasıdır - bir özelliğin artan (daha sık) veya azalan (daha az sıklıkla) değerlerine göre popülasyon birimlerinin düzenli bir dağılımı.

Üç çeşit varyasyon serisi vardır: sıralı seriler, ayrık seriler, aralık serileri. Bir varyasyon serisine genellikle dağıtım serisi denir.

Sıralanmış bir seri, incelenen özelliğe göre artan (azalan) bir popülasyonun bireysel birimlerinin bir listesidir

Sıralama, tercihe göre gerçekleştirilen, çalışma nesnelerini düzenlemeye yönelik bir prosedürdür. Varyasyon aralığı, popülasyondaki birimler arasındaki farkın ne kadar büyük olduğunu gösterir.

Sıralama, değerlerine göre artan veya azalan sırada düzenlenmiş, nitelik değerlerinin seri numarasıdır. Bir özelliğin değeri aynı niceliksel değerlendirmeye sahipse, tüm bu değerlerin sırası, belirlenen karşılık gelen yer sayılarının aritmetik ortalamasına eşit olarak alınır. Bu sıralara bağlı denir.

İstatistiklerdeki grafikler, istatistiksel göstergeleri formda görsel olarak görüntülemenin bir yoludur geometrik şekiller ve işaretler, çizimler veya şematik haritalar. Görsel bir görüntü, bilginin algılanmasını kolaylaştırır, birbiriyle ilişkili bir dizi göstergeyi yakalamanıza, gelişim eğilimlerini ve göstergelerin tipik oranlarını belirlemenize olanak tanır.

Dinamik göstergeleri görüntülemek için çizgi grafiklerin veya çubuk grafiklerin kullanılması tavsiye edilir. Program görsel, anlaşılır, kolay okunabilir ve mümkünse dikkat çekecek şekilde sanatsal olarak tasarlanmış olmalıdır.

Dağılım diyagramları oluşturulurken grafik örnekleri olarak bir dizi nokta kullanılır; doğrusal olanları oluştururken - çizgiler. Grafik oluşturma her zaman yaratıcı bir süreçtir. Burada biraz araştırma yapmak gerekiyor. Ancak birkaç taslak sürümü derleyip karşılaştırdıktan sonra grafiğin doğru kompozisyonunu belirleyebilir, grafik alanındaki işaretlerin ölçeğini ve konumunu ayarlayabilirsiniz.

100 hektar ekilebilir arazi başına patates üretiminin sıralanmış serisinden, en düşük üretimin Balagansky bölgesinde gözlemlendiği ve Angarsky bölgesinin 100 hektar ekilebilir arazi başına en yüksek patates verimliliğine sahip olduğu sonucunu çıkarabiliriz.

En düşük verim 10 c/ha ile Kachugsky bölgesinde, en yüksek verim ise 195,5 c/ha ile Usolsky'de görüldü.

100 hektar ekilebilir arazi başına patates üretiminin yüksek olduğu Chunsky bölgesinde, en düşük maliyet 1 c'ye karşılık geliyordu. Maksimum maliyet Nizhne-Ilimsky bölgesinde görülmektedir. Yüz kilo patatesin maliyet fiyatındaki değişim aralığı çok büyük ve 1161,01 rubleye eşit.

Diğer yayınlar

İşletmenin ekonomik faaliyetinin analizi
Piyasa ekonomisine geçiş, işletmenin üretim verimliliğini, ürün ve hizmetlerin rekabet gücünü uygulamaya dayalı olarak artırmasını gerektirir. etkili formlar yönetim ve üretim yönetimi, bilimsel ve teknolojik ilerlemenin kazanımları,...

JSC TransContainer'ın mali ve ekonomik faaliyetlerinin analizi
Finansal analiz, verilerin incelenmesine dayanan bir süreçtir. ekonomik durum Gelecekteki koşulları ve performansı değerlendirmek için kuruluş ve geçmiş performansı. Bu nedenle, finansal analizin asıl görevi...

İyi çalışmanızı bilgi tabanına göndermek basittir. Aşağıdaki formu kullanın

İyi iş siteye">

Bilgi tabanını çalışmalarında ve çalışmalarında kullanan öğrenciler, lisansüstü öğrenciler, genç bilim insanları size çok minnettar olacaklardır.

Yayınlanan http:// www. en iyi. ru/

Görev No.1

Verilere dayalı istatistiksel gözlem Tabloda verilen tarımsal işletmelerin faktör özelliklerine göre sıralı, aralıklı ve kümülatif dağılım serilerini oluşturup grafiksel olarak gösteriniz.

Bir veri özeti yapın. Gruplandırma yöntemini kullanarak tarımsal işletmelerde etkin özelliğin bir faktöre bağımlılığını belirleyin. Bağımlılık tabloları ve grafikleri oluşturun. Çözüm.

gruplandırma serisi dağılım faktörü

Toprak kalitesi, puan (x)

(y)

Çözüm:

Yapısıralanmışsıra dağılım, serinin tüm varyantlarının incelenen özelliğe (toprak kalitesi) göre artan sırada düzenlenmesini içerir. Sıralama, TP Excel programında “Sıralama” fonksiyonu kullanılarak gerçekleştirildi.

Toprak kalitesi

Açık öğütülmüş sebzelerin verimliliği

Sıralanmış dağıtım serisinin grafik gösterimi

Şekil 1'deki çizgiye Galton'un ojivi adı verilmektedir. Bu ojiv bazı noktalarda küçük sıçramalarla düzgün bir şekilde büyüme eğilimindedir. Sıralanmış bir seriyi aralık serisine dönüştürmek için onu manuel olarak gruplara ayırmak daha iyidir.

Yapıaralıksıraİşletmelerin incelenen özelliklere göre dağılımı, grup sayısının (aralıkların) belirlenmesini içerir.

Grup sayısını hesaplamak için aşağıdaki formülü kullanırız:

n=2, burada N, incelenen popülasyonun toplam birim sayısıdır.

n=2 Ig30 = 2,95424251?3.

Eşit aralığın değeri aşağıdaki formül kullanılarak hesaplanır:

ben = = = 16,33333

Kümülatifsıra- bu, birikmiş frekansların hesaplandığı bir seridir. Kaç tane popülasyon biriminin bu değerden daha büyük olmayan bir karakteristik değere sahip olduğunu gösterir ve sonraki aralıkların frekanslarının birinci aralığın frekansına sırayla eklenmesiyle hesaplanır.

Aralık ve kümülatif seriler

sıklık- gruptaki işletme sayısı;

Özel ağırlık işletmeler V grup- formülle bulunur:

(sayıişletmelerVgrup*%100/M burada m deneysel veri sayısıdır;

Birikmiş sıklık- formülle bulunur: sayıişletmelerVöncesigrup+frekansverildigruplar.

Frekans histogramı

Toprak kalitesi dağılımının kümülatifleri

Özet göstergeler

Grup numarası

Gruptaki şirket sayısı

Açık öğütülmüş sebzelerin verimliliği (grup bazında toplam)

Toprak kalitesi (grup bazında toplam)

II 61.33333-77.33333

III77.33333-94.1

Ortalama Grup Özellikleri

Grup No.

Açık öğütülmüş sebzelerin verimliliği

Toprak kalitesi

II 61.33333-77.33333

III77.33333-94.1

Ortalamada

burada “sebze verimi” sütunu aşağıdaki formüle göre bulunur: sensenBen(Vgrup) / sayıişletmelerVgrup;

"Toprak kalitesi" sütunu şu formül kullanılarak bulunur: senXBen(Vgrup numarasıişletmelerVgrup.

Açık öğütülmüş sebzelerin veriminin toprak kalitesine bağımlılığı.

Söz konusu örnekte şu sonuca varabiliriz: Toprak kalitesinin artmasıyla birlikte açık öğütülmüş sebzelerin verimi de artar, bu nedenle söz konusu parametreler arasında doğrudan bir bağlantı olduğunu varsayabiliriz.

Allbest.ru'da yayınlandı

Benzer belgeler

    Faktör bazında analitik gruplandırma. Etkili özelliğin eşit aralıklı yapısal gruplamasına dayalı değişken frekans ve kümülatif dağılım serilerinin oluşturulması - performans sonuçlarına göre tahakkuk eden temettüler.

    test, eklendi: 05/07/2009

    Kaluga bölgesindeki nüfusun ana göstergeleri ve dağılımı. Bir gruplandırma faktörü karakteristiğine dayalı sıralı ve aralıklı dağılım serilerinin oluşturulması. Nüfus ortalama göstergelerine dayalı tipik grupların analizi.

    kurs çalışması, 10/11/2010 eklendi

    Sturgess formülünü kullanarak inşaat. Rastgele aralıklarla dağıtım serilerinin oluşturulması. Standart sapmayı kullanarak dağılım serilerinin oluşturulması. Dağıtım serilerinin sınıflandırılması. Değişimin temel özelliklerinin hesaplanması.

    kurs çalışması, 22.11.2013 eklendi

    Başlangıç ​​analizi, hesaplanması ve inşası Zaman serisiözellik-fonksiyon ve özellik-faktörü. Zaman serilerindeki değişim göstergelerinin hesaplanması. Bir özellik-fonksiyon ile özellik-faktörler arasındaki ilişkinin yakınlığının çift korelasyon yöntemini kullanarak nicel ölçümü.

    kurs çalışması, eklendi 24.09.2014

    Bir popülasyonun homojenliği açısından değerlendirilmesi. Sıralı ve aralıklı dağılım serilerinin oluşturulması. Aralıkları genişletme ve hareketli ortalama yöntemlerini kullanarak zaman serilerinin analizi, düz çizgi ve parabol denklemini kullanarak analitik hizalama.

    kurs çalışması, eklendi 09/10/2014

    Oturum sonuçlarına göre ortalama akademik puanın hesaplanması, bilgi düzeyindeki değişim göstergesinin ve öğrenci sayısı yapısının akademik performansa göre belirlenmesi. İşletmelerin aralıklı dağıtım serisinin inşası. Korelasyon katsayılarının tahmini.

    test, 21.08.2009 eklendi

    Konsept ve türleri istatistiksel gruplama, incelenen popülasyonun yapısını belirleyerek istatistiksel ilişkiler ve modeller oluşturmak amacıyla gerçekleştirilir. “Satış alanı” özelliğine dayalı olarak işletmelerin aralıklı dağıtım serisinin oluşturulması.

    tez, eklendi: 02/14/2016

    İstatistiklerin ana kategorileri. Gruplandırma, istatistiksel verilerin bilimsel olarak işlenmesinin temelidir. Özet içerik ve istatistiksel toplam. Değişken, sıralanmış ve ayrık seri dağıtımlar. İşletmelerin çalışan sayısına göre gruplandırılması.

    test, eklendi: 17.03.2015

    Mutlak, bağıl, ortalama değerlerin hesaplanması, regresyon ve esneklik katsayıları, değişim göstergeleri, dağılım, dağılım serilerinin oluşturulması ve analizi. Zincirin ve temel dinamik serilerinin analitik hizalanmasının özellikleri.

    kurs çalışması, eklendi 20.05.2010

    Deneysel bir çalışma yürütmek istatistiksel araştırma Smolensk bölgesindeki sosyo-ekonomik olaylar ve süreçler belirli göstergelere dayanmaktadır. İstatistiksel grafiklerin oluşturulması, dağılım serileri, değişim serileri, genelleştirilmesi ve değerlendirilmesi.

Dağıtım serileri şeklinde sunulurlar ve şeklinde sunulurlar.

Dağıtım serisi gruplama türlerinden biridir.

Dağıtım aralığı- incelenen popülasyon birimlerinin belirli bir değişken özelliğe göre gruplar halinde düzenli bir dağılımını temsil eder.

Dağılım serilerinin oluşumunun altında yatan özelliğe bağlı olarak bunlar ayırt edilir. niteliksel ve varyasyonel dağıtım satırları:

  • Nitelikli- niteliksel özelliklere göre oluşturulan dağılım serilerine denir.
  • Niceliksel bir özelliğin değerlerinin artan veya azalan sırasına göre oluşturulan dağılım serisine denir varyasyonel.
Dağıtımın varyasyon serisi iki sütundan oluşur:

İlk sütun, değişen karakteristiklerin niceliksel değerlerini sağlar. seçenekler ve belirlenir. Ayrık seçenek - tamsayı olarak ifade edilir. Aralık seçeneği ile ila arasında değişir. Seçeneklerin türüne bağlı olarak ayrık veya aralıklı bir varyasyon serisi oluşturabilirsiniz.
İkinci sütun şunları içerir: belirli seçenek sayısı, frekanslar veya frekanslar cinsinden ifade edilir:

Frekanslar- bunlar bir özelliğin belirli bir değerinin toplamda kaç kez oluştuğunu gösteren mutlak sayılardır; Tüm frekansların toplamı, tüm popülasyondaki birim sayısına eşit olmalıdır.

Frekanslar() toplamın yüzdesi olarak ifade edilen frekanslardır. Yüzde olarak ifade edilen tüm frekansların toplamı, birin kesirleri halinde %100'e eşit olmalıdır.

Dağıtım serisinin grafik gösterimi

Dağıtım serileri grafik görseller kullanılarak görsel olarak sunulmaktadır.

Dağıtım serisi şu şekilde gösterilmektedir:
  • Çokgen
  • Histogramlar
  • Kümülatif
  • Ogivler

Çokgen

Bir çokgen oluştururken yatay eksen(x ekseni) değişen karakteristiklerin değerleri çizilir ve dikey eksende (y ekseni) frekanslar veya frekanslar çizilir.

Şekil 2'deki çokgen. 6.1, 1994 yılında Rusya nüfusunun mikro sayımından elde edilen verilere dayanmaktadır.

6.1. Hane büyüklüğü dağılımı

Durum: İşletmelerden birinin 25 çalışanının tarife kategorilerine göre dağılımına ilişkin veriler sağlanmaktadır:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Görev: Ayrı bir varyasyon serisi oluşturun ve bunu grafiksel olarak bir dağıtım poligonu olarak gösterin.
Çözüm:
Bu örnekte seçenekler çalışanın maaş notudur. Frekansları belirlemek için ilgili tarife kategorisine göre çalışan sayısını hesaplamak gerekir.

Çokgen, ayrık varyasyon serileri için kullanılır.

Bir dağıtım poligonu oluşturmak için (Şekil 1), değişen karakteristiklerin (varyantların) niceliksel değerlerini apsis (X) ekseni boyunca ve frekansları veya frekansları ordinat ekseni boyunca çizeriz.

Bir özelliğin değerleri aralık şeklinde ifade edilirse böyle bir seriye aralık denir.
Aralık serisi dağılımlar grafiksel olarak histogram, kümülat veya ojiv şeklinde gösterilir.

İstatistik tablosu

Durum: Mevduat büyüklüğüne ilişkin veriler verilmiştir 20 bireyler bir bankada (bin ruble) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Görev: Eşit aralıklara sahip bir aralık varyasyon serisi oluşturun.
Çözüm:

  1. Başlangıç ​​popülasyonu 20 birimden oluşur (N = 20).
  2. Sturgess formülünü kullanarak, kullanılan gerekli grup sayısını belirliyoruz: n=1+3.322*lg20=5
  3. Eşit aralığın değerini hesaplayalım: i=(152 - 2) /5 = 30 bin ruble
  4. Başlangıç ​​popülasyonunu 30 bin ruble arayla 5 gruba ayıralım.
  5. Gruplandırma sonuçlarını tabloda sunuyoruz:

Sürekli bir özelliğin bu şekilde kaydedilmesinde, aynı değer iki kez oluştuğunda (bir aralığın üst sınırı ve diğer aralığın alt sınırı olarak), bu değer, bu değerin üst sınır görevi gördüğü gruba aittir.

grafik çubuğu

Bir histogram oluşturmak için aralıkların sınırlarının değerleri apsis ekseni boyunca gösterilir ve bunlara dayanarak yüksekliği frekanslarla (veya frekanslarla) orantılı olan dikdörtgenler oluşturulur.

İncirde. 6.2. 1997 yılında Rus nüfusunun yaş grubuna göre dağılımının histogramını göstermektedir.

Pirinç. 6.2. Rusya nüfusunun yaş gruplarına göre dağılımı

Durum: 30 şirket çalışanının aylık maaşlarına göre dağılımı verildi ücretler

Görev: Aralık değişim serisini grafiksel olarak histogram biçiminde görüntüleyin ve toplayın.
Çözüm:

  1. Açık (birinci) aralığın bilinmeyen sınırı, ikinci aralığın değerine göre belirlenir: 7000 - 5000 = 2000 ruble. Aynı değerle ilk aralığın alt sınırını buluyoruz: 5000 - 2000 = 3000 ruble.
  2. Dikdörtgen bir koordinat sisteminde bir histogram oluşturmak için, değerleri varis serisinin aralıklarına karşılık gelen bölümleri apsis ekseni boyunca çizeriz.
    Bu bölümler alt taban görevi görür ve karşılık gelen frekans (frekans), oluşturulan dikdörtgenlerin yüksekliği görevi görür.
  3. Bir histogram oluşturalım:

Kümülatif oluşturmak için, birikmiş frekansları (frekansları) hesaplamak gerekir. Bunlar, önceki aralıkların frekanslarının (frekanslarının) sırayla toplanmasıyla belirlenir ve S olarak adlandırılır. Birikmiş frekanslar, popülasyonun kaç biriminin, söz konusu olandan daha büyük olmayan bir karakteristik değere sahip olduğunu gösterir.

Kümülatif

Bir varyasyon serisindeki bir özelliğin birikmiş frekanslar (frekanslar) üzerindeki dağılımı, bir kümülat kullanılarak gösterilir.

Kümülatif veya bir poligondan farklı olarak kümülatif bir eğri, birikmiş frekanslardan veya frekanslardan oluşturulur. Bu durumda, özelliğin değerleri apsis eksenine, biriken frekanslar veya frekanslar ise ordinat eksenine yerleştirilir (Şekil 6.3).

Pirinç. 6.3. Hane büyüklüğü dağılımı kümülatifleri

4. Birikmiş frekansları hesaplayalım:
İlk aralığın kümülatif frekansı şu şekilde hesaplanır: 0 + 4 = 4, ikincisi için: 4 + 12 = 16; üçüncüsü için: 4 + 12 + 8 = 24, vb.

Bir kümülasyon oluştururken, karşılık gelen aralığın birikmiş frekansı (frekansı) üst sınırına atanır:

Ogiva

Ogiva kümülata benzer şekilde inşa edilmiştir; tek fark, biriken frekansların apsis eksenine yerleştirilmesi ve karakteristik değerlerin ordinat eksenine yerleştirilmesidir.

Kümülatın bir türü konsantrasyon eğrisi veya Lorentz grafiğidir. Bir konsantrasyon eğrisi oluşturmak için, dikdörtgen koordinat sisteminin her iki eksenine 0'dan 100'e kadar yüzdelerde bir ölçek ölçeği çizilir, aynı zamanda apsis ekseninde biriken frekanslar ve payın birikmiş değerleri gösterilir. Karakteristiğin hacmine göre (yüzde olarak) ordinat ekseninde gösterilir.

Karakteristiğin düzgün dağılımı, grafikteki karenin köşegenine karşılık gelir (Şekil 6.4). Düzensiz bir dağılıma sahip olan grafik, özelliğin konsantrasyon düzeyine bağlı olarak içbükey bir eğriyi temsil eder.

6.4. Konsantrasyon eğrisi

Özet kavramı, gruplandırma, sınıflandırma

Özet– sistemleştirme ve özetleme: hava durumu raporları, tarlalardan gelen raporlar. Özet, bilgileri ayrıntılı olarak analiz etmenize izin vermez. Herhangi bir özet veri gruplamasına dayalı olmalıdır; Verilerin önce gruplanması, ardından özetlenmesi.

Gruplama- Popülasyonların en önemli özelliklerine göre birkaç gruba bölünmesi.

Niteliksel ve niceliksel gruplamalar vardır. Yüksek kalite– niteliksel, nicel– varyasyonel. Buna karşılık, varyasyon yapısal ve analitik olarak ikiye ayrılır. . Yapısal gruplandırma, her grubun özgül ağırlığının hesaplanmasını içerir. Örnek: Bir işletmede %80'i işçi, %20'si ofis çalışanı, bunların %5'i yönetici, %3'ü ofis çalışanı, %12'si uzmandır. Hedef analitik gruplamalar - özellikler arasındaki ilişkiyi tanımlamak için: hizmet süresi ve ortalama kazanç, hizmet süresi ve çıktı ve diğerleri.

Gruplandırma yapılırken aşağıdakiler gereklidir:

İncelenen olgunun doğasının kapsamlı bir analizinin yapılması;

Bir gruplandırma özelliğinin tanımlanması (bir veya daha fazla);

Grupların sınırlarını, gruplar birbirinden önemli ölçüde farklı olacak ve her grupta homojen unsurlar birleştirilecek şekilde belirleyin.

Karmaşıklık derecesine göre gruplamalar basit ve birleşimsel (özelliklere dayalı) olabilir.

İlk bilgilere dayanarak birincil ve ikincil gruplar ayırt edilir, öncelik ilk gözlem verilerine dayanarak gerçekleştirilen, ikincil birincil gruplandırmadaki verileri kullanır.

Grup sayısı belirlendi Sturgess formülüne göre:

Nerede N- grup sayısı, N- Genel popülasyon.

Kullanıldıysa eşit aralıklar, O aralık değeri eşittir .

Aralıklar eşit veya eşitsiz olabilir. İkincisi, sırasıyla aritmetik yasasına göre değişenlere veya geometrik ilerleme. İlk ve son aralıklar açık veya kapalı olabilir. Kapalı aralıklar aralık sınırlarını içerir veya içermez.

Aralıklar kapalıysa ve üst sınırların dahil edilmesi konusunda hiçbir şey söylenmemişse, o zaman şunu varsayarız: üst sınırlar dahil.

Aralıklar açıksa son aralığa odaklanırız.

Bu aralıklardaki karakteristik ayrı ayrı ve sürekli olarak ölçülebilir (yani bölünebilir). Sürekli işaret ile sınırlar 1-10, 10-20, 20-30'a yakındır; karakteristik belirgin bir şekilde değişirse, aşağıdaki gösterim kullanılabilir: 1 – 10, 11 – 20, 21 – 30.

Aralıklar açıksa son aralığın değeri bir öncekine, birinci aralığın değeri de ikinciye eşittir.

sınıflandırma– niteliksel kriterlere göre gruplandırma. Nispeten istikrarlıdır, standartlaştırılmıştır ve devlet istatistik kurumları tarafından onaylanmıştır.


3.2. Dağıtım serisi: türleri ve ana özellikleri

Altında yakın dağıtım Bir özelliğe dayalı olarak sosyo-ekonomik bir olguyu karakterize eden bir dizi veriyi ifade eder. Bu en basit hal iki özelliğe göre gruplandırma.

Dağılım serileri, özelliğin ayrık ve sürekli dağılımı ile niteliksel ve niceliksel, sıralanmış ve sıralanmamış, gruplandırılmış ve gruplanmamış olarak bölünmüştür.

Gruplandırılmamış, sıralanmamış maaş serisine örnek olarak bordro verilebilir. Aynı zamanda çalışan listesi alfabetik olarak veya personel sayısına göre sıralanabilmektedir. Sıralanmış bir seriye örnek olarak takımların listesi, tenis oyuncularının sıralaması verilebilir.

Dereceli seri dağıtım - bir özelliğin azalan veya artan sırasına göre düzenlenmiş bir dizi veri.

Gruplandırılmış sıralanmış seriler için aşağıdaki özellikler ayırt edilir: değişken, frekans veya frekans, kümülatif ve dağılım yoğunluğu.

Seçenek()– özelliğin ortalama aralık değeri. Çünkü Gruplandırma oluştururken ilkeye uyulmalıdır üniforma dağıtımı Her bir aralıktaki karakteristik, o zaman değişken, aralıkların sınırlarının toplamının yarısı kadar hesaplanabilir.

Sıklık() belirli bir özellik değerinin kaç kez oluştuğunu gösterir. Frekansın göreceli ifadesi sıklık(.) yani paylaşmak, spesifik yer çekimi frekansların toplamından.

Kümülatif() – birikmiş frekans veya frekans, tahakkuk esasına göre hesaplama. Hacim, maliyetler, gelir kümülatif olarak hesaplanır, yani. performans sonuçları.

tablo 1

Akımın gruplandırılması kredi kurumları
kayıtlı boyutuna göre kayıtlı sermaye

2008 yılında Rusya Federasyonu'nda



Sitede yeni

>

En popüler