Ev Kaplamalı dil Varyasyon serisi aşağıdakilerden oluşur: Varyasyon serisinin tanımı

Varyasyon serisi aşağıdakilerden oluşur: Varyasyon serisinin tanımı

Bu bölümde uzmanlaşmanın bir sonucu olarak öğrenci: Bilmek

  • varyasyon göstergeleri ve ilişkileri;
  • özelliklerin dağılımının temel yasaları;
  • rıza kriterlerinin özü; yapabilmek
  • varyasyon indekslerini ve uyum iyiliği kriterlerini hesaplamak;
  • dağıtım özelliklerini belirlemek;
  • istatistiksel dağılım serilerinin temel sayısal özelliklerini değerlendirebilecek;

sahip olmak

  • dağılım serilerinin istatistiksel analiz yöntemleri;
  • temel bilgiler varyans analizi;
  • İstatistiksel dağılım serilerinin temel dağıtım yasalarına uygunluğunu kontrol etme teknikleri.

Değişim göstergeleri

Şu tarihte: istatistiksel araştırmaçeşitli istatistiksel kümelerin özellikleri, bireysel özelliklerin çeşitliliğinin incelenmesi istatistiksel birimler nüfus ve birimlerin ülke genelinde dağılımının doğası bu karakteristik. Varyasyon - bunlar, incelenen popülasyonun birimleri arasındaki bir özelliğin bireysel değerlerindeki farklılıklardır. Varyasyon çalışması büyük pratik öneme sahiptir. Çeşitliliğin derecesine göre, bir özelliğin varyasyonunun sınırları, belirli bir özellik için popülasyonun homojenliği, ortalamanın tipikliği ve varyasyonu belirleyen faktörlerin ilişkisi değerlendirilebilir. İstatistiksel popülasyonları karakterize etmek ve düzenlemek için varyasyon göstergeleri kullanılır.

İstatistiksel dağılım serileri şeklinde sunulan istatistiksel gözlem materyallerinin özeti ve gruplandırılmasının sonuçları, gruplandırma (değişen) kriterlerine göre incelenen popülasyon birimlerinin gruplara sıralı bir dağılımını temsil eder. Gruplandırma için niteliksel bir özellik esas alınırsa, böyle bir dağılım serisine denir. niteliksel(meslek, cinsiyet, renk vb. göre dağılım). Bir dağılım serisi niceliksel olarak oluşturulmuşsa, böyle bir seriye denir. varyasyonel(boy, kilo, maaş vb. göre dağılım). Bir varyasyon serisi oluşturmak, popülasyon birimlerinin niceliksel dağılımını karakteristik değerlere göre düzenlemek, bu değerlere (frekans) sahip popülasyon birimlerinin sayısını saymak ve sonuçları bir tablo halinde düzenlemek anlamına gelir.

Bir değişkenin frekansı yerine, frekans (göreceli frekans) adı verilen toplam gözlem hacmine oranını kullanmak mümkündür.

İki tip var varyasyon serisi: ayrık ve aralık. Ayrık seri- Bu, yapısı süreksiz değişime sahip özelliklere (ayrık özellikler) dayanan bir varyasyon serisidir. İkincisi, işletmedeki çalışan sayısını, tarife kategorisini, ailedeki çocuk sayısını vb. içerir. Ayrık bir varyasyon serisi, iki sütundan oluşan bir tabloyu temsil eder. İlk sütun, özelliğin spesifik değerini gösterirken, ikinci sütun, popülasyondaki özelliğin belirli bir değerine sahip birimlerin sayısını gösterir. Bir özelliğin sürekli bir değişimi varsa (belirli sınırlar dahilinde herhangi bir değer alabilen gelir miktarı, hizmet süresi, işletmenin sabit varlıklarının maliyeti vb.), o zaman bu özellik için inşa etmek mümkündür. aralık varyasyon serisi. Bir aralık varyasyon serisi oluştururken tablonun ayrıca iki sütunu vardır. Birincisi, özelliğin “başlangıç ​​- bitiş” aralığındaki değerini (seçenekler), ikincisi ise aralığa dahil edilen birim sayısını (frekans) gösterir. Frekans (tekrarlama sıklığı) - belirli bir özellik değerleri değişkeninin tekrar sayısı. Aralıklar kapalı veya açık olabilir. Kapalı aralıklar her iki tarafta da sınırlıdır; hem alt (“başlangıç”) hem de üst (“bitiş”) sınırına sahiptir. Açık aralıkların bir sınırı vardır: üst veya alt. Seçenekler artan veya azalan sırada düzenlenmişse satırlar çağrılır. sıralanmıştır.

Değişim serileri için iki tür frekans yanıtı seçeneği vardır: birikmiş frekans ve birikmiş frekans. Birikmiş frekans, karakteristik değerinin kaç gözlemin belirli bir değerden daha düşük değerler aldığını gösterir. Birikmiş frekans, belirli bir grup için bir özelliğin frekans değerlerinin önceki grupların tüm frekanslarıyla toplanmasıyla belirlenir. Birikmiş frekans karakterize eder spesifik yer çekimi karakteristik değerlerin veri grubunun üst sınırını aşmadığı gözlem birimleri. Böylece birikmiş frekans, toplamdaki değeri verilenden büyük olmayan seçeneklerin oranını gösterir. Frekans, frekans, mutlak ve bağıl yoğunluklar, birikmiş frekans ve frekans, varyantın büyüklüğünün özellikleridir.

Nüfusun istatistiksel birimlerinin özelliklerindeki farklılıklar ve dağılımın doğası, serinin ortalama seviyesini, ortalama doğrusal sapmayı, standart sapmayı, dağılımı içeren varyasyon serisinin göstergeleri ve özellikleri kullanılarak incelenir. , salınım katsayıları, varyasyon, asimetri, basıklık vb.

Dağıtım merkezini karakterize etmek için ortalama değerler kullanılır. Ortalama, incelenen popülasyonun üyelerinin sahip olduğu bir özelliğin tipik düzeyinin ölçüldüğü genelleştirici bir istatistiksel özelliktir. Bununla birlikte, aritmetik ortalamaların farklı dağılım modelleriyle çakıştığı durumlar olabilir, bu nedenle varyasyon serilerinin istatistiksel özellikleri olarak, yapısal araçlar olarak adlandırılan mod, medyan ve dağıtım serisini eşit olarak bölen nicelikler hesaplanır. parçalar (çeyrekler, ondalıklar, yüzdelikler vb.).

Moda - Bu, bir özelliğin dağılım serisinde diğer değerlerinden daha sık ortaya çıkan değeridir. Ayrık seriler için bu, en yüksek frekansa sahip seçenektir. Aralık değişim serilerinde modu belirlemek için öncelikle modal aralık olarak adlandırılan aralığın belirlenmesi gerekir. Varyasyon serisinde eşit aralıklarla modal aralık, eşit olmayan aralıklarla seri halindeki en yüksek frekansla belirlenir - ancak en yüksek dağıtım yoğunluğu. Formül daha sonra modu eşit aralıklarla satırlar halinde belirlemek için kullanılır.

burada Mo moda değeridir; xMo - modal aralığın alt sınırı; H- modal aralık genişliği; / Mo - modal aralığın frekansı; / Mo j premodal aralığın frekansıdır; / Mo+1 post-modal aralığın frekansıdır ve bu hesaplama formülünde aralıkları eşit olmayan bir seri için / Mo, / Mo, / Mo frekansları yerine dağılım yoğunlukları kullanılmalıdır. Akıl 0 _| , Akıl 0> UMO+"

Tek bir mod varsa, rastgele değişkenin olasılık dağılımına tek modlu denir; birden fazla mod varsa, iki mod durumunda buna multimodal (polimodal, multimodal) denir - bimodal. Kural olarak çok modluluk, incelenen dağılımın yasaya uymadığını gösterir. normal dağılım. Homojen popülasyonlar, kural olarak, tek tepe dağılımlarıyla karakterize edilir. Multivertex ayrıca incelenen popülasyonun heterojenliğini de gösterir. İki veya daha fazla köşenin ortaya çıkması, daha homojen grupların tanımlanması için verilerin yeniden gruplandırılmasını gerekli kılar.

Bir aralık varyasyon serisinde mod, bir histogram kullanılarak grafiksel olarak belirlenebilir. Bunu yapmak için histogramın en yüksek sütununun üst noktalarından iki bitişik sütunun üst noktalarına kadar kesişen iki çizgi çizin. Daha sonra kesiştikleri noktadan apsis eksenine bir dik indirilir. Özelliğin x ekseni üzerindeki dikliğe karşılık gelen değeri moddur. Çoğu durumda, bir popülasyonu genelleştirilmiş bir gösterge olarak karakterize ederken, aritmetik ortalama yerine mod tercih edilir.

Medyan - Bu merkezi önem karakteristik, sıralanmış dağıtım serisinin merkezi üyesi tarafından sahip olunmaktadır. Ayrık serilerde medyanın değerini bulmak için önce onun değerini belirleyin. seri numarası. Bunun için birim sayısı tek ise tüm frekansların toplamına bir eklenir ve sayı ikiye bölünür. Bir satırda çift sayıda birim varsa, iki ortanca birim olacaktır, dolayısıyla bu durumda ortanca, iki ortanca birimin değerlerinin ortalaması olarak tanımlanır. Dolayısıyla ayrık bir varyasyon serisindeki medyan, seriyi aynı sayıda seçeneği içeren iki parçaya bölen değerdir.

Aralık serilerinde, medyanın seri numarası belirlendikten sonra, biriken frekanslar (frekanslar) kullanılarak orta aralık bulunur ve ardından ortancayı hesaplama formülü kullanılarak ortancanın değeri belirlenir:

burada Me medyan değerdir; x Ben - medyan aralığın alt sınırı; H- medyan aralığın genişliği; - dağıtım serisinin frekanslarının toplamı; /D - medyan öncesi aralığın birikmiş frekansı; /Me - ortanca aralığın frekansı.

Medyan, bir kümülasyon kullanılarak grafiksel olarak bulunabilir. Bunu yapmak için, kümülatın birikmiş frekansları (frekansları) ölçeğinde, medyanın sıra numarasına karşılık gelen noktadan, apsis eksenine kümülat ile kesişene kadar paralel bir düz çizgi çizilir. Daha sonra belirtilen çizginin kümülat ile kesiştiği noktadan itibaren apsis eksenine bir dik indirilir. Özniteliğin x ekseni üzerinde çizilen ordinat (dik) değerine karşılık gelen değeri medyandır.

Medyan aşağıdaki özelliklerle karakterize edilir.

  • 1. Her iki tarafında bulunan özellik değerlerine bağlı değildir.
  • 2. Minimalite özelliğine sahiptir; bu, nitelik değerlerinin medyandan mutlak sapmalarının toplamının, nitelik değerlerinin başka herhangi bir değerden sapmasına kıyasla minimum bir değeri temsil ettiği anlamına gelir.
  • 3. İki dağılımı bilinen medyanlarla birleştirirken, yeni dağılımın medyanının değerini önceden tahmin etmek imkansızdır.

Medyanın bu özellikleri nokta konumlarının tasarlanmasında yaygın olarak kullanılmaktadır. sıraya girme- okullar, klinikler, benzin istasyonları, su noktaları vb. Örneğin şehrin belirli bir bloğuna klinik yapılması planlanıyorsa, bunu blokta bloğun uzunluğunu değil, sakin sayısını yarıya indirecek bir noktaya yerleştirmek daha doğru olacaktır.

Mod, medyan ve aritmetik ortalamanın oranı, özelliğin toplamdaki dağılımının doğasını gösterir ve dağılımın simetrisini değerlendirmemizi sağlar. Eğer x O zaman serinin sağ tarafında bir asimetrisi var. Normal dağılımlı X - Hafıza.

K. Pearson bazlı hizalama çeşitli türler eğriler, orta derecede asimetrik dağılımlar için aritmetik ortalama, medyan ve mod arasında aşağıdaki yaklaşık ilişkilerin geçerli olduğunu belirledi:

burada Me medyan değerdir; Mo - modanın anlamı; x aritmi - aritmetik ortalamanın değeri.

Varyasyon serisinin yapısını daha ayrıntılı olarak incelemeye ihtiyaç varsa, medyana benzer karakteristik değerleri hesaplayın. Bu tür karakteristik değerler, tüm dağıtım birimlerini eşit sayılara böler; bunlara nicelikler veya gradyanlar denir. Nicelikler çeyreklere, ondalık dilimlere, yüzdelik dilimlere vb. bölünmüştür.

Çeyrekler nüfusu dört eşit parçaya böler. İlk çeyrek, daha önce ilk üç aylık aralığı belirledikten sonra, ilk çeyreği hesaplamak için kullanılan formül kullanılarak medyana benzer şekilde hesaplanır:

burada Qi ilk çeyreğin değeridir; xQ^- birinci çeyrek aralığının alt sınırı; H- ilk çeyrek aralığının genişliği; /, - aralık serisinin frekansları;

Birinci çeyrek aralığından önceki aralıktaki kümülatif frekans; Jq ( - ilk çeyrek aralığının frekansı.

İlk çeyrek, nüfus birimlerinin %25'inin değerinden az, %75'inin ise fazla olduğunu göstermektedir. İkinci çeyrek medyana eşittir, yani. S2 = Ben.

Benzer şekilde, üçüncü çeyrek, ilk önce üçüncü üç aylık aralığı bulduktan sonra hesaplanır:

üçüncü çeyrek aralığının alt sınırı nerede; H- üçüncü çeyrek aralığının genişliği; /, - aralık serisinin frekansları; /X" -önceki aralıkta birikmiş frekans

G

üçüncü çeyrek aralığı; Jq üçüncü çeyrek aralığının frekansıdır.

Üçüncü çeyrek, nüfus birimlerinin %75'inin değerinden az, %25'inin ise fazla olduğunu göstermektedir.

Üçüncü ve birinci çeyrekler arasındaki fark çeyrekler arası aralıktır:

burada Aq çeyrekler arası aralığın değeridir; S 3 -üçüncü çeyrek değeri; Q, ilk çeyreğin değeridir.

Ondalıklar nüfusu 10 eşit parçaya böler. Ondalık, bir dağılım serisinde popülasyon büyüklüğünün onda birine karşılık gelen bir özelliğin değeridir. Çeyreklere benzer şekilde, ilk ondalık dilim nüfus birimlerinin %10'unun değerinden az, %90'ının büyük olduğunu gösterirken, dokuzuncu ondalık dilim nüfus birimlerinin %90'ının değerinden az, %10'unun ise değerinden az olduğunu gösterir. daha büyük. Dokuzuncu ve ilk ondalık dilimlerin oranı, yani. Ondalık katsayı, en varlıklı %10 ile en az varlıklı nüfusun %10'unun gelir düzeylerinin oranını ölçmek için gelir farklılaşması çalışmasında yaygın olarak kullanılır. Yüzdelikler sıralanan nüfusu 100 eşit parçaya böler. Yüzdelik dilimlerin hesaplanması, anlamı ve uygulanması ondalık dilimlere benzer.

Çeyrekler, ondalıklar ve diğerleri yapısal özellikler kümülatlar kullanılarak medyana benzetilerek grafiksel olarak belirlenebilir.

Değişimin boyutunu ölçmek için aşağıdaki göstergeler kullanılır: varyasyon aralığı, ortalama doğrusal sapma, standart sapma, dağılım. Değişim aralığının büyüklüğü tamamen serinin uç üyelerinin dağılımının rastgeleliğine bağlıdır. Bu gösterge, bir özelliğin değerlerindeki dalgalanmaların büyüklüğünün ne olduğunu bilmenin önemli olduğu durumlarda ilgi çekicidir:

Nerede R- varyasyon aralığının değeri; x max - özelliğin maksimum değeri; x tt -özelliğin minimum değeri.

Değişim aralığı hesaplanırken seri üyelerinin büyük çoğunluğunun değeri dikkate alınmazken, varyasyon seri üyesinin her değeriyle ilişkilendirilir. Bir özelliğin bireysel değerlerinin ortalama değerlerinden sapmalarından elde edilen ortalamalar olan göstergeler bu dezavantaja sahip değildir: ortalama doğrusal sapma ve standart sapma. Ortalamadan bireysel sapmalar ile belirli bir özelliğin değişkenliği arasında doğrudan bir ilişki vardır. Dalgalanma ne kadar güçlü olursa o kadar fazla olur. mutlak boyutlar ortalamadan sapmalar.

Ortalama doğrusal sapma, şunun aritmetik ortalamasıdır: mutlak değerler bireysel seçeneklerin ortalama değerlerinden sapmaları.

Gruplandırılmamış Veriler için Ortalama Doğrusal Sapma

burada /pr ortalama doğrusal sapmanın değeridir; x, - özelliğin değeridir; X - P - Popülasyondaki birim sayısı.

Gruplandırılmış serilerin ortalama doğrusal sapması

nerede / vz - ortalama doğrusal sapmanın değeri; x, özelliğin değeridir; X - incelenen popülasyon için özelliğin ortalama değeri; / - ayrı bir gruptaki nüfus birimlerinin sayısı.

Sapma belirtileri bu durumda dikkate alınmaz, aksi takdirde tüm sapmaların toplamı sıfıra eşit olacaktır. Analiz edilen verilerin gruplandırılmasına bağlı olarak ortalama doğrusal sapma, çeşitli formüller kullanılarak hesaplanır: gruplandırılmış ve gruplanmamış veriler için. Koşulluluğu nedeniyle ortalama doğrusal sapma, diğer değişkenlik göstergelerinden ayrı olarak pratikte nispeten nadiren kullanılır (özellikle teslimatın tekdüzeliği için sözleşmeden doğan yükümlülüklerin yerine getirilmesini karakterize etmek için; ciro analizinde) dış Ticaret, işçilerin bileşimi, üretim ritmi, ürünlerin kalitesi, dikkate alınarak teknolojik özelliklerüretim vb.).

Standart sapma, incelenen özelliğin bireysel değerlerinin ortalama olarak popülasyonun ortalama değerinden ne kadar saptığını karakterize eder ve incelenen özelliğin ölçüm birimleriyle ifade edilir. Ana varyasyon ölçümlerinden biri olan standart sapma, homojen bir popülasyondaki bir özelliğin varyasyon sınırlarının değerlendirilmesinde, normal bir dağılım eğrisinin ordinat değerlerinin belirlenmesinde ve ayrıca aşağıdakilerle ilgili hesaplamalarda yaygın olarak kullanılır: numune gözleminin organizasyonu ve numune özelliklerinin doğruluğunun belirlenmesi. Gruplandırılmamış verilerin standart sapması aşağıdaki algoritma kullanılarak hesaplanır: ortalamadan her sapmanın karesi alınır, tüm kareler toplanır, ardından karelerin toplamı serinin terim sayısına bölünür ve karekök elde edilir. bölüm:

burada bir Iip standart sapmanın değeridir; Xj...özellik değeri; X- incelenen popülasyona ilişkin özelliğin ortalama değeri; P - Popülasyondaki birim sayısı.

Gruplandırılmış analiz edilen veriler için, verilerin standart sapması ağırlıklı formül kullanılarak hesaplanır.

Nerede - standart sapma değeri; Xj...özellik değeri; X - incelenen popülasyon için özelliğin ortalama değeri; f x - Belirli bir gruptaki nüfus birimlerinin sayısı.

Her iki durumda da kökün altındaki ifadeye varyans denir. Böylece dağılım, nitelik değerlerinin ortalama değerlerinden sapmalarının ortalama karesi olarak hesaplanır. Ağırlıklandırılmamış (basit) nitelik değerleri için varyans aşağıdaki şekilde belirlenir:

Ağırlıklandırılmış karakteristik değerler için

Varyansı hesaplamak için özel, basitleştirilmiş bir yöntem de vardır: genel olarak

ağırlıklandırılmamış (basit) karakteristik değerler için ağırlıklı karakteristik değerler için
sıfır tabanlı yöntemi kullanarak

burada a 2 dağılım değeridir; x, - özelliğin değeridir; X -özelliğin ortalama değeri, H- grup aralığı değeri, t 1 - ağırlık (A =

Dağılımın istatistikte bağımsız bir ifadesi vardır ve sayıyı ifade eder. en önemli göstergeler varyasyonlar. İncelenen özelliğin ölçüm birimlerinin karesine karşılık gelen birimlerle ölçülür.

Dispersiyon aşağıdaki özelliklere sahiptir.

  • 1. Sabit bir değerin varyansı sıfırdır.
  • 2. Bir özelliğin tüm değerlerinin aynı A değeri kadar azaltılması, dağılımın değerini değiştirmez. Bu, ortalama sapma karesinin, bir özelliğin verilen değerlerinden değil, bazı sabit sayıdan sapmalarından hesaplanabileceği anlamına gelir.
  • 3. Herhangi bir karakteristik değerin azaltılması k kez dağılımı azaltır k 2 kez ve standart sapma k kez, yani özelliğin tüm değerleri sabit bir sayıya bölünebilir (örneğin seri aralığının değerine göre), standart sapma hesaplanabilir ve daha sonra sabit bir sayı ile çarpılabilir.
  • 4. Herhangi bir değerden sapmaların ortalama karesini hesaplarsak Ve aritmetik ortalamadan bir dereceye kadar farklıysa, her zaman aritmetik ortalamadan hesaplanan sapmaların ortalama karesinden daha büyük olacaktır. Sapmaların ortalama karesi, ortalama ile geleneksel olarak alınan bu değer arasındaki farkın karesi kadar çok belirli bir miktarda daha büyük olacaktır.

Alternatif bir özelliğin varyasyonu, popülasyon birimlerinde incelenen özelliğin varlığı veya yokluğundan oluşur. Niceliksel olarak, alternatif bir özelliğin değişimi iki değerle ifade edilir: incelenen özelliğin bir biriminin varlığı bir (1) ile gösterilir ve yokluğu sıfır (0) ile gösterilir. İncelenen özelliğe sahip birimlerin oranı P ile, bu özelliğe sahip olmayan birimlerin oranı ise ile gösterilmektedir. G. Dolayısıyla, alternatif bir özelliğin varyansı, bu özelliğe (P) sahip olan birimlerin oranının, bu özelliğe sahip olmayan birimlerin oranına eşittir. (G). Nüfusun en büyük çeşitliliği, toplam nüfus hacminin %50'sini oluşturan nüfusun bir kısmının bir özelliğe sahip olduğu ve nüfusun yine %50'sine eşit olan diğer bir kısmının bu özelliğe sahip olmadığı durumlarda elde edilir, ve dağılım maksimum 0,25 değerine ulaşır, t.e. P = 0,5, g= 1 - P = 1 - 0,5 = 0,5 ve 02 = 0,5 0,5 = 0,25. Bu göstergenin alt sınırı sıfır olup, toplamda herhangi bir değişimin olmadığı bir duruma karşılık gelmektedir. Alternatif bir özelliğin varyansının pratik uygulaması, güvenilirlik aralığıÖrnek gözlem yaparken.

Nasıl daha az değer varyans ve standart sapma, popülasyon ne kadar homojen ve ortalama o kadar tipik olacaktır. İstatistik uygulamalarında sıklıkla varyasyonları karşılaştırmaya ihtiyaç duyulur. çeşitli işaretler. Örneğin, işçilerin yaşı ve nitelikleri, hizmet süresi ve ücretler, maliyet ve kâr, hizmet süresi ve işgücü verimliliği vb. değişkenleri karşılaştırmak ilginç olabilir. Bu tür karşılaştırmalar için, özelliklerin mutlak değişkenliğine ilişkin göstergeler uygun değildir: Yıllar olarak ifade edilen iş deneyimi değişkenliğini, ruble cinsinden ifade edilen ücretlerdeki değişiklikle karşılaştırmak imkansızdır. Bu tür karşılaştırmaların yanı sıra, farklı aritmetik ortalamalara sahip çeşitli popülasyonlarda aynı özelliğin değişkenliğinin karşılaştırılması için varyasyon göstergeleri kullanılır - salınım katsayısı, doğrusal katsayı uç değerlerin ortalama etrafında ne kadar dalgalandığını gösteren varyasyonlar ve varyasyon katsayısı.

Salınım katsayısı:

Nerede VR - salınım katsayısı değeri; R- varyasyon aralığının değeri; X -

Doğrusal varyasyon katsayısı".

Nerede Vj- doğrusal varyasyon katsayısının değeri; BEN- ortalama doğrusal sapmanın değeri; X - incelenen popülasyon için özelliğin ortalama değeri.

Değişim katsayısı:

Nerede Va - varyasyon değeri katsayısı; a standart sapmanın değeridir; X - incelenen popülasyon için özelliğin ortalama değeri.

Salınım katsayısı, varyasyon aralığının incelenen özelliğin ortalama değerine olan yüzde oranıdır ve doğrusal varyasyon katsayısı, ortalama doğrusal sapmanın incelenen özelliğin ortalama değerine oranıdır ve şu şekilde ifade edilir: yüzde. Değişim katsayısı, incelenen özelliğin standart sapmasının ortalama değerine oranıdır. Yüzde olarak ifade edilen göreceli bir değer olarak varyasyon katsayısı, çeşitli özelliklerin varyasyon derecesini karşılaştırmak için kullanılır. Varyasyon katsayısı kullanılarak istatistiksel bir popülasyonun homojenliği değerlendirilir. Varyasyon katsayısı %33'ün altındaysa incelenen popülasyon homojendir ve varyasyon zayıftır. Varyasyon katsayısı %33'ün üzerindeyse, incelenen popülasyon heterojendir, varyasyon güçlüdür ve ortalama değer atipiktir ve bu popülasyon için genel bir gösterge olarak kullanılamaz. Ek olarak varyasyon katsayıları, farklı popülasyonlardaki bir özelliğin değişkenliğini karşılaştırmak için kullanılır. Örneğin, iki işletmedeki işçilerin hizmet süresindeki farklılığı değerlendirmek. Katsayı değeri ne kadar yüksek olursa, karakteristikteki değişim de o kadar anlamlı olur.

Hesaplanan çeyreklere dayanarak, aşağıdaki formülü kullanarak üç aylık değişimin göreceli göstergesini hesaplamak da mümkündür.

nerede Q 2 Ve

Çeyrekler arası aralık formülle belirlenir

Aşırı değerlerin kullanılmasıyla ilgili dezavantajları önlemek için varyasyon aralığı yerine çeyreklik sapma kullanılır:

Eşit olmayan aralıklı değişim serileri için dağılım yoğunluğu da hesaplanır. Karşılık gelen frekansın veya frekansın aralığın değerine bölümü olarak tanımlanır. Eşit olmayan aralık serilerinde mutlak ve bağıl dağılım yoğunlukları kullanılır. Mutlak dağılım yoğunluğu, aralığın birim uzunluğu başına frekanstır. Bağıl dağıtım yoğunluğu - birim aralık uzunluğu başına frekans.

Yukarıdakilerin tümü, dağıtım kanunu normal dağılım kanunu tarafından iyi tanımlanan veya ona yakın olan dağıtım serileri için doğrudur.

Bir varyasyon serisi kavramı.İstatistiksel gözlem materyallerini sistemleştirmenin ilk adımı, belirli bir özelliğe sahip birimlerin sayısını saymaktır. Birimleri niceliksel özelliklerine göre artan veya azalan şekilde düzenleyerek ve özelliğin belirli bir değerine sahip birimlerin sayısını sayarak bir varyasyon serisi elde ederiz. Bir varyasyon serisi, belirli bir istatistiksel popülasyonun birimlerinin bazı niceliksel özelliklere göre dağılımını karakterize eder.

Varyasyon serisi iki sütundan oluşur; sol sütun, değişken adı verilen ve (x) ile gösterilen değişken özelliğin değerlerini içerir ve sağ sütun, her bir değişkenin kaç kez oluştuğunu gösteren mutlak sayıları içerir. Bu sütundaki göstergelere frekans adı verilir ve (f) ile gösterilir.

Varyasyon serisi şematik olarak Tablo 5.1 şeklinde sunulabilir:

Tablo 5.1

Varyasyon serisinin türü

Seçenekler (x)

Frekanslar (f)

Sağ sütunda, bireysel seçeneklerin sıklığının toplam frekanslar içindeki payını karakterize eden göreceli göstergeler de kullanılabilir. Bu göreceli göstergelere frekanslar denir ve geleneksel olarak ile gösterilir, yani. . Tüm frekansların toplamı bire eşittir. Frekanslar yüzde olarak da ifade edilebilir ve bu durumda toplamları %100'e eşit olacaktır.

Farklı belirtiler olabilir farklı karakter. Bazı özelliklerin çeşitleri tamsayılarla ifade edilir; örneğin bir apartman dairesindeki oda sayısı, yayınlanan kitap sayısı vb. Bu işaretlere süreksiz veya ayrık denir. Diğer özelliklerin varyantları, örneğin planlanan görevlerin uygulanması gibi belirli sınırlar dahilinde herhangi bir değeri alabilir, maaş vb. Bu işaretlere sürekli denir.

Ayrık varyasyon serisi. Varyasyon serisinin varyantları şu şekilde ifade edilirse ayrık miktarlar o zaman böyle bir varyasyon serisine ayrık denir, dış görünüş tabloda sunulmuştur. 5.2:

Tablo 5.2

Öğrencilerin sınav notlarına göre dağılımı

Derecelendirmeler (x)

Öğrenci sayısı (f)

Toplamın yüzdesi olarak ()

Ayrık serilerdeki dağılımın doğası, grafiksel olarak bir dağıtım poligonu şeklinde gösterilmektedir, Şekil 5.1.

Pirinç. 5.1. Öğrencilerin sınavda aldıkları notlara göre dağılımı.

Aralıklı varyasyon serisi. Sürekli özellikler için varyasyon serileri aralıklı seriler olarak oluşturulur; içlerindeki karakteristiğin değerleri “başlangıç ​​ve bitiş” aralıkları şeklinde ifade edilir. Bu durumda, böyle bir aralıktaki özelliğin minimum değerine aralığın alt sınırı, maksimum değeri denir. üst sınır aralık.

Aralıklı değişim serileri, hem süreksiz özellikler (kesikli) hem de geniş bir aralıkta değişen özellikler için oluşturulur. Aralık satırları eşit veya eşit olmayan aralıklarla olabilir. Ekonomik uygulamada, giderek artan veya azalan eşit olmayan aralıkların çoğu kullanılır. Bu ihtiyaç özellikle bir karakteristikteki dalgalanmanın düzensiz ve büyük sınırlar içerisinde meydana geldiği durumlarda ortaya çıkar.

Eşit aralıklı aralık serilerinin türünü tablo olarak ele alalım. 5.3:

Tablo 5.3

İşçilerin üretime göre dağılımı

Çıkış, t.r. (X)

Çalışan sayısı (f)

Kümülatif frekans (f')

Aralık dağılım serisi grafiksel olarak histogram şeklinde gösterilmiştir, Şekil 5.2.

Şekil 5.2. İşçilerin üretime göre dağılımı

Birikmiş (kümülatif) frekans. Uygulamada dağıtım serilerinin dönüşüme ihtiyacı vardır. kümülatif seri, birikmiş frekanslara göre inşa edilmiştir. Onların yardımıyla dağılım serisi verilerinin analizini kolaylaştıran yapısal ortalamaları belirleyebilirsiniz.

Kümülatif frekanslar, dağılım serisinin sonraki gruplarının bu göstergelerinin birinci grubun frekanslarına (veya frekanslarına) sırayla eklenmesiyle belirlenir. Dağıtım serilerini göstermek için kümülatlar ve ojivler kullanılır. Bunları oluşturmak için, ayrık karakteristiklerin değerleri (veya aralıkların uçları) apsis ekseninde işaretlenir ve frekansların kümülatif toplamları (kümülatifler) ordinat ekseninde işaretlenir, Şekil 5.3.

Pirinç. 5.3. İşçilerin üretime göre kümülatif dağılımı

Frekans ve seçenek ölçekleri tersine çevrilirse; apsis ekseni birikmiş frekansları yansıtır ve ordinat ekseni değişkenlerin değerlerini gösterir, daha sonra gruptan gruba frekanslardaki değişimi karakterize eden eğriye dağılım işareti adı verilecektir, Şekil 5.4.

Pirinç. 5.4. İşçilerin üretime göre dağılımının Ogiva'sı

Eşit aralıklarla varyasyon serileri en önemli gereksinimlerden birini sağlar. istatistiksel seri dağıtımların zaman ve mekan açısından karşılaştırılabilirliğini sağlamak.

Dağıtım yoğunluğu. Ancak adı geçen serilerdeki bireysel eşit olmayan aralıkların frekansları doğrudan karşılaştırılamaz. Bu gibi durumlarda gerekli karşılaştırılabilirliği sağlamak için dağıtım yoğunluğu hesaplanır; aralık değeri birimi başına her grupta kaç birim olacağını belirleyin.

Eşit olmayan aralıklarla bir varyasyon serisinin dağılımının bir grafiğini oluştururken, dikdörtgenlerin yüksekliği, frekanslarla değil, ilgili olarak incelenen karakteristik değerlerinin dağılımının yoğunluk göstergeleriyle orantılı olarak belirlenir. aralıklar.

Bir varyasyon serisinin hazırlanması ve grafiksel gösterimi, ilk verilerin işlenmesinde ilk adım ve incelenen popülasyonun analizinde ilk aşamadır. Sonraki adım Değişim serilerinin analizinde serinin özellikleri adı verilen ana genel göstergelerin belirlenmesi yer alır. Bu özellikler, özelliğin popülasyon birimleri arasındaki ortalama değeri hakkında fikir vermelidir.

ortalama değer. Ortalama değer, incelenen popülasyonda incelenen özelliğin genelleştirilmiş bir özelliğidir ve belirli yer ve zaman koşulları altında popülasyonun birimi başına tipik seviyesini yansıtır.

Ortalama değer her zaman adlandırılır ve popülasyonun bireysel birimlerinin karakteristiğiyle aynı boyuta sahiptir.

Ortalama değerleri hesaplamadan önce, niteliksel olarak homojen grupları belirleyerek, incelenen popülasyonun birimlerini gruplandırmak gerekir.

Bir bütün olarak nüfus için hesaplanan ortalamaya genel ortalama ve her grup için grup ortalamaları denir.

İki tür ortalama vardır: güç (aritmetik ortalama, harmonik ortalama, geometrik ortalama, ikinci dereceden ortalama); yapısal (mod, medyan, çeyrekler, ondalıklar).

Hesaplama için ortalamanın seçimi amaca bağlıdır.

Güç ortalamalarının türleri ve hesaplanması için yöntemler.İstatistiksel işleme pratiğinde toplanan malzeme kalkmak çeşitli görevlerçözmek için farklı ortalamalar gerektirir.

Matematiksel istatistikler, güç ortalaması formüllerinden çeşitli ortalamalar elde eder:

ortalama değer nerede; x – bireysel seçenekler (özellik değerleri); z – üs (z = 1 – aritmetik ortalama, z = 0 geometrik ortalama, z = - 1 – harmonik ortalama, z = 2 – kare ortalama).

Ancak, her bir durumda ne tür bir ortalamanın uygulanması gerektiği sorusu şu şekilde çözülmektedir: spesifik analiz incelenen nüfus.

İstatistiklerde en yaygın ortalama türü aritmetik ortalama. Ortalama karakteristik hacminin, incelenen istatistiksel popülasyonun bireysel birimleri için değerlerinin toplamı olarak oluşturulduğu durumlarda hesaplanır.

Kaynak verinin niteliğine bağlı olarak aritmetik ortalama çeşitli yollarla belirlenir:

Verilerin gruplandırılması durumunda hesaplama basit ortalama formülü kullanılarak gerçekleştirilir.

Aritmetik ortalamanın hesaplanması ayrık seri formül 3.4'e göre oluşur.

Bir aralık serisinde aritmetik ortalamanın hesaplanması. Her gruptaki bir özelliğin değerinin geleneksel olarak aralığın ortası olarak alındığı bir aralık varyasyon serisinde, aritmetik ortalama, gruplandırılmamış verilerden hesaplanan ortalamadan farklı olabilir. Ayrıca, gruplardaki aralık ne kadar büyük olursa, gruplandırılmış verilerden hesaplanan ortalamanın, gruplandırılmamış verilerden hesaplanan ortalamadan olası sapmaları da o kadar büyük olur.

Bir aralık değişim serisinin ortalamasını hesaplarken, gerekli hesaplamaları gerçekleştirmek için aralıklardan orta noktalarına doğru hareket edilir. Daha sonra ortalama, ağırlıklı aritmetik ortalama formülü kullanılarak hesaplanır.

Aritmetik ortalamanın özellikleri. Aritmetik ortalamanın hesaplamaları basitleştirmeyi mümkün kılan bazı özellikleri vardır;

1. Sabit sayıların aritmetik ortalaması bu sabit sayıya eşittir.

Eğer x = a. Daha sonra .

2. Tüm seçeneklerin ağırlıkları orantılı olarak değiştirilirse; aynı sayıda artar veya azalırsa yeni serinin aritmetik ortalaması değişmeyecektir.

Tüm f ağırlıkları k kat azaltılırsa, o zaman .

3. Bireysel seçeneklerin ortalamadan pozitif ve negatif sapmalarının toplamı ağırlıklarla çarpılarak sıfıra eşittir, yani.

Eğer öyleyse. Buradan.

Tüm seçenekler herhangi bir sayı kadar azaltılır veya artırılırsa, yeni serinin aritmetik ortalaması aynı miktarda azalacak veya artacaktır.

Tüm seçenekleri azaltalım X Açık A, yani X´ = XA.

Daha sonra

Orijinal serinin aritmetik ortalaması, daha önce seçeneklerden çıkarılan sayının indirgenmiş ortalamaya eklenmesiyle elde edilebilir. A, yani .

5. Tüm seçenekler azaltılır veya artırılırsa k kez yeni serinin aritmetik ortalaması aynı miktarda azalacak veya artacaktır; V k bir kere.

Olsun o zaman .

Dolayısıyla, yani. Orijinal serinin ortalamasını elde etmek için yeni serinin aritmetik ortalaması (azaltılmış seçeneklerle) şu kadar artırılmalıdır: k bir kere.

Harmonik ortalama. Harmonik ortalama aritmetik ortalamanın tersidir. İstatistiksel bilgilerin popülasyonun bireysel değişkenleri için frekansları içermediği ancak bunların ürünü (M = xf) olarak sunulduğu durumlarda kullanılır. Harmonik ortalama formül 3.5 kullanılarak hesaplanacaktır.

Harmonik ortalamanın pratik uygulaması bazı endekslerin, özellikle de fiyat endeksinin hesaplanmasıdır.

Geometrik ortalama. Geometrik ortalama kullanıldığında, bir özelliğin bireysel değerleri, kural olarak, bir dizi dinamikteki her seviyenin önceki seviyesine oran olarak zincir değerleri şeklinde inşa edilen dinamiğin göreceli değerleridir. Dolayısıyla ortalama, ortalama büyüme oranını karakterize eder.

Ortalama geometrik miktar bir özelliğin maksimum ve minimum değerlerinden eşit uzaklıktaki değeri belirlemek için de kullanılır. Örneğin, Sigorta şirketi otomobil sigortası hizmetlerinin sağlanmasına ilişkin sözleşmeler imzalar. Belirli sigortalı olaya bağlı olarak sigorta ödemesi yıllık 10.000 ila 100.000 ABD Doları arasında değişebilir. Sigorta ödemelerinin ortalama tutarı USD olacaktır.

Geometrik ortalama, oranların ortalaması olarak veya dağılım serilerinde kullanılan ve şu şekilde temsil edilen bir miktardır: geometrik ilerleme z = 0 olduğunda. Bu ortalamanın, mutlak farklara değil, iki sayının oranlarına dikkat edildiğinde kullanılması uygundur.

Hesaplama formülleri aşağıdaki gibidir

ortalaması alınan özelliğin değişkenlerinin nerede olduğu; – seçeneklerin çarpımı; F– seçeneklerin sıklığı.

Geometrik ortalama, ortalama yıllık büyüme oranlarının hesaplanmasında kullanılır.

Ortalama kare. Ortalama kare formülü, bir özelliğin bireysel değerlerinin dağılım serisindeki aritmetik ortalama etrafındaki dalgalanma derecesini ölçmek için kullanılır. Bu nedenle, varyasyon göstergelerini hesaplarken, ortalama, bir özelliğin bireysel değerlerinin aritmetik ortalamadan sapmalarının karesinden hesaplanır.

Kök ortalama kare değeri aşağıdaki formül kullanılarak hesaplanır

Ekonomik araştırmalarda, değiştirilmiş ortalama kare, dağılım ve standart sapma gibi bir özelliğin varyasyon göstergelerinin hesaplanmasında yaygın olarak kullanılır.

Çoğunluk kuralı. Güç ortalamaları arasında aşağıdaki ilişki vardır; üs ne kadar büyük olursa, ortalamanın değeri de o kadar büyük olur, Tablo 5.4:

Tablo 5.4

Ortalamalar arasındaki ilişki

z değeri

Ortalamalar arasındaki ilişki

Bu ilişkiye çoğunluk kuralı denir.

Yapısal ortalamalar. Nüfusun yapısını karakterize etmek için yapısal ortalamalar olarak adlandırılabilecek özel göstergeler kullanılır. Bu göstergeler arasında mod, medyan, çeyrekler ve ondalıklar yer alır.

Moda. Mod (Mo), popülasyon birimleri arasında bir özelliğin en sık tekrarlanan değeridir. Mod, teorik dağılım eğrisinin maksimum noktasına karşılık gelen özelliğin değeridir.

Moda, ticari uygulamalarda tüketici talebini incelerken (geniş talep gören kıyafet ve ayakkabıların bedenlerini belirlerken) ve fiyatları kaydederken yaygın olarak kullanılmaktadır. Toplamda birkaç mod olabilir.

Ayrık bir seride modun hesaplanması. Ayrık bir seride mod, en yüksek frekansa sahip değişkendir. Ayrık bir seride bir mod bulmayı düşünelim.

Bir aralık serisinde modun hesaplanması. Bir aralık değişim serisinde mod, yaklaşık olarak modal aralığın merkezi değişkeni olarak kabul edilir; en yüksek frekansa (frekansa) sahip olan aralık. Aralık içinde mod olan özelliğin değerini bulmanız gerekir. Bir aralık serisi için mod aşağıdaki formülle belirlenecektir:

modal aralığın alt sınırı nerede; – modal aralığın değeri; – modal aralığa karşılık gelen frekans; – modal aralıktan önceki frekans; – modal olanı takip eden aralığın frekansı.

Medyan. Medyan (), sıralanan serinin orta biriminin niteliğinin değeridir. Sıralanmış seri, nitelik değerlerinin artan veya azalan sırada yazıldığı seridir. Veya medyan, sıralı bir varyasyon serisinin sayısını iki eşit parçaya bölen bir değerdir: bir parça, ortalama seçenekten daha düşük bir değişen karakteristik değerine sahipken, diğeri daha büyük bir değere sahiptir.

Medyanı bulmak için önce sıra numarasını belirleyin. Bunun için birim sayısı tek ise tüm frekansların toplamına bir eklenir ve her şey ikiye bölünür. Çift sayıda birimde medyan, seri numarası toplam frekans toplamının ikiye bölünmesiyle belirlenen bir birimin niteliğinin değeri olarak bulunur. Medyanın seri numarasını bilerek, biriken frekansları kullanarak değerini bulmak kolaydır.

Ayrık bir seride medyanın hesaplanması.Örneklem anketine göre ailelerin çocuk sayısına göre dağılımına ilişkin veriler elde edildi, tablo. 5.5. Medyanı belirlemek için önce sıra sayısını belirleriz

Bu ailelerde çocuk sayısı 2'ye eşit olduğundan = 2'dir. Yani ailelerin %50'sinde çocuk sayısı 2'yi geçmemektedir.

– medyan aralıktan önceki birikmiş frekans;

Bir yandan bu çok olumlu bir özellik çünkü bu durumda, incelenen nüfusun tüm birimlerini etkileyen tüm nedenlerin etkisi dikkate alınır. Öte yandan, kaynak verilere tesadüfen dahil edilen tek bir gözlem bile, incelenen özelliğin incelenen popülasyonda (özellikle kısa serilerde) gelişim düzeyi fikrini önemli ölçüde bozabilir.

Çeyrekler ve ondalıklar. Varyasyon serisindeki medyanı bulmaya benzer şekilde, sıralanan serinin herhangi bir birimi için bir özelliğin değerini bulabilirsiniz. Yani özellikle bir seriyi 4 eşit parçaya, 10'a vb. bölen birimlere ilişkin özelliğin değerini bulabilirsiniz.

Çeyrekler. Sıralanan seriyi dört eşit parçaya bölen seçeneklere çeyrekler denir.

Bu durumda, şunları ayırt ederler: alt (veya ilk) çeyrek (Q1) - sıralanmış serinin bir birimi için özelliğin değeri, nüfusu ¼ ila ¾ oranında böler ve üst (veya üçüncü) çeyrek ( S3) - sıralanmış serinin birimi için özelliğin değeri, popülasyonu ¾ ila ¼ oranında böler.

– çeyrek aralıkların frekansları (alt ve üst)

Q1 ve Q3'ü içeren aralıklar, biriken frekanslar (veya frekanslar) tarafından belirlenir.

Desil.Çeyreklere ek olarak, sıralanan seriyi 10 eşit parçaya bölen seçenekler olan ondalıklar da hesaplanır.

Bunlar D ile gösterilir, ilk ondalık D1 seriyi 1/10 ve 9/10, ikinci D2 - 2/10 ve 8/10 vb. oranında böler. Medyan ve çeyreklerle aynı şemaya göre hesaplanırlar.

Hem medyan, hem çeyrekler, hem de ondalıklar, sıralı serilerde belirli bir sıra yerini işgal eden bir seçenek olarak anlaşılan sıralı istatistiklere aittir.

​ Varyasyon serisi - karşılaştırılan bir seri (artış veya azalma derecesine göre) seçenekler ve karşılık gelen frekanslar

Seçenekler, bir özelliğin bireysel niceliksel ifadeleridir. Latin harfiyle gösterilir V . “Varyant” kavramının klasik anlayışında, tekrar sayısı dikkate alınmaksızın, bir özelliğin kendine özgü her değerinin bir varyant olarak adlandırıldığı varsayılmaktadır.

Örneğin, on hastada ölçülen sistolik kan basıncı göstergelerinin varyasyon serisinde:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Yalnızca 6 değer mevcuttur:

110, 120, 130, 140, 160, 170.

Frekans, bir seçeneğin kaç kez tekrarlandığını gösteren bir sayıdır. Latin harfiyle gösterilir P . Tüm frekansların toplamı (elbette incelenenlerin sayısına eşittir) şu şekilde gösterilir: N.

    Örneğimizde frekanslar aşağıdaki değerleri alacaktır:
  • seçenek 110 için frekans P = 1 (110 değeri bir hastada oluşur),
  • seçenek 120 için sıklık P = 2 (120 değeri iki hastada ortaya çıkar),
  • seçenek 130 için frekans P = 3 (130 değeri üç hastada ortaya çıkar),
  • seçenek 140 için frekans P = 2 (140 değeri iki hastada ortaya çıkar),
  • seçenek 160 için frekans P = 1 (160 değeri bir hastada oluşur),
  • seçenek 170 için frekans P = 1 (170 değeri bir hastada oluşur),

Varyasyon serisi türleri:

  1. basit- bu, her seçeneğin yalnızca bir kez gerçekleştiği bir seridir (tüm frekanslar 1'e eşittir);
  2. askıya alınmış- bir veya daha fazla seçeneğin birden fazla kez göründüğü bir seri.

Varyasyon serisi, büyük sayı dizilerini tanımlamak için kullanılır; çoğu tıbbi çalışmanın toplanan verileri başlangıçta bu biçimde sunulur. Varyasyon serisini karakterize etmek için, ortalama değerler, değişkenlik göstergeleri (sözde dağılım) ve örnek verilerin temsil edilebilirliğine ilişkin göstergeler dahil olmak üzere özel göstergeler hesaplanır.

Varyasyon serisi göstergeleri

1) Aritmetik ortalama, incelenen özelliğin boyutunu karakterize eden genel bir göstergedir. Aritmetik ortalama şu şekilde gösterilir: M , en yaygın ortalama türüdür. Aritmetik ortalama, tüm gözlem birimlerinin gösterge değerlerinin toplamının çalışılan tüm konuların sayısına oranı olarak hesaplanır. Aritmetik ortalamayı hesaplama yöntemi, basit ve ağırlıklı varyasyon serileri için farklılık gösterir.

Hesaplama formülü basit aritmetik ortalama:

Hesaplama formülü ağırlıklı aritmetik ortalama:

M = Σ(V * P)/ n

​ 2) Mod, en sık tekrarlanan seçeneğe karşılık gelen varyasyon serisinin başka bir ortalama değeridir. Veya başka bir deyişle en yüksek frekansa karşılık gelen seçenektir. Olarak gösterilir Ay . Mod yalnızca ağırlıklı seriler için hesaplanır, çünkü basit satırlar seçeneklerin hiçbiri tekrarlanmaz ve tüm frekanslar bire eşittir.

Örneğin, kalp atış hızı değerlerinin varyasyon serisinde:

80, 84, 84, 86, 86, 86, 90, 94;

mod değeri 86 olup bu seçenek 3 kez geçtiğinden frekansı en yüksektir.

3) Medyan - varyasyon serisini ikiye bölen seçeneğin değeri: her iki tarafında da eşit sayıda seçenek vardır. Medyan, aritmetik ortalama ve mod gibi ortalama değerleri ifade eder. Olarak gösterilir Ben

4) Standart sapma (eş anlamlı: standart sapma, sigma sapması, sigma) - varyasyon serisinin değişkenliğinin bir ölçüsü. Ortalamadan tüm sapma durumlarını birleştiren ayrılmaz bir göstergedir. Aslında şu soruyu yanıtlıyor: Değişkenler aritmetik ortalamadan ne kadar uzağa ve ne sıklıkta yayılır? Yunan harfiyle gösterilir σ ("sigma").

Popülasyon büyüklüğü 30 birimden fazla ise standart sapma aşağıdaki formül kullanılarak hesaplanır:

Küçük popülasyonlar için (30 gözlem birimi veya daha az) standart sapma farklı bir formül kullanılarak hesaplanır:

Varyasyon serisi: tanımı, türleri, ana özellikleri. Hesaplama yöntemi
Tıbbi ve istatistiksel araştırmalarda mod, medyan, aritmetik ortalama
(koşullu bir örnekle gösterin).

Bir varyasyon serisi, incelenen özelliğin, büyüklük bakımından birbirinden farklı olan ve belirli bir sırayla (artan veya azalan sırada) düzenlenmiş bir dizi sayısal değeridir. Bir serinin her sayısal değerine değişken (V) adı verilir ve belirli bir değişkenin belirli bir seride ne sıklıkta ortaya çıktığını gösteren sayılara frekans (p) adı verilir.

Varyasyon serisini oluşturan gözlem durumlarının toplam sayısı n harfiyle gösterilir. İncelenen özelliklerin anlamındaki farklılığa varyasyon denir. Değişken bir özelliğin niceliksel bir ölçüsü yoksa, varyasyona niteliksel, dağılım serisine ise atıfsal denir (örneğin, hastalık sonucuna, sağlık durumuna vb. göre dağılım).

Değişen bir özelliğin niceliksel bir ifadesi varsa, bu tür bir değişime niceliksel, dağılım serisine ise varyasyonel denir.

Varyasyon serileri, niceliksel özelliğin doğasına göre süreksiz ve sürekli; varyantın ortaya çıkma sıklığına göre basit ve ağırlıklı olarak ikiye ayrılır.

Basit varyasyon serisinde her seçenek yalnızca bir kez (p=1), ağırlıklı seride aynı seçenek birkaç kez (p>1) ortaya çıkar. Bu tür serilerin örnekleri metinde daha ayrıntılı olarak ele alınacaktır. Kantitatif karakteristik sürekli ise; Tamsayı büyüklükler arasında ara kesirli büyüklükler vardır; varyasyon serisine sürekli denir.

Örneğin: 10,0 – 11,9

14.0 – 15.9 vb.

Kantitatif karakteristik süreksiz ise; bireysel değerleri (varyantları) birbirinden bir tam sayı ile farklılık gösterir ve ara kesirli değerlere sahip değildir; varyasyon serisine süreksiz veya ayrık denir.

Önceki örnekteki kalp atış hızı verilerini kullanma

21 öğrenci için bir varyasyon serisi oluşturacağız (Tablo 1).

tablo 1

Tıp öğrencilerinin kalp atış hızına (bpm) göre dağılımı

Dolayısıyla bir varyasyon serisi oluşturmak, mevcut sayısal değerler(seçenekler) sistematize edin, organize edin, yani. karşılık gelen frekanslarıyla belirli bir sırayla (artan veya azalan sırada) düzenleyin. Söz konusu örnekte, seçenekler artan sırada düzenlenmiştir ve tamsayı süreksiz (ayrık) sayılar olarak ifade edilmiştir; her seçenek birkaç kez meydana gelir; ağırlıklı, süreksiz veya ayrık bir varyasyon serisiyle uğraşıyoruz.

Kural olarak, incelediğimiz istatistiksel popülasyondaki gözlem sayısı 30'u geçmiyorsa, incelenen özelliğin tüm değerlerini Tablo'da olduğu gibi artan bir varyasyon serisinde düzenlemek yeterlidir. 1 veya azalan sırada.

Çok sayıda gözlemle (n>30), ortaya çıkan değişkenlerin sayısı çok büyük olabilir; bu durumda, sonraki işlemleri basitleştirmek ve dağılımın doğasını açıklığa kavuşturmak için bir aralık veya gruplandırılmış varyasyon serisi derlenir, varyantlar gruplar halinde birleştirilir.

Tipik olarak grup seçeneklerinin sayısı 8 ila 15 arasında değişir.

En az 5 tane olmalı çünkü... aksi takdirde çok kaba ve aşırı genişleme olur, bu da genel varyasyon tablosunu bozar ve ortalama değerlerin doğruluğunu büyük ölçüde etkiler. Grup varyantlarının sayısı 20-25'ten fazla olduğunda, ortalama değerlerin hesaplanmasının doğruluğu artar, ancak karakteristik varyasyonun özellikleri önemli ölçüde bozulur ve matematiksel işlem daha karmaşık hale gelir.

Gruplandırılmış bir seriyi derlerken dikkate almak gerekir

- Seçenek grupları belirli bir sıraya göre düzenlenmelidir (artan veya azalan);

− seçenek gruplarındaki aralıklar aynı olmalıdır;

− aralık sınırlarının değerleri çakışmamalıdır çünkü bireysel değişkenlerin hangi gruplara sınıflandırılacağı belirsiz olacaktır;

- Aralık sınırlarını belirlerken toplanan materyalin niteliksel özelliklerinin dikkate alınması gerekir (örneğin, yetişkinlerin ağırlığını incelerken 3-4 kg'lık bir aralık kabul edilebilir ve yaşamın ilk aylarındaki çocuklar için bu kabul edilebilir) 100 g'ı geçmemelidir)

Sınavdan önce 55 tıp öğrencisi için nabız hızına (dakikadaki atış sayısı) ilişkin verileri karakterize eden gruplandırılmış (aralıklı) bir seri oluşturalım: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Gruplandırılmış bir seri oluşturmak için ihtiyacınız olan:

1. Aralığın boyutunu belirleyin;

2. Varyasyon serisindeki grupların ortasını, başlangıcını ve sonunu belirleyin.

● Aralığın boyutu (i), özel bir tabloya göre gözlem sayısına (n) bağlı olarak belirlenen varsayılan grupların (r) sayısına göre belirlenir.

Gözlem sayısına bağlı olarak grup sayısı:

Bizim durumumuzda 55 öğrenci için 8 ila 10 grup oluşturabilirsiniz.

(i) aralığının değeri aşağıdaki formülle belirlenir -

i = V maks-V min/dev

Örneğimizde aralığın değeri 82-58/8= 3'tür.

Aralık değeri ise kesirli bir sayı sonuç tam sayıya yuvarlanmalıdır.

Birkaç tür ortalama vardır:

● aritmetik ortalama,

● geometrik ortalama,

● harmonik ortalama,

● ortalamanın karekökü,

● ortalama ilerici,

● medyan

İÇİNDE tıbbi istatistikler Aritmetik ortalamalar en sık kullanılır.

Aritmetik ortalama (M), tüm popülasyon için neyin tipik olduğunu belirleyen genelleştirici bir değerdir. M'yi hesaplamanın ana yöntemleri şunlardır: aritmetik ortalama yöntemi ve momentler yöntemi (koşullu sapmalar).

Aritmetik ortalama yöntemi, basit aritmetik ortalamayı ve ağırlıklı aritmetik ortalamayı hesaplamak için kullanılır. Aritmetik ortalamanın hesaplanmasında kullanılacak yöntemin seçimi, varyasyon serisinin türüne bağlıdır. Her seçeneğin yalnızca bir kez gerçekleştiği basit bir varyasyon serisi durumunda, basit aritmetik ortalama aşağıdaki formülle belirlenir:

burada: M – aritmetik ortalama değer;

V – değişen özelliğin değeri (varyantlar);

Σ – eylemi – toplamı gösterir;

n – toplam gözlem sayısı.

Basit aritmetik ortalamanın hesaplanmasına bir örnek. 35 yaşındaki 9 erkekte solunum hızı (dakikadaki solunum hareketi sayısı): 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 yaşındaki erkeklerde ortalama solunum hızı seviyesini belirlemek için gereklidir:

1. Tüm seçenekleri artan veya azalan sırada düzenleyerek bir varyasyon serisi oluşturun. Basit bir varyasyon serisi elde ettik çünkü. seçenek değerleri yalnızca bir kez oluşur.

M = ∑V/n = 171/9 = Dakikada 19 nefes

Çözüm. 35 yaşındaki erkeklerde solunum sayısı ortalama 19'dur. nefes hareketleri Bir dakika içinde.

Bir varyantın bireysel değerleri tekrarlanıyorsa, her bir varyantı bir satırda yazmaya gerek yoktur; varyantın ortaya çıkan boyutlarını (V) listelemek ve yanında tekrar sayısını belirtmek yeterlidir (p). ). Seçeneklerin kendilerine karşılık gelen frekans sayısına göre ağırlıklandırıldığı böyle bir varyasyon serisine ağırlıklı varyasyon serisi denir ve hesaplanan ortalama değer, ağırlıklı aritmetik ortalamadır.

Ağırlıklı aritmetik ortalama şu formülle belirlenir: M= ∑Vp/n

burada n gözlem sayısıdır, toplamına eşit frekanslar – Σр.

Aritmetik ağırlıklı ortalamanın hesaplanmasına bir örnek.

Bu yılın ilk çeyreğinde yerel bir doktor tarafından tedavi edilen 35 akut solunum yolu hastalığı (ARI) hastasının sakatlık süresi (gün olarak): 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 gün .

Akut solunum yolu enfeksiyonu olan hastalarda ortalama sakatlık süresinin belirlenmesine yönelik yöntem aşağıdaki gibidir:

1. Ağırlıklandırılmış bir varyasyon serisi oluşturalım çünkü Seçeneğin bireysel değerleri birkaç kez tekrarlanır. Bunu yapmak için, tüm seçenekleri ilgili frekanslarına göre artan veya azalan sırada düzenleyebilirsiniz.

Bizim durumumuzda seçenekler artan sırada düzenlenmiştir.

2. Aşağıdaki formülü kullanarak aritmetik ağırlıklı ortalamayı hesaplayın: M = ∑Vp/n = 233/35 = 6,7 gün

Akut solunum yolu enfeksiyonu geçiren hastaların sakatlık sürelerine göre dağılımı:

Sakatlık süresi (V) Hasta sayısı (p) Başkan Yardımcısı
∑p = n = 35 ∑Vp = 233

Çözüm. Akut solunum yolu hastalığı olan hastalarda sakatlık süresi ortalama 6,7 ​​gündü.

Mod (Mo), varyasyon serisindeki en yaygın seçenektir. Tabloda sunulan dağılım için mod, 10'a eşit bir seçeneğe karşılık gelir; diğerlerinden daha sık görülür - 6 kez.

Hastaların hastane yatağında kalış süresine göre dağılımı (gün olarak)

V
P

Bazen bir modun kesin büyüklüğünü belirlemek zordur çünkü incelenen verilerde birkaç "en yaygın" gözlem bulunabilir.

Medyan (Me), bir varyasyon serisini iki eşit yarıya bölen parametrik olmayan bir göstergedir: medyanın her iki yanında aynı sayıda varyant bulunur.

Örneğin tabloda gösterilen dağılım için medyan 10'dur çünkü bu değerin her iki tarafında da 14 seçenek vardır; 10 numara işgal ediyor merkezi konum bu seride medyanıdır.

Bu örnekteki gözlem sayısının çift olduğu (n=34) dikkate alındığında medyan şu şekilde belirlenebilir:

Ben = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Bu, serinin ortasının 10'a eşit bir medyana karşılık gelen on yedinci seçeneğe denk geldiği anlamına gelir. Tabloda sunulan dağılım için aritmetik ortalama şuna eşittir:

M = ∑Vp/n = 334/34 = 10,1

Yani tablodan 34 gözlem için. Şekil 8'de şunu elde ettik: Mo=10, Me=10, aritmetik ortalama (M) 10,1'dir. Örneğimizde, tamamen farklı olmalarına rağmen üç göstergenin de birbirine eşit veya yakın olduğu ortaya çıktı.

Aritmetik ortalama, tüm etkilerin sonuçta ortaya çıkan toplamıdır; belirli bir fenomen veya popülasyon için genellikle atipik olan aşırı olanlar da dahil olmak üzere istisnasız tüm seçenekler, oluşumunda yer alır.

Mod ve medyan, aritmetik ortalamanın aksine, değişen karakteristiklerin tüm bireysel değerlerinin değerine (aşırı değişkenlerin değerleri ve serinin dağılım derecesi) bağlı değildir. Aritmetik ortalama tüm gözlem kütlesini karakterize eder, mod ve medyan ise kütleyi karakterize eder

İstatistiksel analizde özel bir yer, incelenen özelliğin veya olgunun ortalama düzeyinin belirlenmesine aittir. Bir özelliğin ortalama düzeyi ortalama değerlerle ölçülür.

Ortalama değer, incelenen özelliğin genel niceliksel düzeyini karakterize eder ve istatistiksel popülasyonun bir grup özelliğidir. Bireysel gözlemlerin bir yöndeki rastgele sapmalarını dengeler, zayıflatır ve incelenen özelliğin ana, tipik özelliğini vurgular.

Ortalamalar yaygın olarak kullanılır:

1. Nüfusun sağlık durumunu değerlendirmek: fiziksel gelişim özellikleri (boy, kilo, çevre) göğüs vb.), yaygınlık ve sürenin belirlenmesi çeşitli hastalıklar, analiz demografik göstergeler(doğal nüfus hareketi, ortalama yaşam beklentisi, nüfusun yeniden üretimi, ortalama nüfus büyüklüğü vb.).

2. Sağlık kurumlarının faaliyetlerini incelemek, sağlık personeli ve çalışmalarının kalitesini değerlendirmek, nüfusun ihtiyaçlarını planlamak ve belirlemek çeşitli türler Tıbbi bakım(Yıllık kişi başına ortalama talep veya ziyaret sayısı, ortalama süre hastanın hastanede kalışı, ortalama süre hastanın muayenesi, doktorların ortalama mevcudiyeti, yataklar vb.).

3. Sıhhi ve epidemiyolojik durumu karakterize etmek (atölyedeki ortalama hava tozu içeriği, kişi başına düşen ortalama alan, ortalama protein, yağ ve karbonhidrat tüketimi vb.).

4. Laboratuvar verilerini işlerken normal ve patolojik durumlarda tıbbi ve fizyolojik göstergeleri belirlemek, sonuçların güvenilirliğini sağlamak örnek anket sosyal ve hijyenik, klinik, deneysel çalışmalarda.

Ortalama değerlerin hesaplanması varyasyon serileri esas alınarak yapılır. Varyasyon serisi bireysel birimleri incelenen özellik veya olgunun niceliksel farklılıklarını karakterize eden niteliksel olarak homojen bir istatistiksel kümedir.

Niceliksel değişim iki türde olabilir: süreksiz (kesikli) ve sürekli.

Süreksiz (ayrık) bir nitelik yalnızca bir tamsayı olarak ifade edilir ve herhangi bir ara değere sahip olamaz (örneğin, ziyaret sayısı, sitenin nüfusu, ailedeki çocuk sayısı, hastalığın puan cinsinden şiddeti) , vesaire.).

Sürekli bir özellik, kesirli olanlar da dahil olmak üzere belirli sınırlar dahilinde herhangi bir değer alabilir ve yalnızca yaklaşık olarak ifade edilir (örneğin, ağırlık - yetişkinler için kilogramla ve yeni doğanlar için - gramla sınırlı olabilir; boy, atardamar basıncı, hastayı görmek için harcanan zaman vb.).



Varyasyon serisinde yer alan her bir özelliğin veya olgunun dijital değeri, değişken olarak adlandırılır ve harfle gösterilir. V . Matematik literatüründe başka gösterimler de bulunur; örneğin X veya y.

Her seçeneğin bir kez belirtildiği varyasyon serisine basit denir. Bu tür seriler, bilgisayar veri işleme durumunda çoğu istatistiksel problemde kullanılır.

Gözlem sayısı arttıkça tekrarlanan değişken değerler ortaya çıkma eğilimi gösterir. Bu durumda oluşturulur gruplandırılmış varyasyon serisi tekrar sayısının belirtildiği yer (frekans, “harfiyle gösterilir) R »).

Sıralanmış varyasyon serisi artan veya azalan sırada düzenlenmiş seçeneklerden oluşur. Hem basit hem de gruplandırılmış seriler sıralama ile derlenebilir.

Aralıklı varyasyon serisiÇok sayıda gözlem birimi (1000'den fazla) ile bilgisayar kullanılmadan gerçekleştirilen sonraki hesaplamaları basitleştirmek için derlenmiştir.

Sürekli varyasyon serisi herhangi bir değer olabilen seçenek değerlerini içerir.

Bir varyasyon serisinde, bir özelliğin (varyantların) değerleri bireysel spesifik sayılar biçiminde verilmişse, böyle bir seriye denir. ayrık.

Genel özellikleri varyasyon serisine yansıyan karakteristik değerleri ortalama değerlerdir. Bunlardan en çok kullanılanı: aritmetik ortalama değeri M, moda Ay ve medyan Ben. Bu özelliklerin her biri benzersizdir. Birbirlerinin yerini alamazlar ve yalnızca birlikte varyasyon serisinin özelliklerini oldukça eksiksiz ve yoğunlaştırılmış bir biçimde temsil ederler.

Moda (Mo) en sık tekrarlanan seçeneklerin değerini adlandırın.

Medyan (Ben) – bu, sıralanmış varyasyon serisini ikiye bölen seçeneğin değeridir (medyanın her iki yanında seçeneğin yarısı vardır). Nadir durumlarda, simetrik bir varyasyon serisi olduğunda, mod ve medyan birbirine eşit olur ve aritmetik ortalamanın değeriyle çakışır.

En tipik karakteristik değer seçeneği aritmetik ortalama değer( M ). Matematiksel literatürde belirtilir .

Aritmetik ortalama (M, ) niteliksel olarak homojen bir istatistiksel popülasyon oluşturan, incelenen fenomenin belirli bir özelliğinin genel niceliksel bir özelliğidir. Basit ve ağırlıklı aritmetik ortalamalar vardır. Basit aritmetik ortalama, basit bir varyasyon serisi için tüm seçeneklerin toplanması ve bu toplamın şu sayıya bölünmesiyle hesaplanır: Toplam Bu varyasyon serisine dahil olan seçenek. Hesaplamalar aşağıdaki formüle göre yapılır:

,

Nerede: M - basit aritmetik ortalama;

Σ V - miktar seçeneği;

N- gözlem sayısı.

Gruplandırılmış varyasyon serilerinde ağırlıklı aritmetik ortalama belirlenir. Bunu hesaplamak için formül:

,

Nerede: M - aritmetik ağırlıklı ortalama;

Σ Başkan Yardımcısı - varyantın ürünlerinin frekanslarına göre toplamı;

N- gözlem sayısı.

Çok sayıda gözlemin olduğu manuel hesaplamalarda momentler yöntemi kullanılabilir.

Aritmetik ortalama aşağıdaki özelliklere sahiptir:

· ortalamadan sapmaların toplamı ( Σ D ) sıfıra eşittir (bkz. Tablo 15);

· tüm seçenekleri aynı faktör (bölen) ile çarparken (bölerken), aritmetik ortalama aynı faktör (bölen) ile çarpılır (bölülür);

· tüm seçeneklere aynı sayıyı eklerseniz (çıkarırsanız), aritmetik ortalama aynı sayı kadar artar (azalır).

Hesaplandığı serinin değişkenliği dikkate alınmadan tek başına alınan aritmetik ortalamalar, özellikle diğer ortalamalarla karşılaştırmanın gerekli olduğu durumlarda, varyasyon serisinin özelliklerini tam olarak yansıtmayabilir. Değere yakın ortalamalar serilerden elde edilebilir. değişen dereceler saçılma. Bireysel seçenekler niceliksel özellikleri bakımından birbirine ne kadar yakınsa, o kadar az dağılım (salınım, değişkenlik) serisi, ortalaması ne kadar tipik olursa.

Bir özelliğin değişkenliğini değerlendirmemize olanak sağlayan ana parametreler şunlardır:

· Kapsam;

· Genlik;

· Standart sapma;

· Değişim katsayısı.

Bir özelliğin değişkenliği, varyasyon serisinin aralığı ve genliği ile yaklaşık olarak değerlendirilebilir. Aralık, serideki maksimum (V maks) ve minimum (V min) seçeneklerini gösterir. Genlik (A m) bu seçenekler arasındaki farktır: A m = V max - V min.

Bir varyasyon serisinin değişkenliğinin genel olarak kabul edilen ana ölçüsü şudur: dağılım (D ). Ancak en sık kullanılanı, dağılım temelinde hesaplanan daha uygun bir parametredir - standart sapma ( σ ). Sapmanın büyüklüğünü dikkate alır ( D ) her varyasyon serisinin aritmetik ortalamasından ( d=V-M ).

Ortalamadan sapmalar pozitif ve negatif olabileceğinden toplandığında “0” (S) değerini verir. d=0). Bunu önlemek için sapma değerleri ( D) ikinci kuvvete yükseltilir ve ortalaması alınır. Dolayısıyla bir varyasyon serisinin dağılımı, bir varyantın aritmetik ortalamadan sapmalarının ortalama karesidir ve aşağıdaki formülle hesaplanır:

.

O olur en önemli özellik değişkenlik ve birçok istatistiksel testi hesaplamak için kullanılır.

Dağılım sapmaların karesi olarak ifade edildiğinden değeri aritmetik ortalamayla karşılaştırılarak kullanılamaz. Bu amaçlar için kullanılır standart sapma, “Sigma” işaretiyle gösterilir ( σ ). Bir varyasyon serisinin tüm varyantlarının aritmetik ortalama değerinden ortalama sapmasını, ortalama değerin kendisiyle aynı birimlerde karakterize eder, böylece birlikte kullanılabilirler.

Standart sapma aşağıdaki formülle belirlenir:

Belirtilen formül, gözlem sayısı ( N ) 30'dan fazla. Daha küçük bir sayı ile N standart sapma değerinde matematiksel sapmayla ilişkili bir hata olacaktır ( N -1). Bu bağlamda, standart sapmanın hesaplanmasına yönelik formüldeki bu tür bir önyargı dikkate alınarak daha doğru bir sonuç elde edilebilir:

standart sapma (S ) bir rastgele değişkenin standart sapmasının bir tahminidir X onunla ilgili matematiksel beklenti varyansının tarafsız bir tahminine dayanmaktadır.

Değerlerle N > 30 standart sapma ( σ ) ve standart sapma ( S ) aynı olacak ( σ =s ). Bu nedenle çoğu pratik kılavuzda bu kriterlerin farklı anlamlara sahip olduğu düşünülmektedir.İÇİNDE Excel programı standart sapmanın hesaplanması =STDEV(aralık) fonksiyonuyla yapılabilir. Standart sapmayı hesaplamak için uygun bir formül oluşturmanız gerekir.

Ortalama kare veya standart sapma, bir özelliğin değerlerinin ortalama değerden ne kadar farklı olabileceğini belirlemenizi sağlar. Yaz aylarında günlük ortalama sıcaklığın aynı olduğu iki şehir olduğunu varsayalım. Bu şehirlerden biri sahilde, diğeri ise kıtada yer alıyor. Sahilde yer alan şehirlerde gündüz sıcaklık farklarının iç kesimlerdeki şehirlere göre daha az olduğu biliniyor. Dolayısıyla kıyı kenti için gündüz sıcaklıklarının standart sapması ikinci kente göre daha az olacaktır. Uygulamada bu, her bir odanın ortalama hava sıcaklığının belirli gün Kıtada yer alan bir şehirde, kıyıdaki bir şehre göre ortalamadan daha fazla farklılık gösterecektir. Ek olarak standart sapma, ortalamadan olası sıcaklık sapmalarını gerekli olasılık düzeyiyle değerlendirmenize olanak tanır.

Olasılık teorisine göre normal dağılım yasasına uyan olaylarda aritmetik ortalama, standart sapma ve seçenekler değerleri arasında sıkı bir ilişki vardır ( üç sigma kuralı). Örneğin değişken bir karakteristiğin değerlerinin %68,3'ü M±1 dahilindedir σ , %95,5 - M ± 2 dahilinde σ ve %99,7 - M ± 3 dahilinde σ .

Standart sapmanın değeri, varyasyon serisinin ve çalışma grubunun homojenliğinin doğasını yargılamamızı sağlar. Standart sapmanın değeri küçükse, bu, incelenen olgunun oldukça yüksek bir homojenliğini gösterir. Bu durumda aritmetik ortalamanın belirli bir varyasyon serisi için oldukça karakteristik olduğu düşünülmelidir. Ancak sigma değerinin çok küçük olması, gözlemlerin yapay olarak seçilmesini düşündürür. Çok büyük bir sigma ile aritmetik ortalama, varyasyon serisini daha az ölçüde karakterize eder; bu, incelenen özelliğin veya olgunun önemli değişkenliğini veya incelenen grubun heterojenliğini gösterir. Ancak standart sapma değerinin karşılaştırılması yalnızca aynı boyuttaki özellikler için mümkündür. Nitekim yeni doğan çocuk ve yetişkinlerin ağırlık çeşitliliğini karşılaştırırsak yetişkinlerde her zaman daha yüksek sigma değerleri elde ederiz.

Farklı boyutlardaki özelliklerin değişkenliğinin karşılaştırılması aşağıdakiler kullanılarak yapılabilir: varyasyon katsayısı. Çeşitliliği ortalamanın yüzdesi olarak ifade eder ve farklı özellikler arasında karşılaştırma yapılmasına olanak tanır. Tıp literatüründeki varyasyon katsayısı “işaretiyle belirtilmektedir. İLE "ve matematiksel olarak" v"ve aşağıdaki formülle hesaplanır:

.

Değişim katsayısının %10'dan az değerleri, aritmetik ortalama etrafında güçlü saçılma hakkında, %10'dan %20'ye kadar - yaklaşık ortalama, %20'den fazla - küçük saçılmayı gösterir.

Aritmetik ortalama genellikle örnek bir popülasyondan elde edilen verilere dayanarak hesaplanır. Tekrarlanan çalışmalarla rastgele olayların etkisi altında aritmetik ortalama değişebilir. Bunun nedeni, kural olarak olası gözlem birimlerinin yalnızca bir kısmının, yani örnek popülasyonun çalışılmasıdır. İncelenen olayı temsil eden tüm olası birimler hakkında bilgi, olayın tamamının incelenmesiyle elde edilebilir. nüfus ki bu her zaman mümkün değildir. Aynı zamanda deneysel verilerin genelleştirilmesi amacıyla genel popülasyondaki ortalamanın değeri ilgi çekicidir. Bu nedenle, incelenen olgu hakkında genel bir sonuç formüle etmek için, örneklem popülasyonu bazında elde edilen sonuçların istatistiksel yöntemler kullanılarak genel popülasyona aktarılması gerekir.

Bir örneklem çalışması ile genel popülasyon arasındaki uyumun derecesini belirlemek için, örneklem gözlemi sırasında kaçınılmaz olarak ortaya çıkan hatanın büyüklüğünü tahmin etmek gerekir. Bu hatanın adı " Temsil edilebilirlik hatası"veya"Aritmetik ortalamanın ortalama hatası." Aslında örneklemden elde edilen ortalamalar arasındaki farktır. istatistiksel gözlem ve aynı nesnenin sürekli incelenmesi sırasında elde edilecek benzer değerler, yani. genel bir popülasyonu incelerken. Örneklem ortalaması rastgele bir değişken olduğundan, böyle bir tahmin araştırmacı için kabul edilebilir bir olasılık düzeyiyle gerçekleştirilir. İÇİNDE tıbbi araştırma en az %95'tir.

Temsil hatası, deney sırasında kullanılan uygun yöntem ve araçlarla en aza indirilmesi gereken kayıt hataları veya dikkat hatalarıyla (kayma, yanlış hesaplama, yazım hatası vb.) karıştırılamaz.

Temsil edilebilirlik hatasının büyüklüğü hem örneklem büyüklüğüne hem de özelliğin değişkenliğine bağlıdır. Nasıl daha büyük sayı gözlemler, numune popülasyona ne kadar yakınsa ve hata o kadar küçükse. İşaret ne kadar değişken olursa istatistiksel hata da o kadar büyük olur.

Pratikte varyasyon serilerindeki temsiliyet hatasını belirlemek için aşağıdaki formül kullanılır:

,

Nerede: M – temsil hatası;

σ - standart sapma;

N– numunedeki gözlem sayısı.

Formülden, boyutun açık olduğu açıktır. ortalama hata standart sapmayla, yani incelenen özelliğin değişkenliğiyle doğru orantılıdır ve gözlem sayısının kareköküyle ters orantılıdır.

Göreceli değerlerin hesaplanmasına dayalı istatistiksel analiz yapılırken bir varyasyon serisi oluşturmaya gerek yoktur. Bu durumda, göreceli göstergeler için ortalama hatanın belirlenmesi basitleştirilmiş bir formül kullanılarak gerçekleştirilebilir:

,

Nerede: R- yüzde, ppm vb. olarak ifade edilen ilgili göstergenin değeri;

Q- P'nin karşılığı ve göstergenin hesaplandığı esasa bağlı olarak (1-P), (100-P), (1000-P), vb. olarak ifade edilir;

N– örnek popülasyondaki gözlem sayısı.

Bununla birlikte, göreceli değerler için temsiliyet hatasını hesaplamak için belirtilen formül, yalnızca göstergenin değeri tabanından küçük olduğunda uygulanabilir. Yoğun göstergelerin hesaplandığı bazı durumlarda bu koşul karşılanmaz ve gösterge %100 veya %1000'den fazla bir sayı olarak ifade edilebilir. Böyle bir durumda bir varyasyon serisi oluşturulur ve standart sapmaya dayalı ortalama değerler formülü kullanılarak temsil hatası hesaplanır.

Popülasyondaki aritmetik ortalamanın değerinin tahmin edilmesi, minimum ve maksimum olmak üzere iki değer belirtilerek gerçekleştirilir. Bu ekstrem değerler olası sapmalar Popülasyonun istenilen ortalama değerinin dalgalanabileceği durumlara “ Güven sınırları».

Olasılık teorisinin varsayımları,% 99,7 olasılıkla bir özelliğin normal dağılımıyla, ortalama sapmaların uç değerlerinin temsil hatasının üçlü değerinden daha büyük olmayacağını kanıtlamıştır ( M ± 3 M ); %95,5 – ortalama değerin ortalama hatasının iki katından fazla değil ( M ± 2 M ); %68,3 – birden fazla ortalama hata yok ( M ± 1 M ) (Şek. 9).

P%

Pirinç. 9. Normal dağılımın olasılık yoğunluğu.

Yukarıdaki ifadenin yalnızca normal Gauss dağılım yasasına uyan bir özellik için doğru olduğunu unutmayın.

Çoğunluk deneysel araştırma Tıp alanı da dahil olmak üzere, sonuçları belirli bir aralıkta hemen hemen her değeri alabilen ölçümlerle ilişkilidir, bu nedenle kural olarak sürekli rastgele değişkenler modeliyle tanımlanırlar. Bu bakımdan çoğu istatistiksel yöntem sürekli dağılımları dikkate alır. Bu dağıtımlardan biri olan ve temel bir role sahip olan matematiksel istatistik, dır-dir normal veya Gauss dağılımı.

Bunun bir takım nedenleri var.

1. Öncelikle birçok deneysel gözlem normal dağılım kullanılarak başarılı bir şekilde tanımlanabilir. Normal olarak dağılmış bir dağılım olduğundan, ampirik verilerin tam olarak normal olacak hiçbir dağılımının bulunmadığı hemen belirtilmelidir. rastgele değer ile arasında olup pratikte hiçbir zaman gerçekleşmez. Ancak normal dağılım çoğu zaman bir yaklaşım olarak işe yarar.

İnsan vücudunun ağırlık, boy ve diğer fizyolojik parametrelerinin ölçümlerinin yapılıp yapılmadığı - her yerde sonuçlar çok sayıda rastgele faktörden etkilenir ( doğal sebepler ve ölçüm hataları). Üstelik kural olarak bu faktörlerin her birinin etkisi önemsizdir. Deneyimler, bu gibi durumlarda sonuçların yaklaşık olarak normal dağılacağını göstermektedir.

2. Rastgele örneklemeyle ilişkili birçok dağılım, ikincisinin hacmi arttıkça normal hale gelir.

3. Normal dağılım, diğer sürekli dağılımların (örneğin çarpık) bir yaklaşımı olarak çok uygundur.

4. Normal dağılımın bir takım olumlu özellikleri vardır. matematiksel özellikler büyük ölçüde bunu sağladı geniş uygulama istatistiklerde.

Aynı zamanda tıbbi verilerde normal dağılım modeliyle açıklanamayacak pek çok deneysel dağılımın bulunduğunu da belirtmek gerekir. Bu amaçla istatistikler yaygın olarak “Parametrik Olmayan” olarak adlandırılan yöntemler geliştirmiştir.

Belirli bir deneyden elde edilen verilerin işlenmesine uygun istatistiksel yöntemin seçimi, elde edilen verilerin normal dağılım kanununa ait olup olmamasına bağlı olarak yapılmalıdır. Bir işaretin normal dağılım yasasına tabi kılınmasına ilişkin hipotezin test edilmesi, bir frekans dağılım histogramı (grafik) ve bir dizi istatistiksel kriter kullanılarak gerçekleştirilir. Aralarında:

Asimetri kriteri ( B );

Basıklık test kriteri ( G );

Shapiro-Wilks testi ( W ) .

Her parametre için veri dağılımının doğasına ilişkin bir analiz (buna aynı zamanda dağılımın normalliği testi de denir) gerçekleştirilir. Bir parametrenin dağılımının normal yasaya uyup uymadığını güvenle yargılamak için yeterince fazla sayıda gözlem birimi (en az 30 değer) gereklidir.

Normal bir dağılım için çarpıklık ve basıklık kriterleri 0 değerini alır. Dağılım sağa kaydırılırsa B > 0 (pozitif asimetri), B < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона G =0. Şu tarihte: G > 0 ise dağılım eğrisi daha keskindir G < 0 пик более сглаженный, чем функция нормального распределения.

Shapiro-Wilks testini kullanarak normalliği kontrol etmek için, bu kriterin değerini aşağıdaki istatistiksel tabloları kullanarak bulmanız gerekir: gereken seviyeönemine ve gözlem birimlerinin sayısına (serbestlik derecelerine) bağlıdır. Ek 1. Normallik hipotezi, kural olarak bu kriterin küçük değerlerinde reddedilir. w <0,8.



Sitede yeni

>

En popüler