Ev Kaplamalı dil Varyasyon serisi şu şekle sahipse. Varyasyon ve varyasyon serileri, varyasyonun kapsamı

Varyasyon serisi şu şekle sahipse. Varyasyon ve varyasyon serileri, varyasyonun kapsamı

Varyasyonel niceliksel olarak oluşturulan dağılım serilerine denir. Nüfusun bireysel birimlerindeki niceliksel özelliklerin değerleri sabit değildir ve birbirinden az çok farklıdır.

varyasyon- Nüfusun birimleri arasında bir özelliğin değerinin dalgalanması, değişebilirliği. Ayırmak sayısal değerlerİncelenen popülasyonda bulunan özelliklere ne ad verilir? seçenekler değerler. Yetersiz ortalama değer tüm özellikler nüfus bizi ortalama değerleri, incelenen özelliğin değişkenliğini (varyantını) ölçerek bu ortalamaların tipikliğini değerlendirmemize olanak tanıyan göstergelerle desteklemeye zorlar.

Varyasyonun varlığı, çok sayıda faktörün özelliğin düzeyinin oluşumu üzerindeki etkisinden kaynaklanmaktadır. Bu faktörler eşit olmayan güçte ve farklı yönlerde etki eder. Özellik değişkenliğinin ölçüsünü tanımlamak için varyasyon indeksleri kullanılır.

Görevler istatistiksel çalışma varyasyonlar:

  • 1) nüfusun bireysel birimlerindeki özelliklerin doğası ve çeşitlilik derecesinin incelenmesi;
  • 2) popülasyonun belirli özelliklerinin değişmesinde bireysel faktörlerin veya gruplarının rolünün belirlenmesi.

İstatistiklerde kullanılır özel yöntemler Bir gösterge sisteminin kullanımına dayalı varyasyon çalışmaları, İle varyasyonun ölçüldüğü yöntemdir.

Varyasyonların incelenmesi önemli. Örnekleme, korelasyon ve analiz yapılırken varyasyonların ölçülmesi gereklidir. varyans analizi vesaire. Ermolaev O.Yu. Psikologlar için matematiksel istatistikler: Ders Kitabı [Metin]/ O.Yu. Ermolaev. - M .: Moskova Psikolojik ve Sosyal Enstitüsü Flint Yayınevi, 2012. - 335 s.

Çeşitlilik derecesine göre, popülasyonun homojenliği, bireysel özellik değerlerinin istikrarı ve ortalamanın tipikliği değerlendirilebilir. Temel olarak, özellikler arasındaki ilişkinin yakınlığına ilişkin göstergeler ve örnek gözlemin doğruluğunu değerlendirmek için göstergeler geliştirildi.

Uzaydaki değişim ile zamandaki değişim arasında bir ayrım yapılır.

Uzaydaki çeşitlilik, bireysel bölgeleri temsil eden nüfus birimleri arasındaki nitelik değerlerinin dalgalanması olarak anlaşılmaktadır. Zaman içindeki değişim, bir özelliğin değerlerinde meydana gelen değişiklik anlamına gelir. farklı dönemler zaman.

Dağıtım satırlarındaki varyasyonu incelemek için özellik değerlerinin tüm çeşitleri artan veya azalan sırada düzenlenir. Bu işleme seri sıralaması denir.

En çok basit işaretler varyasyonlar minimum ve maksimum- en az ve en yüksek değer toplu olarak işaretler. Özellik değerlerinin bireysel varyantlarının tekrar sayısına tekrarlama frekansı (fi) denir. Frekansları frekanslarla değiştirmek uygundur - wi. Frekans, bir birimin veya yüzdenin kesirleri olarak ifade edilebilen ve varyasyon serilerini karşılaştırmanıza olanak tanıyan göreceli bir frekans göstergesidir. farklı numara gözlemler. Formülle ifade edilir:

burada Xmax, Xmin, toplamdaki özelliğin maksimum ve minimum değerleridir; n - grup sayısı.

Bir özelliğin değişimini ölçmek için çeşitli mutlak ve göreceli göstergeler kullanılır. Mutlak varyasyon göstergeleri arasında varyasyon aralığı, ortalama doğrusal sapma, dağılım ve standart sapma yer alır. Salınımın göreceli göstergeleri, salınım katsayısını, göreceli doğrusal sapmayı ve varyasyon katsayısını içerir.

Örnek bulma varyasyon serisi

Egzersiz yapmak. Bu örnek için:

  • a) Varyasyon serisini bulun;
  • b) Dağıtım fonksiyonunu oluşturun;

Hayır.=42. Örnek öğeler:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Çözüm.

  • a) sıralanmış bir varyasyon serisinin oluşturulması:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) ayrı bir varyasyon serisinin oluşturulması.

Sturgess formülünü kullanarak varyasyon serisindeki grup sayısını hesaplayalım:

Grup sayısını 7'ye eşitleyelim.

Grup sayısını bilerek aralığın boyutunu hesaplıyoruz:

Tabloyu oluşturmanın kolaylığı için grup sayısını 8'e eşit alacağız, aralık 1 olacaktır.

Pirinç. 1 Belirli bir süre için bir mağazanın mal satış hacmi

Varyasyon belirler Belirli bir popülasyonun farklı birimleri arasında aynı dönemde (zaman içinde) bir özelliğin değerlerindeki farklılıklar. Farklılıkların nedenleri farklı koşullar Bütünlüğün farklı birimlerinin varlığı. Örneğin ikizler bile hayatları boyunca boy, kilo, eğitim düzeyi, gelir, çocuk sayısı gibi özelliklerde farklılıklar kazanırlar.

Varyasyon, niteliğin değerlerinin, her bir durumda farklı şekillerde birleştirilen çeşitli koşulların toplam etkisi altında oluşmasının bir sonucu olarak ortaya çıkar. Bu nedenle herhangi bir seçeneğin değeri objektiftir.

Varyasyon karakteristiktir Bireysel sosyal özelliklerin yasal olarak belirlenmiş normatif anlamları dışında, istisnasız tüm doğa ve toplum olgularına. İstatistikteki varyasyon çalışmaları büyük bir değer incelenen olgunun özünün anlaşılmasına yardımcı olur. Çeşitliliği bulmak, nedenlerini bulmak, bireysel faktörlerin etkisini belirlemek önemli bilgi Bilimsel temelli yönetim kararlarının uygulanması için.

Ortalama değer, popülasyonun karakteristiğinin genelleştirilmiş bir özelliğini verir, ancak yapısını ortaya çıkarmaz. Ortalama değer, ortalaması alınan özelliğin değişkenlerinin ortalamanın etrafında nasıl dağıldığını, ortalamaya yakın mı dağıldığını veya ortalamadan saptığını göstermez. İki popülasyondaki ortalama aynı olabilir, ancak bir versiyonda tüm bireysel değerler bundan önemsiz derecede farklıdır ve diğerinde bu farklılıklar büyüktür, yani. ilk durumda karakteristikteki değişim küçük, ikincisinde ise büyüktür; bu, ortalama değerin önemini karakterize etmek için çok önemlidir.

Bir kuruluşun başkanının, bir yöneticinin veya bir araştırmacının varyasyonu incelemesi ve yönetmesi için istatistikler, varyasyonu incelemek için özel yöntemler (bir göstergeler sistemi) geliştirmiştir. Onların yardımıyla çeşitlilik bulunur ve özellikleri karakterize edilir. Değişim göstergeleri şunları içerir: : varyasyon aralığı, ortalama doğrusal sapma, varyasyon katsayısı.

Varyasyon serileri ve formları

Varyasyon serisi- bu, genellikle bir özelliğin artan (daha az sıklıkla azalan) değerlerine göre ve belirli bir karakteristiğe sahip birimlerin sayısını sayarak, bir popülasyonun birimlerinin düzenli bir dağılımıdır. Popülasyon birimlerinin sayısı fazla olduğunda sıralanan seriler hantal hale gelir ve yapımı zaman alır. uzun zaman. Böyle bir durumda popülasyon birimleri, çalışılan özelliğin değerlerine göre gruplandırılarak bir varyasyon serisi oluşturulur.

Aşağıdakiler var varyasyon serisi formları :

  1. Dereceli seri incelenen özelliğin artan (azalan) sırasına göre popülasyonun bireysel birimlerinin bir listesini temsil eder.
  2. Ayrık varyasyon serisi - bu, iki çizgi veya grafikten oluşan bir tablodur: değişen x karakteristiğinin belirli değerleri ve belirli bir f değerine sahip popülasyonun birim sayısı - frekans özelliği. Nitelik en fazla sayıda değeri aldığında oluşturulur.
  3. Aralık serisi.

Varyasyon aralığı belirlenirözelliğin maksimum ve minimum değerleri (varyantları) arasındaki farkın mutlak değeri olarak:

Varyasyon aralığı gösterir yalnızca karakteristikteki aşırı sapmalar olup serideki tüm seçeneklerin bireysel sapmalarını yansıtmaz. Değişken bir özellikteki değişimin sınırlarını karakterize eder ve iki aşırı seçeneğin dalgalanmalarına bağlıdır ve kesinlikle varyasyon serisindeki frekanslarla, yani bu değere rastgele bir karakter veren dağılımın doğasıyla ilgili değildir. Varyasyonu analiz etmek için, varyasyon karakteristiğindeki tüm dalgalanmaları yansıtan ve aşağıdakileri veren bir göstergeye ihtiyacınız vardır: Genel özellikleri. Bu türün en basit göstergesi ortalama doğrusal sapmadır.

İstatistiksel dağılım serisi- Bu, nüfus birimlerinin belirli bir değişken özelliğe göre gruplara düzenli bir şekilde dağıtılmasıdır.
Dağılım serisinin oluşumunun altında yatan özelliğe bağlı olarak, Niteliksel ve değişken dağılım serileri.

Ortak bir özelliğin varlığı, bir tanımlamanın veya ölçümün sonuçlarını temsil eden istatistiksel popülasyonun oluşumunun temelini oluşturur. ortak özellikler araştırma nesneleri.

İstatistikte çalışmanın konusu değişen (değişen) özellikler veya istatistiksel özelliklerdir.

İstatistiksel özellik türleri.

Dağıtım serilerine niteliksel denir kalite kriterlerine göre inşa edilmiştir. Nitelikli– bu, adı olan bir işarettir (örneğin meslek: terzi, öğretmen vb.).
Dağıtım serileri genellikle tablolar halinde sunulur. Masada 2.8 nitelik dağılım serisini göstermektedir.
Tablo 2.8 - Türlerin dağılımı yasal yardım Avukatlar tarafından Rusya Federasyonu'nun bölgelerinden birinin vatandaşlarına sağlanan hizmetler.

Varyasyon serisi– bunlar özelliğin değerleri (veya değer aralıkları) ve bunların frekanslarıdır.
Varyasyon serileri dağıtım serileridir niceliksel temele dayalı olarak oluşturulmuştur. Herhangi bir varyasyon serisi iki unsurdan oluşur: seçenekler ve frekanslar.
Varyantlar, bir varyasyon serisinde aldığı bir özelliğin bireysel değerleri olarak kabul edilir.
Frekanslar, bireysel varyantların veya bir varyasyon serisinin her grubunun sayısıdır; Bunlar bir dağıtım serisinde belirli seçeneklerin ne sıklıkta ortaya çıktığını gösteren sayılardır. Tüm frekansların toplamı, tüm popülasyonun büyüklüğünü, hacmini belirler.
Frekanslar, bir birimin kesirleri veya toplamın yüzdesi olarak ifade edilen frekanslardır. Buna göre frekansların toplamı %1 veya %100'e eşittir. Varyasyon serisi, gerçek verilere dayanarak dağıtım yasasının biçimini tahmin etmeye olanak tanır.

Özelliğin varyasyonunun doğasına bağlı olarak, ayrık ve aralıklı varyasyon serileri.
Ayrık bir varyasyon serisinin bir örneği tabloda verilmiştir. 2.9.
Tablo 2.9 - Rusya Federasyonu'nda 1989 yılında ailelerin bireysel dairelerde işgal edilen oda sayısına göre dağılımı.

Tablonun ilk sütunu ayrı bir varyasyon serisine ilişkin seçenekleri sunar, ikinci sütunu varyasyon serisinin frekanslarını ve üçüncü sütunu ise frekans göstergelerini içerir.

Varyasyon serisi

İÇİNDE nüfus belirli bir niceliksel özellik araştırılmaktadır. Bir hacim örneği bundan rastgele çıkarılır N yani örnek elemanların sayısı eşittir N. İstatistiksel işlemenin ilk aşamasında, değişenörnekler, yani numara sıralaması x 1 , x 2 , …, x n Artan. Gözlemlenen her değer x ben isminde seçenek. Sıklık ben ben değerin gözlem sayısıdır x benörnekte. Bağıl frekans (frekans) ben frekans oranı ben benörnek boyutuna N: .
Varyasyon serilerini incelerken birikmiş frekans ve birikmiş frekans kavramları da kullanılır. İzin vermek X bir miktar. Daha sonra seçenek sayısı , değerleri daha az olan X, birikmiş frekans olarak adlandırılır: xi için N birikmiş frekans w i max olarak adlandırılır.
Bireysel değerleri (varyantları) birbirinden belirli bir sonlu değer (genellikle bir tam sayı) kadar farklıysa, bir özelliğe ayrık değişken denir. Böyle bir özelliğin varyasyon serisine ayrık varyasyon serisi denir.

Tablo 1. Ayrık varyasyon frekans serisinin genel görünümü

Karakteristik değerlerx ben x 1 x 2 xn
Frekanslarben ben m 1 m2 m n

Değerleri birbirinden keyfi olarak küçük bir miktarda farklıysa, bir özelliğe sürekli değişen denir, yani. Bir işaret belirli bir aralıkta her değeri alabilir. Böyle bir karakteristik için sürekli bir değişim serisine aralık adı verilir.

Tablo 2. Frekansların aralık değişim serilerine genel bakış

Tablo 3. Varyasyon serisinin grafik görüntüleri

SıraÇokgen veya histogramAmpirik dağılım fonksiyonu
ayrık
Aralık
Gözlem sonuçları incelenerek her spesifik aralığa kaç tane varyant değerinin düştüğü belirlenir. Her aralığın uçlarından birine ait olduğu varsayılır: ya her durumda sol (daha sık) ya da her durumda sağ ve frekanslar ya da frekanslar, belirtilen sınırlar içinde yer alan seçeneklerin sayısını gösterir. Farklılıklar a ben – a ben +1 kısmi aralıklar denir. Sonraki hesaplamaları basitleştirmek için aralık değişim serisi, koşullu olarak ayrık bir seriyle değiştirilebilir. Bu durumda ortalama değer Ben-interval bir seçenek olarak alınır x ben ve karşılık gelen aralık frekansı ben ben– bu aralığın sıklığı için.
Değişim serilerinin grafiksel gösterimi için en yaygın kullanılanlar çokgen, histogram, kümülatif eğri ve ampirik dağılım fonksiyonudur.

Masada 2.3 (Nisan 1994'te Rusya nüfusunun kişi başına düşen ortalama gelire göre gruplandırılması) sunulmuştur. aralık varyasyon serisi.
Dağıtım serisini, dağılımın şeklini yargılamaya olanak tanıyan grafiksel bir görüntü kullanarak analiz etmek uygundur. Varyasyon serisinin frekanslarındaki değişikliklerin doğasının görsel bir temsili şu şekilde verilmektedir: çokgen ve histogram.
Çokgen, ayrı varyasyon serilerini tasvir ederken kullanılır.
Örneğin konut stokunun daire tipine göre dağılımını grafiksel olarak gösterelim (Tablo 2.10).
Tablo 2.10 - Kentsel alandaki konut stokunun daire tipine göre dağılımı (koşullu rakamlar).


Pirinç. Konut dağıtım alanı


Ordinat eksenleri üzerinde yalnızca frekans değerleri değil, aynı zamanda varyasyon serilerinin frekansları da çizilebilir.
Histogram bir aralık varyasyon serisini tasvir etmek için kullanılır. Bir histogram oluştururken, aralıkların değerleri apsis eksenine çizilir ve frekanslar, karşılık gelen aralıklar üzerine inşa edilen dikdörtgenler ile gösterilir. Sütunların yüksekliği eşit aralıklarla olması durumunda frekanslarla orantılı olmalıdır. Histogram, bir serinin birbirine bitişik çubuklar halinde gösterildiği bir grafiktir.
Tabloda verilen aralık dağılım serisini grafiksel olarak gösterelim. 2.11.
Tablo 2.11 - Ailelerin kişi başına düşen yaşam alanı büyüklüğüne göre dağılımı (koşullu rakamlar).
N p/p Kişi başına düşen yaşam alanı büyüklüğüne göre aile grupları Belirli bir yaşam alanına sahip aile sayısı Kümülatif aile sayısı
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOPLAM 115 ----


Pirinç. 2.2. Ailelerin kişi başına düşen yaşam alanı büyüklüğüne göre dağılımının histogramı


Birikmiş serilerin verilerini kullanarak (Tablo 2.11), kümülatif dağılım.


Pirinç. 2.3. Ailelerin kişi başına düşen yaşam alanı büyüklüğüne göre kümülatif dağılımı


Bir varyasyon serisinin bir kümülat biçiminde temsili, frekansları serinin frekanslarının toplamının kesirleri veya yüzdeleri olarak ifade edilen varyasyon serileri için özellikle etkilidir.
Bir varyasyon serisini kümülatif formda grafiksel olarak tasvir ederken eksenleri değiştirirsek, o zaman şunu elde ederiz: ogiva. İncirde. 2.4, Tablodaki verilere dayanarak oluşturulan ojivi göstermektedir. 2.11.
Bir histogram, dikdörtgenlerin kenarlarının orta noktalarının bulunması ve bu noktaların düz çizgilerle birleştirilmesiyle bir dağıtım poligonuna dönüştürülebilir. Ortaya çıkan dağıtım poligonu Şekil 2'de gösterilmektedir. 2.2 noktalı çizgiyle.
Eşit olmayan aralıklarla bir varyasyon serisinin dağılımının histogramını oluştururken, ordinat ekseni boyunca çizilen frekanslar değil, ilgili aralıklardaki karakteristik dağılımının yoğunluğudur.
Dağıtım yoğunluğu, birim aralık genişliği başına hesaplanan frekanstır; aralık değeri birimi başına her grupta kaç birim vardır. Dağıtım yoğunluğunun hesaplanmasına ilişkin bir örnek tabloda sunulmaktadır. 2.12.
Tablo 2.12 - İşletmelerin çalışan sayısına göre dağılımı (koşullu rakamlar)
N p/p Çalışan sayısına göre işletme grupları, kişiler. İşletme sayısı Aralık büyüklüğü millet. Dağıtım yoğunluğu
A 1 2 3=1/2
1 20'ye kadar 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOPLAM 147 ---- ----

Varyasyon serilerini grafiksel olarak temsil etmek için de kullanılabilir kümülatif eğri. Bir kümülasyon (toplam eğrisi) kullanılarak bir dizi birikmiş frekans tasvir edilir. Kümülatif frekanslar, gruplar arasındaki frekansların sırayla toplanmasıyla belirlenir ve popülasyondaki kaç birimin, söz konusu değerden daha büyük olmayan nitelik değerlerine sahip olduğunu gösterir.


Pirinç. 2.4. Ailelerin kişi başına düşen yaşam alanı büyüklüğüne göre dağılımı

Bir aralık varyasyon serisinin kümülatlarını oluştururken, serinin varyantları apsis ekseni boyunca, birikmiş frekanslar ise ordinat ekseni boyunca çizilir.

İstatistiksel analizde özel bir yer, incelenen özelliğin veya olgunun ortalama düzeyinin belirlenmesine aittir. Bir özelliğin ortalama düzeyi ortalama değerlerle ölçülür.

Ortalama değer, incelenen özelliğin genel niceliksel düzeyini karakterize eder ve istatistiksel popülasyonun bir grup özelliğidir. Bireysel gözlemlerin bir yöndeki rastgele sapmalarını dengeler, zayıflatır ve incelenen özelliğin ana, tipik özelliğini vurgular.

Ortalamalar yaygın olarak kullanılır:

1. Nüfusun sağlık durumunu değerlendirmek: fiziksel gelişim özellikleri (boy, kilo, göğüs çevresi vb.), çeşitli hastalıkların yaygınlığını ve süresini belirlemek, demografik göstergeleri analiz etmek (nüfusun hayati hareketi, ortalama yaşam beklentisi, Nüfusun yeniden üretimi, ortalama nüfus vb.).

2. Tıbbi kurumların, tıbbi personelin faaliyetlerini incelemek ve işlerinin kalitesini değerlendirmek, nüfusun çeşitli tıbbi bakım türlerine olan ihtiyaçlarını planlamak ve belirlemek (yılda kişi başına ortalama talep veya ziyaret sayısı, bir kişinin ortalama kalış süresi) Hastanedeki hasta, hastanın ortalama muayene süresi, doktorların, yatakların vs. ortalama kullanılabilirliği).

3. Sıhhi ve epidemiyolojik durumu karakterize etmek (atölyedeki ortalama hava tozu içeriği, kişi başına düşen ortalama alan, ortalama protein, yağ ve karbonhidrat tüketimi vb.).

4. Laboratuvar verilerini işlerken normal ve patolojik koşullarda tıbbi ve fizyolojik göstergeleri belirlemek, sosyal, hijyenik, klinik ve deneysel çalışmalarda örnek bir çalışmanın sonuçlarının güvenilirliğini sağlamak.

Ortalama değerlerin hesaplanması varyasyon serileri esas alınarak yapılır. Varyasyon serisi bireysel birimleri incelenen özellik veya olgunun niceliksel farklılıklarını karakterize eden niteliksel olarak homojen bir istatistiksel kümedir.

Niceliksel değişim iki türde olabilir: süreksiz (kesikli) ve sürekli.

Süreksiz (ayrık) bir nitelik yalnızca bir tamsayı olarak ifade edilir ve herhangi bir ara değere sahip olamaz (örneğin, ziyaret sayısı, sitenin nüfusu, ailedeki çocuk sayısı, hastalığın puan cinsinden şiddeti) , vesaire.).

Sürekli bir işaret, kesirli olanlar da dahil olmak üzere belirli sınırlar dahilinde herhangi bir değeri alabilir ve yalnızca yaklaşık olarak ifade edilir (örneğin, ağırlık - yetişkinler için kilogram ile sınırlı olabilir ve yeni doğanlar için - gram; boy, kan basıncı, zaman) bir hastayı görmek için harcanan zaman vb.).



Varyasyon serisinde yer alan her bir özelliğin veya olgunun dijital değeri, değişken olarak adlandırılır ve harfle gösterilir. V . Matematik literatüründe başka gösterimler de bulunur; örneğin X veya y.

Her seçeneğin bir kez belirtildiği varyasyon serisine basit denir. Bu tür seriler, bilgisayar veri işleme durumunda çoğu istatistiksel problemde kullanılır.

Gözlem sayısı arttıkça tekrarlanan değişken değerler ortaya çıkma eğilimi gösterir. Bu durumda oluşturulur gruplandırılmış varyasyon serisi tekrar sayısının belirtildiği yer (frekans, “harfiyle gösterilir) R »).

Sıralanmış varyasyon serisi artan veya azalan sırada düzenlenmiş seçeneklerden oluşur. Hem basit hem de gruplandırılmış seriler sıralama ile derlenebilir.

Aralıklı varyasyon serisiÇok sayıda gözlem birimi (1000'den fazla) ile bilgisayar kullanılmadan gerçekleştirilen sonraki hesaplamaları basitleştirmek için derlenmiştir.

Sürekli varyasyon serisi herhangi bir değer olabilen seçenek değerlerini içerir.

Bir varyasyon serisinde, bir özelliğin (varyantların) değerleri bireysel spesifik sayılar biçiminde verilmişse, böyle bir seriye denir. ayrık.

Varyasyon serisine yansıyan karakteristik değerlerinin genel özellikleri ortalama değerlerdir. Bunlar arasında en çok kullanılanlar şunlardır: aritmetik ortalama M, moda Ay ve medyan Ben. Bu özelliklerin her biri benzersizdir. Birbirlerinin yerini alamazlar ve yalnızca birlikte varyasyon serisinin özelliklerini oldukça eksiksiz ve yoğunlaştırılmış bir biçimde temsil ederler.

Moda (Mo) en sık tekrarlanan seçeneklerin değerini adlandırın.

Medyan (Ben) – bu, sıralanmış varyasyon serisini ikiye bölen seçeneğin değeridir (medyanın her iki yanında seçeneğin yarısı vardır). Nadir durumlarda, simetrik bir varyasyon serisi olduğunda, mod ve medyan birbirine eşit olur ve aritmetik ortalamanın değeriyle çakışır.

Opsiyon değerlerinin en tipik özelliği aritmetik ortalama değer( M ). Matematiksel literatürde belirtilir .

Aritmetik ortalama (M, ) niteliksel olarak homojen bir istatistiksel popülasyon oluşturan, incelenen fenomenin belirli bir özelliğinin genel niceliksel bir özelliğidir. Basit ve ağırlıklı aritmetik ortalamalar vardır. Basit aritmetik ortalama, basit bir varyasyon serisi için tüm seçeneklerin toplanması ve bu toplamın bu varyasyon serisinde yer alan toplam seçenek sayısına bölünmesiyle hesaplanır. Hesaplamalar aşağıdaki formüle göre yapılır:

,

Nerede: M - basit aritmetik ortalama;

Σ V - miktar seçeneği;

N- gözlem sayısı.

Gruplandırılmış varyasyon serilerinde ağırlıklı aritmetik ortalama belirlenir. Bunu hesaplamak için formül:

,

Nerede: M - aritmetik ağırlıklı ortalama;

Σ Başkan Yardımcısı - varyantın ürünlerinin frekanslarına göre toplamı;

N- gözlem sayısı.

Çok sayıda gözlemin olduğu manuel hesaplamalarda momentler yöntemi kullanılabilir.

Aritmetik ortalama aşağıdaki özelliklere sahiptir:

· ortalamadan sapmaların toplamı ( Σ D ) sıfıra eşittir (bkz. Tablo 15);

· tüm seçenekleri aynı faktör (bölen) ile çarparken (bölerken), aritmetik ortalama aynı faktör (bölen) ile çarpılır (bölülür);

· tüm seçeneklere aynı sayıyı eklerseniz (çıkarırsanız), aritmetik ortalama aynı sayı kadar artar (azalır).

Hesaplandığı serinin değişkenliği dikkate alınmadan tek başına alınan aritmetik ortalamalar, özellikle diğer ortalamalarla karşılaştırmanın gerekli olduğu durumlarda, varyasyon serisinin özelliklerini tam olarak yansıtmayabilir. Değişen saçılma derecelerine sahip serilerden değer olarak birbirine yakın ortalamalar elde edilebilir. Bireysel seçenekler niceliksel özellikleri bakımından birbirine ne kadar yakınsa, o kadar az dağılım (salınım, değişkenlik) serisi, ortalaması ne kadar tipik olursa.

Bir özelliğin değişkenliğini değerlendirmemize olanak sağlayan ana parametreler şunlardır:

· Kapsam;

· Genlik;

· Standart sapma;

· Değişim katsayısı.

Bir özelliğin değişkenliği, varyasyon serisinin aralığı ve genliği ile yaklaşık olarak değerlendirilebilir. Aralık, serideki maksimum (V maks) ve minimum (V min) seçeneklerini gösterir. Genlik (A m) bu seçenekler arasındaki farktır: A m = V max - V min.

Bir varyasyon serisinin değişkenliğinin genel olarak kabul edilen ana ölçüsü şudur: dağılım (D ). Ancak en sık kullanılanı, dağılım temelinde hesaplanan daha uygun bir parametredir - standart sapma ( σ ). Sapmanın büyüklüğünü dikkate alır ( D ) her varyasyon serisinin aritmetik ortalamasından ( d=V-M ).

Ortalamadan sapmalar pozitif ve negatif olabileceğinden toplandığında “0” (S) değerini verir. d=0). Bunu önlemek için sapma değerleri ( D) ikinci kuvvete yükseltilir ve ortalaması alınır. Dolayısıyla, bir varyasyon serisinin dağılımı, bir varyantın aritmetik ortalamadan sapmalarının ortalama karesidir ve aşağıdaki formülle hesaplanır:

.

Değişkenliğin en önemli özelliğidir ve birçok istatistiksel kriterin hesaplanmasında kullanılır.

Dağılım sapmaların karesi olarak ifade edildiğinden değeri aritmetik ortalamayla karşılaştırılarak kullanılamaz. Bu amaçlar için kullanılır standart sapma“Sigma” işaretiyle gösterilen ( σ ). Bir varyasyon serisinin tüm varyantlarının aritmetik ortalama değerinden ortalama sapmasını, ortalama değerin kendisiyle aynı birimlerde karakterize eder, böylece birlikte kullanılabilirler.

Standart sapma aşağıdaki formülle belirlenir:

Belirtilen formül, gözlem sayısı ( N ) 30'dan fazla. Daha küçük bir sayı ile N standart sapma değerinde matematiksel sapmayla ilişkili bir hata olacaktır ( N -1). Bu bağlamda, standart sapmanın hesaplanmasına yönelik formüldeki bu tür bir önyargı dikkate alınarak daha doğru bir sonuç elde edilebilir:

standart sapma (S ) bir rastgele değişkenin standart sapmasının bir tahminidir X varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre.

Değerlerle N > 30 standart sapma ( σ ) ve standart sapma ( S ) aynı olacak ( σ =s ). Bu nedenle çoğu pratik kılavuzda bu kriterlerin farklı anlamlara sahip olduğu düşünülmektedir. Bir programda Excel hesaplaması=STDEV(aralık) fonksiyonu kullanılarak standart sapma gerçekleştirilebilir. Standart sapmayı hesaplamak için uygun bir formül oluşturmanız gerekir.

Ortalama kare veya standart sapma, bir özelliğin değerlerinin ortalama değerden ne kadar farklı olabileceğini belirlemenizi sağlar. Yaz aylarında günlük ortalama sıcaklığın aynı olduğu iki şehir olduğunu varsayalım. Bu şehirlerden biri sahilde, diğeri ise kıtada yer almaktadır. Sahilde yer alan şehirlerde gündüz sıcaklık farklarının iç kesimlerdeki şehirlere göre daha az olduğu biliniyor. Dolayısıyla kıyı kenti için gündüz sıcaklıklarının standart sapması ikinci kente göre daha az olacaktır. Uygulamada bu, her bir odanın ortalama hava sıcaklığının belirli gün Kıtada yer alan bir şehirde, kıyıdaki bir şehre göre ortalamadan daha fazla farklılık gösterecektir. Ek olarak standart sapma, ortalamadan olası sıcaklık sapmalarını gerekli olasılık düzeyiyle değerlendirmenize olanak tanır.

Olasılık teorisine göre normal dağılım yasasına uyan olaylarda aritmetik ortalama, standart sapma ve seçenekler değerleri arasında sıkı bir ilişki vardır ( üç sigma kuralı). Örneğin değişken bir karakteristiğin değerlerinin %68,3'ü M±1 dahilindedir σ , %95,5 - M ± 2 dahilinde σ ve %99,7 - M ± 3 dahilinde σ .

Standart sapmanın değeri, varyasyon serisinin ve çalışma grubunun homojenliğinin doğasını yargılamamızı sağlar. Standart sapmanın değeri küçükse, bu, incelenen olgunun oldukça yüksek bir homojenliğini gösterir. Bu durumda aritmetik ortalamanın belirli bir varyasyon serisi için oldukça karakteristik olduğu düşünülmelidir. Ancak sigma değerinin çok küçük olması, gözlemlerin yapay olarak seçilmesini düşündürür. Çok büyük bir sigma ile aritmetik ortalama, varyasyon serisini daha az ölçüde karakterize eder; bu, incelenen özelliğin veya olgunun önemli değişkenliğini veya incelenen grubun heterojenliğini gösterir. Ancak standart sapma değerinin karşılaştırılması yalnızca aynı boyuttaki özellikler için mümkündür. Nitekim yeni doğan çocuk ve yetişkinlerin ağırlık çeşitliliğini karşılaştırırsak yetişkinlerde her zaman daha yüksek sigma değerleri elde ederiz.

Farklı boyutlardaki özelliklerin değişkenliğinin karşılaştırılması aşağıdakiler kullanılarak yapılabilir: varyasyon katsayısı. Çeşitliliği ortalamanın yüzdesi olarak ifade eder ve karşılaştırmaya olanak tanır çeşitli işaretler. Tıp literatüründeki varyasyon katsayısı “işaretiyle belirtilmektedir. İLE "ve matematiksel olarak" v"ve aşağıdaki formülle hesaplanır:

.

Değişim katsayısının %10'dan az değerleri, aritmetik ortalama etrafında güçlü saçılma hakkında, %10'dan %20'ye kadar - yaklaşık ortalama, %20'den fazla - küçük saçılmayı gösterir.

Aritmetik ortalama genellikle verilere dayanarak hesaplanır. örnek popülasyon. Tekrarlanan çalışmalarla rastgele olayların etkisi altında aritmetik ortalama değişebilir. Bunun nedeni, kural olarak, olası gözlem birimlerinin yalnızca bir kısmının, yani örnek popülasyonun çalışılmasıdır. İncelenen olguyu temsil eden tüm olası birimler hakkında bilgi, tüm popülasyonun incelenmesiyle elde edilebilir, ancak bu her zaman mümkün değildir. Aynı zamanda deneysel verilerin genelleştirilmesi amacıyla genel popülasyondaki ortalamanın değeri ilgi çekicidir. Bu nedenle, incelenen olgu hakkında genel bir sonuç formüle etmek için, örneklem popülasyonu bazında elde edilen sonuçların istatistiksel yöntemler kullanılarak genel popülasyona aktarılması gerekir.

Bir örneklem çalışması ile genel popülasyon arasındaki uyumun derecesini belirlemek için, örneklem gözlemi sırasında kaçınılmaz olarak ortaya çıkan hatanın büyüklüğünü tahmin etmek gerekir. Bu hatanın adı " Temsil edilebilirlik hatası"veya"Aritmetik ortalamanın ortalama hatası." Aslında örneklemden elde edilen ortalamalar arasındaki farktır. istatistiksel gözlem ve aynı nesnenin sürekli incelenmesi sırasında elde edilecek benzer değerler, yani. genel bir popülasyonu incelerken. Örneklem ortalaması rastgele bir değişken olduğundan, böyle bir tahmin araştırmacı için kabul edilebilir bir olasılık düzeyiyle gerçekleştirilir. İÇİNDE tıbbi araştırma en az %95'tir.

Temsil hatası, deney sırasında kullanılan uygun yöntem ve araçlarla en aza indirilmesi gereken kayıt hataları veya dikkat hatalarıyla (kayma, yanlış hesaplama, yazım hatası vb.) karıştırılamaz.

Temsil edilebilirlik hatasının büyüklüğü hem örneklem büyüklüğüne hem de özelliğin değişkenliğine bağlıdır. Nasıl daha büyük sayı gözlemler, numune popülasyona ne kadar yakınsa ve hata o kadar küçükse. İşaret ne kadar değişken olursa istatistiksel hata da o kadar büyük olur.

Pratikte varyasyon serilerindeki temsil hatasını belirlemek için aşağıdaki formül kullanılır:

,

Nerede: M – temsil hatası;

σ - standart sapma;

N– numunedeki gözlem sayısı.

Formülden, boyutun açık olduğu açıktır. ortalama hata standart sapmayla, yani incelenen özelliğin değişkenliğiyle doğru orantılıdır ve gözlem sayısının kareköküyle ters orantılıdır.

Göreceli değerlerin hesaplanmasına dayalı istatistiksel analiz yapılırken bir varyasyon serisi oluşturmaya gerek yoktur. Bu durumda, göreceli göstergeler için ortalama hatanın belirlenmesi basitleştirilmiş bir formül kullanılarak gerçekleştirilebilir:

,

Nerede: R- yüzde, ppm vb. olarak ifade edilen ilgili göstergenin değeri;

Q- P'nin karşılığı ve göstergenin hesaplandığı esasa bağlı olarak (1-P), (100-P), (1000-P), vb. şeklinde ifade edilir;

N– örnek popülasyondaki gözlem sayısı.

Bununla birlikte, göreceli değerler için temsiliyet hatasını hesaplamak için belirtilen formül, yalnızca göstergenin değeri tabanından küçük olduğunda uygulanabilir. Yoğun göstergelerin hesaplandığı bazı durumlarda bu koşul karşılanmaz ve gösterge %100 veya %1000'den fazla bir sayı olarak ifade edilebilir. Böyle bir durumda bir varyasyon serisi oluşturulur ve standart sapmaya dayalı ortalama değerler formülü kullanılarak temsil hatası hesaplanır.

Popülasyondaki aritmetik ortalamanın değerinin tahmin edilmesi, minimum ve maksimum olmak üzere iki değer belirtilerek gerçekleştirilir. Bu ekstrem değerler olası sapmalar Popülasyonun istenilen ortalama değerinin dalgalanabileceği durumlara “ Güven sınırları».

Olasılık teorisinin varsayımları,% 99,7 olasılıkla bir özelliğin normal dağılımıyla, ortalama sapmaların uç değerlerinin temsil hatasının üçlü değerinden daha büyük olmayacağını kanıtlamıştır ( M ± 3 M ); %95,5 – ortalama değerin ortalama hatasının iki katından fazla değil ( M ± 2 M ); %68,3 – birden fazla ortalama hata yok ( M ± 1 M ) (Şek. 9).

P%

Pirinç. 9. Olasılık yoğunluğu normal dağılım.

Yukarıdaki ifadenin yalnızca normal Gauss dağılım yasasına uyan bir özellik için doğru olduğunu unutmayın.

Tıp alanı da dahil olmak üzere deneysel çalışmaların çoğu, sonuçları belirli bir aralıkta hemen hemen her değeri alabilen ölçümlerle ilişkilidir, bu nedenle kural olarak sürekli rastgele değişkenler modeliyle tanımlanırlar. Bu bakımdan çoğu istatistiksel yöntem sürekli dağılımları dikkate alır. Bu dağıtımlardan biri olan ve temel bir role sahip olan matematiksel istatistik, dır-dir normal veya Gauss dağılımı.

Bunun bir takım nedenleri var.

1. Öncelikle birçok deneysel gözlem normal dağılım kullanılarak başarılı bir şekilde tanımlanabilir. Normal olarak dağılmış bir dağılım olduğundan, ampirik verilerin tam olarak normal olacak hiçbir dağılımının bulunmadığı hemen belirtilmelidir. rastgele değer ile arasında olup pratikte hiçbir zaman gerçekleşmez. Ancak normal dağılım çoğu zaman bir yaklaşım olarak işe yarar.

İnsan vücudunun ağırlık, boy ve diğer fizyolojik parametrelerinin ölçümlerinin yapılıp yapılmadığı - her yerde sonuçlar çok sayıda rastgele faktörden etkilenir ( doğal sebepler ve ölçüm hataları). Üstelik kural olarak bu faktörlerin her birinin etkisi önemsizdir. Deneyimler, bu gibi durumlarda sonuçların yaklaşık olarak normal dağılacağını göstermektedir.

2. Rastgele örneklemeyle ilişkili birçok dağılım, ikincisinin hacmi arttıkça normal hale gelir.

3. Normal dağılım, diğer sürekli dağılımların (örneğin çarpık) bir yaklaşımı olarak çok uygundur.

4. Normal dağılımın bir takım olumlu özellikleri vardır. matematiksel özellikler büyük ölçüde bunu sağladı geniş uygulama istatistiklerde.

Aynı zamanda tıbbi verilerde normal dağılım modeliyle tanımlanamayacak pek çok deneysel dağılımın bulunduğunu da belirtmek gerekir. Bu amaçla istatistikler yaygın olarak “Parametrik Olmayan” olarak adlandırılan yöntemler geliştirmiştir.

Belirli bir deneyden elde edilen verilerin işlenmesine uygun istatistiksel yöntemin seçimi, elde edilen verilerin normal dağılım kanununa ait olup olmamasına bağlı olarak yapılmalıdır. Bir işaretin normal dağılım yasasına tabi kılınmasına ilişkin hipotezin test edilmesi, bir frekans dağılım histogramı (grafik) ve bir dizi istatistiksel kriter kullanılarak gerçekleştirilir. Aralarında:

Asimetri kriteri ( B );

Basıklık testi için kriter ( G );

Shapiro-Wilks testi ( K ) .

Her parametre için veri dağılımının doğasına ilişkin bir analiz (ayrıca dağılımın normalliği testi olarak da adlandırılır) gerçekleştirilir. Bir parametrenin dağılımının normal yasaya uyup uymadığını güvenle yargılamak için yeterince fazla sayıda gözlem birimi (en az 30 değer) gereklidir.

Normal bir dağılım için çarpıklık ve basıklık kriterleri 0 değerini alır. Dağılım sağa kaydırılırsa B > 0 (pozitif asimetri), B < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона G =0. Şu tarihte: G > 0 ise dağılım eğrisi daha keskindir G < 0 пик более сглаженный, чем функция нормального распределения.

Shapiro-Wilks testini kullanarak normalliği kontrol etmek için, bu kriterin değerini aşağıdaki istatistiksel tabloları kullanarak bulmanız gerekir: gereken seviyeönemine ve gözlem birimlerinin sayısına (serbestlik derecelerine) bağlıdır. Ek 1. Normallik hipotezi, kural olarak bu kriterin küçük değerlerinde reddedilir. w <0,8.

Gruplandırma yöntemi aynı zamanda ölçüm yapmanıza da olanak tanır varyasyon işaretlerin (değişkenlik, dalgalanma). Bir popülasyondaki birim sayısı nispeten küçük olduğunda varyasyon, popülasyonu oluşturan birimlerin sıralanmış sayısına göre ölçülür. Seri denir sıralanmış, birimler karakteristiğin artan (azalan) sırasına göre düzenlenmişse.

Bununla birlikte, karşılaştırmalı bir varyasyon karakteristiğine ihtiyaç duyulduğunda sıralanmış seriler oldukça gösterge niteliğindedir. Ek olarak, birçok durumda, belirli bir seri biçiminde temsil edilmesi pratik olarak zor olan, çok sayıda birimden oluşan istatistiksel popülasyonlarla uğraşmak zorundayız. Bu bağlamda, istatistiksel verilerle ilk genel tanışma için ve özellikle özelliklerdeki çeşitliliğin incelenmesini kolaylaştırmak için, incelenen olgular ve süreçler genellikle gruplar halinde birleştirilir ve gruplandırma sonuçları grup tabloları şeklinde sunulur.

Bir grup tablosunun yalnızca iki sütunu varsa - seçilen özelliğe (seçenekler) ve grup sayısına (frekans veya frekans) göre gruplar, buna denir yakın dağıtım.

Dağıtım aralığı - Karakteristiğin varyantlarını ve frekanslarını içeren iki sütunlu bir grup tablosunda görüntülenen, tek bir özelliğe dayalı en basit yapısal gruplandırma türü. Çoğu durumda, böyle bir yapısal gruplamayla; Dağıtım serilerinin derlenmesiyle ilk istatistiksel materyalin incelenmesi başlar.

Bir dağılım serisi şeklindeki yapısal gruplama, seçilen grupların sadece frekanslarla değil aynı zamanda diğer istatistiksel göstergelerle de karakterize edilmesi durumunda gerçek bir yapısal gruplamaya dönüştürülebilir. Dağılım serilerinin temel amacı özelliklerin değişimini incelemektir. Dağılım serisi teorisi matematiksel istatistiklerle ayrıntılı olarak geliştirilmiştir.

Dağıtım serisi şu şekilde ayrılmıştır: niteliksel(Nüfusun cinsiyete, uyruğa, medeni duruma vb. göre bölünmesi gibi niteleyici özelliklere göre gruplandırma) ve varyasyonel(niceliksel özelliklere göre gruplandırma).

Varyasyon serisi iki sütun içeren bir grup tablosudur: birimlerin bir niceliksel özelliğe göre gruplandırılması ve her gruptaki birim sayısı. Varyasyon serilerindeki aralıklar genellikle eşit ve kapalı olarak oluşturulur. Varyasyon serisi, Rus nüfusunun kişi başına düşen ortalama parasal gelire göre aşağıdaki gruplandırılmasıdır (Tablo 3.10).

Tablo 3.10

2004-2009 yıllarında Rusya nüfusunun kişi başına düşen ortalama gelire göre dağılımı.

Kişi başına ortalama nakit gelire göre nüfus grupları, rub./ay

Gruptaki nüfus, toplamın yüzdesi

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25.000,0'ın üzerinde

Tüm nüfus

Varyasyon serileri ise ayrık ve aralıklı olarak ikiye ayrılır. ayrık varyasyon serileri, dar sınırlar içinde değişen farklı karakteristiklerin varyantlarını birleştirir. Ayrık bir varyasyon serisinin bir örneği, Rus ailelerin sahip oldukları çocuk sayısına göre dağılımıdır.

Aralık varyasyon serileri, geniş bir aralıkta değişen sürekli karakteristiklerin veya ayrık karakteristiklerin varyantlarını birleştirir. Aralık, Rus nüfusunun kişi başına düşen ortalama parasal gelire göre dağılımının varyasyon serisidir.

Ayrık varyasyon serileri pratikte çok sık kullanılmaz. Bu arada, grupların bileşimi, incelenen gruplandırma özelliklerinin gerçekte sahip olduğu belirli değişkenler tarafından belirlendiğinden, bunları derlemek zor değildir.

Aralıklı varyasyon serileri daha yaygındır. Bunları derlerken, grup sayısı ve oluşturulması gereken aralıkların büyüklüğü konusunda zor bir soru ortaya çıkıyor.

Bu sorunu çözmeye yönelik ilkeler, istatistiksel gruplamaların oluşturulmasına ilişkin metodoloji bölümünde ortaya konmuştur (bkz. paragraf 3.3).

Varyasyon serileri, çeşitli bilgileri kompakt bir formda daraltmanın veya sıkıştırmanın bir yoludur; bunlardan biri, varyasyonun doğası hakkında oldukça net bir yargıya varabilir ve incelenen sette yer alan fenomenlerin özelliklerindeki farklılıkları inceleyebilir. Ancak varyasyon serilerinin en önemli önemi, varyasyonun özel genelleştirici özelliklerinin bu serilere dayanarak hesaplanmasıdır (bkz. Bölüm 7).



Sitede yeni

>

En popüler