Ev Kaplanmış dil Variasiya seriyası aşağıdakılardan ibarətdir: Variasiya sıralarının tərifi

Variasiya seriyası aşağıdakılardan ibarətdir: Variasiya sıralarının tərifi

Bu fəslin mənimsənilməsi nəticəsində tələbə aşağıdakıları etməlidir: bilmək

  • variasiya göstəriciləri və onların əlaqəsi;
  • xüsusiyyətlərin paylanmasının əsas qanunlarını;
  • razılıq meyarlarının mahiyyəti; bacarmaq
  • dəyişkənlik indekslərini və uyğunluq meyarlarını hesablamaq;
  • paylanma xüsusiyyətlərini müəyyən etmək;
  • statistik paylanma sıralarının əsas ədədi xarakteristikalarını qiymətləndirir;

sahibi

  • paylanma sıralarının statistik təhlili üsullarını;
  • əsaslar dispersiya təhlili;
  • statistik paylanma sıralarının paylanmanın əsas qanunlarına uyğunluğunun yoxlanılması üsulları.

Variasiya göstəriciləri

At statistik tədqiqat müxtəlif statistik aqreqatların xüsusiyyətləri, fərdi xüsusiyyətlərin variasiyasının öyrənilməsi statistik vahidlərəhali, eləcə də vahidlərin üzrə paylanma xarakteri bu xüsusiyyət. Variasiya - bunlar tədqiq olunan əhalinin vahidləri arasında bir xüsusiyyətin fərdi dəyərlərindəki fərqlərdir. Variasiyanın öyrənilməsi böyük praktik əhəmiyyət kəsb edir. Dəyişiklik dərəcəsinə görə, xarakteristikanın dəyişmə hüdudlarını, verilmiş bir xüsusiyyət üçün populyasiyanın homojenliyini, orta göstəricinin tipikliyini və dəyişkənliyi müəyyən edən amillərin əlaqəsini mühakimə etmək olar. Variasiya göstəriciləri statistik populyasiyaları xarakterizə etmək və təşkil etmək üçün istifadə olunur.

Statistik müşahidə materiallarının ümumiləşdirilməsinin və qruplaşdırılmasının statistik paylanma sıraları şəklində təqdim edilməsinin nəticələri öyrənilən əhalinin vahidlərinin qruplaşma (dəyişən) meyarlarına uyğun olaraq qruplara nizamlı şəkildə bölünməsini ifadə edir. Qruplaşdırma üçün keyfiyyət xarakteristikası əsas götürülürsə, belə bir paylama sırası deyilir atributiv(peşə, cins, rəng və s. üzrə paylama). Əgər paylama seriyası kəmiyyət əsasında qurulursa, belə bir sıra deyilir variasiyalı(boy, çəki, əmək haqqı və s. üzrə bölgü). Variasiya silsiləsi yaratmaq, əhali vahidlərinin xarakterik qiymətlər üzrə kəmiyyət bölgüsünü təşkil etmək, bu qiymətlərlə (tezlik) populyasiya vahidlərinin sayını hesablamaq və nəticələri cədvəldə tərtib etmək deməkdir.

Variantın tezliyi əvəzinə onun müşahidələrin ümumi həcminə nisbətindən istifadə etmək olar ki, bu da tezlik (nisbi tezlik) adlanır.

İki növ var variasiya seriyası: diskret və interval. Diskret seriyalar- Bu, quruluşu fasiləsiz dəyişikliklərə (diskret xüsusiyyətlərə) malik xüsusiyyətlərə əsaslanan variasiya seriyasıdır. Sonunculara müəssisədə işçilərin sayı, tarif kateqoriyası, ailədəki uşaqların sayı və s. Diskret variasiya seriyası iki sütundan ibarət cədvəli təmsil edir. Birinci sütun atributun xüsusi dəyərini, ikinci sütun isə atributun xüsusi dəyəri olan populyasiyada vahidlərin sayını göstərir. Əgər xarakteristikanın davamlı dəyişməsi varsa (gəlir məbləği, xidmət stajı, müəssisənin əsas vəsaitlərinin dəyəri və s. müəyyən hüdudlarda istənilən dəyərləri qəbul edə bilər), onda bu xarakteristikaya görə qurmaq olar. interval variasiya seriyası.İnterval variasiya seriyası qurarkən cədvəldə də iki sütun var. Birincisi "dan --ə" (seçimlər) intervalında atributun dəyərini, ikincisi intervala (tezlik) daxil olan vahidlərin sayını göstərir. Tezlik (təkrar tezliyi) - atribut dəyərlərinin müəyyən variantının təkrarlarının sayı. Intervallar qapalı və ya açıq ola bilər. Qapalı intervallar hər iki tərəfdən məhduddur, yəni. həm aşağı (“dan”), həm də yuxarı (“dan”) sərhədə malikdir. Açıq intervalların bir sərhədi var: yuxarı və ya aşağı. Seçimlər artan və ya azalan ardıcıllıqla düzülübsə, cərgələr çağırılır sıralanır.

Variasiya seriyaları üçün iki növ tezlik cavab variantları mövcuddur: yığılmış tezlik və yığılmış tezlik. Yığılmış tezlik, xarakteristikanın dəyərinin müəyyən edilmiş dəyərdən neçə dəfə az dəyər aldığını göstərir. Yığılmış tezlik əvvəlki qrupların bütün tezlikləri ilə müəyyən bir qrup üçün xarakteristikanın tezlik dəyərlərinin cəmlənməsi ilə müəyyən edilir. Yığılmış tezliyi xarakterizə edir xüsusi çəkisi xarakterik dəyərlərin məlumat qrupunun yuxarı həddini aşmayan müşahidə vahidləri. Beləliklə, yığılmış tezlik veriləndən çox olmayan qiymətə malik olan variantların cəmində nisbətini göstərir. Tezlik, tezlik, mütləq və nisbi sıxlıqlar, yığılmış tezlik və tezlik variantın böyüklüyünün xarakteristikalarıdır.

Əhalinin statistik vahidlərinin xüsusiyyətlərinin dəyişməsi, həmçinin paylanma xarakteri, sıranın orta səviyyəsini, orta xətti kənarlaşmanı, standart kənarlaşmanı, dispersiyanı əhatə edən variasiya sıralarının göstəriciləri və xüsusiyyətlərindən istifadə etməklə öyrənilir. , rəqs əmsalları, variasiya, asimmetriya, kurtoz və s.

Dağıtım mərkəzini xarakterizə etmək üçün orta dəyərlər istifadə olunur. Orta ümumiləşdirici statistik xarakteristikadır ki, burada tədqiq olunan əhalinin üzvlərinin malik olduğu xarakteristikanın tipik səviyyəsi kəmiyyətlə ifadə edilir. Bununla belə, arifmetik vasitələrin müxtəlif paylanma qanunauyğunluqları ilə üst-üstə düşməsi halları ola bilər, buna görə də variasiya sıralarının statistik xüsusiyyətləri kimi, sözdə struktur vasitələr hesablanır - rejim, median, həmçinin paylanma sıralarını bərabər hissələrə bölən kvantillər. hissələr (kvartillər, desillər, faizlər və s.).

Moda - Bu, paylama seriyasında digər dəyərlərindən daha tez-tez baş verən xarakteristikanın dəyəridir. Diskret seriyalar üçün bu, ən yüksək tezlikli seçimdir. İnterval variasiya seriyalarında rejimi müəyyən etmək üçün ilk növbədə onun yerləşdiyi intervalı, modal intervalı təyin etmək lazımdır. Ilə variasiya seriyasında bərabər fasilələrlə modal interval qeyri-bərabər intervalları ilə seriyası, ən yüksək tezlik ilə müəyyən edilir - lakin ən yüksək paylama sıxlığı. Daha sonra düstur bərabər intervallarla sətirlərdə rejimi müəyyən etmək üçün istifadə olunur

burada Mo moda dəyəridir; xMo - modal intervalın aşağı həddi; h- modal interval eni; / Mo - modal intervalın tezliyi; / Mo j - premodal intervalın tezliyi; / Mo+1 postmodal intervalın tezliyidir və bu hesablama düsturunda qeyri-bərabər intervallara malik seriyalar üçün / Mo, / Mo, / Mo tezliklərinin əvəzinə paylanma sıxlıqlarından istifadə edilməlidir. Ağıl 0 _| , Ağıl 0> UMO+"

Əgər tək rejim varsa, onda təsadüfi dəyişənin ehtimal paylanması unimodal adlanır; birdən çox rejim varsa, o, multimodal (polimodal, multimodal), iki rejim olduqda - bimodal adlanır. Bir qayda olaraq, multimodallıq tədqiq olunan paylamanın qanuna tabe olmadığını göstərir normal paylanma. Homojen populyasiyalar, bir qayda olaraq, tək təpəli paylanmalarla xarakterizə olunur. Multivertex həm də tədqiq olunan əhalinin heterojenliyini göstərir. İki və ya daha çox təpənin görünməsi daha homojen qrupları müəyyən etmək üçün məlumatların yenidən qruplaşdırılmasını zəruri edir.

İnterval variasiya seriyasında rejim histoqramdan istifadə edərək qrafik olaraq təyin edilə bilər. Bunu etmək üçün histoqramın ən yüksək sütununun yuxarı nöqtələrindən iki bitişik sütunun yuxarı nöqtələrinə iki kəsişən xətt çəkin. Sonra onların kəsişmə nöqtəsindən absis oxuna perpendikulyar endirilir. Perpendikulyar olan x oxundakı xüsusiyyətin qiyməti rejimdir. Bir çox hallarda populyasiyanı xarakterizə edərkən ümumiləşdirilmiş göstərici kimi arifmetik ortadan daha çox rejimə üstünlük verilir.

Median - Bu mərkəzi əhəmiyyət kəsb edir xarakterikdir, o, sıralanmış paylama seriyasının mərkəzi üzvünə malikdir. Diskret sıralarda medianın qiymətini tapmaq üçün əvvəlcə onu təyin edin seriya nömrəsi. Bunun üçün vahidlərin sayı təkdirsə, bütün tezliklərin cəminə bir əlavə edilir və ədəd ikiyə bölünür. Ardıcıl sayda vahidlər varsa, iki median vahidi olacaq, buna görə də bu halda median iki median vahidinin qiymətlərinin ortalaması kimi müəyyən edilir. Beləliklə, diskret variasiya seriyasındakı median seriyanı eyni sayda variantdan ibarət iki hissəyə bölən dəyərdir.

Interval seriyalarında medianın seriya nömrəsini təyin etdikdən sonra yığılmış tezliklərdən (tezliklərdən) istifadə edərək medial interval tapılır və sonra medianın hesablanması düsturundan istifadə edərək medianın özünün dəyəri müəyyən edilir:

burada Me median dəyərdir; x Me - median intervalın aşağı həddi; h- median intervalın eni; - paylama sıralarının tezliklərinin cəmi; /D - pre-median intervalının yığılmış tezliyi; / Me - median intervalın tezliyi.

Medianı kumulyasiyadan istifadə edərək qrafik olaraq tapmaq olar. Bunun üçün kumulyasiyanın yığılmış tezliklərinin (tezliklərinin) şkalasında medianın sıra nömrəsinə uyğun gələn nöqtədən absis oxuna paralel olaraq kumulyasiya ilə kəsişənə qədər düz xətt çəkilir. Sonra, göstərilən xəttin kumulyasiya ilə kəsişdiyi nöqtədən absis oxuna perpendikulyar endirilir. Çəkilmiş ordinata (perpendikulyar) uyğun gələn x oxundakı atributun qiyməti mediandır.

Median aşağıdakı xüsusiyyətlərlə xarakterizə olunur.

  • 1. Bu, onun hər iki tərəfində yerləşən atribut dəyərlərindən asılı deyil.
  • 2. Minimallıq xassəsinə malikdir, yəni atribut dəyərlərinin mediandan mütləq kənara çıxmalarının cəmi atribut dəyərlərinin hər hansı digər dəyərdən kənarlaşması ilə müqayisədə minimum dəyəri təmsil edir.
  • 3. İki paylanmanı məlum medianlarla birləşdirərkən, yeni paylanmanın medianın qiymətini əvvəlcədən proqnozlaşdırmaq mümkün deyil.

Medianın bu xüsusiyyətləri nöqtə yerlərinin layihələndirilməsində geniş istifadə olunur. növbə- məktəblər, klinikalar, yanacaqdoldurma məntəqələri, su məntəqələri və s. Məsələn, əgər şəhərin müəyyən məhəlləsində klinikanın tikintisi nəzərdə tutulursa, o zaman onun məhəllənin uzunluğunu deyil, sakinlərin sayını yarıya qədər azaldan nöqtəsində yerləşdirmək daha məqsədəuyğun olardı.

Modu, median və arifmetik ortanın nisbəti məcmuda xarakteristikanın paylanmasının xarakterini göstərir və paylanmanın simmetriyasını qiymətləndirməyə imkan verir. Əgər x Me o zaman sıranın sağ tərəfli asimmetriyası var. Normal paylama ilə X - Mən - Mo.

K. Pearson əsaslı uyğunlaşma müxtəlif növlərəyrilər müəyyən etdi ki, orta dərəcədə asimmetrik paylanmalar üçün arifmetik orta, median və rejim arasında aşağıdakı təxmini əlaqə etibarlıdır:

burada Me median dəyərdir; Mo - modanın mənası; x arifm - arifmetik ortanın qiyməti.

Variasiya seriyasının strukturunu daha ətraflı öyrənməyə ehtiyac varsa, mediana bənzər xarakterik dəyərləri hesablayın. Belə xarakterik dəyərlər bütün paylama vahidlərini bərabər ədədlərə bölür, onlara kvantillər və ya gradientlər deyilir; Kvantillər kvartillərə, desillərə, faizlərə və s.

Kvartillər əhalini dörd bərabər hissəyə bölürlər. Birinci kvartil əvvəllər birinci rüblük intervalı təyin edərək, birinci kvartilin hesablanması düsturundan istifadə edərək mediana bənzər şəkildə hesablanır:

burada Qi birinci kvartilin dəyəridir; xQ^- birinci kvartil diapazonunun aşağı həddi; h- birinci rüb intervalının eni; /, - interval seriyasının tezlikləri;

Birinci kvartil intervalından əvvəlki intervalda məcmu tezlik; Jq ( - birinci kvartil intervalının tezliyi.

Birinci kvartil əhali vahidlərinin 25%-nin onun dəyərindən az, 75%-nin isə çox olduğunu göstərir. İkinci kvartil mediana bərabərdir, yəni. Q 2 = Mən.

Bənzətmə ilə üçüncü rüblük ilk olaraq üçüncü rüblük intervalı taparaq hesablanır:

üçüncü kvartil diapazonunun aşağı həddi haradadır; h- üçüncü kvartil intervalının eni; /, - interval seriyasının tezlikləri; /X" -əvvəlki intervalda yığılmış tezlik

G

üçüncü kvartil intervalı; Jq üçüncü kvartil intervalının tezliyidir.

Üçüncü kvartil göstərir ki, əhali vahidlərinin 75%-i onun dəyərindən az, 25%-i isə daha çoxdur.

Üçüncü və birinci kvartillər arasındakı fərq kvartillərarası diapazondur:

burada Aq kvartallararası diapazonun qiymətidir; Q 3 -üçüncü kvartil dəyəri; Q, birinci kvartilin dəyəridir.

Desillər əhalini 10 bərabər hissəyə bölür. Onluq paylama seriyasındakı xarakteristikanın populyasiya ölçüsünün onda bir hissəsinə uyğun olan qiymətidir. Kvartillərə bənzətməklə, birinci desil əhali vahidlərinin 10%-nin onun dəyərindən az, 90%-nin isə böyük olduğunu, doqquzuncu desil isə əhali vahidlərinin 90%-nin onun dəyərindən az olduğunu, 10%-nin isə daha aşağı olduğunu göstərir. daha böyük. Doqquzuncu və birinci desillərin nisbəti, yəni. Desil əmsalı gəlirlərin differensiallaşdırılmasının öyrənilməsində ən varlı əhalinin 10%-nin və ən az imkanlı əhalinin 10%-nin gəlir səviyyələrinin nisbətini ölçmək üçün geniş istifadə olunur. Faizlər sıralanmış əhalini 100 bərabər hissəyə bölür. Persentillərin hesablanması, mənası və tətbiqi desillərə bənzəyir.

Kvartillər, desillər və s struktur xüsusiyyətləri kumulyasiyalardan istifadə etməklə mediana bənzətməklə qrafik olaraq müəyyən edilə bilər.

Variasiyanın ölçüsünü ölçmək üçün aşağıdakı göstəricilərdən istifadə olunur: variasiya diapazonu, orta xətti kənarlaşma, standart kənarlaşma, dispersiya. Variasiya diapazonunun böyüklüyü tamamilə silsilənin ekstremal üzvlərinin paylanmasının təsadüfiliyindən asılıdır. Bu göstərici xarakteristikanın dəyərlərindəki dalğalanmaların amplitudasının nə olduğunu bilmək vacib olduğu hallarda maraq doğurur:

Harada R- variasiya diapazonunun dəyəri; x max - atributun maksimum dəyəri; x tt - atributun minimum dəyəri.

Dəyişiklik diapazonu hesablanarkən seriya üzvlərinin böyük əksəriyyətinin qiyməti nəzərə alınmır, variasiya isə seriya üzvünün hər bir qiyməti ilə əlaqələndirilir. Bir xarakteristikanın fərdi dəyərlərinin onların orta qiymətindən sapmalarından əldə edilən orta göstəricilər olan göstəricilərin bu çatışmazlığı yoxdur: orta xətti sapma və standart sapma. Orta göstəricidən fərdi sapmalar və müəyyən bir əlamətin dəyişkənliyi arasında birbaşa əlaqə var. Dəyişmə nə qədər güclüdürsə, bir o qədər çox olur mütləq ölçülər orta göstəricidən kənarlaşmalar.

Orta xətti kənarlaşma arifmetik ortasıdır mütləq dəyərlər ayrı-ayrı variantların orta qiymətindən kənara çıxması.

Qruplaşdırılmamış verilənlər üçün orta xətti kənarlaşma

burada /pr orta xətti kənarlaşmanın qiymətidir; x, - atributun qiymətidir; X - p -əhalidəki vahidlərin sayı.

Qruplaşdırılmış seriyanın orta xətti kənarlaşması

burada / vz - orta xətti sapmanın qiyməti; x, atributun qiymətidir; X - tədqiq olunan əhali üçün xarakteristikanın orta qiyməti; / - ayrı qrupdakı əhali vahidlərinin sayı.

İçərisində sapma əlamətləri bu halda nəzərə alınmır, əks halda bütün kənarlaşmaların cəmi sıfıra bərabər olacaqdır. Təhlil olunan məlumatların qruplaşdırılmasından asılı olaraq orta xətti sapma müxtəlif düsturlardan istifadə etməklə hesablanır: qruplaşdırılmış və qruplaşdırılmamış məlumatlar üçün. Orta xətti kənarlaşma, şərtiliyinə görə, digər variasiya göstəricilərindən ayrı olaraq, praktikada nisbətən nadir hallarda istifadə olunur (xüsusən, çatdırılmanın vahidliyi üzrə müqavilə öhdəliklərinin yerinə yetirilməsini xarakterizə etmək üçün; dövriyyənin təhlilində xarici ticarət, işçilərin tərkibi, istehsalın ritmi, məhsulların keyfiyyəti nəzərə alınmaqla texnoloji xüsusiyyətlər istehsal və s.).

Standart sapma, tədqiq olunan xarakteristikanın fərdi qiymətlərinin orta hesabla əhalinin orta qiymətindən nə qədər kənara çıxdığını xarakterizə edir və öyrənilən xarakteristikanın ölçü vahidləri ilə ifadə edilir. Dəyişikliyin əsas ölçülərindən biri olan standart sapma homojen populyasiyada xarakteristikanın dəyişmə hədlərini qiymətləndirməkdə, normal paylanma əyrisinin ordinat qiymətlərini təyin etməkdə, həmçinin nümunə müşahidəsinin təşkili və nümunə xarakteristikalarının düzgünlüyünün müəyyən edilməsi. Qruplaşdırılmamış məlumatların standart sapması aşağıdakı alqoritmdən istifadə etməklə hesablanır: ortadan hər bir sapma kvadrata alınır, bütün kvadratlar cəmlənir, bundan sonra kvadratların cəmi seriyanın şərtlərinin sayına bölünür və kvadrat kök çıxarılır. əmsal:

burada Iip standart kənarlaşmanın qiymətidir; Xj- atribut dəyəri; X- tədqiq olunan əhali üçün xarakteristikanın orta qiyməti; p -əhalidəki vahidlərin sayı.

Qruplaşdırılmış təhlil edilmiş məlumatlar üçün məlumatların standart kənarlaşması çəkili düsturdan istifadə etməklə hesablanır

Harada - standart sapma dəyəri; Xj- atribut dəyəri; X - tədqiq olunan əhali üçün xarakteristikanın orta qiyməti; f x - müəyyən bir qrupdakı əhali vahidlərinin sayı.

Hər iki halda kök altındakı ifadəyə variasiya deyilir. Beləliklə, dispersiya atribut dəyərlərinin orta qiymətindən sapmalarının orta kvadratı kimi hesablanır. Çəkisiz (sadə) atribut dəyərləri üçün dispersiya aşağıdakı kimi müəyyən edilir:

Çəkili xarakterik dəyərlər üçün

Dispersiyanı hesablamaq üçün xüsusi sadələşdirilmiş üsul da var: ümumiyyətlə

çəkilməmiş (sadə) xarakterik dəyərlər üçün çəkili xarakterik dəyərlər üçün
sıfır əsaslı metoddan istifadə etməklə

burada 2 dispersiya dəyəridir; x, - atributun qiymətidir; X - xarakteristikanın orta dəyəri, h- qrup interval dəyəri, t 1 -çəki (A =

Dispersiyanın statistikada müstəqil ifadəsi var və rəqəmə aiddir ən mühüm göstəricilərdir variasiyalar. Öyrənilən xarakteristikanın ölçü vahidlərinin kvadratına uyğun vahidlərlə ölçülür.

Dispersiya aşağıdakı xüsusiyyətlərə malikdir.

  • 1. Sabit qiymətin dispersiyası sıfırdır.
  • 2. Xarakteristikanın bütün qiymətlərinin eyni A dəyəri ilə azaldılması dispersiyanın qiymətini dəyişmir. Bu o deməkdir ki, sapmaların orta kvadratı bir xarakteristikanın verilmiş qiymətlərindən deyil, onların müəyyən bir sabit ədəddən sapmalarından hesablana bilər.
  • 3. Hər hansı xarakterik dəyərlərin azaldılması k dəfə dispersiyanı azaldır k 2 dəfə və standart sapma içərisindədir k dəfə, yəni. atributun bütün dəyərləri bəzi sabit ədədə (məsələn, seriya intervalının dəyərinə görə) bölünə bilər, standart sapma hesablana bilər və sonra sabit bir ədədə vurula bilər.
  • 4. İstənilən qiymətdən kənarlaşmaların orta kvadratını hesablasaq arifmetik ortadan bu və ya digər dərəcədə fərqlənirsə, onda həmişə arifmetik ortadan hesablanmış kənarlaşmaların orta kvadratından böyük olacaqdır. Sapmaların orta kvadratı çox müəyyən bir məbləğlə - orta və bu şərti olaraq alınan dəyər arasındakı fərqin kvadratı ilə daha çox olacaqdır.

Alternativ xarakteristikanın dəyişməsi tədqiq olunan əmlakın əhali vahidlərində olması və ya olmamasından ibarətdir. Alternativ atributun dəyişməsi kəmiyyətcə iki qiymətlə ifadə edilir: öyrənilən xassə vahidinin mövcudluğu bir (1), yoxluğu isə sıfır (0) ilə işarələnir. Tədqiq olunan xassə malik vahidlərin nisbəti P ilə, bu xassə malik olmayan vahidlərin nisbəti isə ilə işarələnir. G. Beləliklə, alternativ atributun dispersiyası bu xassə malik vahidlərin nisbətinin (P) bu xassə malik olmayan vahidlərin nisbətinə hasilinə bərabərdir. (G).Əhalinin ən böyük dəyişkənliyi əhalinin ümumi həcminin 50% -ni təşkil edən bir hissəsinin bir xüsusiyyətə malik olduğu və əhalinin 50% -ə bərabər olan digər bir hissəsinin bu xüsusiyyətə malik olmadığı hallarda əldə edilir. və dispersiya 0,25 maksimum qiymətə çatır, t .e. P = 0,5, G= 1 - P = 1 - 0,5 = 0,5 və o 2 = 0,5 0,5 = 0,25. Bu göstəricinin aşağı həddi sıfırdır, bu, məcmuda heç bir dəyişikliyin olmadığı vəziyyətə uyğundur. Alternativ xarakteristikanın variasiyasının praktiki tətbiqi qurmaqdır etimad intervalları nümunə müşahidəsi apararkən.

Necə az dəyər dispersiya və standart kənarlaşma, populyasiya nə qədər homojen və orta göstərici bir o qədər tipik olacaqdır. Statistikanın praktikasında çox vaxt variasiyaların müqayisəsinə ehtiyac yaranır müxtəlif əlamətlər. Məsələn, işçilərin yaşı və onların ixtisasları, iş stajı və əmək haqqı, xərc və mənfəət, xidmət stajı və əmək məhsuldarlığı və s. dəyişiklikləri müqayisə etmək maraqlıdır. Bu cür müqayisələr üçün xüsusiyyətlərin mütləq dəyişkənliyinin göstəriciləri uyğun deyil: illərlə ifadə edilən iş təcrübəsinin dəyişkənliyini rublla ifadə olunan əmək haqqının dəyişməsi ilə müqayisə etmək mümkün deyil. Bu cür müqayisələri, habelə fərqli arifmetik ortalamaları olan bir neçə populyasiyada eyni xarakteristikanın dəyişkənliyini müqayisə etmək üçün variasiya göstəricilərindən istifadə olunur - salınım əmsalı, xətti əmsal ekstremal dəyərlərin orta ətrafında nə dərəcədə dəyişdiyini göstərən varyasyonlar və dəyişmə əmsalı.

Salınma əmsalı:

Harada V R - salınım əmsalının dəyəri; R- variasiya diapazonunun dəyəri; X -

Xətti dəyişmə əmsalı”.

Harada Vj- xətti dəyişmə əmsalının qiyməti; mən - orta xətti kənarlaşmanın qiyməti; X - tədqiq olunan əhali üçün xarakteristikanın orta qiyməti.

Dəyişmə əmsalı:

Harada V a - dəyişmə dəyərinin əmsalı; a - standart kənarlaşmanın qiyməti; X - tədqiq olunan əhali üçün xarakteristikanın orta qiyməti.

Salınma əmsalı - tədqiq olunan xarakteristikanın orta qiymətinə dəyişmə diapazonunun faiz nisbəti, xətti dəyişmə əmsalı isə tədqiq olunan xarakteristikanın orta dəyərinə nisbəti ilə ifadə edilir. faiz. Dəyişiklik əmsalı tədqiq olunan xarakteristikanın orta qiymətinə standart kənarlaşmanın faizidir. Faizlə ifadə edilən nisbi qiymət olaraq, müxtəlif xüsusiyyətlərin dəyişmə dərəcəsini müqayisə etmək üçün variasiya əmsalı istifadə olunur. Dəyişiklik əmsalından istifadə edərək statistik populyasiyanın homojenliyi qiymətləndirilir. Dəyişmə əmsalı 33%-dən azdırsa, o zaman tədqiq olunan populyasiya homojendir və variasiya zəifdir. Dəyişmə əmsalı 33%-dən çox olarsa, onda tədqiq olunan populyasiya heterojendir, variasiya güclüdür və orta qiymət atipikdir və bu populyasiyanın ümumi göstəricisi kimi istifadə edilə bilməz. Bundan əlavə, müxtəlif populyasiyalarda bir əlamətin dəyişkənliyini müqayisə etmək üçün variasiya əmsallarından istifadə olunur. Məsələn, iki müəssisədə işçilərin iş stajının dəyişməsini qiymətləndirmək. Əmsal dəyəri nə qədər yüksəkdirsə, xarakteristikanın dəyişməsi bir o qədər əhəmiyyətlidir.

Hesablanmış kvartillərə əsasən, düsturdan istifadə edərək rüblük dəyişmənin nisbi göstəricisini hesablamaq da mümkündür.

harada Q 2

Kvartallararası diapazon düsturla müəyyən edilir

Həddindən artıq dəyərlərdən istifadə ilə bağlı çatışmazlıqların qarşısını almaq üçün variasiya diapazonu əvəzinə kvartil sapma istifadə olunur:

Qeyri-bərabər intervallı variasiya seriyaları üçün paylanma sıxlığı da hesablanır. Müvafiq tezliyin və ya tezlikin intervalın dəyərinə bölünməsi kimi müəyyən edilir. Qeyri-bərabər interval silsiləsində mütləq və nisbi paylanma sıxlıqlarından istifadə olunur. Mütləq paylanma sıxlığı intervalın vahid uzunluğuna düşən tezlikdir. Nisbi paylanma sıxlığı intervalın vahid uzunluğuna düşən tezlikdir.

Yuxarıda göstərilənlərin hamısı paylanma qanunu normal paylanma qanunu ilə yaxşı təsvir edilən və ya ona yaxın olan paylama seriyaları üçün doğrudur.

Variasiya seriyası konsepsiyası. Statistik müşahidə materiallarının sistemləşdirilməsində ilk addım müəyyən xüsusiyyətə malik vahidlərin sayının hesablanmasıdır. Vahidləri kəmiyyət xarakteristikasına görə artan və ya azalan ardıcıllıqla düzərək və xarakteristikanın xüsusi dəyəri olan vahidlərin sayını hesablayaraq variasiya sırasını əldə edirik. Variasiya seriyası müəyyən statistik populyasiyanın vahidlərinin bəzi kəmiyyət xarakteristikasına görə paylanmasını xarakterizə edir.

Variasiya seriyası iki sütundan ibarətdir, sol sütunda variant adlanan və (x) işarəsi ilə işarələnən dəyişən xarakteristikanın dəyərləri, sağ sütunda isə hər variantın neçə dəfə baş verdiyini göstərən mütləq ədədlər var. Bu sütundakı göstəricilər tezliklər adlanır və (f) ilə təyin olunur.

Variasiya seriyası sxematik olaraq Cədvəl 5.1 şəklində təqdim edilə bilər:

Cədvəl 5.1

Variasiya seriyasının növü

Seçimlər (x)

Tezliklər (f)

Sağ sütunda, tezliklərin ümumi cəmində fərdi seçimlərin tezliyinin payını xarakterizə edən nisbi göstəricilərdən də istifadə edilə bilər. Bu nisbi göstəricilər tezliklər adlanır və şərti olaraq , yəni ilə işarələnir. . Bütün tezliklərin cəmi birə bərabərdir. Tezliklər də faizlə ifadə oluna bilər və sonra onların cəmi 100%-ə bərabər olacaqdır.

Fərqli əlamətlər ola bilər fərqli xarakter. Bəzi xüsusiyyətlərin variantları tam ədədlərlə ifadə edilir, məsələn, bir mənzildə otaqların sayı, nəşr olunan kitabların sayı və s. Bu işarələrə fasiləsiz və ya diskret deyilir. Digər xüsusiyyətlərin variantları, məsələn, planlaşdırılmış tapşırıqların yerinə yetirilməsi kimi müəyyən məhdudiyyətlər daxilində istənilən dəyərləri qəbul edə bilər. əmək haqqı s.Bu əlamətlər davamlı adlanır.

Diskret variasiya seriyası. Variasiya sıralarının variantları formada ifadə olunarsa diskret kəmiyyətlər, onda belə variasiya seriyası diskret adlanır, o görünüş cədvəldə təqdim olunur. 5.2:

Cədvəl 5.2

Şagirdlərin imtahan qiymətlərinə görə bölgüsü

Reytinqlər (x)

Şagirdlərin sayı (f)

Ümumi () % ilə

Diskret sıralarda paylanmanın xarakteri qrafik olaraq paylanma çoxbucaqlı şəklində təsvir edilmişdir, Şəkil 5.1.

düyü. 5.1. Şagirdlərin imtahanda topladığı qiymətlərə görə bölgüsü.

İnterval variasiya seriyası. Davamlı xüsusiyyətlər üçün variasiya sıraları interval olanlar kimi qurulur, yəni. onlarda xarakteristikanın dəyərləri "dan və" intervalları şəklində ifadə edilir. Bu halda belə intervalda xarakteristikanın minimum qiyməti intervalın aşağı həddi, maksimumu isə adlanır. yuxarı həddi interval.

İnterval variasiya seriyaları həm fasiləsiz xüsusiyyətlər (diskret), həm də geniş diapazonda dəyişənlər üçün qurulur. İnterval sıraları bərabər və ya qeyri-bərabər intervallarla ola bilər. İqtisadi praktikada tədricən artan və ya azalan qeyri-bərabər intervalların əksəriyyəti istifadə olunur. Bu ehtiyac xüsusilə xarakteristikanın dəyişməsinin qeyri-bərabər və böyük hüdudlarda baş verdiyi hallarda yaranır.

Bərabər intervallara malik interval sıralarının tipini nəzərdən keçirək, cədvəl. 5.3:

Cədvəl 5.3

İşçilərin istehsal üzrə bölgüsü

Çıxış, t.r. (X)

İşçilərin sayı (f)

Kumulyativ tezlik (f´)

İnterval paylama seriyası qrafik olaraq histoqram kimi təsvir edilmişdir, Şəkil 5.2.

Şəkil 5.2. İşçilərin istehsal üzrə bölgüsü

Yığılmış (kumulyativ) tezlik. Praktikada paylama seriyalarının çevrilməsinə ehtiyac var məcmu seriyalar, yığılmış tezliklərə uyğun qurulur. Onların köməyi ilə siz paylama seriyası məlumatlarının təhlilini asanlaşdıran struktur ortalamaları təyin edə bilərsiniz.

Kumulyativ tezliklər birinci qrupun tezliklərinə (və ya tezliklərinə) paylama seriyasının sonrakı qruplarının bu göstəricilərini ardıcıl olaraq əlavə etməklə müəyyən edilir. Dağıtım seriyalarını təsvir etmək üçün kumulyatlar və oivlərdən istifadə olunur. Onları qurmaq üçün absis oxunda diskret xarakteristikanın qiymətləri (və ya intervalların ucları), ordinat oxunda isə tezliklərin məcmu cəmləri (kumulyativlər) qeyd olunur, Şəkil 5.3.

düyü. 5.3. İstehsal üzrə işçilərin məcmu bölgüsü

Tezliklərin və seçimlərin miqyası tərsinə çevrilirsə, yəni. absis oxu yığılmış tezlikləri, ordinat oxu isə variantların qiymətlərini əks etdirir, onda tezliklərin qrupdan qrupa dəyişməsini xarakterizə edən əyri paylama oqivi adlanacaq, Şəkil 5.4.

düyü. 5.4. İşçilərin istehsal üzrə bölgüsü Ogiva

Bərabər intervallara malik variasiya seriyaları ən vacib tələblərdən birini təmin edir statistik seriyalar paylanmalar, onların zaman və məkan baxımından müqayisəliliyini təmin etmək.

Paylanma sıxlığı. Bununla belə, adı çəkilən sıralarda fərdi qeyri-bərabər intervalların tezlikləri birbaşa müqayisə edilə bilməz. Belə hallarda, zəruri müqayisəliliyi təmin etmək üçün paylama sıxlığı hesablanır, yəni. interval dəyərinin vahidi üçün hər qrupda neçə vahidin olduğunu müəyyənləşdirin.

Qeyri-bərabər intervallarla bir variasiya seriyasının paylanması qrafikini qurarkən, düzbucaqlıların hündürlüyü tezliklərə deyil, müvafiq olaraq öyrənilən xarakteristikanın dəyərlərinin paylanmasının sıxlıq göstəricilərinə mütənasib olaraq müəyyən edilir. intervallar.

Variasiya seriyasının tərtibi və onun qrafik təsviri ilkin məlumatların emalının ilk addımı və öyrənilən populyasiyanın təhlilinin birinci mərhələsidir. Növbəti addım variasiya sıralarının təhlilində seriyanın xarakteristikaları adlanan əsas ümumi göstəricilərin müəyyən edilməsidir. Bu xüsusiyyətlər əhali vahidləri arasında xarakteristikanın orta dəyəri haqqında fikir verməlidir.

Orta dəyər. Orta qiymət tədqiq olunan populyasiyada tədqiq olunan xarakteristikanın ümumiləşdirilmiş xarakteristikasıdır, onun müəyyən yer və zaman şəraitində əhalinin vahidinə düşən tipik səviyyəsini əks etdirir.

Orta dəyər həmişə adlandırılır və əhalinin ayrı-ayrı vahidlərinin xarakteristikası ilə eyni ölçüyə malikdir.

Orta dəyərləri hesablamazdan əvvəl, keyfiyyətcə homojen qrupları müəyyən edərək, öyrənilən əhalinin vahidlərini qruplaşdırmaq lazımdır.

Bütövlükdə əhali üzrə hesablanmış orta göstərici ümumi orta, hər bir qrup üzrə isə qrup ortalamaları adlanır.

Ortaların iki növü var: güc (orta hesab, harmonik orta, həndəsi orta, kvadrat orta); struktur (rejim, median, kvartillər, desillər).

Hesablama üçün ortalamanın seçimi məqsəddən asılıdır.

Orta güclərin növləri və onların hesablanması üsulları. Statistik emal praktikasında toplanmış material yaranmaq müxtəlif vəzifələr, həll etmək üçün müxtəlif ortalamalar tələb olunur.

Riyazi statistika güc orta düsturlarından müxtəlif ortalamalar əldə edir:

orta dəyər haradadır; x – fərdi seçimlər (xüsusiyyət dəyərləri); z – eksponent (z = 1 – arifmetik orta, z = 0 həndəsi orta, z = - 1 – harmonik orta, z = 2 – kvadrat orta ilə).

Bununla belə, hər bir fərdi halda hansı növ ortalamanın tətbiq edilməsi məsələsi həll olunur xüsusi analizöyrənilən əhali.

Statistikada ən çox yayılmış ortalama növüdür arifmetik orta. Orta hesablanmış xarakteristikanın həcmi tədqiq olunan statistik əhalinin ayrı-ayrı vahidləri üçün onun dəyərlərinin cəmi kimi formalaşdığı hallarda hesablanır.

Mənbə məlumatlarının xarakterindən asılı olaraq arifmetik orta müxtəlif üsullarla müəyyən edilir:

Məlumatlar qruplaşdırılmamışsa, hesablama sadə orta düsturdan istifadə etməklə aparılır

Arifmetik ortanın hesablanması diskret sıra düstur 3.4-ə uyğun olaraq baş verir.

İnterval seriyasında arifmetik ortanın hesablanması. Hər bir qrupdakı xarakteristikanın dəyərinin şərti olaraq intervalın ortası kimi qəbul edildiyi interval dəyişikliyi seriyasında arifmetik ortalama qruplaşdırılmamış məlumatlardan hesablanmış ortadan fərqli ola bilər. Üstəlik, qruplardakı interval nə qədər böyükdürsə, qruplaşdırılmış məlumatlardan hesablanmış orta göstəricinin qruplaşdırılmamış məlumatlardan hesablanmış ortadan mümkün sapmaları bir o qədər çox olar.

Bir interval variasiya seriyası üzrə orta hesablanarkən, lazımi hesablamaları yerinə yetirmək üçün intervallardan onların orta nöqtələrinə keçir. Və sonra orta çəkili arifmetik orta düsturla hesablanır.

Arifmetik ortanın xassələri. Arifmetik orta hesablamaları sadələşdirməyə imkan verən bəzi xüsusiyyətlərə malikdir;

1. Sabit ədədlərin arifmetik ortası bu sabit ədədə bərabərdir.

Əgər x = a. Sonra .

2. Əgər bütün variantların çəkiləri mütənasib olaraq dəyişdirilərsə, yəni. eyni sayda artır və ya azalır, onda yeni seriyanın arifmetik ortası dəyişməyəcək.

Bütün f çəkiləri k dəfə azaldılsa, onda .

3. Ayrı-ayrı variantların ortadan müsbət və mənfi sapmalarının cəmi, çəkilərə vurularaq, sıfıra bərabərdir, yəni.

Əgər, onda. Buradan.

Əgər bütün variantlar istənilən sayda azaldılıbsa və ya artırılsa, onda yeni seriyanın arifmetik ortası eyni miqdarda azalacaq və ya artacaq.

Bütün variantları azaldaq x haqqında a, yəni. x´ = xa.

Sonra

Orijinal seriyanın arifmetik ortası, azaldılmış ortaya əvvəl variantlardan çıxılan ədədi əlavə etməklə əldə edilə bilər. a, yəni. .

5. Bütün seçimlər azaldılıbsa və ya artırılıbsa k dəfə, onda yeni seriyanın arifmetik ortası eyni miqdarda azalacaq və ya artacaq, yəni. V k bir dəfə.

Onda olsun .

Beləliklə, yəni. orijinal seriyanın ortasını əldə etmək üçün yeni seriyanın arifmetik ortası (azaldılmış variantlarla) ilə artırılmalıdır. k bir dəfə.

Harmonik orta. Harmonik orta arifmetik ortanın əksidir. Statistik məlumatda əhalinin ayrı-ayrı variantları üçün tezliklər olmadıqda, onların məhsulu kimi təqdim edildikdə istifadə olunur (M = xf). Harmonik orta düstur 3.5 ilə hesablanacaq

Harmonik ortanın praktik tətbiqi bəzi indekslərin, xüsusən də qiymət indeksinin hesablanmasıdır.

Həndəsi orta. Həndəsi orta istifadə edərkən, bir xarakteristikanın fərdi dəyərləri, bir qayda olaraq, bir sıra dinamikada hər səviyyənin əvvəlki səviyyəsinə nisbət olaraq zəncir dəyərləri şəklində qurulmuş dinamikanın nisbi dəyərləridir. Beləliklə, ortalama orta artım tempini xarakterizə edir.

Orta həndəsi kəmiyyət xarakteristikanın maksimum və minimum dəyərlərindən bərabər məsafəli dəyəri müəyyən etmək üçün də istifadə olunur. Məsələn, sığorta şirkəti avtomobil sığortası xidmətlərinin göstərilməsi üçün müqavilələr bağlayır. Xüsusi sığorta hadisəsindən asılı olaraq sığorta ödənişi ildə 10.000-100.000 dollar arasında dəyişə bilər. Sığorta ödənişlərinin orta məbləği ABŞ dolları təşkil edəcək.

Həndəsi orta əmsalların ortası kimi istifadə olunan və ya paylanma sıralarında kimi təmsil olunan kəmiyyətdir həndəsi irəliləyiş, z = 0 olduqda. Bu ortadan mütləq fərqlərə deyil, iki ədədin nisbətlərinə diqqət yetirildikdə istifadə etmək əlverişlidir.

Hesablama üçün düsturlar aşağıdakı kimidir

xarakteristikanın orta hesablanan variantları haradadır; – opsion məhsulu; f– variantların tezliyi.

Həndəsi orta orta illik artım templərinin hesablanmasında istifadə olunur.

Orta kvadrat. Orta kvadrat düsturu, paylama seriyasında arifmetik orta ətrafında bir xarakteristikanın fərdi dəyərlərinin dəyişmə dərəcəsini ölçmək üçün istifadə olunur. Beləliklə, variasiya göstəricilərini hesablayarkən, ortalama arifmetik ortadan bir xarakteristikanın fərdi dəyərlərinin kvadratik sapmalarından hesablanır.

Kök orta kvadrat dəyəri düsturdan istifadə etməklə hesablanır

İqtisadi tədqiqatlarda dispersiya və standart kənarlaşma kimi xarakteristikanın variasiya göstəricilərinin hesablanmasında dəyişdirilmiş orta kvadratdan geniş istifadə olunur.

Çoxluq qaydası. Orta güc göstəriciləri arasında aşağıdakı əlaqə mövcuddur - eksponent nə qədər böyükdürsə, ortanın dəyəri də o qədər böyükdür, Cədvəl 5.4:

Cədvəl 5.4

Orta göstəricilər arasında əlaqə

z dəyəri

Orta göstəricilər arasında əlaqə

Bu əlaqə majoranlıq qaydası adlanır.

Struktur ortalamalar.Əhalinin strukturunu xarakterizə etmək üçün xüsusi göstəricilərdən istifadə olunur ki, onları struktur ortalamalar adlandırmaq olar. Bu göstəricilərə rejim, median, kvartillər və desillər daxildir.

Moda. Rejim (Mo) əhali vahidləri arasında xarakteristikanın ən çox rast gəlinən dəyəridir. Rejim nəzəri paylanma əyrisinin maksimum nöqtəsinə uyğun gələn atributun qiymətidir.

Dəb kommersiya praktikasında istehlakçı tələbini öyrənərkən (geniş tələbat olan paltar və ayaqqabıların ölçülərini təyin edərkən) və qiymətləri qeyd edərkən geniş istifadə olunur. Ümumilikdə bir neçə mod ola bilər.

Diskret seriyada rejimin hesablanması. Diskret seriyada rejim ən yüksək tezlikli variantdır. Diskret seriyada rejimin tapılmasını nəzərdən keçirək.

İnterval seriyasında rejimin hesablanması.İnterval variasiya seriyasında rejim təxminən modal intervalın mərkəzi variantı hesab olunur, yəni. ən yüksək tezlikə (tezliyə) malik olan interval. Aralıq daxilində rejim olan atributun dəyərini tapmaq lazımdır. İnterval seriyası üçün rejim düsturla müəyyən ediləcək

modal intervalın aşağı həddi haradadır; – modal intervalın qiyməti; – modal intervala uyğun tezlik; – modal intervaldan əvvəlki tezlik; – modaldan sonrakı intervalın tezliyi.

Median. Median () sıralanmış seriyanın orta vahidinin atributunun dəyəridir. Sıralanmış sıra, xarakterik dəyərlərin artan və ya azalan qaydada yazıldığı bir sıradır. Yaxud median sıralı variasiya seriyasının sayını iki bərabər hissəyə bölən dəyərdir: bir hissə orta variantdan kiçik dəyişən xarakteristikanın dəyərinə, digəri isə daha böyük dəyərə malikdir.

Medianı tapmaq üçün əvvəlcə onun sıra nömrəsini təyin edin. Bunun üçün vahidlərin sayı təkdirsə, bütün tezliklərin cəminə bir əlavə edilir və hər şey ikiyə bölünür. Cüt sayda vahidlərlə median vahidin atributunun dəyəri kimi tapılır, seriya nömrəsi tezliklərin ümumi cəminin ikiyə bölünməsi ilə müəyyən edilir. Medianın seriya nömrəsini bilməklə, yığılmış tezliklərdən istifadə edərək onun dəyərini tapmaq asandır.

Diskret sıralarda medianın hesablanması. Seçmə sorğuya əsasən ailələrin uşaq sayına görə bölgüsünə dair məlumatlar əldə edilmişdir, cədvəl. 5.5. Medianı təyin etmək üçün əvvəlcə onun sıra nömrəsini təyin edirik

Bu ailələrdə uşaqların sayı 2-yə bərabərdir, buna görə də = 2. Beləliklə, ailələrin 50% -də uşaqların sayı 2-dən çox deyil.

– median intervaldan əvvəl yığılmış tezlik;

Bu, bir tərəfdən çox müsbət bir xüsusiyyətdir, çünki bu zaman tədqiq olunan əhalinin bütün vahidlərinə təsir edən bütün səbəblərin təsiri nəzərə alınır. Digər tərəfdən, hətta təsadüfən ilkin məlumatlara daxil edilən bir müşahidə də nəzərdən keçirilən populyasiyada (xüsusilə də qısa seriyalarda) öyrənilən əlamətin inkişaf səviyyəsi haqqında fikri əhəmiyyətli dərəcədə təhrif edə bilər.

Kvartillər və desillər. Variasiya sıralarında medianı tapmaqla bənzətməklə, sıralanmış seriyanın istənilən vahidi üçün xarakteristikanın qiymətini tapa bilərsiniz. Beləliklə, xüsusən də seriyanı 4 bərabər hissəyə, 10-a və s. bölən vahidlər üçün atributun dəyərini tapa bilərsiniz.

Kvartillər. Reytinq sırasını dörd bərabər hissəyə bölən variantlara kvartillər deyilir.

Bu halda, onlar fərqləndirirlər: aşağı (və ya birinci) kvartil (Q1) - əhalini ¼ ilə ¾ nisbətində və yuxarı (və ya üçüncü) kvartil ( Q3) - əhalini ¾ ilə ¼ nisbətində bölən sıralanmış seriyanın vahidi üçün atributun dəyəri.

– kvartil intervalların tezliyi (aşağı və yuxarı)

Q1 və Q3 olan intervallar yığılmış tezliklər (və ya tezliklər) ilə müəyyən edilir.

Onluq. Kvartillərə əlavə olaraq, desillər hesablanır - sıralanmış seriyaları 10 bərabər hissəyə bölən variantlar.

Onlar D ilə təyin olunur, birinci desil D1 seriyanı 1/10 və 9/10 nisbətində bölür, ikinci D2 - 2/10 və 8/10 və s. Onlar median və kvartillərlə eyni sxemə əsasən hesablanır.

Həm median, həm kvartillər, həm də desillər sıralanmış sıralarda müəyyən sıra yeri tutan variant kimi başa düşülən sıralı statistikaya aiddir.

Variasiya seriyası - müqayisə edilən seriyalar (artım və ya azalma dərəcəsinə görə) seçimlər və müvafiq tezliklər

Seçimlər bir xüsusiyyətin fərdi kəmiyyət ifadələridir. Latın hərfi ilə göstərilir V . “Variant” termininin klassik anlayışı, təkrarların sayını nəzərə almadan, xarakteristikanın hər bir unikal dəyərinin variant adlandırılmasını nəzərdə tutur.

Məsələn, on xəstədə ölçülən sistolik qan təzyiqi göstəricilərinin variasiya seriyasında:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Yalnız 6 dəyər mövcuddur:

110, 120, 130, 140, 160, 170.

Tezlik bir variantın neçə dəfə təkrarlandığını göstərən rəqəmdir. Latın hərfi ilə qeyd olunur P . Bütün tezliklərin cəmi (əlbəttə ki, bütün öyrənilənlərin sayına bərabərdir) kimi işarələnir. n.

    Bizim nümunəmizdə tezliklər aşağıdakı dəyərləri alacaq:
  • seçim 110 tezliyi üçün P = 1 (dəyər 110 bir xəstədə baş verir),
  • seçim 120 üçün, tezlik P = 2 (dəyər 120 iki xəstədə baş verir),
  • seçim 130 tezliyi üçün P = 3 (dəyər 130 üç xəstədə baş verir),
  • seçim 140 tezliyi üçün P = 2 (dəyər 140 iki xəstədə baş verir),
  • seçim 160 tezliyi üçün P = 1 (dəyər 160 bir xəstədə baş verir),
  • seçim 170 tezliyi üçün P = 1 (dəyər 170 bir xəstədə baş verir),

Variasiya seriyalarının növləri:

  1. sadə- bu, hər variantın yalnız bir dəfə baş verdiyi seriyadır (bütün tezliklər 1-ə bərabərdir);
  2. dayandırılıb- bir və ya bir neçə variantın bir dəfədən çox göründüyü seriya.

Variasiya seriyası böyük sayda rəqəmləri təsvir etmək üçün istifadə olunur, əksər tibbi tədqiqatların toplanmış məlumatları ilkin olaraq bu formada təqdim olunur. Variasiya sıralarını xarakterizə etmək üçün xüsusi göstəricilər, o cümlədən orta qiymətlər, dəyişkənlik göstəriciləri (dispersiya adlanan) və seçmə məlumatlarının reprezentativliyi göstəriciləri hesablanır.

Variasiya seriyasının göstəriciləri

1) Arifmetik orta tədqiq olunan xarakteristikanın ölçüsünü xarakterizə edən ümumi göstəricidir. Arifmetik orta kimi qeyd olunur M , ən çox yayılmış ortalama növüdür. Arifmetik orta bütün müşahidə vahidlərinin göstərici dəyərlərinin cəminin öyrənilən bütün fənlərin sayına nisbəti kimi hesablanır. Arifmetik ortanın hesablanması üsulu sadə və çəkili variasiya seriyası üçün fərqlidir.

Hesablama üçün düstur sadə arifmetik orta:

Hesablama üçün düstur Çəkili arifmetik orta:

M = Σ(V * P)/ n

​ 2) Rejim ən tez-tez təkrarlanan varianta uyğun gələn variasiya seriyasının başqa bir orta qiymətidir. Və ya başqa sözlə desək, bu, ən yüksək tezlikə uyğun gələn variantdır. kimi qeyd olunur Mo . Rejim yalnız çəkili seriyalar üçün hesablanır, çünki ildən sadə sıralar variantlardan heç biri təkrarlanmır və bütün tezliklər birinə bərabərdir.

Məsələn, ürək dərəcəsi dəyərlərinin variasiya seriyasında:

80, 84, 84, 86, 86, 86, 90, 94;

rejim dəyəri 86-dır, çünki bu seçim 3 dəfə baş verir, buna görə də onun tezliyi ən yüksəkdir.

3) Median - variasiya seriyasını yarıya bölən variantın qiyməti: onun hər iki tərəfində bərabər sayda variant var. Median, arifmetik orta və rejim kimi, orta dəyərlərə aiddir. kimi qeyd olunur Mən

4) Standart kənarlaşma (sinonimlər: standart sapma, siqma sapması, siqma) - variasiya sıralarının dəyişkənliyinin ölçüsü. Bu, orta göstəricidən bütün sapma hallarını birləşdirən inteqral göstəricidir. Əslində, bu suala cavab verir: variantlar arifmetik ortadan nə qədər uzağa və nə qədər yayılır. Yunan hərfi ilə qeyd olunur σ ("siqma").

Əgər əhalinin sayı 30 vahiddən çox olarsa, standart kənarlaşma aşağıdakı düsturla hesablanır:

Kiçik populyasiyalar üçün - 30 müşahidə vahidi və ya daha az - standart kənarlaşma fərqli bir düsturla hesablanır:

Variasiya seriyası: tərifi, növləri, əsas xüsusiyyətləri. Hesablama üsulu
tibbi və statistik tədqiqatlarda rejim, median, arifmetik orta
(şərti nümunə ilə göstərin).

Variasiya silsiləsi tədqiq olunan xarakteristikanın bir-birindən böyüklüyünə görə fərqlənən və müəyyən ardıcıllıqla (artan və ya azalan qaydada) düzülən ədədi dəyərlər silsiləsidir. Seriyanın hər bir ədədi dəyəri variant (V) adlanır və müəyyən bir variantın verilmiş seriyada nə qədər tez-tez baş verdiyini göstərən rəqəmlər tezlik (p) adlanır.

Variasiya seriyasını təşkil edən müşahidə hallarının ümumi sayı n hərfi ilə işarələnir. Öyrənilən xüsusiyyətlərin məna fərqinə variasiya deyilir. Dəyişən xüsusiyyətin kəmiyyət ölçüsü yoxdursa, variasiya keyfiyyət, paylanma sırası isə atributiv adlanır (məsələn, xəstəliyin nəticəsi, sağlamlıq vəziyyəti və s. üzrə paylanma).

Əgər dəyişən xarakteristikanın kəmiyyət ifadəsi varsa, belə dəyişkənliyə kəmiyyət, paylanma sırasına isə variasiya deyilir.

Variasiya sıraları kəmiyyət xarakteristikasının xarakterinə görə, variantın baş vermə tezliyinə görə fasiləsiz və davamlı olaraq bölünür;

Sadə variasiya seriyasında hər bir variant yalnız bir dəfə (p=1), çəkili seriyada eyni variant bir neçə dəfə baş verir (p>1). Bu cür seriyaların nümunələri mətndə daha sonra müzakirə ediləcəkdir. Əgər kəmiyyət xarakteristikası davamlıdırsa, yəni. Tam ədədli kəmiyyətlər arasında ara kəsrli kəmiyyətlər var variasiya sırası davamlı adlanır;

Məsələn: 10.0 – 11.9

14.0 - 15.9 və s.

Əgər kəmiyyət xarakteristikası fasiləsizdirsə, yəni. onun fərdi dəyərləri (variantları) bir-birindən tam ədədlə fərqlənir və aralıq fraksiya dəyərləri yoxdur;

Əvvəlki nümunədəki ürək dərəcəsi məlumatlarından istifadə

21 tələbə üçün bir variasiya seriyası quracağıq (Cədvəl 1).

Cədvəl 1

Tibb tələbələrinin ürək dərəcəsinə görə bölgüsü (bpm)

Beləliklə, bir variasiya seriyası qurmaq mövcud deməkdir rəqəmli dəyərlər(variantları) sistemləşdirmək, təşkil etmək, yəni. onların müvafiq tezlikləri ilə müəyyən ardıcıllıqla (artan və ya azalan qaydada) düzün. Baxılan misalda variantlar artan qaydada düzülür və tam kəsikli (diskret) ədədlər kimi ifadə edilir, hər seçim bir neçə dəfə baş verir, yəni. biz çəkili, fasiləsiz və ya diskret variasiya seriyası ilə məşğul oluruq.

Bir qayda olaraq, öyrəndiyimiz statistik populyasiyada müşahidələrin sayı 30-dan çox deyilsə, o zaman tədqiq olunan xarakteristikanın bütün qiymətlərini Cədvəldəki kimi artan variasiya seriyasında təşkil etmək kifayətdir. 1 və ya azalan sıra.

Çox sayda müşahidə ilə (n>30) baş verən variantların sayı çox böyük ola bilər, bu halda bir interval və ya qruplaşdırılmış variasiya seriyası tərtib edilir, burada sonrakı emalları sadələşdirmək və paylanmanın xarakterini aydınlaşdırmaq üçün, variantlar qruplara birləşdirilir.

Tipik olaraq qrup seçimlərinin sayı 8 ilə 15 arasında dəyişir.

Onların ən azı 5-i olmalıdır, çünki... əks halda çox kobud, həddindən artıq genişlənmə olacaq ki, bu da variasiyanın ümumi mənzərəsini təhrif edir və orta dəyərlərin düzgünlüyünə böyük təsir göstərir. Qrup variantlarının sayı 20-25-dən çox olduqda, orta dəyərlərin hesablanmasının dəqiqliyi artır, lakin xarakteristikanın dəyişməsinin xüsusiyyətləri əhəmiyyətli dərəcədə təhrif edilir və riyazi emal daha mürəkkəbləşir.

Qruplaşdırılmış seriya tərtib edərkən nəzərə almaq lazımdır

− opsion qrupları müəyyən ardıcıllıqla (artan və ya azalan) düzülməlidir;

− variant qruplarında intervallar eyni olmalıdır;

− interval sərhədlərinin dəyərləri üst-üstə düşməməlidir, çünki ayrı-ayrı variantların hansı qruplara təsnif ediləcəyi bəlli olmayacaq;

− interval həddini təyin edərkən toplanmış materialın keyfiyyət xüsusiyyətlərini nəzərə almaq lazımdır (məsələn, böyüklərin çəkisini öyrənərkən 3-4 kq interval məqbuldur, həyatın ilk aylarında isə uşaqlar üçün bu 100 q-dan çox olmamalıdır)

İmtahandan əvvəl 55 tibb tələbəsinin nəbz dərəcəsi (dəqiqədə döyünmə) haqqında məlumatları xarakterizə edən qruplaşdırılmış (interval) sıra quraq: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Qruplaşdırılmış seriya yaratmaq üçün sizə lazımdır:

1. Aralığın ölçüsünü müəyyən edin;

2. Variasiya silsiləsi qruplarının ortasını, başlanğıcını və sonunu müəyyən edin.

● (i) intervalının ölçüsü ehtimal olunan qrupların (r) sayı ilə müəyyən edilir, onların sayı xüsusi cədvələ əsasən müşahidələrin sayından (n) asılı olaraq təyin olunur.

Müşahidələrin sayından asılı olaraq qrupların sayı:

Bizim vəziyyətimizdə 55 tələbə üçün 8-dən 10-a qədər qrup yarada bilərsiniz.

(i) intervalının qiyməti aşağıdakı düsturla müəyyən edilir -

i = V max-V min/r

Bizim nümunəmizdə intervalın qiyməti 82-58/8= 3-dür.

Əgər interval dəyəri olarsa kəsr sayı, nəticə tam ədədə yuvarlaqlaşdırılmalıdır.

Ortalamaların bir neçə növü var:

● arifmetik orta,

● həndəsi orta,

● harmonik orta,

● orta kvadrat,

● orta proqressiv,

● median

IN tibbi statistikaƏn çox arifmetik orta istifadə olunur.

Arifmetik orta (M) bütün əhali üçün xarakterik olanı müəyyən edən ümumiləşdirici dəyərdir. M-nin hesablanması üçün əsas üsullar bunlardır: arifmetik orta metod və momentlər üsulu (şərti kənarlaşmalar).

Sadə arifmetik orta və çəkili arifmetik ortanı hesablamaq üçün arifmetik orta metoddan istifadə olunur. Arifmetik ortanın hesablanması metodunun seçimi variasiya sıralarının növündən asılıdır. Hər bir variantın yalnız bir dəfə baş verdiyi sadə variasiya seriyası vəziyyətində, arifmetik orta düsturla müəyyən edilir:

burada: M – arifmetik orta qiymət;

V – dəyişən xarakteristikanın (variantların) qiyməti;

Σ – hərəkəti göstərir – toplama;

n – müşahidələrin ümumi sayı.

Sadə arifmetik ortanın hesablanmasına bir nümunə. 35 yaşlı 9 kişidə tənəffüs dərəcəsi (dəqiqədə tənəffüs hərəkətlərinin sayı): 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 yaşlı kişilərdə tənəffüs sürətinin orta səviyyəsini müəyyən etmək üçün aşağıdakılar lazımdır:

1. Bütün variantları artan və ya azalan ardıcıllıqla düzən bir variasiya seriyası qurun, çünki sadə variasiya seriyası əldə etdik seçim dəyərləri yalnız bir dəfə baş verir.

M = ∑V/n = 171/9 = dəqiqədə 19 nəfəs

Nəticə. 35 yaşlı kişilərdə tənəffüs dərəcəsi orta hesabla 19-dur tənəffüs hərəkətləri dəqiqədə.

Variantın fərdi dəyərləri təkrarlanırsa, hər variantı sətirdə yazmağa ehtiyac yoxdur, variantın baş verən ölçülərini (V) sadalamaq və onun yanında onların təkrar sayını göstərmək kifayətdir (p; ). Variantların, sanki, onlara uyğun gələn tezliklərin sayı ilə ölçüldüyü belə bir variasiya sırası çəkili variasiya seriyası adlanır və hesablanmış orta qiymət çəkili arifmetik ortadır.

Çəkili arifmetik orta düsturla müəyyən edilir: M= ∑Vp/n

burada n - müşahidələrin sayı, məbləğinə bərabərdir tezliklər – Σр.

Arifmetik çəkili ortanın hesablanmasına nümunə.

Cari ilin birinci rübü ərzində ərazi həkimi tərəfindən müalicə olunan kəskin respirator xəstəlikləri (KRİ) olan 35 xəstədə əlillik müddəti (günlərlə): 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 gün.

Kəskin respirator infeksiyaları olan xəstələrdə əlilliyin orta müddətini təyin etmək üsulu aşağıdakı kimidir:

1. Çəkili variasiya seriyası quraq, çünki Seçimlərin fərdi dəyərləri bir neçə dəfə təkrarlanır. Bunu etmək üçün bütün variantları müvafiq tezlikləri ilə artan və ya azalan qaydada təşkil edə bilərsiniz.

Bizim vəziyyətimizdə variantlar artan qaydada düzülür

2. Aşağıdakı düsturdan istifadə edərək arifmetik çəkili ortanı hesablayın: M = ∑Vp/n = 233/35 = 6,7 gün

Kəskin respirator infeksiyalı xəstələrin əlillik müddətinə görə bölgüsü:

Əlillik müddəti (V) Xəstələrin sayı (p) Vp
∑p = n = 35 ∑Vp = 233

Nəticə. Kəskin respirator xəstəlikləri olan xəstələrdə əlilliyin müddəti orta hesabla 6,7 ​​gün təşkil edib.

Rejim (Mo) variasiya seriyasında ən çox yayılmış seçimdir. Cədvəldə təqdim olunan paylama üçün rejim 10-a bərabər olan bir seçimə uyğundur, digərlərindən daha tez-tez baş verir - 6 dəfə.

Xəstələrin xəstəxana çarpayısında qalma müddətinə görə bölgüsü (günlərlə)

V
səh

Bəzən rejimin dəqiq ölçüsünü müəyyən etmək çətindir, çünki tədqiq olunan məlumatlarda bir neçə "ən çox yayılmış" müşahidələr ola bilər.

Median (Me) variasiya seriyasını iki bərabər yarıya bölən qeyri-parametrik göstəricidir: eyni sayda variantlar medianın hər iki tərəfində yerləşir.

Məsələn, cədvəldə göstərilən paylama üçün median 10-dur, çünki bu dəyərin hər iki tərəfində 14 seçim var, yəni. 10 nömrə tutur mərkəzi mövqe bu seriyada onun medianıdır.

Bu misaldakı müşahidələrin sayının cüt (n=34) olduğunu nəzərə alsaq, medianı aşağıdakı kimi müəyyən etmək olar:

Mən = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Bu o deməkdir ki, seriyanın ortası 10-a bərabər mediana uyğun gələn on yeddinci varianta düşür. Cədvəldə təqdim olunan paylanma üçün arifmetik orta bərabərdir:

M = ∑Vp/n = 334/34 = 10.1

Beləliklə, cədvəldən 34 müşahidə üçün. 8, əldə etdik: Mo=10, Me=10, arifmetik orta (M) 10,1-dir. Bizim nümunəmizdə hər üç göstərici tamamilə fərqli olsa da, bərabər və ya bir-birinə yaxın olduğu ortaya çıxdı.

Arifmetik orta, müəyyən bir fenomen və ya populyasiya üçün çox vaxt atipik olan, istisnasız olaraq bütün variantların təsirli cəmidir;

Rejim və median, arifmetik ortadan fərqli olaraq, dəyişən xarakteristikanın bütün fərdi dəyərlərinin dəyərindən (ekstremal variantların dəyərləri və seriyanın dağılma dərəcəsi) asılı deyildir. Arifmetik orta müşahidələrin bütün kütləsini, rejim və median isə kütləni xarakterizə edir.

Statistik təhlildə xüsusi yer tədqiq olunan xarakteristikanın və ya hadisənin orta səviyyəsinin müəyyən edilməsinə aiddir. Xarakterin orta səviyyəsi orta qiymətlərlə ölçülür.

Orta qiymət tədqiq olunan xarakteristikanın ümumi kəmiyyət səviyyəsini xarakterizə edir və statistik əhalinin qrup xassəsidir. Ayrı-ayrı müşahidələrin bu və ya digər istiqamətdə təsadüfi kənarlaşmalarını səviyyələşdirir, zəiflədir və tədqiq olunan xarakteristikanın əsas, tipik xassəsini vurğulayır.

Ortalamalar geniş istifadə olunur:

1. Əhalinin sağlamlıq vəziyyətini qiymətləndirmək üçün: fiziki inkişafın xüsusiyyətləri (boy, çəki, çevrə sinə s.), yayılma və müddəti müəyyən etmək müxtəlif xəstəliklər, təhlili demoqrafik göstəricilər(əhalinin təbii hərəkəti, orta ömür uzunluğu, əhalinin təkrar istehsalı, əhalinin orta sayı və s.).

2. Tibb müəssisələrinin fəaliyyətini öyrənmək, tibb işçiləri və onların işinin keyfiyyətinin qiymətləndirilməsi, əhalinin ehtiyaclarının planlaşdırılması və müəyyən edilməsi müxtəlif növlər tibbi yardım(ildə bir sakinə düşən müraciətlərin və ya ziyarətlərin orta sayı, orta müddət xəstənin xəstəxanada qalması, orta müddət xəstənin müayinəsi, həkimlərin orta mövcudluğu, çarpayılar və s.).

3. Sanitariya-epidemioloji vəziyyəti xarakterizə etmək (emalatxanada orta hava tozunun miqdarı, adambaşına düşən orta sahə, zülalların, yağların və karbohidratların orta istehlakı və s.).

4. Laboratoriya məlumatları işlənərkən normal və patoloji şəraitdə tibbi-fizioloji göstəriciləri müəyyən etmək, nəticələrin etibarlılığını müəyyən etmək nümunə sorğu sosial və gigiyenik, klinik, eksperimental tədqiqatlarda.

Orta dəyərlərin hesablanması variasiya sıraları əsasında aparılır. Variasiya seriyası ayrı-ayrı vahidləri tədqiq olunan xarakteristikanın və ya hadisənin kəmiyyət fərqlərini xarakterizə edən keyfiyyətcə bircins statistik çoxluqdur.

Kəmiyyət dəyişkənliyi iki növ ola bilər: fasiləsiz (diskret) və davamlı.

Fasiləsiz (diskret) atribut yalnız tam ədəd kimi ifadə edilir və heç bir ara dəyərə malik ola bilməz (məsələn, ziyarətlərin sayı, saytın əhalisi, ailədəki uşaqların sayı, ballarda xəstəliyin şiddəti və s.).

Davamlı bir xüsusiyyət, fraksiya daxil olmaqla, müəyyən məhdudiyyətlər daxilində istənilən dəyərləri qəbul edə bilər və yalnız təxminən ifadə edilir (məsələn, çəki - böyüklər üçün kiloqramla, yeni doğulmuşlar üçün isə qramla məhdudlaşdırıla bilər; boy, qan təzyiqi, xəstəni görməyə sərf olunan vaxt və s.).



Variasiya seriyasına daxil olan hər bir fərdi xarakteristikanın və ya fenomenin rəqəmsal dəyəri variant adlanır və hərflə təyin olunur. V . Məsələn, riyazi ədəbiyyatda başqa qeydlərə də rast gəlinir x və ya y.

Hər variantın bir dəfə göstərildiyi variasiya seriyası sadə adlanır. Belə seriyalar kompüter məlumatlarının işlənməsi vəziyyətində əksər statistik məsələlərdə istifadə olunur.

Müşahidələrin sayı artdıqca təkrarlanan variant dəyərləri baş verir. Bu vəziyyətdə yaradılır qruplaşdırılmış variasiya seriyası, təkrarların sayı göstərildiyi yerdə (tezlik, " hərfi ilə qeyd olunur" r »).

Reytinqli variasiya seriyası artan və ya azalan qaydada düzülmüş variantlardan ibarətdir. Həm sadə, həm də qruplaşdırılmış seriyalar sıralama ilə tərtib edilə bilər.

İnterval variasiya seriyasıçox sayda müşahidə vahidi (1000-dən çox) ilə kompüterdən istifadə etmədən aparılan sonrakı hesablamaları sadələşdirmək üçün tərtib edilmişdir.

Davamlı variasiya seriyası istənilən dəyər ola bilən seçim dəyərləri daxildir.

Variasiya seriyasında xarakteristikanın (variantların) qiymətləri fərdi xüsusi ədədlər şəklində verilirsə, belə bir sıra adlanır. diskret.

Ümumi xüsusiyyətlər variasiya silsiləsində əks olunan xarakteristikanın dəyərləri orta qiymətlərdir. Onların arasında ən çox istifadə olunanlar bunlardır: arifmetik orta M, moda Mo və median Mən. Bu xüsusiyyətlərin hər biri unikaldır. Onlar bir-birini əvəz edə bilməz və yalnız birlikdə variasiya seriyasının xüsusiyyətlərini kifayət qədər tam və sıxlaşdırılmış formada təmsil edirlər.

Moda (ay) ən tez-tez baş verən variantların dəyərini adlandırın.

Median (Mən) – bu, sıralanmış variasiya seriyasını yarıya bölən variantın dəyəridir (medianın hər tərəfində variantın yarısı var). Nadir hallarda simmetrik variasiya silsiləsi olduqda rejim və median bir-birinə bərabər olur və arifmetik ortanın qiyməti ilə üst-üstə düşür.

Ən çox tipik xüsusiyyət dəyər variantıdır arifmetik orta dəyər( M ). Riyaziyyat ədəbiyyatında işarə olunur .

Arifmetik orta (M, ) keyfiyyətcə bircins statistik populyasiyanı təşkil edən tədqiq olunan hadisələrin müəyyən xarakteristikasının ümumi kəmiyyət xarakteristikasıdır. Sadə və çəkili arifmetik ortalamalar var. Sadə arifmetik orta bütün variantları toplamaq və bu məbləği bölmək yolu ilə sadə variasiya seriyası üçün hesablanır. ümumi miqdar seçim bu variasiya seriyasına daxildir. Hesablamalar düstura görə aparılır:

,

Harada: M - sadə arifmetik orta;

Σ V - məbləğ seçimi;

n- müşahidələrin sayı.

Qruplaşdırılmış variasiya sıralarında çəkili arifmetik orta müəyyən edilir. Onu hesablamaq üçün düstur:

,

Harada: M - arifmetik çəkili orta;

Σ Vp - variantın hasillərinin onların tezlikləri üzrə cəmi;

n- müşahidələrin sayı.

Çox sayda müşahidə ilə, əl ilə hesablamalar halında, anlar üsulundan istifadə edilə bilər.

Arifmetik orta aşağıdakı xüsusiyyətlərə malikdir:

· orta göstəricidən kənarlaşmaların cəmi ( Σ d ) sıfıra bərabərdir (Cədvəl 15-ə bax);

· bütün variantları eyni əmsala (bölənə) vurarkən (bölərkən) arifmetik orta eyni əmsala (bölənə) vurulur (bölülür);

· bütün variantlara eyni ədədi əlavə etsəniz (çıxsanız), arifmetik orta eyni sayda artır (azalır).

Hesablandıqları sıraların dəyişkənliyini nəzərə almadan öz-özünə götürülmüş arifmetik ortalar variasiya sıralarının xassələrini tam əks etdirməyə bilər, xüsusən də digər orta qiymətlərlə müqayisə etmək lazım olduqda. Dəyəri yaxın olan ortalar seriyalardan əldə edilə bilər müxtəlif dərəcələrdə səpilmə. Fərdi variantlar kəmiyyət xüsusiyyətlərinə görə bir-birinə nə qədər yaxındırsa, bir o qədər azdır dispersiya (salınma, dəyişkənlik) sıra, onun ortalaması daha tipikdir.

Xüsusiyyətin dəyişkənliyini qiymətləndirməyə imkan verən əsas parametrlər bunlardır:

· Əhatə dairəsi;

· Amplituda;

· Standart kənarlaşma;

· Dəyişiklik əmsalı.

Xarakterin dəyişkənliyi təxminən variasiya seriyasının diapazonu və amplitudası ilə qiymətləndirilə bilər. Aralıq seriyadakı maksimum (V max) və minimum (V min) seçimləri göstərir. Amplituda (A m) bu variantlar arasındakı fərqdir: A m = V max - V min.

Variasiya seriyasının dəyişkənliyinin əsas, ümumi qəbul edilmiş ölçüsüdür dispersiya (D ). Ancaq ən çox istifadə edilən parametr dispersiya əsasında hesablanan daha əlverişli parametrdir - standart sapma ( σ ). Bu, sapmanın böyüklüyünü nəzərə alır ( d ) hər variasiya seriyasının arifmetik ortasından ( d=V - M ).

Ortadan kənarlaşmalar müsbət və mənfi ola bildiyi üçün cəmləndikdə “0” qiymətini verirlər (S d=0). Bunun qarşısını almaq üçün sapma dəyərləri ( d) ikinci dərəcəyə qaldırılır və orta ölçülür. Beləliklə, variasiya seriyasının dispersiyası variantın arifmetik ortadan kənarlaşmalarının orta kvadratıdır və düsturla hesablanır:

.

Odur ən mühüm xüsusiyyətidir dəyişkənlikdir və bir çox statistik testləri hesablamaq üçün istifadə olunur.

Dispersiya kənarlaşmaların kvadratı kimi ifadə olunduğu üçün onun dəyəri arifmetik orta ilə müqayisədə istifadə edilə bilməz. Bu məqsədlər üçün istifadə olunur standart sapma, "Sigma" işarəsi ilə təyin olunur ( σ ). O, variasiya seriyasının bütün variantlarının orta arifmetik orta qiymətdən orta kənarlaşmasını orta qiymətin özü ilə eyni vahidlərdə xarakterizə edir, ona görə də onlar birlikdə istifadə oluna bilər.

Standart sapma düsturla müəyyən edilir:

Göstərilən düstur müşahidələrin sayı ( n ) 30-dan çox. Daha kiçik rəqəmlə n standart sapma dəyərində riyazi ofsetlə əlaqəli xəta olacaq ( n - 1). Bu baxımdan, standart sapmanın hesablanması düsturunda belə bir qərəzliyi nəzərə alaraq daha dəqiq nəticə əldə edilə bilər:

standart sapma (s ) təsadüfi kəmiyyətin standart kənarlaşmasının qiymətləndirilməsidir X onun haqqında riyazi gözlənti onun dispersiyasının qərəzsiz qiymətləndirilməsinə əsaslanır.

Dəyərlərlə n > 30 standart sapma ( σ ) və standart sapma ( s ) eyni olacaq ( σ =s ). Buna görə də əksər praktik dərsliklərdə bu meyarların fərqli mənaları olduğu nəzərə alınır. IN Excel proqramı standart kənarlaşmanın hesablanması =STDEV(aralıq) funksiyası ilə edilə bilər. Və standart sapmanı hesablamaq üçün müvafiq düstur yaratmalısınız.

Orta kvadrat və ya standart sapma, bir xarakteristikanın dəyərlərinin orta dəyərdən nə qədər fərqlənə biləcəyini müəyyən etməyə imkan verir. Tutaq ki, yayda orta gündəlik temperatur eyni olan iki şəhər var. Bu şəhərlərdən biri sahildə, digəri isə qitədə yerləşir. Məlumdur ki, sahildə yerləşən şəhərlərdə gündüz temperatur fərqləri ölkə daxilində yerləşən şəhərlərə nisbətən daha azdır. Buna görə də, sahil şəhəri üçün gündüz temperaturunun standart sapması ikinci şəhərdən daha az olacaq. Praktikada bu, hər birinin orta hava temperaturu deməkdir konkret gün qitədə yerləşən bir şəhərdə sahildəki bir şəhərlə müqayisədə orta səviyyədən daha çox fərqlənəcəkdir. Bundan əlavə, standart sapma, mümkün olan temperatur sapmalarını tələb olunan ehtimal səviyyəsi ilə orta səviyyədən qiymətləndirməyə imkan verir.

Ehtimal nəzəriyyəsinə görə, normal paylanma qanununa tabe olan hadisələrdə arifmetik orta, standart kənarlaşma və variantlar arasında ciddi əlaqə mövcuddur ( üç siqma qaydası). Məsələn, dəyişən bir xarakteristikanın dəyərlərinin 68,3% -i M ± 1 daxilindədir σ , 95,5% - M ± 2 daxilində σ və 99,7% - M ± 3 daxilində σ .

Standart kənarlaşmanın dəyəri variasiya seriyasının və tədqiqat qrupunun homojenliyinin xarakterini mühakimə etməyə imkan verir. Standart sapmanın dəyəri kiçikdirsə, bu, tədqiq olunan fenomenin kifayət qədər yüksək homojenliyini göstərir. Bu vəziyyətdə arifmetik orta müəyyən bir variasiya seriyası üçün olduqca xarakterik hesab edilməlidir. Bununla belə, çox kiçik bir siqma dəyəri müşahidələrin süni seçimi haqqında düşünməyə vadar edir. Çox böyük siqma ilə arifmetik orta variasiya seriyasını daha az dərəcədə xarakterizə edir ki, bu da tədqiq olunan xarakteristikanın və ya hadisənin əhəmiyyətli dəyişkənliyini və ya tədqiq olunan qrupun heterojenliyini göstərir. Bununla belə, standart kənarlaşmanın dəyərinin müqayisəsi yalnız eyni ölçüdə olan xüsusiyyətlər üçün mümkündür. Həqiqətən, yeni doğulmuş uşaqların və böyüklərin çəkilərinin müxtəlifliyini müqayisə etsək, böyüklərdə həmişə daha yüksək siqma dəyərləri alacağıq.

Müxtəlif ölçülü xüsusiyyətlərin dəyişkənliyinin müqayisəsi istifadə edilə bilər variasiya əmsalı. O, müxtəlifliyi orta göstəricinin faizi kimi ifadə edərək, müxtəlif əlamətlər arasında müqayisə aparmağa imkan verir. Tibbi ədəbiyyatda variasiya əmsalı " işarəsi ilə göstərilir. İLƏ ", və riyazi" v"və düsturla hesablanır:

.

Dəyişmə əmsalının 10%-dən az olan dəyərləri kiçik səpilməni, 10-dan 20%-ə qədər - təxminən orta, 20% -dən çox - arifmetik orta ətrafında güclü səpilməni göstərir.

Arifmetik orta adətən nümunə populyasiyasından alınan məlumatlar əsasında hesablanır. Təkrar tədqiqatlarla, təsadüfi hadisələrin təsiri altında arifmetik orta dəyişə bilər. Bu, bir qayda olaraq, mümkün müşahidə vahidlərinin yalnız bir hissəsinin, yəni seçmə populyasiyasının öyrənilməsi ilə əlaqədardır. Öyrənilən hadisəni təmsil edən bütün mümkün vahidlər haqqında məlumatı bütövlükdə öyrənməklə əldə etmək olar. əhali, bu həmişə mümkün deyil. Eyni zamanda, eksperimental məlumatların ümumiləşdirilməsi məqsədi ilə ümumi populyasiyada orta göstəricinin dəyəri maraq doğurur. Buna görə də tədqiq olunan fenomen haqqında ümumi nəticəni formalaşdırmaq üçün statistik metodlardan istifadə etməklə seçmə populyasiyası əsasında alınan nəticələr ümumi əhali kütləsinə ötürülməlidir.

Nümunəvi tədqiqat və ümumi əhali arasında razılıq dərəcəsini müəyyən etmək üçün nümunə müşahidəsi zamanı qaçılmaz olaraq yaranan xətanın miqyasını qiymətləndirmək lazımdır. Bu səhv deyilir " Təmsilçiliyin səhvi"və ya "Arifmetik ortanın orta xətası." Əslində bu, nümunədən alınan ortalamalar arasındakı fərqdir statistik müşahidə, və eyni obyektin davamlı tədqiqi zamanı əldə ediləcək oxşar dəyərlər, yəni. ümumi əhalini öyrənərkən. Seçim ortası təsadüfi dəyişən olduğundan, belə bir proqnoz tədqiqatçı üçün məqbul olan ehtimal səviyyəsi ilə həyata keçirilir. IN tibbi tədqiqatən azı 95% təşkil edir.

Təcrübə zamanı istifadə olunan adekvat üsul və vasitələrlə minimuma endirilməli olan representasiya xətası qeydiyyat xətaları və ya diqqət xətaları (sürüşmələr, səhv hesablamalar, yazı xətləri və s.) ilə qarışdırıla bilməz.

Reprezentativlik xətasının böyüklüyü həm seçmə ölçüsündən, həm də əlamətin dəyişkənliyindən asılıdır. Necə daha böyük rəqəm müşahidələr, nümunə əhaliyə nə qədər yaxın olarsa və səhv bir o qədər kiçik olar. İşarə nə qədər çox dəyişkəndirsə, statistik səhv bir o qədər böyükdür.

Təcrübədə variasiya sıralarında reprezentativlik xətasını təyin etmək üçün aşağıdakı düsturdan istifadə olunur:

,

Harada: m – təmsilçilik səhvi;

σ – standart sapma;

n– nümunədəki müşahidələrin sayı.

Formuldan aydın olur ki, ölçü orta səhv standart kənarlaşma ilə düz mütənasibdir, yəni tədqiq olunan xarakteristikanın dəyişkənliyi, müşahidələrin sayının kvadrat kökü ilə tərs mütənasibdir.

Nisbi dəyərlərin hesablanması əsasında statistik təhlil apararkən variasiya seriyasının qurulmasına ehtiyac yoxdur. Bu halda, nisbi göstəricilər üçün orta xətanın müəyyən edilməsi sadələşdirilmiş düsturdan istifadə etməklə həyata keçirilə bilər:

,

Harada: R– faizlə ifadə olunan nisbi göstəricinin qiyməti, ppm və s.;

q– P-nin əksi və göstəricinin hesablandığı əsasdan asılı olaraq (1-P), (100-P), (1000-P) və s. kimi ifadə edilir;

n– nümunə populyasiyasında müşahidələrin sayı.

Bununla birlikdə, nisbi dəyərlər üçün təmsilçilik səhvinin hesablanması üçün göstərilən düstur yalnız göstəricinin dəyəri onun bazasından az olduqda tətbiq edilə bilər. İntensiv göstəricilərin hesablanmasının bir sıra hallarda bu şərt yerinə yetirilmir və göstərici 100% və ya 1000% -dən çox rəqəmlə ifadə edilə bilər. Belə bir vəziyyətdə, bir variasiya seriyası qurulur və standart sapmaya əsaslanan orta dəyərlər üçün düsturdan istifadə edərək təmsilçilik səhvi hesablanır.

Əhalidəki arifmetik orta dəyərinin proqnozlaşdırılması iki dəyəri - minimum və maksimumu göstərməklə həyata keçirilir. Bu ifrat dəyərlər mümkün sapmalar, əhalinin istənilən orta dəyərinin dəyişə bildiyi “ Güvən sərhədləri».

Ehtimal nəzəriyyəsinin postulatları sübut etdi ki, 99,7% ehtimalı olan bir xarakteristikanın normal paylanması ilə ortanın kənara çıxmalarının ekstremal dəyərləri reprezentativlik xətasının üçqat dəyərindən çox olmayacaq ( M ± 3 m ); 95,5% - orta dəyərin orta xətasından iki dəfədən çox olmayan ( M ± 2 m ); 68,3% - birdən çox orta səhv ( M ± 1 m ) (Şəkil 9).

P%

düyü. 9. Normal paylanmanın ehtimal sıxlığı.

Qeyd edək ki, yuxarıdakı ifadə yalnız normal Qauss paylanma qanununa tabe olan xüsusiyyət üçün doğrudur.

Çoxluq eksperimental tədqiqat, o cümlədən tibb sahəsində, nəticələri müəyyən bir intervalda demək olar ki, hər hansı bir dəyəri ala bilən ölçmələrlə əlaqələndirilir, buna görə də, bir qayda olaraq, davamlı təsadüfi dəyişənlər modeli ilə təsvir olunur. Bu baxımdan, əksər statistik metodlar davamlı paylanmaları nəzərə alır. Bu paylamalardan biri də əsas rolu olan riyazi statistika, edir normal və ya Qauss paylanması.

Bu bir sıra səbəblərlə bağlıdır.

1. Əvvəla, bir çox eksperimental müşahidələri normal paylanmadan istifadə etməklə uğurla təsvir etmək olar. Dərhal qeyd etmək lazımdır ki, tam normal olacaq empirik məlumatların heç bir paylanması yoxdur, çünki normal paylanmış təsadüfi dəyişən-dən -ə qədər olan diapazondadır ki, bu da praktikada heç vaxt baş vermir. Bununla belə, normal paylama çox vaxt təxmini olaraq yaxşı işləyir.

İnsan bədəninin çəkisi, boyu və digər fizioloji parametrlərinin ölçülməsindən asılı olmayaraq - hər yerdə nəticələr çox sayda təsadüfi amillərdən təsirlənir ( təbii səbəblər və ölçmə xətaları).

Üstəlik, bir qayda olaraq, bu amillərin hər birinin təsiri əhəmiyyətsizdir. Təcrübə göstərir ki, belə hallarda nəticələr təxminən normal şəkildə paylanacaqdır.

2. Təsadüfi seçmə ilə əlaqəli bir çox paylanma, sonuncunun həcmi artdıqca normal olur.

3. Normal paylanma digər davamlı paylanmaların təxmini (məsələn, əyri) kimi yaxşı uyğun gəlir. 4. Normal paylanma bir sıra əlverişli xüsusiyyətlərə malikdir riyazi xassələri böyük ölçüdə təmin edən geniş tətbiq

statistikada.

Eyni zamanda qeyd etmək lazımdır ki, tibbi məlumatlarda normal paylanma modeli ilə təsvir edilə bilməyən çoxlu eksperimental paylanmalar mövcuddur. Bu məqsədlə statistika adətən “Qeyri-parametrik” adlanan metodlar işləyib hazırlamışdır.

Müəyyən bir təcrübədən əldə edilən məlumatların emalı üçün uyğun olan statistik metodun seçimi, əldə edilən məlumatların normal paylanma qanununa aid olub-olmamasından asılı olaraq aparılmalıdır. İşarənin normal paylanma qanununa tabe olması ilə bağlı fərziyyənin yoxlanılması tezlik paylanması histoqramından (qrafik), həmçinin bir sıra statistik meyarlardan istifadə etməklə həyata keçirilir. Onların arasında: Asimmetriya meyarı ( );

b Kurtosis üçün test meyarı ( );

g Şapiro-Wilks testi ( ) .

Hər bir parametr üçün verilənlərin paylanmasının təbiətinin təhlili (paylanmanın normallığı üçün test də deyilir) aparılır. Parametrin paylanmasının normal qanuna uyğun olub-olmadığını əminliklə mühakimə etmək üçün kifayət qədər çox sayda müşahidə vahidi (ən azı 30 dəyər) tələb olunur.

Normal paylanma üçün əyrilik və kurtoz meyarları 0 qiymətini alır. Paylanma sağa sürüşdürülürsə Asimmetriya meyarı ( > 0 (müsbət asimmetriya), ilə Asimmetriya meyarı ( < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона Kurtosis üçün test meyarı ( =0. At Kurtosis üçün test meyarı ( > 0 olarsa, paylanma əyrisi daha kəskin olar Kurtosis üçün test meyarı ( < 0 пик более сглаженный, чем функция нормального распределения.

Şapiro-Wilks testindən istifadə edərək normallığı yoxlamaq üçün buradakı statistik cədvəllərdən istifadə edərək bu meyarın dəyərini tapmaq lazımdır. tələb olunan səviyyəəhəmiyyətindən və müşahidə vahidlərinin sayından (sərbəstlik dərəcələri) asılı olaraq. Əlavə 1. Normallıq hipotezi bu meyarın kiçik dəyərlərində, bir qayda olaraq, w <0,8.



Saytda yeni

>

Ən Populyar