Ev Protez və implantasiya Ən kiçik kvadratlar metodu. Ən kiçik kvadratlar üsulu harada istifadə olunur?

Ən kiçik kvadratlar metodu. Ən kiçik kvadratlar üsulu harada istifadə olunur?

Misal.

Dəyişənlərin dəyərlərinə dair eksperimental məlumatlar Xsaat cədvəldə verilmişdir.

Onların düzülməsi nəticəsində funksiya əldə edilir

İstifadə üsul ən kiçik kvadratlar , bu məlumatları xətti asılılıqla təxmin edin y=ax+b(parametrləri tapın Ab). İki sətirdən hansının (ən kiçik kvadratlar metodu mənasında) eksperimental məlumatları daha yaxşı uyğunlaşdırdığını tapın. Rəsm çəkin.

Ən kiçik kvadratlar metodunun (LSM) mahiyyəti.

Tapşırıq iki dəyişənin funksiyasının yerinə yetirildiyi xətti asılılıq əmsallarını tapmaqdır Ab ən kiçik qiyməti alır. Yəni verilmişdir Ab tapılmış düz xəttdən eksperimental məlumatların kvadrat sapmalarının cəmi ən kiçik olacaqdır. Ən kiçik kvadratlar metodunun bütün nöqtəsi budur.

Beləliklə, nümunənin həlli iki dəyişənli funksiyanın ekstremumunun tapılmasına gəlir.

Əmsalların tapılması üçün düsturların alınması.

İki naməlum olan iki tənlik sistemi tərtib edilir və həll edilir. Funksiyanın qismən törəmələrinin tapılması dəyişənlərə görə Ab, bu törəmələri sıfıra bərabərləşdiririk.

Yaranan tənliklər sistemini istənilən üsuldan istifadə edərək həll edirik (məsələn əvəzetmə üsulu ilə və ya Kramer üsulu) və ən kiçik kvadratlar metodundan (LSM) istifadə edərək əmsalları tapmaq üçün düsturlar əldə edin.

verilmiş Ab funksiyası ən kiçik qiyməti alır. Bu faktın sübutu verilir səhifənin sonundakı mətndə aşağıda.

Ən kiçik kvadratların bütün üsulu budur. Parametri tapmaq üçün düstur a cəmləri,,, və parametrləri ehtiva edir n- eksperimental məlumatların miqdarı. Bu məbləğlərin dəyərlərini ayrıca hesablamağı tövsiyə edirik. Əmsal b hesablamadan sonra tapılır a.

Orijinal nümunəni xatırlamağın vaxtı gəldi.

Həll.

Bizim nümunəmizdə n=5. Tələb olunan əmsalların düsturlarına daxil olan məbləğlərin hesablanmasının rahatlığı üçün cədvəli doldururuq.

Cədvəlin dördüncü sətirindəki dəyərlər 2-ci sətrin dəyərlərini hər bir nömrə üçün 3-cü sətirin dəyərlərinə vurmaqla əldə edilir. i.

Cədvəlin beşinci cərgəsindəki dəyərlər hər bir nömrə üçün 2-ci sətirdəki dəyərlərin kvadratı ilə əldə edilir. i.

Cədvəlin son sütunundakı dəyərlər sətirlər arasında olan dəyərlərin cəmidir.

Əmsalları tapmaq üçün ən kiçik kvadratlar metodunun düsturlarından istifadə edirik Ab. Cədvəlin son sütunundan müvafiq dəyərləri onlara əvəz edirik:

Beləliklə, y = 0,165x+2,184- istədiyiniz təxmini düz xətt.

Sətirlərdən hansının olduğunu tapmaq qalır y = 0,165x+2,184 və ya ilkin məlumatları daha yaxşı təxmin edir, yəni ən kiçik kvadratlar metodundan istifadə edərək təxmin edir.

Ən kiçik kvadratlar metodunun səhv qiymətləndirilməsi.

Bunu etmək üçün, bu sətirlərdən orijinal məlumatların kvadrat sapmalarının cəmini hesablamalısınız , daha kiçik bir dəyər ən kiçik kvadratlar metodu mənasında orijinal məlumatı daha yaxşı təxmin edən xəttə uyğun gəlir.

Ondan bəri, sonra düz y = 0,165x+2,184 orijinal məlumatlara daha yaxşı yaxınlaşır.

Ən kiçik kvadratlar (LS) metodunun qrafik təsviri.

Qrafiklərdə hər şey aydın görünür. Qırmızı xətt tapılan düz xəttdir y = 0,165x+2,184, mavi xəttdir , çəhrayı nöqtələr orijinal məlumatlardır.

Təcrübədə, müxtəlif prosesləri modelləşdirərkən - xüsusən də iqtisadi, fiziki, texniki, sosial - müəyyən sabit nöqtələrdə onların məlum dəyərlərindən funksiyaların təxmini qiymətlərinin hesablanmasının bu və ya digər üsullarından geniş istifadə olunur.

Bu cür funksiyaların yaxınlaşması problemi tez-tez yaranır:

    təcrübə nəticəsində əldə edilmiş cədvəl məlumatlarından istifadə etməklə tədqiq olunan prosesin xarakterik kəmiyyətlərinin qiymətlərinin hesablanması üçün təxmini düsturlar qurarkən;

    ədədi inteqrasiyada, diferensiasiyada, həllində diferensial tənliklər və s.;

    zəruri hallarda, nəzərdən keçirilən intervalın aralıq nöqtələrində funksiyaların qiymətlərini hesablayın;

    nəzərdə tutulan intervaldan kənar bir prosesin xarakterik kəmiyyətlərinin dəyərlərini təyin edərkən, xüsusən də proqnozlaşdırarkən.

Cədvəllə müəyyən edilmiş müəyyən prosesi modelləşdirmək üçün ən kiçik kvadratlar metodu əsasında bu prosesi təqribən təsvir edən funksiya qursaq, o, yaxınlaşma funksiyası (reqressiya) adlanacaq və yaxınlaşan funksiyaların özünün qurulması məsələsi adlanacaq. yaxınlaşma problemi.

Bu məqalədə bu tip məsələlərin həlli üçün MS Excel paketinin imkanlarından bəhs edilir, əlavə olaraq, cədvəlləşdirilmiş funksiyalar üçün reqressiyaların qurulması (yaradılması) üsulları və üsulları təqdim olunur (bu, reqressiya təhlilinin əsasını təşkil edir).

Excel-də reqressiya yaratmaq üçün iki seçim var.

    Tədqiq olunan prosesin xarakteristikası üçün verilənlər cədvəli əsasında qurulmuş diaqrama seçilmiş reqressiyaların (trend xətlərinin) əlavə edilməsi (yalnız diaqram qurulubsa mümkündür);

    Excel iş vərəqinin daxili statistik funksiyalarından istifadə edərək, reqressiyaları (trend xətləri) birbaşa mənbə verilənlər cədvəlindən əldə etməyə imkan verir.

Qrafikə trend xətlərinin əlavə edilməsi

Prosesi təsvir edən və diaqramla təmsil olunan verilənlər cədvəli üçün Excel-də sizə imkan verən effektiv reqressiya təhlili aləti var:

    ən kiçik kvadratlar metodu əsasında qurmaq və tədqiq olunan prosesi müxtəlif dəqiqlik dərəcələri ilə modelləşdirən beş növ reqressiyanı diaqrama əlavə etmək;

    qurulmuş reqressiya tənliyini diaqrama əlavə edin;

    seçilmiş reqressiyanın diaqramda göstərilən məlumatlara uyğunluq dərəcəsini müəyyən etmək.

Diaqram məlumatlarına əsaslanaraq, Excel tənliklə təyin olunan xətti, çoxhədli, loqarifmik, güc, eksponensial reqressiya növlərini əldə etməyə imkan verir:

y = y(x)

burada x, tez-tez natural ədədlər ardıcıllığının (1; 2; 3; ...) dəyərlərini alan və məsələn, tədqiq olunan prosesin vaxtının (xüsusiyyətlərinin) geri sayımını yaradan müstəqil dəyişəndir.

1 . Xətti reqressiya dəyərləri sabit sürətlə artan və ya azalan xüsusiyyətlərin modelləşdirilməsi üçün yaxşıdır. Bu, tədqiq olunan proses üçün qurmaq üçün ən sadə modeldir. Bu tənliyə uyğun olaraq qurulur:

y = mx + b

burada m maillik bucağının tangensidir xətti reqressiya absis oxuna; b - xətti reqressiyanın ordinat oxu ilə kəsişmə nöqtəsinin koordinatı.

2 . Çoxhədli trend xətti bir neçə fərqli ekstremal (maksima və minimum) olan xüsusiyyətləri təsvir etmək üçün faydalıdır. Polinom dərəcəsinin seçimi tədqiq olunan xarakteristikanın ekstremal sayı ilə müəyyən edilir. Beləliklə, ikinci dərəcəli çoxhədli yalnız bir maksimum və ya minimum olan prosesi yaxşı təsvir edə bilər; üçüncü dərəcəli çoxhədli - iki ekstremaldan çox olmayan; dördüncü dərəcəli çoxhədli - üç ekstremaldan çox olmayan və s.

Bu halda, trend xətti tənliyə uyğun olaraq qurulur:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

burada c0, c1, c2,... c6 əmsalları tikinti zamanı qiymətləri təyin olunan sabitlərdir.

3 . Dəyərləri əvvəlcə sürətlə dəyişən və sonra tədricən sabitləşən xüsusiyyətlərin modelləşdirilməsi zamanı loqarifmik trend xətti uğurla istifadə olunur.

y = c ln(x) + b

4 . Tədqiq olunan əlaqənin dəyərləri artım sürətinin daimi dəyişməsi ilə xarakterizə olunarsa, güc qanunu meyl xətti yaxşı nəticələr verir. Belə bir asılılığa misal olaraq avtomobilin vahid sürətlənmiş hərəkətinin qrafikini göstərmək olar. Məlumatda sıfır və ya mənfi dəyərlər varsa, güc trend xəttindən istifadə edə bilməzsiniz.

Tənliyə uyğun olaraq qurulur:

y = c xb

burada b, c əmsalları sabitlərdir.

5 . Məlumatların dəyişmə sürəti davamlı olaraq artdıqda eksponensial trend xəttindən istifadə edilməlidir. Sıfır və ya mənfi dəyərləri ehtiva edən məlumatlar üçün bu cür yaxınlaşma da tətbiq edilmir.

Tənliyə uyğun olaraq qurulur:

y = c ebx

burada b, c əmsalları sabitlərdir.

Bir xətt seçərkən Excel trendi avtomatik olaraq yaxınlaşmanın etibarlılığını xarakterizə edən R2 dəyərini hesablayır: daha daha yaxın dəyər R2 vəhdət təşkil edirsə, trend xətti tədqiq olunan prosesə bir o qədər etibarlı şəkildə yaxınlaşır. Lazım gələrsə, R2 dəyəri həmişə diaqramda göstərilə bilər.

Düsturla müəyyən edilir:

Məlumat seriyasına trend xətti əlavə etmək üçün:

    bir sıra məlumatlara əsaslanan qrafiki aktivləşdirin, yəni diaqram sahəsi daxilində klikləyin. Diaqram elementi əsas menyuda görünəcək;

    bu elementə kliklədikdən sonra ekranda trend xətti əlavə et əmrini seçməli olduğunuz bir menyu görünəcək.

Eyni hərəkətləri siçan göstəricisini verilənlər seriyasından birinə uyğun olan qrafikin üzərinə aparıb sağ klikləməklə asanlıqla həyata keçirmək olar; Görünən kontekst menyusunda Trend xətti əlavə et əmrini seçin. Növ tabı açılmış halda ekranda Trend xətti dialoq qutusu görünəcək (şək. 1).

Bundan sonra sizə lazımdır:

Növ sekmesinde tələb olunan trend xətti növünü seçin (Xətti tip standart olaraq seçilir). Polinom növü üçün Dərəcə sahəsində seçilmiş polinomun dərəcəsini göstərin.

1 . Quraşdırılmış seriya sahəsi sözügedən diaqramdakı bütün məlumat seriyalarını sadalayır. Xüsusi məlumat seriyasına trend xətti əlavə etmək üçün onun adını Quraşdırılmış seriyalar sahəsində seçin.

Lazım gələrsə, Parametrlər sekmesine keçərək (Şəkil 2) trend xətti üçün aşağıdakı parametrləri təyin edə bilərsiniz:

    təxmini (hamarlanmış) əyri sahəsinin adı sahəsində trend xəttinin adını dəyişdirin.

    Proqnoz sahəsində proqnoz üçün dövrlərin sayını (irəli və ya geri) təyin edin;

    diaqram sahəsində trend xəttinin tənliyini göstərin, bunun üçün diaqram onay qutusunda tənliyi göstərməlisiniz;

    diaqram sahəsində R2 yaxınlaşma etibarlılıq dəyərini göstərin, bunun üçün siz təxmini etibarlılıq dəyərini diaqramda yerləşdirin (R^2) qutusunu aktivləşdirməlisiniz;

    trend xəttinin Y oxu ilə kəsişmə nöqtəsini təyin edin, bunun üçün əyrinin Y oxu ilə bir nöqtədə kəsişməsi üçün onay qutusunu aktivləşdirməlisiniz;

    Dialoq qutusunu bağlamaq üçün OK düyməsini basın.

Artıq çəkilmiş trend xəttini redaktə etməyə başlamaq üçün üç yol var:

    əvvəlcədən trend xəttini seçərək Format menyusundan Seçilmiş trend xətti əmrindən istifadə edin;

    kontekst menyusundan trend xəttinin üzərinə sağ klikləməklə çağırılan Format trend xətti əmrini seçin;

    trend xəttinə iki dəfə klikləyin.

Ekranda Trend Line Format informasiya qutusu görünəcək (Şəkil 3), üç nişanı ehtiva edir: Görünüş, Növ, Parametrlər və sonuncu ikisinin məzmunu Trend Xətti dialoq qutusunun oxşar nişanları ilə tamamilə üst-üstə düşür (Şəkil 1). -2). Görünüş sekmesinde siz xəttin növünü, rəngini və qalınlığını təyin edə bilərsiniz.

Artıq çəkilmiş trend xəttini silmək üçün silinəcək trend xəttini seçin və Sil düyməsini sıxın.

Nəzərə alınan reqressiya təhlili alətinin üstünlükləri aşağıdakılardır:

    onun üçün məlumat cədvəli yaratmadan qrafiklərdə trend xəttinin qurulmasının nisbi asanlığı;

    təklif olunan trend xətlərinin növlərinin kifayət qədər geniş siyahısı və bu siyahıya ən çox istifadə olunan reqressiya növləri daxildir;

    tədqiq olunan prosesin davranışını ixtiyari (sağlam düşüncə hüdudları daxilində) irəli və geriyə addımlarla proqnozlaşdırmaq bacarığı;

    trend xətti tənliyini analitik formada əldə etmək bacarığı;

    zərurət yarandıqda, yaxınlaşmanın etibarlılığının qiymətləndirilməsinin əldə edilməsi imkanı.

Dezavantajlara aşağıdakılar daxildir:

    trend xəttinin qurulması yalnız bir sıra məlumatlar əsasında qurulmuş bir diaqram olduqda həyata keçirilir;

    onun üçün əldə edilən trend xətti tənliklərinə əsaslanaraq öyrənilən xarakteristika üçün məlumat seriyalarının yaradılması prosesi bir qədər qarışıqdır: tələb olunan reqressiya tənlikləri orijinal məlumat seriyasının dəyərlərində hər dəyişikliklə yenilənir, lakin yalnız diaqram sahəsi daxilində , isə verilənlər seriyası köhnə trend xətti tənliyi əsasında yaradılan , dəyişməz olaraq qalır;

    PivotChart hesabatlarında diaqramın və ya əlaqəli Pivot Cədvəl hesabatının görünüşünün dəyişdirilməsi mövcud trend xətlərini saxlamır, yəni trend xətləri çəkməzdən və ya PivotChart hesabatını başqa şəkildə formatlamazdan əvvəl siz hesabat tərtibatının tələb olunan tələblərə cavab verdiyinə əmin olmalısınız.

Trend xətləri qrafik, histoqram, düz qeyri-standart sahə diaqramları, bar diaqramları, səpələnmə diaqramları, qabarcıq diaqramları və fond qrafikləri kimi diaqramlarda təqdim olunan məlumat seriyalarını əlavə etmək üçün istifadə edilə bilər.

Siz 3D, normallaşdırılmış, radar, pasta və pişi diaqramlarında məlumat seriyasına trend xətləri əlavə edə bilməzsiniz.

Excel-in daxili funksiyalarından istifadə

Excel, həmçinin qrafik sahəsindən kənarda trend xətlərini çəkmək üçün reqressiya təhlili alətinə malikdir. Bu məqsədlə istifadə edə biləcəyiniz bir sıra statistik iş səhifəsi funksiyaları var, lakin onların hamısı yalnız xətti və ya eksponensial reqressiyalar qurmağa imkan verir.

Excel xətti reqressiyanın qurulması üçün bir neçə funksiyaya malikdir, xüsusən:

    TREND;

  • SLOPE və CUT.

Eksponensial trend xəttinin qurulması üçün bir neçə funksiya, xüsusən:

    LGRFPRIBL.

Qeyd etmək lazımdır ki, TREND və GROWTH funksiyalarından istifadə edərək reqressiyaların qurulması üsulları demək olar ki, eynidir. Eyni şeyi LINEST və LGRFPRIBL funksiyaları cütü haqqında da demək olar. Bu dörd funksiya üçün dəyərlər cədvəli yaratmaq reqressiyaların qurulması prosesini bir qədər çətinləşdirən massiv düsturları kimi Excel xüsusiyyətlərindən istifadə edir. Onu da qeyd edək ki, xətti reqressiyanın qurulması, fikrimizcə, SLOPE və INTERCEPT funksiyalarından istifadə etməklə ən asan yerinə yetirilir, burada birincisi xətti reqressiyanın yamacını, ikincisi isə y-də reqressiyanın kəsdiyi seqmenti təyin edir. -ox.

Reqressiya təhlili üçün daxili funksiyalar alətinin üstünlükləri bunlardır:

    trend xətlərini müəyyən edən bütün daxili statistik funksiyalar üçün tədqiq olunan xarakteristikanın verilənlər seriyasının yaradılmasının kifayət qədər sadə, vahid prosesi;

    yaradılan verilənlər seriyası əsasında trend xətlərinin qurulması üçün standart metodologiya;

    tələb olunan sayda irəli və ya geri addımlarla tədqiq olunan prosesin davranışını proqnozlaşdırmaq bacarığı.

Dezavantajlara Excel-də digər (xətti və eksponensial istisna olmaqla) trend xətlərinin yaradılması üçün daxili funksiyaların olmaması daxildir. Bu hal çox vaxt tədqiq olunan prosesin kifayət qədər dəqiq modelini seçməyə, eləcə də reallığa yaxın proqnozlar almağa imkan vermir. Bundan əlavə, TREND və GROWTH funksiyalarından istifadə edərkən, trend xətlərinin tənlikləri məlum deyil.

Qeyd etmək lazımdır ki, müəlliflər reqressiya təhlili kursunu hər hansı bir tamlıq dərəcəsi ilə təqdim etməyi qarşılarına məqsəd qoymamışlar. Onun əsas vəzifəsi təxmini məsələlərin həlli zamanı konkret nümunələrdən istifadə etməklə Excel paketinin imkanlarını göstərməkdir; reqressiyaların qurulması və proqnozlaşdırılması üçün Excel-in hansı effektiv alətlərə malik olduğunu nümayiş etdirmək; reqressiya təhlili üzrə geniş biliyə malik olmayan istifadəçi tərəfindən belə problemlərin nisbətən asanlıqla necə həll oluna biləcəyini təsvir edin.

Xüsusi problemlərin həlli nümunələri

Sadalanan Excel alətlərindən istifadə edərək konkret problemlərin həllinə baxaq.

Problem 1

1995-2002-ci illər üçün avtomobil nəqliyyatı müəssisəsinin mənfəəti haqqında məlumat cədvəli ilə. aşağıdakıları etməlisiniz:

    Diaqram qurun.

    Qrafikə xətti və çoxhədli (kvadrat və kub) trend xətləri əlavə edin.

    Trend xətti tənliklərindən istifadə edərək, 1995-2004-cü illər üçün hər bir trend xətti üçün müəssisə mənfəəti haqqında cədvəl məlumatları əldə edin.

    Müəssisənin 2003 və 2004-cü illər üçün mənfəətinin proqnozunu tərtib edin.

Problemin həlli

    Excel iş vərəqinin A4:C11 xanalarının diapazonuna Şəkildə göstərilən iş vərəqini daxil edin. 4.

    B4:C11 xanalarının diapazonunu seçdikdən sonra diaqram qururuq.

    Biz qurulmuş diaqramı aktivləşdiririk və yuxarıda təsvir edilən üsula uyğun olaraq Trend Xətti dialoq qutusunda trend xəttinin növünü seçdikdən sonra (şək. 1-ə baxın) diaqrama növbə ilə xətti, kvadrat və kub trend xətlərini əlavə edirik. Eyni dialoq qutusunda Parametrlər sekmesini açın (Şəkil 2-ə baxın), təqribən (hamarlanmış) əyrinin adı sahəsində əlavə olunan trendin adını daxil edin və Proqnoz: dövrlər sahəsində dəyər 2, çünki iki il üçün mənfəət proqnozu vermək planlaşdırılır. Diaqram sahəsində reqressiya tənliyini və R2 yaxınlaşma etibarlılıq dəyərini göstərmək üçün ekrandakı onay qutularında tənliyi göstərin və diaqramda yaxınlaşma etibarlılığı dəyərini (R^2) qoyun. Daha yaxşı vizual qavrayış üçün biz qurulmuş trend xətlərinin növünü, rəngini və qalınlığını dəyişdiririk, bunun üçün Trend Xətti Formatı dialoq qutusunun Görünüş nişanından istifadə edirik (bax. Şəkil 3). Əlavə edilmiş trend xətləri ilə nəticələnən diaqram Şəkildə göstərilmişdir. 5.

    1995-2004-cü illər üçün hər bir tendensiya xətti üzrə müəssisə mənfəəti haqqında cədvəl məlumatları əldə etmək. Şəkildə təqdim olunan trend xətti tənliklərindən istifadə edək. 5. Bunun üçün D3:F3 diapazonunun xanalarına seçilmiş trend xəttinin növü haqqında mətn məlumatı daxil edin: Xətti trend, Kvadrat trend, Kub trend. Sonra D4 xanasına xətti reqressiya düsturunu daxil edin və doldurma markerindən istifadə edərək bu düsturu D5:D13 xana diapazonuna nisbi istinadlarla köçürün. Qeyd etmək lazımdır ki, D4:D13 xanaları diapazonundan xətti reqressiya düsturu olan hər bir xana arqument kimi A4:A13 diapazonundan müvafiq xanaya malikdir. Eynilə, kvadrat reqressiya üçün E4:E13 xanalarının diapazonunu, kub reqressiya üçün isə F4:F13 xanalarının diapazonunu doldurun. Beləliklə, müəssisənin 2003 və 2004-cü illər üzrə mənfəətinin proqnozu tərtib edilmişdir. üç tendensiyadan istifadə edir. Nəticə dəyərlər cədvəli Şəkildə göstərilmişdir. 6.

Problem 2

    Diaqram qurun.

    Qrafikə loqarifmik, güc və eksponensial trend xətləri əlavə edin.

    Alınan tendensiya xətlərinin tənliklərini, eləcə də onların hər biri üçün R2 yaxınlaşmasının etibarlılıq qiymətlərini çıxarın.

    Trend xətti tənliklərindən istifadə edərək, 1995-2002-ci illər üçün hər bir trend xətti üzrə müəssisənin mənfəəti haqqında cədvəl məlumatları əldə edin.

    Bu trend xətlərindən istifadə etməklə şirkətin 2003 və 2004-cü illər üçün mənfəətinin proqnozunu hazırlayın.

Problemin həlli

1-ci məsələnin həllində verilən metodologiyaya əməl edərək, ona loqarifmik, güc və eksponensial meyl xətlərinin əlavə olunduğu diaqramı əldə edirik (şək. 7). Sonra, əldə edilmiş trend xətti tənliklərindən istifadə edərək, 2003 və 2004-cü illər üçün proqnozlaşdırılan dəyərlər də daxil olmaqla, müəssisənin mənfəəti üçün dəyərlər cədvəlini doldururuq. (şək. 8).

Şəkildə. 5 və şək. görünə bilər ki, loqarifmik meylli model yaxınlaşma etibarlılığının ən aşağı qiymətinə uyğundur.

R2 = 0,8659

R2-nin ən yüksək dəyərləri polinom tendensiyası olan modellərə uyğundur: kvadrat (R2 = 0,9263) və kub (R2 = 0,933).

Problem 3

1-ci tapşırıqda verilmiş 1995-2002-ci illər üçün avtomobil nəqliyyatı müəssisəsinin mənfəəti haqqında məlumat cədvəli ilə aşağıdakı addımları yerinə yetirməlisiniz.

    TREND və GROW funksiyalarından istifadə edərək xətti və eksponensial trend xətləri üçün məlumat seriyalarını əldə edin.

    TREND və GROWTH funksiyalarından istifadə edərək 2003 və 2004-cü illər üçün müəssisənin mənfəətinin proqnozunu hazırlayın.

    İlkin məlumatlar və əldə edilən verilənlər seriyası üçün diaqram qurun.

Problemin həlli

1-ci məsələ üçün iş vərəqindən istifadə edək (şək. 4-ə baxın). TREND funksiyasından başlayaq:

    müəssisənin mənfəəti haqqında məlum məlumatlara uyğun gələn TREND funksiyasının dəyərləri ilə doldurulmalı olan D4:D11 xanalarının diapazonunu seçin;

    Insert menyusundan Function əmrini çağırın. Görünən Function Wizard dialoq qutusunda Statistika kateqoriyasından TREND funksiyasını seçin və sonra OK düyməsini sıxın. Eyni əməliyyatı standart alətlər panelindəki (Funksiya daxil et) düyməsini sıxmaqla yerinə yetirmək olar.

    Görünən Function Arquments dialoq qutusunda Known_values_y sahəsinə C4:C11 xanalarının diapazonunu daxil edin; Known_values_x sahəsində - B4:B11 xanalarının diapazonu;

    Daxil edilmiş düsturun massiv formuluna çevrilməsi üçün + + düymələri birləşməsindən istifadə edin.

Düstur çubuğuna daxil etdiyimiz düstur belə görünəcək: =(TREND(C4:C11,B4:B11)).

Nəticədə, D4:D11 xanalarının diapazonu TREND funksiyasının müvafiq qiymətləri ilə doldurulur (Şəkil 9).

2003 və 2004-cü illər üçün müəssisənin mənfəətinin proqnozunu vermək. zəruri:

    TREND funksiyası tərəfindən proqnozlaşdırılan dəyərlərin daxil ediləcəyi D12:D13 xanalarının diapazonunu seçin.

    TREND funksiyasına zəng edin və görünən Funksiya Arqumentləri dialoq qutusunda Bilinən_dəyərlər_y sahəsinə - C4:C11 xanalarının diapazonunu daxil edin; Known_values_x sahəsində - B4:B11 xanalarının diapazonu; və Yeni_dəyərlər_x sahəsində - B12:B13 xanalarının diapazonu.

    Ctrl + Shift + Enter düymələri birləşməsindən istifadə edərək bu düsturu massiv düsturuna çevirin.

    Daxil edilmiş düstur belə görünəcək: =(TREND(C4:C11;B4:B11;B12:B13)) və D12:D13 xanalarının diapazonu TREND funksiyasının proqnozlaşdırılan qiymətləri ilə doldurulacaq (bax. 9).

Məlumat seriyası qeyri-xətti asılılıqların təhlilində istifadə olunan və xətti analoqu TREND ilə eyni şəkildə işləyən GROWTH funksiyasından istifadə etməklə eyni şəkildə doldurulur.

Şəkil 10-da cədvəl düsturun göstərilməsi rejimində göstərilir.

İlkin məlumatlar və əldə edilmiş məlumat seriyası üçün Şəkildə göstərilən diaqram. on bir.

Problem 4

Cari ayın 1-dən 11-dək olan dövr üçün avtonəqliyyat müəssisəsinin dispetçer xidməti tərəfindən xidmətlər üçün müraciətlərin qəbulu haqqında məlumat cədvəli ilə aşağıdakı hərəkətləri yerinə yetirməlisiniz.

    Xətti reqressiya üçün verilənlər seriyasını əldə edin: SLOPE və INTERCEPT funksiyalarından istifadə etməklə; LINEST funksiyasından istifadə etməklə.

    LGRFPRIBL funksiyasından istifadə edərək eksponensial reqressiya üçün bir sıra məlumat əldə edin.

    Yuxarıdakı funksiyalardan istifadə edərək cari ayın 12-dən 14-dək olan dövr üçün dispetçer xidmətinə müraciətlərin qəbulu ilə bağlı proqnoz hazırlayın.

    Orijinal və qəbul edilmiş məlumat seriyası üçün diaqram yaradın.

Problemin həlli

Qeyd edək ki, TREND və GROWTH funksiyalarından fərqli olaraq, yuxarıda sadalanan funksiyaların heç biri (SLOPE, INTERCEPT, LINEST, LGRFPRIB) reqressiya deyil. Bu funksiyalar zəruri reqressiya parametrlərini təyin edərək yalnız köməkçi rol oynayır.

SLOPE, INTERCEPT, LINEST, LGRFPRIB funksiyalarından istifadə etməklə qurulmuş xətti və eksponensial reqressiyalar üçün TREND və GROWTH funksiyalarına uyğun xətti və eksponensial reqressiyalardan fərqli olaraq, onların tənliklərinin görünüşü həmişə məlum olur.

1 . tənliyi ilə xətti reqressiya quraq:

y = mx+b

SLOPE və INTERCEPT funksiyalarından istifadə etməklə, reqressiya mailliyi m SLOPE funksiyası ilə, sərbəst b termini isə INTERCEPT funksiyası ilə müəyyən edilir.

Bunun üçün aşağıdakı hərəkətləri həyata keçiririk:

    orijinal cədvəli A4:B14 xana diapazonuna daxil edin;

    m parametrinin qiyməti C19 xanasında müəyyən ediləcək. Statistik kateqoriyadan Slope funksiyasını seçin; məlum_dəyərlər_y sahəsinə B4:B14 xanalarının diapazonunu və məlum_dəyərlər_x sahəsinə A4:A14 xanalarının diapazonunu daxil edin. Düstur C19 xanasına daxil ediləcək: =SLOPE(B4:B14,A4:A14);

    Bənzər bir texnikadan istifadə edərək D19 xanasındakı b parametrinin qiyməti müəyyən edilir. Və onun məzmunu belə görünəcək: =SEGMENT(B4:B14,A4:A14). Beləliklə, xətti reqressiyanın qurulması üçün tələb olunan m və b parametrlərinin dəyərləri müvafiq olaraq C19, D19 xanalarında saxlanılacaq;

    Sonra C4 xanasına xətti reqressiya düsturunu aşağıdakı formada daxil edin: =$C*A4+$D. Bu düsturda C19 və D19 xanaları mütləq istinadlarla yazılır (mümkün surət çıxarma zamanı xana ünvanı dəyişməməlidir). Mütləq istinad işarəsi $ kursoru xananın ünvanına qoyduqdan sonra klaviaturadan və ya F4 düyməsindən istifadə etməklə daxil edilə bilər. Doldurma qulpundan istifadə edərək, bu düsturu C4:C17 xanalarının diapazonuna köçürün. Biz tələb olunan verilənlər seriyasını alırıq (şək. 12). Sorğuların sayı tam ədəd olduğuna görə, Hüceyrə Format pəncərəsinin Nömrə sekmesinde onluq yerlərin sayı ilə rəqəm formatını 0-a təyin etməlisiniz.

2 . İndi tənliklə verilən xətti reqressiya quraq:

y = mx+b

LINEST funksiyasından istifadə etməklə.

Bunun üçün:

    LINEST funksiyasını C20:D20 xana diapazonuna massiv düsturu kimi daxil edin: =(LINEST(B4:B14,A4:A14)). Nəticədə C20 xanasında m parametrinin qiymətini, D20 xanasında b parametrinin qiymətini alırıq;

    D4 xanasına formula daxil edin: =$C*A4+$D;

    doldurma markerindən istifadə edərək bu düsturu D4:D17 xana diapazonuna köçürün və istədiyiniz məlumat seriyasını əldə edin.

3 . Tənlik ilə eksponensial reqressiya qururuq:

LGRFPRIBL funksiyasından istifadə edərək, oxşar şəkildə həyata keçirilir:

    C21:D21 xana diapazonunda biz LGRFPRIBL funksiyasını massiv düsturu kimi daxil edirik: =( LGRFPRIBL (B4:B14,A4:A14)). Bu halda m parametrinin qiyməti C21 xanasında, b parametrinin qiyməti isə D21 xanasında müəyyən ediləcək;

    düstur E4 xanasına daxil edilir: =$D*$C^A4;

    doldurma markerindən istifadə edərək, bu düstur eksponensial reqressiya üçün verilənlər seriyasının yerləşəcəyi E4:E17 xanalarının diapazonuna köçürülür (bax. Şəkil 12).

Şəkildə. Şəkil 13 tələb olunan xana diapazonları ilə istifadə etdiyimiz funksiyaları, həmçinin düsturları görə biləcəyiniz cədvəli göstərir.

Böyüklük R 2 çağırdı təyin əmsalı.

Reqressiya asılılığının qurulması vəzifəsi R əmsalının maksimum qiyməti aldığı modelin (1) m əmsallarının vektorunu tapmaqdır.

R-nin əhəmiyyətini qiymətləndirmək üçün düsturdan istifadə edərək hesablanan Fişerin F testindən istifadə olunur

Harada n- nümunənin ölçüsü (təcrübələrin sayı);

k model əmsallarının sayıdır.

Əgər F verilənlər üçün bəzi kritik dəyəri keçərsə nk və qəbul edilmiş etimad ehtimalı, onda R dəyəri əhəmiyyətli hesab edilir. Cədvəllər kritik dəyərlər F riyazi statistikaya dair arayış kitablarında verilmişdir.

Beləliklə, R-nin əhəmiyyəti təkcə onun dəyəri ilə deyil, həm də təcrübələrin sayı ilə modelin əmsallarının (parametrlərinin) sayı arasındakı nisbətlə müəyyən edilir. Həqiqətən, sadə xətti model üçün n=2 üçün korrelyasiya nisbəti 1-ə bərabərdir (bir düz xətt həmişə müstəvidə 2 nöqtədən keçə bilər). Bununla belə, əgər eksperimental məlumatlar təsadüfi dəyişənlərdirsə, R-nin belə bir dəyərinə çox ehtiyatla etibar etmək lazımdır. Adətən, əhəmiyyətli R və etibarlı reqressiya əldə etmək üçün təcrübələrin sayının model əmsallarının (n>k) sayından əhəmiyyətli dərəcədə çox olmasını təmin etməyə çalışırlar.

Xətti reqressiya modelini qurmaq üçün sizə lazımdır:

1) eksperimental məlumatları ehtiva edən n sətir və m sütunun siyahısını hazırlayın (çıxış dəyərini ehtiva edən sütun Y siyahıda birinci və ya sonuncu olmalıdır); Məsələn, əvvəlki tapşırıqdan məlumatları götürək, “Dövr nömrəsi” adlı bir sütun əlavə edərək, dövr nömrələrini 1-dən 12-yə qədər nömrələyin. (bu dəyərlər olacaq. X)

2) Data/Data Analysis/Regression menyusuna keçin

"Alətlər" menyusunda "Məlumatların təhlili" maddəsi yoxdursa, o zaman eyni menyuda "Əlavələr" maddəsinə keçməli və "Analiz paketi" qutusunu qeyd etməlisiniz.

3) "Reqressiya" informasiya qutusunda təyin edin:

· daxiletmə intervalı Y;

· daxiletmə intervalı X;

· çıxış intervalı - hesablama nəticələrinin yerləşdiriləcəyi intervalın yuxarı sol xanası (onları yeni iş vərəqinə yerləşdirmək tövsiyə olunur);

4) "Ok" düyməsini basın və nəticələri təhlil edin.

Hansı daha çox tapır geniş tətbiq elm və praktik fəaliyyətin müxtəlif sahələrində. Bu fizika, kimya, biologiya, iqtisadiyyat, sosiologiya, psixologiya və s. ola bilər. Taleyin iradəsi ilə mən tez-tez iqtisadiyyatla məşğul oluram və buna görə də bu gün sizin üçün heyrətamiz bir ölkəyə səyahət təşkil edəcəyəm. Ekonometriya=) ...Necə istəməzsən?! Orada çox yaxşıdır - sadəcə qərarınızı verməlisiniz! ...Amma yəqin ki, mütləq istədiyiniz şey problemləri həll etməyi öyrənməkdir ən kiçik kvadratlar üsulu. Və xüsusilə çalışqan oxucular onları nəinki dəqiq, həm də ÇOX TEZ ;-) həll etməyi öyrənəcəklər. problemin ümumi ifadəsi+ müşayiət edən nümunə:

Müəyyən bir fənn sahəsində kəmiyyət ifadəsi olan göstəriciləri öyrənək. Eyni zamanda, göstəricinin göstəricidən asılı olduğuna inanmaq üçün hər cür əsas var. Bu fərziyyə ya elmi fərziyyə ola bilər, ya da əsas sağlam düşüncəyə əsaslana bilər. Bununla belə, elmi bir kənara qoyub daha iştahaaçan sahələri - yəni ərzaq mağazalarını araşdıraq. ilə işarə edək:

– ərzaq mağazasının pərakəndə satış sahəsi, kv.m.,
- ərzaq mağazasının illik dövriyyəsi, milyon rubl.

Tamamilə aydındır ki, mağaza sahəsi nə qədər böyükdürsə, əksər hallarda onun dövriyyəsi bir o qədər çox olacaqdır.

Tutaq ki, qavalla müşahidələr/təcrübələr/hesablamalar/rəqslər apardıqdan sonra ixtiyarımızda rəqəmsal məlumatlar var:

Ərzaq mağazaları ilə məncə hər şey aydındır: - bu, 1-ci mağazanın ərazisidir, - onun illik dövriyyəsi, - 2-ci mağazanın sahəsi, - illik dövriyyəsi və s. Yeri gəlmişkən, məxfi materiallara çıxış əldə etmək heç də vacib deyil - ticarət dövriyyəsinin kifayət qədər dəqiq qiymətləndirilməsi aşağıdakı vasitələrlə əldə edilə bilər. riyazi statistika. Bununla belə, diqqətinizi yayındırmayaq, kommersiya casusluğu kursu artıq ödənişlidir =)

Cədvəl məlumatları nöqtələr şəklində də yazıla və tanış formada təsvir edilə bilər Kartezyen sistem .

Biz cavab verəcəyik vacib sual: Keyfiyyətli bir araşdırma üçün neçə bal lazımdır?

Nə qədər böyük, bir o qədər yaxşıdır. Minimum məqbul dəst 5-6 baldan ibarətdir. Bundan əlavə, məlumatların miqdarı kiçik olduqda, "anomal" nəticələr nümunəyə daxil edilə bilməz. Beləliklə, məsələn, kiçik bir elit mağaza "həmkarlarından" daha çox böyük sifarişlər qazana bilər və bununla da onları təhrif edə bilər. ümumi model, tapmaq üçün lazım olan budur!

Çox sadə desək, bir funksiya seçməliyik, cədvəli nöqtələrə mümkün qədər yaxın keçir . Bu funksiya deyilir yaxınlaşdıran (yaxınlaşma - yaxınlaşma) və ya nəzəri funksiya . Ümumiyyətlə, burada dərhal aşkar bir "iddiaçı" görünür - qrafiki BÜTÜN nöqtələrdən keçən yüksək dərəcəli polinom. Ancaq bu seçim mürəkkəbdir və çox vaxt sadəcə səhvdir. (çünki qrafik hər zaman "dövrə" olacaq və əsas trendi zəif əks etdirəcək).

Beləliklə, axtarılan funksiya kifayət qədər sadə olmalı və eyni zamanda asılılığı adekvat şəkildə əks etdirməlidir. Təxmin etdiyiniz kimi, bu cür funksiyaları tapmaq üsullarından biri adlanır ən kiçik kvadratlar üsulu. Əvvəlcə onun mahiyyətinə nəzər salaq ümumi görünüş. Bəzi funksiyaların təxmini eksperimental məlumatlara icazə verin:


Bu yaxınlaşmanın düzgünlüyünü necə qiymətləndirmək olar? Eksperimental ilə arasındakı fərqləri (sapmaları) da hesablayaq funksional mənalar (rəsmi öyrənirik). Ağla gələn ilk fikir, məbləğin nə qədər böyük olduğunu təxmin etməkdir, lakin problem fərqlərin mənfi ola bilməsidir. (Misal üçün, ) və bu cür cəmləmə nəticəsində sapmalar bir-birini ləğv edəcəkdir. Buna görə də, yaxınlaşmanın düzgünlüyünü qiymətləndirmək üçün cəmi götürmək yalvarır. modullar sapmalar:

və ya çökdü: (hər kəs bilmirsə: – bu, cəmi işarəsidir və – 1-dən -ə kimi dəyərlər alan köməkçi “sayıcı” dəyişəndir).

Təcrübə nöqtələrinin yaxınlaşması müxtəlif funksiyalar, alacağıq müxtəlif mənalar, və açıq-aydın, bu məbləğ daha kiçik olan yerdə, bu funksiya daha dəqiqdir.

Belə bir üsul mövcuddur və ona deyilir ən az modul üsulu. Ancaq praktikada bu, daha geniş yayılmışdır ən kiçik kvadrat üsulu, burada mümkün mənfi dəyərlər modul tərəfindən deyil, sapmaların kvadratlaşdırılması ilə aradan qaldırılır:

, bundan sonra səylər bir funksiyanın seçilməsinə yönəldilir ki, kənarların kvadratı cəmi olsun mümkün qədər kiçik idi. Əslində metodun adı da buradan gəlir.

İndi isə başqa bir şeyə qayıdırıq mühüm məqam: yuxarıda qeyd edildiyi kimi, seçilmiş funksiya olduqca sadə olmalıdır - lakin belə funksiyalar da çoxdur: xətti , hiperbolik, eksponensial, loqarifmik, kvadratik və s. Və təbii ki, burada mən dərhal “fəaliyyət sahəsini azaltmaq” istərdim. Tədqiqat üçün hansı sinif funksiyaları seçməliyəm? Primitiv, lakin effektiv texnika:

– Ən asan yol nöqtələri təsvir etməkdir rəsm üzərində və onların yerini təhlil edin. Əgər onlar düz bir xətt üzrə qaçmağa meyllidirlərsə, onda siz axtarmalısınız xəttin tənliyi ilə optimal dəyərlər Və . Başqa sözlə, vəzifə BELƏ əmsalları tapmaqdır ki, kvadratdan kənara çıxanların cəmi ən kiçik olsun.

Nöqtələr, məsələn, boyunca yerləşirsə hiperbola, onda xətti funksiyanın zəif yaxınlaşma verəcəyi aydındır. Bu halda biz hiperbola tənliyi üçün ən “əlverişli” əmsalları axtarırıq – kvadratların minimum cəmini verənlər .

İndi qeyd edin ki, hər iki halda söhbət gedir iki dəyişənin funksiyaları, arqumentləri kimindir asılılıq parametrləri axtarılır:

Və mahiyyətcə standart bir problemi həll etməliyik - tapın iki dəyişənin minimum funksiyası.

Nümunəmizi xatırlayaq: fərz edək ki, “mağaza” nöqtələri düz bir xətt üzərində yerləşir və buna inanmaq üçün hər cür əsas var. xətti asılılıq pərakəndə satış sahəsindən dövriyyə. BELƏ “a” və “be” əmsallarını tapaq ki, kvadratdan kənara çıxanların cəmi olsun. ən kiçik idi. Hər şey həmişəki kimi - birincisi 1-ci dərəcəli qismən törəmələr. görə xəttilik qaydası Siz cəmi ikonasının altında fərqlənə bilərsiniz:

İstifadə etmək istəyirsinizsə bu məlumat esse və ya kurs işi üçün - Mənbələr siyahısındakı keçidə görə çox minnətdar olacağam; belə ətraflı hesablamaları bir neçə yerdə tapa bilərsiniz:

Standart bir sistem yaradaq:

Hər tənliyi "iki" azaldırıq və əlavə olaraq məbləğləri "parçalayırıq":

Qeyd : “a” və “be”nin nə üçün cəmi işarəsindən kənara çıxarıla biləcəyini müstəqil təhlil edin. Yeri gəlmişkən, formal olaraq bu, məbləğlə edilə bilər

Sistemi “tətbiq olunan” formada yenidən yazaq:

bundan sonra problemimizin həlli üçün alqoritm yaranmağa başlayır:

Nöqtələrin koordinatlarını bilirikmi? Biz bilirik. Məbləğlər tapa bilerik? Asanlıqla. Ən sadəini edək iki naməlumda iki xətti tənlik sistemi(“a” və “olmaq”). Sistemi həll edirik, məsələn, Kramer üsulu, bunun nəticəsində stasionar nöqtə əldə edirik. Yoxlama ekstremum üçün kifayət qədər şərtdir, biz bu nöqtədə funksiyanın olduğunu yoxlaya bilərik dəqiq çatır minimum. Çek əlavə hesablamaları əhatə edir və buna görə də onu pərdə arxasında qoyacağıq (lazım olduqda, çatışmayan çərçivəyə baxmaq olar). Son nəticəni çıxarırıq:

Funksiya ən yaxşı yol (ən azı hər hansı digər xətti funksiya ilə müqayisədə) eksperimental nöqtələri yaxınlaşdırır . Kobud desək, onun qrafiki bu nöqtələrə mümkün qədər yaxın keçir. Ənənədə ekonometriya yaranan yaxınlaşma funksiyası da adlanır qoşalaşmış xətti reqressiya tənliyi .

Baxılan problem böyük praktik əhəmiyyət kəsb edir. Bizim nümunə vəziyyətimizdə, Eq. hansı ticarət dövriyyəsini proqnozlaşdırmağa imkan verir ("İqrek") mağaza satış sahəsinin bu və ya digər dəyərinə sahib olacaq (“x”in bu və ya digər mənası). Bəli, ortaya çıxan proqnoz yalnız bir proqnoz olacaq, lakin bir çox hallarda kifayət qədər dəqiq olacaq.

Mən "real" nömrələrlə yalnız bir problemi təhlil edəcəyəm, çünki orada heç bir çətinlik yoxdur - bütün hesablamalar səviyyədədir məktəb kurikulumu 7-8 sinif. 95 faiz hallarda sizdən sadəcə xətti funksiyanı tapmağınız xahiş olunacaq, lakin məqalənin ən sonunda optimal hiperbolanın, eksponensialın və bəzi digər funksiyaların tənliklərini tapmaq daha çətin olmadığını göstərəcəyəm.

Əslində, yalnız vəd edilmiş yaxşılıqları yaymaq qalır - belə nümunələri yalnız dəqiq deyil, həm də tez həll etməyi öyrənə bilərsiniz. Standartı diqqətlə öyrənirik:

Tapşırıq

İki göstərici arasındakı əlaqənin öyrənilməsi nəticəsində aşağıdakı cüt ədədlər əldə edilmişdir:

Ən kiçik kvadratlar metodundan istifadə edərək, empirikə ən yaxşı yaxınlaşan xətti funksiyanı tapın (təcrübəli) data. Dekart düzbucaqlı koordinat sistemində təcrübi nöqtələrin və yaxınlaşma funksiyasının qrafikinin qurulması üçün çertyoj çəkin. . Empirik və nəzəri qiymətlər arasındakı kvadratik kənarlaşmaların cəmini tapın. Xüsusiyyətin daha yaxşı olub olmadığını öyrənin (ən kiçik kvadratlar metodu baxımından) eksperimental nöqtələri yaxınlaşdırın.

Nəzərə alın ki, “x” mənaları təbiidir və bunun xarakterik mənalı mənası var ki, bu barədə bir az sonra danışacağam; lakin onlar, əlbəttə, fraksiya da ola bilər. Bundan əlavə, müəyyən bir tapşırığın məzmunundan asılı olaraq həm "X", həm də "oyun" dəyərləri tamamilə və ya qismən mənfi ola bilər. Yaxşı, bizə “simasız” tapşırıq verildi və biz ona başlayırıq həll:

Oranlar optimal funksiya sistemin həlli kimi tapırıq:

Daha yığcam qeyd etmək üçün "sayıcı" dəyişəni buraxıla bilər, çünki toplamanın 1-dən -ə qədər aparıldığı artıq aydındır.

Tələb olunan məbləğləri cədvəl şəklində hesablamaq daha rahatdır:


Hesablamalar mikrokalkulyatorda aparıla bilər, lakin Excel-dən istifadə etmək daha yaxşıdır - həm daha sürətli, həm də səhvsiz; qısa videoya baxın:

Beləliklə, aşağıdakıları əldə edirik sistemi:

Burada ikinci tənliyi 3 və vura bilərsiniz 1-ci tənliyin həddi ilə 2-cini çıxarın. Ancaq bu şansdır - praktikada sistemlər çox vaxt hədiyyə deyil və belə hallarda qənaət edir Kramer üsulu:
, yəni sistemin unikal həlli var.

yoxlayaq. Başa düşürəm ki, istəmirsiniz, amma niyə tamamilə qaçırılmayan səhvləri atlayın? Tapılan həlli ilə əvəz edək sol tərəf sistemin hər bir tənliyi:

Müvafiq tənliklərin sağ tərəfləri alınır ki, bu da sistemin düzgün həll edildiyini bildirir.

Beləliklə, istədiyiniz yaxınlaşma funksiyası: – dən bütün xətti funksiyalar Eksperimental məlumatları ən yaxşı şəkildə təxmin edən odur.

Fərqli düz mağazanın dövriyyəsinin onun sahəsindən asılılığı, tapılan asılılıqdır tərs ("nə qədər çox, bir o qədər az" prinsipi), və bu fakt dərhal mənfi ilə üzə çıxır yamac. Funksiya müəyyən bir göstəricinin 1 vahid artması ilə asılı göstəricinin dəyərinin azaldığını söyləyir orta 0,65 vahid. Necə deyərlər, qarabaşaq yarmasının qiyməti nə qədər bahadırsa, o qədər az satılır.

Təxmini funksiyanın qrafikini çəkmək üçün onun iki qiymətini tapırıq:

və rəsmini yerinə yetirin:


Qurulmuş düz xətt deyilir trend xətti (yəni xətti trend xətti, yəni ümumi hal trend mütləq düz xətt deyil). “Trenddə olmaq” ifadəsi ilə hər kəs tanışdır və hesab edirəm ki, bu terminin əlavə şərhə ehtiyacı yoxdur.

Kvadrat sapmaların cəmini hesablayaq empirik və nəzəri dəyərlər arasında. Həndəsi olaraq bu, "moruq" seqmentlərinin uzunluqlarının kvadratlarının cəmidir (onlardan ikisi o qədər kiçikdir ki, hətta görünmür).

Hesablamaları cədvəldə ümumiləşdirək:


Yenə də, onlar əl ilə edilə bilər; hər halda, 1-ci nöqtə üçün bir nümunə verəcəyəm:

lakin bunu artıq məlum üsulla etmək daha effektivdir:

Bir daha təkrar edirik: Əldə edilən nəticənin mənası nədir? From bütün xətti funksiyalar y funksiyası göstərici ən kiçikdir, yəni ailəsində ən yaxşı yaxınlaşmadır. Və burada, yeri gəlmişkən, problemin son sualı təsadüfi deyil: əgər təklif olunan eksponensial funksiya eksperimental nöqtələri yaxınlaşdırmaq daha yaxşı olardı?

Kvadrat sapmaların müvafiq cəmini tapaq - ayırd etmək üçün onları "epsilon" hərfi ilə işarələyəcəyəm. Texnika tamamilə eynidır:


Və yenə də, hər halda, 1-ci nöqtə üçün hesablamalar:

Excel-də biz standart funksiyadan istifadə edirik EXP (sintaksis Excel Yardımında tapıla bilər).

Nəticə: , bu o deməkdir ki, eksponensial funksiya düz xəttdən daha pis eksperimental nöqtələrə yaxınlaşır. .

Ancaq burada qeyd etmək lazımdır ki, "daha pis" hələ demək deyil, səhv nədir. İndi bunun qrafikini qurmuşam eksponensial funksiya– həm də nöqtələrin yaxınlığından keçir - o qədər ki, analitik araşdırma olmadan hansı funksiyanın daha dəqiq olduğunu söyləmək çətindir.

Bu, həlli yekunlaşdırır və mən mübahisənin təbii dəyərləri sualına qayıdıram. IN müxtəlif tədqiqatlar, bir qayda olaraq, iqtisadi və ya sosioloji, təbii “X”lər ayları, illəri və ya digər bərabər zaman intervallarını nömrələmək üçün istifadə olunur. Məsələn, aşağıdakı problemi nəzərdən keçirək.

Ən kiçik kvadrat üsulu

Ən kiçik kvadrat metodu ( OLS, OLS, Adi Ən Kiçik Kvadratlar) - nümunə verilənlərdən istifadə etməklə reqressiya modellərinin naməlum parametrlərinin qiymətləndirilməsi üçün reqressiya təhlilinin əsas üsullarından biri. Metod reqressiya qalıqlarının kvadratlarının cəmini minimuma endirməyə əsaslanır.

Qeyd etmək lazımdır ki, həll tələb olunan dəyişənlərin bəzi funksiyalarının kvadratlarının cəmini minimuma endirmək üçün hansısa meyarda olarsa və ya ona cavab verirsə, ən kiçik kvadratlar metodunun özünü hər hansı bir sahədə problemin həlli üsulu adlandırmaq olar. Buna görə də, ən kiçik kvadratlar metodu, sayı bu kəmiyyətlərin sayından çox olan tənlikləri və ya məhdudiyyətləri ödəyən kəmiyyətlər toplusunu taparkən, verilmiş funksiyanın digər (daha sadə) funksiyalarla təxmini təsviri (təxmini) üçün də istifadə edilə bilər. və s.

MNC-nin mahiyyəti

(izah edilən) dəyişən arasında ehtimal (reqressiya) əlaqəsinin bəzi (parametrik) modeli verilsin. y və bir çox amillər (izahedici dəyişənlər) x

naməlum model parametrlərinin vektoru haradadır

- təsadüfi model xətası.

Bu dəyişənlərin dəyərlərinin nümunə müşahidələri də olsun. Müşahidə nömrəsi () olsun. Sonra ci müşahidədəki dəyişənlərin qiymətləridir. Sonra b parametrlərinin verilmiş qiymətləri üçün izah edilən y dəyişəninin nəzəri (model) qiymətlərini hesablamaq olar:

Qalıqların ölçüsü parametrlərin qiymətlərindən asılıdır b.

Ən kiçik kvadratlar metodunun (adi, klassik) mahiyyəti, qalıqların kvadratlarının cəminin olduğu b parametrlərini tapmaqdır (ing. Kvadratların qalıq cəmi) minimal olacaq:

Ümumi halda bu problem ədədi optimallaşdırma (minimizasiya) üsulları ilə həll edilə bilər. Bu vəziyyətdə onlar haqqında danışırlar qeyri-xətti ən kiçik kvadratlar(NLS və ya NLLS - İngilis dili) Qeyri-xətti ən kiçik kvadratlar). Bir çox hallarda analitik həll əldə etmək mümkündür. Minimumlaşdırma məsələsini həll etmək üçün onu naməlum b parametrlərinə görə diferensiallaşdırmaq, törəmələri sıfıra bərabərləşdirmək və nəticədə yaranan tənliklər sistemini həll etməklə funksiyanın stasionar nöqtələrini tapmaq lazımdır:

Modelin təsadüfi səhvləri normal şəkildə paylanıbsa, eyni dispersiyaya malikdirsə və korrelyasiya yoxdursa, OLS parametrinin təxminləri maksimum ehtimal təxminləri (MLM) ilə eynidir.

Xətti model vəziyyətində OLS

Reqressiya asılılığı xətti olsun:

Qoy y izah edilən dəyişənin müşahidələrinin sütun vektorudur və faktor müşahidələrinin matrisidir (matrisanın sətirləri amil dəyərlərinin vektorlarıdır) bu müşahidə, sütunlarda - bütün müşahidələrdə verilmiş amilin dəyərlərinin vektoru). Xətti modelin matris təmsili:

O zaman izah edilən dəyişənin qiymətləndirmə vektoru ilə reqressiya qalıqlarının vektoru bərabər olacaqdır.

Müvafiq olaraq, reqressiya qalıqlarının kvadratlarının cəmi bərabər olacaqdır

Bu funksiyanı parametrlərin vektoruna görə fərqləndirərək və törəmələri sıfıra bərabərləşdirərək, tənliklər sistemini (matris şəklində) əldə edirik:

.

Bu tənliklər sisteminin həlli verir ümumi formula Xətti model üçün OLS təxminləri:

Analitik məqsədlər üçün bu düsturun sonuncu təqdimatı faydalıdır. Əgər reqressiya modelində verilənlər mərkəzləşdirilmişdir, onda bu təsvirdə birinci matrisa amillərin seçmə kovariasiya matrisi mənasını verir, ikincisi isə asılı dəyişənlə faktorların kovariasiya vektorudur. Əgər əlavə olaraq məlumatlar da normallaşdırılıb MSE-yə (yəni, nəticədə standartlaşdırılmış), onda birinci matris amillərin seçmə korrelyasiya matrisi, ikinci vektor - asılı dəyişənlə amillərin seçmə korrelyasiya vektoru mənasına malikdir.

Modellər üçün OLS qiymətləndirmələrinin mühüm xüsusiyyəti daimi ilə- qurulmuş reqressiyanın xətti nümunə məlumatının ağırlıq mərkəzindən keçir, yəni bərabərlik təmin edilir:

Xüsusilə, ekstremal vəziyyətdə, yeganə reqressor sabit olduqda, yeganə parametrin (sabitin özü) OLS qiymətləndirməsinin izah edilən dəyişənin orta qiymətinə bərabər olduğunu görürük. Yəni arifmetik orta, onun üçün məlumdur yaxşı xassələri böyük ədədlər qanunlarından, həm də ən kiçik kvadratlar təxminidir - ondan kənara çıxan kvadratların minimum cəminin meyarına cavab verir.

Nümunə: ən sadə (ikili) reqressiya

Cütlənmiş xətti reqressiya vəziyyətində hesablama düsturları sadələşdirilir (matris cəbri olmadan edə bilərsiniz):

OLS qiymətləndiricilərinin xassələri

İlk növbədə qeyd edək ki, xətti modellər üçün OLS təxminləridir xətti təxminlər, yuxarıdakı düsturdan aşağıdakı kimi. Qərəzsiz OLS qiymətləndirmələri üçün yerinə yetirmək üçün zəruri və kifayətdir ən vacib şərtdir reqressiya təhlili: amillərə görə şərti olaraq, təsadüfi səhvin riyazi gözləntisi sıfıra bərabər olmalıdır. Bu şərt, xüsusilə, əgər razıdır

  1. gözlənilən dəyər təsadüfi səhvlər sıfırdır və
  2. amillər və təsadüfi səhvlər müstəqil təsadüfi dəyişənlərdir.

İkinci şərt - amillərin ekzogenliyi şərti əsasdır. Bu xüsusiyyət yerinə yetirilməzsə, demək olar ki, hər hansı bir qiymətləndirmənin son dərəcə qeyri-qənaətbəxş olacağını güman edə bilərik: onlar hətta ardıcıl olmayacaqlar (yəni, hətta çox böyük miqdarda məlumat bu vəziyyətdə yüksək keyfiyyətli qiymətləndirmələr əldə etməyə imkan vermir). ). Klassik halda təsadüfi səhvdən fərqli olaraq amillərin determinizmi haqqında daha güclü fərziyyə irəli sürülür ki, bu da avtomatik olaraq ekzogenlik şərtinin yerinə yetirildiyini bildirir. Ümumi halda, qiymətləndirmələrin ardıcıllığı üçün seçmə ölçüsü sonsuza qədər artdıqca, matrisin bəzi qeyri-tək olmayan matrisə yaxınlaşması ilə birlikdə ekzogenlik şərtini təmin etmək kifayətdir.

Ardıcıllıq və qərəzsizliyə əlavə olaraq (adi) ən kiçik kvadratların təxminlərinin də təsirli olması (xətti qərəzsiz qiymətləndirmələr sinfində ən yaxşısı) üçün təsadüfi səhvin əlavə xüsusiyyətləri təmin edilməlidir:

Bu fərziyyələr təsadüfi xəta vektorunun kovariasiya matrisi üçün tərtib edilə bilər

Bu şərtləri ödəyən xətti model adlanır klassik. Klassik xətti reqressiya üçün OLS təxminləri qərəzsiz, ardıcıl və bütün xətti qərəzsiz təxminlər sinfində ən effektiv hesablamalardır (ingilis ədəbiyyatında bu abreviatura bəzən istifadə olunur). MAVİ (Ən yaxşı xətti əsassız qiymətləndirici) - ən yaxşı xətti qərəzsiz qiymətləndirmə; rus ədəbiyyatında Qauss-Markov teoreminə daha çox istinad edilir). Göstərmək asan olduğu kimi, əmsal təxminlərinin vektorunun kovariasiya matrisi aşağıdakılara bərabər olacaqdır:

Ümumiləşdirilmiş OLS

Ən kiçik kvadratlar metodu geniş ümumiləşdirməyə imkan verir. Qalıqların kvadratlarının cəmini minimuma endirmək əvəzinə, qalıqlar vektorunun bəzi müsbət müəyyən kvadratik formasını minimuma endirmək olar, burada bəzi simmetrik müsbət müəyyən çəki matrisi var. Ən kiçik kvadratlar bu yanaşmanın xüsusi halıdır, burada çəki matrisi eynilik matrisi ilə mütənasibdir. Simmetrik matrislər (və ya operatorlar) nəzəriyyəsindən məlum olduğu kimi, belə matrislər üçün parçalanma var. Nəticə etibarilə, göstərilən funksional aşağıdakı kimi təqdim edilə bilər, yəni bu funksional bəzi çevrilmiş "qalıqların" kvadratlarının cəmi kimi təqdim edilə bilər. Beləliklə, biz ən kiçik kvadratlar üsulları sinfini - LS metodlarını (Ən kiçik kvadratlar) ayıra bilərik.

Sübut edilmişdir (Aitken teoremi) ümumiləşdirilmiş xətti reqressiya modeli üçün (təsadüfi xətaların kovariasiya matrisinə heç bir məhdudiyyət qoyulmur) ən effektiv (xətti qərəzsiz qiymətləndirmələr sinfində) sözdə təxminlərdir. Ümumiləşdirilmiş Kiçik Kvadratlar (GLS - Ümumiləşdirilmiş Kiçik Kvadratlar)- Təsadüfi xətaların tərs kovariasiya matrisinə bərabər çəki matrisi ilə LS üsulu: .

Göstərilə bilər ki, xətti modelin parametrlərinin GLS təxminləri formulunun forması var

Bu təxminlərin kovariasiya matrisi müvafiq olaraq bərabər olacaqdır

Əslində OLS-in mahiyyəti ilkin verilənlərin müəyyən (xətti) transformasiyasında (P) və çevrilmiş verilənlərə adi OLS-in tətbiqindədir. Bu transformasiyanın məqsədi odur ki, transformasiya edilmiş məlumatlar üçün təsadüfi səhvlər artıq klassik fərziyyələri təmin edir.

Çəkili OLS

Diaqonal çəki matrisi (və buna görə də təsadüfi səhvlərdən ibarət kovariasiya matrisi) vəziyyətində bizdə ən kiçik ölçülü kvadratlar (WLS) var. IN bu halda model qalıqlarının kvadratlarının çəkili cəmi minimuma endirilir, yəni hər bir müşahidə bu müşahidədə təsadüfi xətanın dispersiyasına tərs mütənasib “çəki” alır: . Əslində, məlumatlar müşahidələrin çəkisi ilə dəyişdirilir (gözlənilənə mütənasib məbləğə bölünür). standart sapma təsadüfi səhvlər) və adi OLS ölçülmüş məlumatlara tətbiq edilir.

MNC-nin praktikada istifadəsinin bəzi xüsusi halları

Xətti asılılığın yaxınlaşması

Müəyyən bir skalyar kəmiyyətin müəyyən bir skalyar kəmiyyətdən asılılığının öyrənilməsi nəticəsində (Bu, məsələn, gərginliyin cərəyan gücündən asılılığı ola bilər: , sabit qiymət haradadır, müqavimət dirijor), bu kəmiyyətlərin ölçülməsi aparıldı, nəticədə dəyərlər və onların müvafiq dəyərləri. Ölçmə məlumatları cədvəldə qeyd edilməlidir.

Cədvəl. Ölçmə nəticələri.

Ölçmə nömrəsi.
1
2
3
4
5
6

Sual olunur: asılılığı ən yaxşı təsvir etmək üçün əmsalın hansı dəyəri seçilə bilər? Ən kiçik kvadratlar metoduna görə, bu dəyər elə olmalıdır ki, dəyərlərin dəyərlərdən kvadrat sapmalarının cəmi olsun.

minimal idi

Kvadrat sapmaların cəmi bir ekstremuma malikdir - minimum, bu düsturdan istifadə etməyə imkan verir. Bu düsturdan əmsalın qiymətini tapaq. Bunun üçün onun sol tərəfini aşağıdakı kimi çeviririk:

Sonuncu düstur bizə problemdə tələb olunan əmsalın dəyərini tapmağa imkan verir.

Hekayə

Əvvəl erkən XIX V. elm adamlarının naməlumların sayının tənliklərin sayından az olduğu tənliklər sisteminin həlli üçün müəyyən qaydaları yox idi; O vaxta qədər tənliklərin növündən və kalkulyatorların zəkasından asılı olan özəl texnikalardan istifadə olunurdu və buna görə də eyni müşahidə məlumatlarına əsaslanan müxtəlif kalkulyatorlar yaranırdı. müxtəlif nəticələr. Qauss (1795) metodun ilk tətbiqindən məsul idi və Legendre (1805) müstəqil olaraq onu kəşf edib nəşr etdi. müasir ad(fr. Méthode des moindres arrés ) . Laplas metodu ehtimal nəzəriyyəsi ilə əlaqələndirdi və Amerika riyaziyyatçısı Adrain (1808) onun ehtimal-nəzəri tətbiqlərini nəzərdən keçirdi. Metod Encke, Bessel, Hansen və başqalarının əlavə tədqiqatları ilə geniş yayılmış və təkmilləşdirilmişdir.

OLS-in alternativ istifadəsi

Ən kiçik kvadratlar metodu ideyası reqressiya təhlili ilə birbaşa əlaqəli olmayan digər hallarda da istifadə edilə bilər. Fakt budur ki, kvadratların cəmi vektorlar üçün ən çox yayılmış yaxınlıq ölçülərindən biridir (sonlu ölçülü fəzalarda Evklid metrikası).

Tətbiqlərdən biri sistemləri “həll etmək”dir xətti tənliklər, olan tənliklərin sayı daha çox nömrə dəyişənlər

burada matris kvadrat deyil, ölçülü düzbucaqlıdır.

Belə tənliklər sisteminin, ümumi halda, həlli yoxdur (əgər dərəcə faktiki olaraq dəyişənlərin sayından çox olarsa). Buna görə də, bu sistem yalnız və vektorlar arasındakı "məsafəni" minimuma endirmək üçün belə bir vektor seçmək mənasında "həll edilə bilər". Bunu etmək üçün, siz sol və kvadrat fərqlərin cəmini minimuma endirmək kriteriyasını tətbiq edə bilərsiniz. sağ hissələr sistemin tənlikləri, yəni. Bu minimumlaşdırma probleminin həllinin həllə gətirib çıxardığını göstərmək asandır növbəti sistem tənliklər

Ən kiçik kvadrat üsulu

Ən kiçik kvadrat metodu ( OLS, OLS, Adi Ən Kiçik Kvadratlar) - nümunə verilənlərdən istifadə etməklə reqressiya modellərinin naməlum parametrlərinin qiymətləndirilməsi üçün reqressiya təhlilinin əsas üsullarından biri. Metod reqressiya qalıqlarının kvadratlarının cəmini minimuma endirməyə əsaslanır.

Qeyd etmək lazımdır ki, həll tələb olunan dəyişənlərin bəzi funksiyalarının kvadratlarının cəmini minimuma endirmək üçün hansısa meyarda olarsa və ya ona cavab verirsə, ən kiçik kvadratlar metodunun özünü hər hansı bir sahədə problemin həlli üsulu adlandırmaq olar. Buna görə də, ən kiçik kvadratlar metodu, sayı bu kəmiyyətlərin sayından çox olan tənlikləri və ya məhdudiyyətləri ödəyən kəmiyyətlər toplusunu taparkən, verilmiş funksiyanın digər (daha sadə) funksiyalarla təxmini təsviri (təxmini) üçün də istifadə edilə bilər. və s.

MNC-nin mahiyyəti

(izah edilən) dəyişən arasında ehtimal (reqressiya) əlaqəsinin bəzi (parametrik) modeli verilsin. y və bir çox amillər (izahedici dəyişənlər) x

naməlum model parametrlərinin vektoru haradadır

- təsadüfi model xətası.

Bu dəyişənlərin dəyərlərinin nümunə müşahidələri də olsun. Müşahidə nömrəsi () olsun. Sonra ci müşahidədəki dəyişənlərin qiymətləridir. Sonra b parametrlərinin verilmiş qiymətləri üçün izah edilən y dəyişəninin nəzəri (model) qiymətlərini hesablamaq olar:

Qalıqların ölçüsü parametrlərin qiymətlərindən asılıdır b.

Ən kiçik kvadratlar metodunun (adi, klassik) mahiyyəti, qalıqların kvadratlarının cəminin olduğu b parametrlərini tapmaqdır (ing. Kvadratların qalıq cəmi) minimal olacaq:

Ümumi halda bu problem ədədi optimallaşdırma (minimizasiya) üsulları ilə həll edilə bilər. Bu vəziyyətdə onlar haqqında danışırlar qeyri-xətti ən kiçik kvadratlar(NLS və ya NLLS - İngilis dili) Qeyri-xətti ən kiçik kvadratlar). Bir çox hallarda analitik həll əldə etmək mümkündür. Minimumlaşdırma məsələsini həll etmək üçün onu naməlum b parametrlərinə görə diferensiallaşdırmaq, törəmələri sıfıra bərabərləşdirmək və nəticədə yaranan tənliklər sistemini həll etməklə funksiyanın stasionar nöqtələrini tapmaq lazımdır:

Modelin təsadüfi səhvləri normal şəkildə paylanıbsa, eyni dispersiyaya malikdirsə və korrelyasiya yoxdursa, OLS parametrinin təxminləri maksimum ehtimal təxminləri (MLM) ilə eynidir.

Xətti model vəziyyətində OLS

Reqressiya asılılığı xətti olsun:

Qoy y izah edilən dəyişənin müşahidələrinin sütun vektorudur və faktor müşahidələrinin matrisidir (matrisanın sətirləri verilmiş müşahidədə amil dəyərlərinin vektorlarıdır, sütunlar verilmiş amilin qiymətlərinin vektorudur. bütün müşahidələrdə). Xətti modelin matris təmsili:

O zaman izah edilən dəyişənin qiymətləndirmə vektoru ilə reqressiya qalıqlarının vektoru bərabər olacaqdır.

Müvafiq olaraq, reqressiya qalıqlarının kvadratlarının cəmi bərabər olacaqdır

Bu funksiyanı parametrlərin vektoruna görə fərqləndirərək və törəmələri sıfıra bərabərləşdirərək, tənliklər sistemini (matris şəklində) əldə edirik:

.

Bu tənliklər sisteminin həlli xətti model üçün ən kiçik kvadratların təxminlərinin ümumi düsturunu verir:

Analitik məqsədlər üçün bu düsturun sonuncu təqdimatı faydalıdır. Əgər reqressiya modelində verilənlər mərkəzləşdirilmişdir, onda bu təsvirdə birinci matrisa amillərin seçmə kovariasiya matrisi mənasını verir, ikincisi isə asılı dəyişənlə faktorların kovariasiya vektorudur. Əgər əlavə olaraq məlumatlar da normallaşdırılıb MSE-yə (yəni, nəticədə standartlaşdırılmış), onda birinci matris amillərin seçmə korrelyasiya matrisi, ikinci vektor - asılı dəyişənlə amillərin seçmə korrelyasiya vektoru mənasına malikdir.

Modellər üçün OLS qiymətləndirmələrinin mühüm xüsusiyyəti daimi ilə- qurulmuş reqressiyanın xətti nümunə məlumatının ağırlıq mərkəzindən keçir, yəni bərabərlik təmin edilir:

Xüsusilə, ekstremal vəziyyətdə, yeganə reqressor sabit olduqda, yeganə parametrin (sabitin özü) OLS qiymətləndirməsinin izah edilən dəyişənin orta qiymətinə bərabər olduğunu görürük. Yəni, böyük ədədlər qanunlarından yaxşı xassələri ilə tanınan arifmetik orta, həm də ən kiçik kvadratlar təxminidir - ondan kənara çıxan kvadratların minimum cəminin meyarını ödəyir.

Nümunə: ən sadə (ikili) reqressiya

Cütlənmiş xətti reqressiya vəziyyətində hesablama düsturları sadələşdirilir (matris cəbri olmadan edə bilərsiniz):

OLS qiymətləndiricilərinin xassələri

İlk növbədə qeyd edirik ki, xətti modellər üçün OLS təxminləri yuxarıdakı düsturdan aşağıdakı kimi xətti təxminlərdir. Qərəzsiz OLS qiymətləndirmələri üçün reqressiya təhlilinin ən vacib şərtini yerinə yetirmək zəruri və kifayətdir: amillərlə şərtlənən təsadüfi səhvin riyazi gözləntisi sıfıra bərabər olmalıdır. Bu şərt, xüsusilə, əgər təmin edilir

  1. təsadüfi səhvlərin riyazi gözləntisi sıfırdır və
  2. amillər və təsadüfi səhvlər müstəqil təsadüfi dəyişənlərdir.

İkinci şərt - amillərin ekzogenliyi şərti əsasdır. Bu xüsusiyyət yerinə yetirilməzsə, demək olar ki, hər hansı bir qiymətləndirmənin son dərəcə qeyri-qənaətbəxş olacağını güman edə bilərik: onlar hətta ardıcıl olmayacaqlar (yəni, hətta çox böyük miqdarda məlumat bu vəziyyətdə yüksək keyfiyyətli qiymətləndirmələr əldə etməyə imkan vermir). ). Klassik halda təsadüfi səhvdən fərqli olaraq amillərin determinizmi haqqında daha güclü fərziyyə irəli sürülür ki, bu da avtomatik olaraq ekzogenlik şərtinin yerinə yetirildiyini bildirir. Ümumi halda, qiymətləndirmələrin ardıcıllığı üçün seçmə ölçüsü sonsuza qədər artdıqca, matrisin bəzi qeyri-tək olmayan matrisə yaxınlaşması ilə birlikdə ekzogenlik şərtini təmin etmək kifayətdir.

Ardıcıllıq və qərəzsizliyə əlavə olaraq (adi) ən kiçik kvadratların təxminlərinin də təsirli olması (xətti qərəzsiz qiymətləndirmələr sinfində ən yaxşısı) üçün təsadüfi səhvin əlavə xüsusiyyətləri təmin edilməlidir:

Bu fərziyyələr təsadüfi xəta vektorunun kovariasiya matrisi üçün tərtib edilə bilər

Bu şərtləri ödəyən xətti model adlanır klassik. Klassik xətti reqressiya üçün OLS təxminləri qərəzsiz, ardıcıl və bütün xətti qərəzsiz təxminlər sinfində ən effektiv hesablamalardır (ingilis ədəbiyyatında bu abreviatura bəzən istifadə olunur). MAVİ (Ən yaxşı xətti əsassız qiymətləndirici) - ən yaxşı xətti qərəzsiz qiymətləndirmə; rus ədəbiyyatında Qauss-Markov teoreminə daha çox istinad edilir). Göstərmək asan olduğu kimi, əmsal təxminlərinin vektorunun kovariasiya matrisi aşağıdakılara bərabər olacaqdır:

Ümumiləşdirilmiş OLS

Ən kiçik kvadratlar metodu geniş ümumiləşdirməyə imkan verir. Qalıqların kvadratlarının cəmini minimuma endirmək əvəzinə, qalıqlar vektorunun bəzi müsbət müəyyən kvadratik formasını minimuma endirmək olar, burada bəzi simmetrik müsbət müəyyən çəki matrisi var. Ən kiçik kvadratlar bu yanaşmanın xüsusi halıdır, burada çəki matrisi eynilik matrisi ilə mütənasibdir. Simmetrik matrislər (və ya operatorlar) nəzəriyyəsindən məlum olduğu kimi, belə matrislər üçün parçalanma var. Nəticə etibarilə, göstərilən funksional aşağıdakı kimi təqdim edilə bilər, yəni bu funksional bəzi çevrilmiş "qalıqların" kvadratlarının cəmi kimi təqdim edilə bilər. Beləliklə, biz ən kiçik kvadratlar üsulları sinfini - LS metodlarını (Ən kiçik kvadratlar) ayıra bilərik.

Sübut edilmişdir (Aitken teoremi) ümumiləşdirilmiş xətti reqressiya modeli üçün (təsadüfi xətaların kovariasiya matrisinə heç bir məhdudiyyət qoyulmur) ən effektiv (xətti qərəzsiz qiymətləndirmələr sinfində) sözdə təxminlərdir. Ümumiləşdirilmiş Kiçik Kvadratlar (GLS - Ümumiləşdirilmiş Kiçik Kvadratlar)- Təsadüfi xətaların tərs kovariasiya matrisinə bərabər çəki matrisi ilə LS üsulu: .

Göstərilə bilər ki, xətti modelin parametrlərinin GLS təxminləri formulunun forması var

Bu təxminlərin kovariasiya matrisi müvafiq olaraq bərabər olacaqdır

Əslində OLS-in mahiyyəti ilkin verilənlərin müəyyən (xətti) transformasiyasında (P) və çevrilmiş verilənlərə adi OLS-in tətbiqindədir. Bu transformasiyanın məqsədi odur ki, transformasiya edilmiş məlumatlar üçün təsadüfi səhvlər artıq klassik fərziyyələri təmin edir.

Çəkili OLS

Diaqonal çəki matrisi (və buna görə də təsadüfi səhvlərdən ibarət kovariasiya matrisi) vəziyyətində bizdə ən kiçik ölçülü kvadratlar (WLS) var. Bu zaman model qalıqlarının kvadratlarının çəkili cəmi minimuma endirilir, yəni hər bir müşahidə bu müşahidədə təsadüfi xətanın dispersiyasına tərs mütənasib olan “çəki” alır: . Əslində, məlumatlar müşahidələrin çəkisi ilə transformasiya olunur (təsadüfi səhvlərin təxmin edilən standart kənarlaşmasına mütənasib olan məbləğə bölünür) və ölçülmüş məlumatlara adi OLS tətbiq edilir.

MNC-nin praktikada istifadəsinin bəzi xüsusi halları

Xətti asılılığın yaxınlaşması

Müəyyən bir skalyar kəmiyyətin müəyyən bir skalyar kəmiyyətdən asılılığının öyrənilməsi nəticəsində (Bu, məsələn, gərginliyin cərəyan gücündən asılılığı ola bilər: , sabit qiymət haradadır, müqavimət dirijor), bu kəmiyyətlərin ölçülməsi aparıldı, nəticədə dəyərlər və onların müvafiq dəyərləri. Ölçmə məlumatları cədvəldə qeyd edilməlidir.

Cədvəl. Ölçmə nəticələri.

Ölçmə nömrəsi.
1
2
3
4
5
6

Sual olunur: asılılığı ən yaxşı təsvir etmək üçün əmsalın hansı dəyəri seçilə bilər? Ən kiçik kvadratlar metoduna görə, bu dəyər elə olmalıdır ki, dəyərlərin dəyərlərdən kvadrat sapmalarının cəmi olsun.

minimal idi

Kvadrat sapmaların cəmi bir ekstremuma malikdir - minimum, bu düsturdan istifadə etməyə imkan verir. Bu düsturdan əmsalın qiymətini tapaq. Bunun üçün onun sol tərəfini aşağıdakı kimi çeviririk:

Sonuncu düstur bizə problemdə tələb olunan əmsalın dəyərini tapmağa imkan verir.

Hekayə

19-cu əsrin əvvəllərinə qədər. elm adamlarının naməlumların sayının tənliklərin sayından az olduğu tənliklər sisteminin həlli üçün müəyyən qaydaları yox idi; O vaxta qədər tənliklərin növündən və kalkulyatorların zəkasından asılı olan özəl texnikalardan istifadə olunurdu və buna görə də eyni müşahidə məlumatlarına əsaslanan müxtəlif kalkulyatorlar müxtəlif nəticələrə gəlirdilər. Metoddan ilk dəfə Qauss (1795) istifadə etdi və Legendre (1805) müstəqil olaraq kəşf etdi və müasir adı ilə nəşr etdi (Fransız. Méthode des moindres arrés ) . Laplas metodu ehtimal nəzəriyyəsi ilə əlaqələndirdi və Amerika riyaziyyatçısı Adrain (1808) onun ehtimal-nəzəri tətbiqlərini nəzərdən keçirdi. Metod Encke, Bessel, Hansen və başqalarının əlavə tədqiqatları ilə geniş yayılmış və təkmilləşdirilmişdir.

OLS-in alternativ istifadəsi

Ən kiçik kvadratlar metodu ideyası reqressiya təhlili ilə birbaşa əlaqəli olmayan digər hallarda da istifadə edilə bilər. Fakt budur ki, kvadratların cəmi vektorlar üçün ən çox yayılmış yaxınlıq ölçülərindən biridir (sonlu ölçülü fəzalarda Evklid metrikası).

Tətbiqlərdən biri tənliklərin sayının dəyişənlərin sayından çox olduğu xətti tənliklər sistemlərinin “həlli”dir.

burada matris kvadrat deyil, ölçülü düzbucaqlıdır.

Belə tənliklər sisteminin, ümumi halda, həlli yoxdur (əgər dərəcə faktiki olaraq dəyişənlərin sayından çox olarsa). Buna görə də, bu sistem yalnız və vektorlar arasındakı "məsafəni" minimuma endirmək üçün belə bir vektor seçmək mənasında "həll edilə bilər". Bunun üçün sistem tənliklərinin sol və sağ tərəfləri arasındakı fərqlərin kvadratlarının cəmini minimuma endirmək kriteriyasını tətbiq edə bilərsiniz, yəni. Bu minimumlaşdırma məsələsinin həllinin aşağıdakı tənliklər sisteminin həllinə gətirib çıxardığını göstərmək asandır

Əgər bəziləri fiziki kəmiyyət başqa kəmiyyətdən asılıdır, onda bu asılılığı x-in müxtəlif qiymətlərində y ölçməklə öyrənmək olar. Ölçmələr nəticəsində bir sıra dəyərlər əldə edilir:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Belə bir təcrübənin məlumatlarına əsasən y = ƒ(x) asılılığının qrafikini qurmaq olar. Alınan əyri ƒ(x) funksiyasının formasını mühakimə etməyə imkan verir. Lakin bu funksiyaya daxil olan sabit əmsallar naməlum olaraq qalır. Onları ən kiçik kvadratlar üsulu ilə müəyyən etmək olar. Eksperimental nöqtələr, bir qayda olaraq, əyri üzərində tam olaraq yatmır. Ən kiçik kvadratlar metodu tələb edir ki, eksperimental nöqtələrin əyridən kənara çıxmalarının kvadratlarının cəmi, yəni. 2 ən kiçik idi.

Praktikada bu üsul ən çox (və ən sadə) xətti əlaqə vəziyyətində istifadə olunur, yəni. Nə vaxt

y = kx və ya y = a + bx.

Xətti asılılıq fizikada çox geniş yayılmışdır. Hətta əlaqə qeyri-xətti olduqda belə, onlar adətən düz xətt əldə etmək üçün qrafik qurmağa çalışırlar. Məsələn, n şüşəsinin sındırma göstəricisinin n = a + b/λ 2 əlaqəsi ilə işıq dalğasının uzunluğu λ ilə əlaqəli olduğu qəbul edilərsə, onda n-nin λ -2-dən asılılığı qrafikdə göstərilir.

Asılılığı nəzərdən keçirin y = kx(mənşədən keçən düz xətt). Nöqtələrimizin düz xəttdən sapmalarının kvadratlarının cəmi φ dəyərini tərtib edək

φ dəyəri həmişə müsbətdir və nöqtələrimiz düz xəttə nə qədər yaxın olarsa, o qədər kiçik olur. Ən kiçik kvadratlar metodu bildirir ki, k üçün dəyər elə seçilməlidir ki, φ minimuma malik olsun


və ya
(19)

Hesablama göstərir ki, k-nin dəyərinin müəyyən edilməsində orta kök-kvadrat səhvi bərabərdir.

, (20)
burada n ölçmələrin sayıdır.

İndi bir az daha düşünək ağır iş, ballar düstura cavab verdikdə y = a + bx(mənşədən keçməyən düz xətt).

Vəzifə x i , y i dəyərlər toplusunu tapmaqdır ən yaxşı dəyərlər a və b.

Yenidən φ kvadrat formasını tərtib edək, məbləğinə bərabərdir x i, y i nöqtələrinin düz xəttdən kvadratik kənarlaşmaları

və φ-nin minimuma malik olduğu a və b qiymətlərini tapın

;

.

.

Bu tənliklərin birgə həlli verir

(21)

a və b-nin təyin edilməsinin kök orta kvadrat səhvləri bərabərdir

(23)

.  (24)

Bu üsuldan istifadə edərək ölçmə nəticələrini emal edərkən, bütün məlumatları (19) (24) düsturlarına daxil edilmiş bütün məbləğlərin əvvəlcədən hesablandığı bir cədvəldə ümumiləşdirmək rahatdır. Bu cədvəllərin formaları aşağıdakı nümunələrdə verilmişdir.

Misal 1. Dinamikanın əsas tənliyi tədqiq edilmişdir fırlanma hərəkətiε = M/J (mənşədən keçən xətt). M anının müxtəlif dəyərlərində müəyyən bir cismin bucaq sürəti ε ölçüldü. Bu cismin ətalət anını təyin etmək tələb olunur. İkinci və üçüncü sütunlarda güc anının və bucaq sürətinin ölçülməsinin nəticələri verilmişdir. cədvəl 5.

Cədvəl 5
n M, N m ε, s -1 M 2 M ε ε - km (ε - km) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Formula (19) istifadə edərək müəyyən edirik:

.

Kök orta kvadrat səhvini müəyyən etmək üçün (20) düsturundan istifadə edirik.

0.005775Kiloqram-1 · m -2 .

Formula (18) görə bizdə var

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kq m2.

Etibarlılığı P = 0,95 təyin edərək, n = 5 üçün Tələbə əmsalları cədvəlindən istifadə edərək t = 2,78 tapırıq və müəyyən edirik. mütləq səhvΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kq m2.

Nəticələri formada yazaq:

J = (3,0 ± 0,2) kq m2;


Misal 2.Ən kiçik kvadratlar üsulu ilə metal müqavimətinin temperatur əmsalını hesablayaq. Müqavimət temperaturdan xətti olaraq asılıdır

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Sərbəst termin 0 ° C temperaturda R 0 müqavimətini təyin edir və yamac əmsalı temperatur əmsalı α və müqavimət R 0 məhsuludur.

Ölçmə və hesablamaların nəticələri cədvəldə verilmişdir ( 6-cı cədvələ baxın).

Cədvəl 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

(21), (22) düsturlarından istifadə edərək müəyyən edirik

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

α-nın tərifində səhv tapaq. -dən bəri (18) düsturuna görə biz:

.

(23), (24) düsturlarından istifadə etməklə bizdə var

;

0.014126 Ohm.

Etibarlılığı P = 0,95 olaraq təyin edərək, n = 6 üçün Tələbə əmsalları cədvəlindən istifadə edərək, t = 2,57 tapırıq və mütləq xətanı müəyyən edirik Δα = 2,57 0,000132 = 0,000338 -1 dərəcə.

α = (23 ± 4) 10 -4 dolu P = 0,95-də -1.


Misal 3. Nyuton halqalarından istifadə edərək linzanın əyrilik radiusunu təyin etmək tələb olunur. Nyutonun halqalarının radiusları r m ölçüldü və bu halqaların ədədləri m təyin olundu. Nyuton halqalarının radiusları lensin əyrilik radiusu R və üzük nömrəsi tənliklə bağlıdır.

r 2 m = mλR - 2d 0 R,

burada d 0 linza ilə müstəvi-paralel lövhə arasındakı boşluğun qalınlığı (və ya linzanın deformasiyası),

λ düşən işığın dalğa uzunluğu.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

onda tənlik formasını alacaq y = a + bx.

.

Ölçmə və hesablamaların nəticələri daxil edilir cədvəl 7.

Cədvəl 7
n x = m y = r 2, 10 -2 mm 2 m -¯m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –



Saytda yeni

>

Ən məşhur