Uy Protezlash va implantatsiya Eng kichik kvadratlar usuli. Eng kichik kvadratlar usuli qayerda qo'llaniladi?

Eng kichik kvadratlar usuli. Eng kichik kvadratlar usuli qayerda qo'llaniladi?

Misol.

O'zgaruvchilar qiymatlari bo'yicha eksperimental ma'lumotlar X Va da jadvalda keltirilgan.

Ularning hizalanishi natijasida funktsiya olinadi

Foydalanish usuli eng kichik kvadratlar , bu ma'lumotlarni chiziqli bog'liqlik bilan yaqinlashtiring y=ax+b(parametrlarni toping A Va b). Ikki qatordan qaysi biri yaxshiroq (eng kichik kvadratlar usuli ma'nosida) tajriba ma'lumotlarini tekislashini aniqlang. Chizma qiling.

Eng kichik kvadratlar usulining (LSM) mohiyati.

Vazifa ikkita o'zgaruvchining funktsiyasi bajariladigan chiziqli bog'liqlik koeffitsientlarini topishdir A Va b eng kichik qiymatni oladi. Ya'ni, berilgan A Va b eksperimental ma'lumotlarning topilgan to'g'ri chiziqdan kvadrat og'ishlari yig'indisi eng kichik bo'ladi. Bu eng kichik kvadratlar usulining butun nuqtasidir.

Shunday qilib, misolni yechish ikkita o'zgaruvchining funksiyasining ekstremumini topishga to'g'ri keladi.

Koeffitsientlarni topish formulalarini chiqarish.

Ikki noma’lumli ikkita tenglamalar sistemasi tuziladi va yechiladi. Funksiyaning qisman hosilalarini topish o'zgaruvchilar bo'yicha A Va b, bu hosilalarni nolga tenglashtiramiz.

Olingan tenglamalar tizimini har qanday usul yordamida echamiz (masalan almashtirish usuli bilan yoki Kramer usuli) va eng kichik kvadratlar usuli (LSM) yordamida koeffitsientlarni topish formulalarini oling.

Berilgan A Va b funktsiyasi eng kichik qiymatni oladi. Bu faktning isboti keltirilgan sahifaning oxiridagi matnda quyida.

Bu eng kichik kvadratlarning butun usuli. Parametrni topish uchun formula a,,, va parametrlarini o'z ichiga oladi n- eksperimental ma'lumotlar miqdori. Ushbu miqdorlarning qiymatlarini alohida hisoblashni tavsiya etamiz. Koeffitsient b hisoblashdan keyin topiladi a.

Asl misolni eslash vaqti keldi.

Yechim.

Bizning misolimizda n=5. Kerakli koeffitsientlar formulalariga kiritilgan miqdorlarni hisoblash qulayligi uchun jadvalni to'ldiramiz.

Jadvalning to'rtinchi qatoridagi qiymatlar har bir raqam uchun 2-qatorning qiymatlarini 3-qatorning qiymatlariga ko'paytirish yo'li bilan olinadi. i.

Jadvalning beshinchi qatoridagi qiymatlar har bir raqam uchun 2-qatordagi qiymatlarni kvadratga solish orqali olinadi. i.

Jadvalning oxirgi ustunidagi qiymatlar qatorlar bo'ylab qiymatlarning yig'indisidir.

Koeffitsientlarni topish uchun eng kichik kvadratlar usuli formulalaridan foydalanamiz A Va b. Jadvalning oxirgi ustunidagi tegishli qiymatlarni ularga almashtiramiz:

Demak, y = 0,165x+2,184- kerakli yaqinlashuvchi to'g'ri chiziq.

Chiziqlarning qaysi biri ekanligini aniqlash uchun qoladi y = 0,165x+2,184 yoki dastlabki ma'lumotlarni yaxshiroq yaqinlashtiradi, ya'ni eng kichik kvadratlar usulidan foydalangan holda baho beradi.

Eng kichik kvadratlar usulini xato baholash.

Buning uchun ushbu satrlardan dastlabki ma'lumotlarning kvadratik og'ishlari yig'indisini hisoblashingiz kerak Va , kichikroq qiymat eng kichik kvadratlar usuli ma'nosida asl ma'lumotlarni yaxshiroq yaqinlashtiradigan chiziqqa mos keladi.

dan beri, keyin to'g'ri y = 0,165x+2,184 asl ma'lumotlarga yaxshiroq yaqinlashadi.

Eng kichik kvadratlar (LS) usulining grafik tasviri.

Grafiklarda hamma narsa aniq ko'rinadi. Qizil chiziq topilgan to'g'ri chiziqdir y = 0,165x+2,184, ko'k chiziq , pushti nuqtalar asl ma'lumotlardir.

Amalda, turli jarayonlarni modellashtirishda, xususan, iqtisodiy, fizik, texnik, ijtimoiy - ma'lum sobit nuqtalarda ma'lum qiymatlardan funktsiyalarning taxminiy qiymatlarini hisoblashning u yoki bu usuli keng qo'llaniladi.

Funktsiyani yaqinlashtirish muammosi ko'pincha yuzaga keladi:

    tajriba natijasida olingan jadval ma'lumotlaridan foydalangan holda o'rganilayotgan jarayonning xarakterli miqdorlarining qiymatlarini hisoblash uchun taxminiy formulalarni qurishda;

    sonli integrasiya, differensiallash, yechishda differensial tenglamalar va hokazo.;

    agar kerak bo'lsa, ko'rib chiqilayotgan intervalning oraliq nuqtalarida funktsiyalar qiymatlarini hisoblang;

    ko'rib chiqilgan intervaldan tashqarida jarayonning xarakterli miqdorlarining qiymatlarini aniqlashda, xususan, prognozlashda.

Agar jadvalda belgilangan muayyan jarayonni modellashtirish uchun eng kichik kvadratlar usuli asosida bu jarayonni taxminan tavsiflovchi funktsiyani tuzadigan bo'lsak, u yaqinlashuvchi funktsiya (regressiya) deb ataladi va yaqinlashuvchi funktsiyalarni qurish vazifasining o'zi deyiladi. yaqinlashish muammosi.

Ushbu maqolada MS Excel paketining ushbu turdagi masalalarni yechish imkoniyatlari ko‘rib chiqiladi, bundan tashqari, u jadvallashtirilgan funksiyalar uchun regressiyalarni qurish (yaratish) usullari va usullarini taqdim etadi (bu regressiya tahlilining asosidir).

Excelda regressiyalarni yaratish uchun ikkita variant mavjud.

    O'rganilayotgan jarayon xarakteristikasi uchun ma'lumotlar jadvali asosida tuzilgan diagrammaga tanlangan regressiyalarni (trend chiziqlarini) qo'shish (faqat diagramma tuzilgan bo'lsa mavjud);

    Excel ish varag'ining o'rnatilgan statistik funktsiyalaridan foydalanish, to'g'ridan-to'g'ri manba ma'lumotlar jadvalidan regressiyalarni (trend chiziqlarini) olish imkonini beradi.

Grafikga trend chiziqlarini qo'shish

Jarayonni tavsiflovchi va diagramma bilan tasvirlangan ma'lumotlar jadvali uchun Excelda samarali regressiya tahlili vositasi mavjud bo'lib, u sizga quyidagilarga imkon beradi:

    eng kichik kvadratlar usuli asosida qurish va diagrammaga besh turdagi regressiyalarni qo‘shish, ular o‘rganilayotgan jarayonni turli darajadagi aniqlik bilan modellashtirish;

    tuzilgan regressiya tenglamasini diagrammaga qo‘shish;

    tanlangan regressiyaning diagrammada ko'rsatilgan ma'lumotlarga muvofiqligi darajasini aniqlash.

Grafik ma'lumotlariga asoslanib, Excel sizga tenglama bilan aniqlangan chiziqli, ko'p nomli, logarifmik, quvvatli, eksponensial regressiya turlarini olish imkonini beradi:

y = y(x)

Bu erda x mustaqil o'zgaruvchi bo'lib, u ko'pincha natural sonlar ketma-ketligining qiymatlarini oladi (1; 2; 3; ...) va, masalan, o'rganilayotgan jarayon vaqtini (xususiyatlar) ortga hisoblashni hosil qiladi.

1 . Chiziqli regressiya qiymatlari doimiy tezlikda ko'tariladigan yoki kamayadigan xususiyatlarni modellashtirish uchun yaxshi. Bu o'rganilayotgan jarayon uchun qurish uchun eng oddiy model. U quyidagi tenglamaga muvofiq tuzilgan:

y = mx + b

bu yerda m - qiyalik burchagi tangensi chiziqli regressiya abscissa o'qiga; b - chiziqli regressiyaning ordinata o'qi bilan kesishish nuqtasining koordinatasi.

2 . Polinomli tendentsiya chizig'i bir nechta aniq ekstremallarga (maksima va minimal) ega xususiyatlarni tavsiflash uchun foydalidir. Polinom darajani tanlash o'rganilayotgan xarakteristikaning ekstremal soni bilan belgilanadi. Shunday qilib, ikkinchi darajali polinom faqat bitta maksimal yoki minimumga ega bo'lgan jarayonni yaxshi tasvirlashi mumkin; uchinchi darajali polinom - ikkita ekstremaldan ko'p bo'lmagan; to'rtinchi darajali polinom - uchta ekstremaldan ko'p bo'lmagan va hokazo.

Bunday holda, tendentsiya chizig'i tenglamaga muvofiq tuziladi:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

Bu erda c0, c1, c2,... c6 koeffitsientlari konstantalar bo'lib, ularning qiymatlari qurilish vaqtida aniqlanadi.

3 . Logarifmik trend chizig'i qiymatlari dastlab tez o'zgarib, keyin asta-sekin barqarorlashadigan xususiyatlarni modellashtirishda muvaffaqiyatli qo'llaniladi.

y = c ln(x) + b

4 . Agar o'rganilayotgan munosabatlarning qiymatlari o'sish sur'atining doimiy o'zgarishi bilan tavsiflangan bo'lsa, kuch-huquqiy tendentsiya chizig'i yaxshi natijalar beradi. Bunday qaramlikka misol sifatida avtomobilning bir tekis tezlashtirilgan harakati grafigi keltiriladi. Agar ma'lumotlarda nol yoki salbiy qiymatlar mavjud bo'lsa, siz quvvat trend chizig'idan foydalana olmaysiz.

Tenglamaga muvofiq tuzilgan:

y = c xb

bu erda b, c koeffitsientlari doimiydir.

5 . Ma'lumotlarning o'zgarish tezligi doimiy ravishda oshib borayotganda eksponensial trend chizig'idan foydalanish kerak. Nol yoki manfiy qiymatlarni o'z ichiga olgan ma'lumotlar uchun ushbu turdagi yaqinlashtirish ham qo'llanilmaydi.

Tenglamaga muvofiq tuzilgan:

y = c ebx

bu erda b, c koeffitsientlari doimiydir.

Chiziqni tanlashda Excel tendentsiyasi R2 qiymatini avtomatik ravishda hisoblab chiqadi, bu taxminiylikning ishonchliligini tavsiflaydi: dan yaqinroq qiymat R2 birlikka teng bo'lsa, trend chizig'i o'rganilayotgan jarayonga shunchalik ishonchli yaqinlashadi. Agar kerak bo'lsa, R2 qiymati har doim diagrammada ko'rsatilishi mumkin.

Formula bilan aniqlanadi:

Ma'lumotlar qatoriga trend chizig'ini qo'shish uchun:

    bir qator ma'lumotlarga asoslangan diagrammani faollashtiring, ya'ni diagramma maydonini bosing. Asosiy menyuda Diagramma elementi paydo bo'ladi;

    ushbu elementni bosgandan so'ng, ekranda trend chizig'ini qo'shish buyrug'ini tanlashingiz kerak bo'lgan menyu paydo bo'ladi.

Xuddi shu harakatlar sichqoncha ko'rsatkichini ma'lumotlar qatoridan biriga mos keladigan grafik ustiga olib borib, sichqonchaning o'ng tugmachasini bosish orqali osongina amalga oshirilishi mumkin; Ko'rsatilgan kontekst menyusida "Trend chizig'ini qo'shish" buyrug'ini tanlang. Ekranda "Trend" yorlig'i ochilgan holda "Trend chizig'i" dialog oynasi paydo bo'ladi (1-rasm).

Shundan so'ng sizga kerak bo'ladi:

Tur yorlig'ida kerakli trend chizig'i turini tanlang (Chiziqli tur sukut bo'yicha tanlangan). Polinom turi uchun Degree maydonida tanlangan ko'phadning darajasini belgilang.

1 . O'rnatilgan seriya maydonida ko'rib chiqilayotgan diagrammadagi barcha ma'lumotlar seriyalari ro'yxati keltirilgan. Muayyan ma'lumotlar qatoriga trend chizig'ini qo'shish uchun "O'rnatilgan seriya" maydonida uning nomini tanlang.

Agar kerak bo'lsa, Parametrlar yorlig'iga o'tish orqali (2-rasm) trend chizig'i uchun quyidagi parametrlarni o'rnatishingiz mumkin:

    yaqinlashtiruvchi (tekislashtirilgan) egri chiziq maydoni nomidagi trend chizig'i nomini o'zgartiring.

    Prognoz maydonida prognoz uchun davrlar sonini (oldinga yoki orqaga) belgilang;

    diagramma maydonida tendentsiya chizig'i tenglamasini ko'rsatish, buning uchun diagrammadagi katakchada tenglamani ko'rsatishni yoqishingiz kerak;

    diagramma maydonida R2 taxminiy ishonchlilik qiymatini ko'rsatish, buning uchun siz diagrammada taxminiy ishonchlilik qiymatini joylashtirish (R^2) katagiga belgi qo'yishingiz kerak;

    trend chizig'ining Y o'qi bilan kesishish nuqtasini o'rnating, buning uchun egri chiziqning Y o'qi bilan bir nuqtada kesishishi uchun katakchani yoqishingiz kerak;

    Muloqot oynasini yopish uchun OK tugmasini bosing.

Chizilgan trend chizig'ini tahrirlashni boshlash uchun uchta usul mavjud:

    oldindan trend chizig'ini tanlagan holda Format menyusidagi Tanlangan trend chizig'i buyrug'idan foydalaning;

    kontekst menyusidan trend chizig‘ini sichqonchaning o‘ng tugmasi bilan bosish orqali chaqiriladigan “Format trend line” buyrug‘ini tanlang;

    trend chizig'ini ikki marta bosing.

Ekranda "Trend chizig'i formati" dialog oynasi paydo bo'ladi (3-rasm), unda uchta yorliq mavjud: Ko'rish, Tur, Parametrlar va oxirgi ikkitasining mazmuni Trend chizig'i muloqot oynasining o'xshash yorliqlariga to'liq mos keladi (1-rasm). -2). Ko'rinish yorlig'ida siz chiziq turini, uning rangi va qalinligini belgilashingiz mumkin.

Allaqachon chizilgan trend chizig'ini o'chirish uchun o'chiriladigan trend chizig'ini tanlang va Delete tugmasini bosing.

Ko'rib chiqilayotgan regressiya tahlili vositasining afzalliklari quyidagilardan iborat:

    grafiklar bo'yicha trend chizig'ini uning uchun ma'lumotlar jadvalini yaratmasdan qurishning nisbatan qulayligi;

    taklif qilingan tendentsiyalar turlarining juda keng ro'yxati va bu ro'yxat eng ko'p ishlatiladigan regressiya turlarini o'z ichiga oladi;

    o'rganilayotgan jarayonning xulq-atvorini o'zboshimchalik bilan (sog'lom fikr doirasida) oldinga va orqaga qadamlar bilan bashorat qilish qobiliyati;

    trend chizig'i tenglamasini analitik shaklda olish qobiliyati;

    agar kerak bo'lsa, yaqinlashishning ishonchliligi bahosini olish imkoniyati.

Kamchiliklarga quyidagilar kiradi:

    trend chizig'ini qurish faqat bir qator ma'lumotlarga asoslangan diagramma mavjud bo'lganda amalga oshiriladi;

    O'rganilayotgan xarakteristikalar uchun olingan trend chizig'i tenglamalari asosida ma'lumotlar seriyasini yaratish jarayoni biroz chalkash: kerakli regressiya tenglamalari dastlabki ma'lumotlar seriyasi qiymatlarining har bir o'zgarishi bilan yangilanadi, lekin faqat diagramma maydonida. , esa ma'lumotlar seriyasi, eski trend chizig'i tenglamasi asosida yaratilgan, o'zgarishsiz qoladi;

    PivotChart hisobotlarida diagramma yoki bogʻlangan jamlanma jadval hisoboti koʻrinishini oʻzgartirish mavjud trend chiziqlarini saqlamaydi, yaʼni trend chiziqlarini chizish yoki PivotChart hisobotini boshqa yoʻl bilan formatlashdan oldin, hisobot tartibi kerakli talablarga javob berishiga ishonch hosil qilishingiz kerak.

Grafik, gistogramma, yassi standartlashtirilmagan maydon diagrammalari, shtrixli diagrammalar, tarqalish diagrammalari, pufakchalar diagrammalari va birja grafiklari kabi diagrammalarda taqdim etilgan ma'lumotlar seriyasini to'ldirish uchun trend chiziqlaridan foydalanish mumkin.

Siz 3D, normallashtirilgan, radar, pirog va donut diagrammalarida maʼlumotlar seriyasiga trend chiziqlarini qoʻsha olmaysiz.

Excelning o'rnatilgan funktsiyalaridan foydalanish

Excelda shuningdek, diagramma maydonidan tashqarida trend chiziqlarini chizish uchun regressiya tahlili vositasi mavjud. Bu maqsadda foydalanishingiz mumkin bo'lgan bir qator statistik ish varag'i funktsiyalari mavjud, ammo ularning barchasi faqat chiziqli yoki eksponensial regressiyalarni yaratishga imkon beradi.

Excelda chiziqli regressiyani yaratish uchun bir nechta funktsiyalar mavjud, xususan:

    TREND;

  • SLOPE va CUT.

Shuningdek, eksponensial trend chizig'ini yaratish uchun bir nechta funktsiyalar, xususan:

    LGRFPRIBL.

Shuni ta'kidlash kerakki, TREND va GROWTH funktsiyalaridan foydalangan holda regressiyalarni qurish usullari deyarli bir xil. LINEST va LGRFPRIBL funksiyalari juftligi haqida ham xuddi shunday deyish mumkin. Ushbu to'rtta funktsiya uchun qiymatlar jadvalini yaratishda regressiyalarni yaratish jarayonini biroz chalkashtirib yuboradigan massiv formulalari kabi Excel xususiyatlaridan foydalaniladi. Shuni ham ta'kidlab o'tamizki, chiziqli regressiyani qurish, bizning fikrimizcha, SLOPE va INTERCEPT funktsiyalari yordamida eng oson bajariladi, bu erda ularning birinchisi chiziqli regressiyaning qiyaligini aniqlaydi, ikkinchisi esa regressiya bilan kesilgan segmentni aniqlaydi. y o'qi.

Regressiya tahlili uchun o'rnatilgan funktsiyalar vositasining afzalliklari quyidagilardan iborat:

    trend chiziqlarini aniqlaydigan barcha o'rnatilgan statistik funktsiyalar uchun o'rganilayotgan xarakteristikaning ma'lumotlar seriyasini yaratishning juda oddiy, bir xil jarayoni;

    ishlab chiqarilgan ma'lumotlar seriyalari asosida trend chiziqlarini qurishning standart metodologiyasi;

    o'rganilayotgan jarayonning harakatini oldinga yoki orqaga kerakli miqdordagi qadamlar bilan bashorat qilish qobiliyati.

Kamchiliklar qatoriga Excel-da boshqa (chiziqli va eksponensial) trend chiziqlarini yaratish uchun o'rnatilgan funktsiyalar mavjud emas. Bu holat ko'pincha o'rganilayotgan jarayonning etarlicha aniq modelini tanlashga, shuningdek, haqiqatga yaqin prognozlarni olishga imkon bermaydi. Bundan tashqari, TREND va GROWTH funksiyalaridan foydalanilganda, tendentsiya chiziqlari tenglamalari noma'lum.

Shuni ta'kidlash kerakki, mualliflar regressiya tahlili kursini to'liqlik darajasi bilan taqdim etishni maqsad qilmaganlar. Uning asosiy vazifasi - taxminiy masalalarni yechishda aniq misollar yordamida Excel paketining imkoniyatlarini ko'rsatish; regressiya va prognozlash uchun Excelning qanday samarali vositalari mavjudligini ko'rsatish; regressiya tahlili bo'yicha keng ma'lumotga ega bo'lmagan foydalanuvchi tomonidan ham bunday muammolarni qanday qilib nisbatan oson hal qilish mumkinligini ko'rsating.

Muayyan muammolarni hal qilish misollari

Keling, sanab o'tilgan Excel vositalaridan foydalangan holda muayyan muammolarni hal qilishni ko'rib chiqaylik.

Muammo 1

1995-2002 yillardagi avtotransport korxonasining foydasi to'g'risidagi ma'lumotlar jadvali bilan. quyidagilarni qilishingiz kerak:

    Diagramma tuzing.

    Grafikga chiziqli va polinom (kvadrat va kub) trend chiziqlarini qo'shing.

    Trend chizig'i tenglamalaridan foydalanib, 1995-2004 yillardagi har bir trend chizig'i uchun korxona foydasi bo'yicha jadval ma'lumotlarini oling.

    2003 va 2004 yillar uchun korxona foydasi prognozini tuzing.

Muammoning yechimi

    Excel ish varag'ining A4:C11 katakchalari oralig'iga rasmda ko'rsatilgan ish varag'ini kiriting. 4.

    B4:C11 katakchalari diapazonini tanlab, biz diagramma tuzamiz.

    Biz tuzilgan diagrammani faollashtiramiz va yuqorida tavsiflangan usulga ko'ra, "Trend chizig'i" dialog oynasida (1-rasmga qarang) trend chizig'ining turini tanlagandan so'ng, diagrammaga navbat bilan chiziqli, kvadratik va kubik tendentsiya chiziqlarini qo'shamiz. Xuddi shu dialog oynasida Parametrlar yorlig'ini oching (2-rasmga qarang), yaqinlashtiruvchi (tekislashtirilgan) egri chiziq nomi maydoniga qo'shilayotgan tendentsiya nomini kiriting va oldinga prognoz: davrlar maydoniga o'rnating. 2-qiymat, chunki kelgusi ikki yil uchun foyda prognozini tuzish rejalashtirilgan. Diagramma maydonida regressiya tenglamasini va yaqinlashuv ishonchliligi qiymati R2 ni ko'rsatish uchun ekranda belgilash katakchalarida tenglamani ko'rsatishni yoqing va diagrammaga yaqinlashish ishonchliligi qiymatini (R^2) qo'ying. Yaxshiroq vizual idrok etish uchun biz tuzilgan trend chiziqlarining turini, rangini va qalinligini o'zgartiramiz, buning uchun biz "Trend chizig'i formati" muloqot oynasining "Ko'rish" yorlig'idan foydalanamiz (3-rasmga qarang). Olingan diagramma qo'shilgan trend chiziqlari bilan rasmda ko'rsatilgan. 5.

    1995-2004 yillardagi har bir tendentsiya yo'nalishi bo'yicha korxona foydasi bo'yicha jadval ma'lumotlarini olish. Shaklda keltirilgan tendentsiya chizig'i tenglamalaridan foydalanamiz. 5. Buning uchun D3:F3 diapazonidagi katakchalarga tanlangan trend chizig’i turi haqidagi matnli ma’lumotlarni kiriting: Chiziqli trend, Kvadrat trend, Kub trend. Keyinchalik, D4 katakchaga chiziqli regressiya formulasini kiriting va to'ldirish belgisidan foydalanib, ushbu formuladan D5: D13 katakcha diapazoniga nisbiy havolalar bilan nusxa oling. Shuni ta'kidlash kerakki, D4:D13 katakchalari diapazonidagi chiziqli regressiya formulasiga ega bo'lgan har bir katak argument sifatida A4:A13 diapazonidagi mos keladigan katakka ega. Xuddi shunday, kvadratik regressiya uchun E4:E13 katakchalar diapazonini, kubik regressiya uchun esa F4:F13 katakchalar diapazonini to‘ldiring. Shunday qilib, korxonaning 2003 va 2004 yillardagi foydasi prognozi tuzildi. uchta tendentsiyadan foydalanish. Olingan qiymatlar jadvali rasmda ko'rsatilgan. 6.

Muammo 2

    Diagramma tuzing.

    Grafikga logarifmik, quvvat va eksponensial tendentsiya chiziqlarini qo'shing.

    Olingan tendentsiya chiziqlari tenglamalarini, shuningdek ularning har biri uchun R2 ga yaqinlik ishonchlilik qiymatlarini chiqaring.

    Trend chizig'i tenglamalaridan foydalanib, 1995-2002 yillardagi har bir trend chizig'i uchun korxona foydasi to'g'risida jadval ma'lumotlarini oling.

    Ushbu tendentsiya chiziqlaridan foydalangan holda kompaniyaning 2003 va 2004 yillardagi foydasi prognozini tuzing.

Muammoning yechimi

1-masalani yechishda berilgan metodologiyaga amal qilib, unga logarifmik, quvvat va eksponensial trend chiziqlari qo‘shilgan diagramma olamiz (7-rasm). Keyinchalik, olingan tendentsiya chizig'i tenglamalaridan foydalanib, biz korxona foydasi uchun qiymatlar jadvalini, shu jumladan 2003 va 2004 yillar uchun bashorat qilingan qiymatlarni to'ldiramiz. (8-rasm).

Shaklda. 5 va rasm. logarifmik tendentsiyaga ega model taxminiy ishonchlilikning eng past qiymatiga mos kelishini ko'rish mumkin

R2 = 0,8659

R2 ning eng yuqori qiymatlari polinom tendentsiyasiga ega modellarga mos keladi: kvadratik (R2 = 0,9263) va kubik (R2 = 0,933).

Muammo 3

1-topshiriqda berilgan 1995-2002 yillardagi avtotransport korxonasining foydasi to'g'risidagi ma'lumotlar jadvali bilan siz quyidagi amallarni bajarishingiz kerak.

    TREND va GROW funktsiyalaridan foydalangan holda chiziqli va eksponensial trend chiziqlari uchun ma'lumotlar seriyasini oling.

    TREND va GROWTH funksiyalaridan foydalanib, korxonaning 2003 va 2004 yillardagi foydasi prognozini tuzing.

    Dastlabki ma'lumotlar va olingan ma'lumotlar seriyasi uchun diagramma tuzing.

Muammoning yechimi

1-muammo uchun ishchi varaqdan foydalanamiz (4-rasmga qarang). TREND funksiyasidan boshlaylik:

    korxona foydasi to'g'risidagi ma'lum ma'lumotlarga mos keladigan TREND funktsiyasi qiymatlari bilan to'ldirilishi kerak bo'lgan D4: D11 katakchalari diapazonini tanlang;

    Insert menyusidan Function buyrug'ini chaqiring. Ko'rsatilgan Funktsiya ustasi muloqot oynasida Statistik kategoriyadan TREND funksiyasini tanlang va keyin OK tugmasini bosing. Xuddi shu amalni standart asboblar panelidagi (Vstavit funksiyasi) tugmasini bosish orqali bajarish mumkin.

    Ko'rsatilgan Funktsiya argumentlari dialog oynasida "Ma'lum_qiymatlar_y" maydoniga C4:C11 katakchalar oralig'ini kiriting; ma'lum_qiymatlar_x maydonida - B4:B11 katakchalar diapazoni;

    Kiritilgan formulani massiv formulasiga aylantirish uchun ++ tugmalar birikmasidan foydalaning.

Formulalar qatoriga kiritgan formulamiz quyidagicha ko'rinadi: =(TREND(C4:C11,B4:B11)).

Natijada, D4: D11 katakchalari diapazoni TREND funksiyasining mos qiymatlari bilan to'ldiriladi (9-rasm).

Korxonaning 2003 va 2004 yillardagi foydasi prognozini tuzish. zarur:

    TREND funksiyasi tomonidan bashorat qilingan qiymatlar kiritiladigan D12:D13 katakchalar diapazonini tanlang.

    TREND funksiyasini chaqiring va paydo bo'lgan Funktsiya argumentlari dialog oynasida "Ma'lum_qiymatlar_y" maydoniga - C4:C11 katakchalar diapazoni kiriting; ma'lum_qiymatlar_x maydonida - B4:B11 katakchalar diapazoni; va New_values_x maydonida - B12:B13 katakchalar diapazoni.

    Ctrl + Shift + Enter tugmalar birikmasi yordamida ushbu formulani massiv formulasiga aylantiring.

    Kiritilgan formula quyidagicha ko'rinadi: =(TREND(C4:C11;B4:B11;B12:B13)) va D12:D13 katakchalari diapazoni TREND funktsiyasining taxmin qilingan qiymatlari bilan to'ldiriladi (2-rasmga qarang). 9).

Ma'lumotlar seriyasi xuddi shunday tarzda to'ldiriladi GROWTH funktsiyasi, bu chiziqli bo'lmagan bog'liqliklarni tahlil qilishda qo'llaniladi va uning chiziqli hamkasbi TREND bilan bir xil ishlaydi.

10-rasmda formulani ko'rsatish rejimida jadval ko'rsatilgan.

Dastlabki ma'lumotlar va olingan ma'lumotlar seriyasi uchun rasmda ko'rsatilgan diagramma. o'n bir.

Muammo 4

Avtotransport korxonasining dispetcherlik xizmati tomonidan joriy oyning 1-dan 11-sanasigacha bo'lgan davrda xizmatlar uchun arizalarni qabul qilish to'g'risidagi ma'lumotlar jadvali bilan siz quyidagi amallarni bajarishingiz kerak.

    Chiziqli regressiya uchun ma'lumotlar qatorini oling: SLOPE va INTERCEPT funksiyalaridan foydalanish; LINEST funksiyasidan foydalanish.

    LGRFPRIBL funktsiyasidan foydalanib, eksponensial regressiya uchun bir qator ma'lumotlarni oling.

    Yuqoridagi funksiyalardan foydalanib, joriy oyning 12-dan 14-kuniga qadar dispetcherlik xizmatiga arizalar kelib tushishi haqida prognoz tuzing.

    Asl va olingan ma'lumotlar seriyasi uchun diagramma yarating.

Muammoning yechimi

E'tibor bering, TREND va GROWTH funksiyalaridan farqli o'laroq, yuqorida sanab o'tilgan funksiyalarning hech biri (SLOPE, INTERCEPT, LINEST, LGRFPRIB) regressiya emas. Bu funktsiyalar zarur regressiya parametrlarini belgilab, faqat yordamchi rol o'ynaydi.

SLOPE, INTERCEPT, LINEST, LGRFPRIB funksiyalari yordamida tuzilgan chiziqli va eksponensial regressiyalar uchun TREND va GROWTH funksiyalariga mos keladigan chiziqli va eksponensial regressiyalardan farqli o‘laroq, ularning tenglamalarining ko‘rinishi doimo ma’lum bo‘ladi.

1 . Keling, tenglama bilan chiziqli regressiya quramiz:

y = mx+b

SLOPE va INTERCEPT funksiyalaridan foydalanib, regressiya qiyaligi m SLOPE funksiyasi bilan, erkin termin b esa INTERCEPT funksiyasi bilan aniqlanadi.

Buning uchun biz quyidagi harakatlarni bajaramiz:

    asl jadvalni A4:B14 yacheyka diapazoniga kiriting;

    m parametrining qiymati C19 katakchasida aniqlanadi. Statistik kategoriyadan Slope funksiyasini tanlang; ma'lum_qiymatlar_y maydoniga B4:B14 katakchalar diapazonini va ma'lum_qiymatlar_x maydoniga A4:A14 katakchalar diapazonini kiriting. Formula C19 katakchaga kiritiladi: =SLOPE(B4:B14,A4:A14);

    Shunga o'xshash texnikadan foydalanib, D19 katakdagi b parametrining qiymati aniqlanadi. Va uning mazmuni quyidagicha ko'rinadi: =SEGMENT(B4:B14,A4:A14). Shunday qilib, chiziqli regressiyani yaratish uchun zarur bo'lgan m va b parametrlarining qiymatlari mos ravishda C19, D19 kataklarida saqlanadi;

    Keyin C4 katagiga chiziqli regressiya formulasini quyidagi shaklda kiriting: =$C*A4+$D. Ushbu formulada C19 va D19 katakchalari mutlaq havolalar bilan yoziladi (mumkin bo'lgan nusxa ko'chirish paytida hujayra manzili o'zgarmasligi kerak). Mutlaq mos yozuvlar belgisi $ kursorni katak manziliga qo'ygandan so'ng klaviaturadan yoki F4 tugmasi yordamida terilishi mumkin. To'ldirish dastagidan foydalanib, ushbu formulani C4:C17 katakchalari oralig'iga ko'chiring. Biz kerakli ma'lumotlar seriyasini olamiz (12-rasm). So'rovlar soni butun son bo'lganligi sababli, Hujayra formati oynasining Raqam yorlig'ida o'nli kasrlar soni bilan raqam formatini 0 ga o'rnatishingiz kerak.

2 . Endi tenglama bilan berilgan chiziqli regressiya quramiz:

y = mx+b

LINEST funksiyasidan foydalanish.

Buning uchun:

    LINEST funksiyasini massiv formulasi sifatida C20:D20 katakcha diapazoniga kiriting: =(LINEST(B4:B14,A4:A14)). Natijada C20 katakchada m parametr qiymatini, D20 katakda b parametr qiymatini olamiz;

    formulani D4 katakka kiriting: =$C*A4+$D;

    ushbu formulani to'ldirish belgisi yordamida D4:D17 katakcha diapazoniga ko'chiring va kerakli ma'lumotlar seriyasini oling.

3 . Eksponensial regressiyani tenglama bilan quramiz:

LGRFPRIBL funksiyasidan foydalangan holda u xuddi shunday amalga oshiriladi:

    C21:D21 hujayra diapazonida biz LGRFPRIBL funksiyasini massiv formulasi sifatida kiritamiz: =( LGRFPRIBL (B4:B14,A4:A14)). Bunda C21 katakda m parametrning qiymati, D21 katakda b parametrining qiymati aniqlanadi;

    formula E4 katakka kiritiladi: =$D*$C^A4;

    to'ldirish belgisi yordamida bu formula E4:E17 katakchalari diapazoniga ko'chiriladi, bu erda eksponensial regressiya uchun ma'lumotlar seriyasi joylashadi (12-rasmga qarang).

Shaklda. 13-rasmda biz foydalanadigan funktsiyalarni kerakli hujayra diapazonlari, shuningdek formulalar bilan ko'rishingiz mumkin bo'lgan jadval ko'rsatilgan.

Kattalik R 2 chaqirdi aniqlash koeffitsienti.

Regressiyaga bog'liqlikni qurish vazifasi (1) modelning m koeffitsientlari vektorini topishdir, bunda R koeffitsienti maksimal qiymatni oladi.

R ning ahamiyatini baholash uchun formula yordamida hisoblangan Fisherning F testi qo'llaniladi

Qayerda n- namuna hajmi (tajribalar soni);

k - model koeffitsientlari soni.

Agar F ma'lumotlar uchun kritik qiymatdan oshsa n Va k va qabul qilingan ishonch ehtimoli, keyin R qiymati muhim hisoblanadi. Jadvallar tanqidiy qadriyatlar F matematik statistika bo'yicha ma'lumotnomalarda berilgan.

Shunday qilib, R ning ahamiyati nafaqat uning qiymati, balki tajribalar soni va modelning koeffitsientlari (parametrlari) soni o'rtasidagi nisbat bilan ham aniqlanadi. Darhaqiqat, oddiy chiziqli model uchun n=2 uchun korrelyatsiya nisbati 1 ga teng (tekislikdagi 2 nuqta orqali har doim bitta to'g'ri chiziq o'tkazilishi mumkin). Biroq, agar tajriba ma'lumotlari tasodifiy o'zgaruvchilar bo'lsa, R ning bunday qiymatiga juda ehtiyotkorlik bilan ishonish kerak. Odatda, sezilarli R va ishonchli regressiyani olish uchun ular tajribalar soni model koeffitsientlari sonidan (n>k) sezilarli darajada oshib ketishini ta'minlashga intiladi.

Chiziqli regressiya modelini yaratish uchun sizga kerak bo'ladi:

1) eksperimental ma'lumotlarni o'z ichiga olgan n ta satr va m ustun ro'yxatini tayyorlang (chiqish qiymatini o'z ichiga olgan ustun) Y ro'yxatda birinchi yoki oxirgi bo'lishi kerak); Misol uchun, oldingi vazifadan ma'lumotlarni olaylik, "Davr raqami" deb nomlangan ustunni qo'shib, davr raqamlarini 1 dan 12 gacha raqamlang. (bu qiymatlar bo'ladi. X)

2) Ma'lumotlar/Ma'lumotlarni tahlil qilish/Regressiya menyusiga o'ting

Agar "Asboblar" menyusidagi "Ma'lumotlarni tahlil qilish" bandi yo'q bo'lsa, siz xuddi shu menyudagi "Qo'shimchalar" bandiga o'tishingiz va "Tahlil paketi" katagiga belgi qo'yishingiz kerak.

3) "Regressiya" dialog oynasida quyidagilarni o'rnating:

· kiritish oralig'i Y;

· kirish oralig'i X;

· chiqish oralig'i - hisoblash natijalari joylashtiriladigan intervalning yuqori chap katakchasi (ularni yangi ish varag'iga joylashtirish tavsiya etiladi);

4) "Ok" tugmasini bosing va natijalarni tahlil qiling.

Qaysi biri eng ko'p topadi keng qo'llanilishi fan va amaliy faoliyatning turli sohalarida. Bu fizika, kimyo, biologiya, iqtisodiyot, sotsiologiya, psixologiya va boshqalar bo'lishi mumkin. Taqdirning irodasiga ko'ra, men tez-tez iqtisod bilan shug'ullanishim kerak va shuning uchun bugun men siz uchun ajoyib mamlakatga sayohat uyushtiraman. Ekonometriya=) ...Qanday qilib buni xohlamaysiz?! U erda juda yaxshi - siz faqat qaror qabul qilishingiz kerak! ...Ammo siz, ehtimol, muammolarni hal qilishni o'rganishni xohlaysiz eng kichik kvadratlar usuli. Va ayniqsa, tirishqoq o'quvchilar ularni nafaqat aniq, balki JUDA TEZ echishni ham o'rganadilar ;-) Lekin birinchi navbatda muammoning umumiy bayoni+ qo'shimcha misol:

Keling, miqdoriy ifodaga ega bo'lgan ma'lum bir fan sohasidagi ko'rsatkichlarni o'rganamiz. Shu bilan birga, indikatorning ko'rsatkichga bog'liqligiga ishonish uchun barcha asoslar mavjud. Bu taxmin ilmiy gipoteza bo'lishi yoki asosiy sog'lom fikrga asoslangan bo'lishi mumkin. Keling, ilm-fanni bir chetga surib, ko'proq ishtahani ochadigan joylarni, xususan, oziq-ovqat do'konlarini o'rganaylik. Quyidagi bilan belgilaymiz:

– oziq-ovqat do‘konining chakana savdo maydoni, kv.m.,
- oziq-ovqat do'konining yillik aylanmasi, million rubl.

Do'kon maydoni qanchalik katta bo'lsa, aksariyat hollarda uning aylanmasi shunchalik katta bo'lishi aniq.

Aytaylik, daf bilan kuzatishlar/tajribalar/hisob-kitoblar/raqslarni o'tkazganimizdan so'ng bizda raqamli ma'lumotlar mavjud:

Oziq-ovqat do'konlari bilan, menimcha, hamma narsa aniq: - bu birinchi do'konning maydoni, - uning yillik aylanmasi, - 2-do'konning maydoni, - yillik aylanmasi va boshqalar. Aytgancha, tasniflangan materiallarga ega bo'lish shart emas - savdo aylanmasini etarlicha aniq baholashni matematik statistika. Biroq, chalg'itmaylik, tijoriy josuslik kursi allaqachon to'langan =)

Jadvalli ma'lumotlar nuqtalar shaklida ham yozilishi va tanish shaklda tasvirlanishi mumkin Dekart tizimi .

Biz javob beramiz muhim savol: Sifatli o'rganish uchun qancha ball kerak?

Qanchalik katta bo'lsa, shuncha yaxshi. Minimal qabul qilinadigan to'plam 5-6 balldan iborat. Bundan tashqari, ma'lumotlar miqdori kichik bo'lsa, "anomal" natijalar namunaga kiritilishi mumkin emas. Masalan, kichik elita do'koni "hamkasblari" dan ko'ra ko'proq buyurtmalarga ega bo'lishi mumkin va shu bilan uni buzadi. umumiy naqsh, nimani topishingiz kerak!

Oddiy qilib aytganda, biz funktsiyani tanlashimiz kerak, jadval nuqtalarga imkon qadar yaqin o'tadi . Bu funksiya deyiladi yaqinlashtirish (taxminlash - yaqinlashish) yoki nazariy funktsiya . Umuman olganda, bu erda darhol aniq "davogar" paydo bo'ladi - grafigi HAMMA nuqtalardan o'tadigan yuqori darajali polinom. Ammo bu variant murakkab va ko'pincha oddiygina noto'g'ri. (chunki grafik har doim "aylanib turadi" va asosiy tendentsiyani yomon aks ettiradi).

Shunday qilib, qidirilayotgan funktsiya juda sodda bo'lishi va shu bilan birga bog'liqlikni etarli darajada aks ettirishi kerak. Siz taxmin qilganingizdek, bunday funktsiyalarni topish usullaridan biri deyiladi eng kichik kvadratlar usuli. Birinchidan, uning mohiyatini ko'rib chiqaylik umumiy ko'rinish. Tajriba maʼlumotlariga taqriban baʼzi funksiyalarga ruxsat bering:


Ushbu yaqinlashishning to'g'riligini qanday baholash mumkin? Keling, eksperimental va o'rtasidagi farqlarni (burilishlarni) ham hisoblaylik funktsional ma'nolari (Biz rasmni o'rganamiz). Aqlga keladigan birinchi fikr bu summaning qanchalik kattaligini taxmin qilishdir, ammo muammo shundaki, farqlar salbiy bo'lishi mumkin. (Masalan, ) va bunday yig'ish natijasida og'ishlar bir-birini bekor qiladi. Shuning uchun, yaqinlashishning to'g'riligini baholash uchun yig'indini olishni iltimos qiladi. modullar og'ishlar:

yoki qulab tushdi: (agar kimdir bilmasa: - bu yig'indi belgisi va - 1 dan ga gacha bo'lgan qiymatlarni qabul qiluvchi yordamchi "hisoblagich" o'zgaruvchisi).

Tajriba nuqtalarini yaqinlashtirish turli funktsiyalar, qabul qilamiz turli ma'nolar, va aniqki, bu miqdor kichikroq bo'lsa, bu funktsiya aniqroq bo'ladi.

Bunday usul mavjud va u deyiladi eng kam modul usuli. Biroq, amalda u ancha keng tarqalgan eng kichik kvadrat usuli, bunda mumkin bo'lgan salbiy qiymatlar modul tomonidan emas, balki og'ishlarni kvadratlash orqali yo'q qilinadi:

, shundan so'ng harakatlar kvadrat og'ishlar yig'indisi bo'ladigan funktsiyani tanlashga qaratilgan imkon qadar kichik edi. Aslida, bu usulning nomi qaerdan keladi.

Va endi biz boshqa narsaga qaytamiz muhim nuqta: yuqorida ta'kidlab o'tilganidek, tanlangan funksiya juda oddiy bo'lishi kerak - lekin bunday funktsiyalar ham ko'p: chiziqli , giperbolik, eksponentsial, logarifmik, kvadratik va hokazo. Va, albatta, bu erda men darhol "faoliyat maydonini qisqartirishni" xohlayman. Tadqiqot uchun qaysi funktsiyalar sinfini tanlashim kerak? Ibtidoiy, lekin samarali texnika:

- Eng oson yo'li - nuqtalarni tasvirlash chizma ustida va ularning joylashuvini tahlil qiling. Agar ular tekis chiziqda yugurishga moyil bo'lsa, unda siz izlashingiz kerak chiziq tenglamasi Bilan optimal qiymatlar Va . Boshqacha qilib aytganda, vazifa kvadrat og'ishlar yig'indisi eng kichik bo'lishi uchun BUNDAY koeffitsientlarni topishdir.

Agar nuqtalar, masalan, bo'ylab joylashgan bo'lsa giperbola, u holda chiziqli funktsiya yomon yaqinlik berishi aniq. Bunday holda, biz giperbola tenglamasi uchun eng "qulay" koeffitsientlarni qidiramiz - kvadratlarning minimal yig'indisini beradiganlar .

Endi ikkala holatda ham biz gaplashayotganimizga e'tibor bering ikkita o'zgaruvchining funktsiyalari, kimning dalillari qaramlik parametrlarini qidirdi:

Va aslida biz standart muammoni hal qilishimiz kerak - toping ikkita o'zgaruvchining minimal funktsiyasi.

Keling, misolimizni eslaylik: deylik, "do'kon" punktlari to'g'ri chiziqda joylashgan va bunga ishonish uchun barcha asoslar mavjud. chiziqli bog'liqlik chakana savdo maydonidan aylanma. SHUNDAY “a” va “be” koeffitsientlarini topamizki, kvadrat og'ishlar yig'indisi eng kichiki edi. Hammasi odatdagidek - birinchi navbatda 1-tartibli qisman hosilalar. Ga binoan chiziqlilik qoidasi Siz to'g'ridan-to'g'ri yig'indi belgisi ostida farqlashingiz mumkin:

Agar foydalanmoqchi bo'lsangiz bu ma'lumot insho yoki kurs ishi uchun - manbalar ro'yxatidagi havola uchun juda minnatdorman; bunday batafsil hisob-kitoblarni bir necha joylarda topasiz:

Keling, standart tizimni yarataylik:

Biz har bir tenglamani "ikki" ga kamaytiramiz va qo'shimcha ravishda yig'indilarni "parchalaymiz":

Eslatma : "a" va "be" nima uchun yig'indi belgisidan tashqarida olib tashlanishi mumkinligini mustaqil ravishda tahlil qiling. Aytgancha, rasmiy ravishda bu summa bilan amalga oshirilishi mumkin

Keling, tizimni "amaliy" shaklda qayta yozamiz:

shundan so'ng bizning muammomizni hal qilish algoritmi paydo bo'la boshlaydi:

Nuqtalarning koordinatalarini bilamizmi? Bilamiz. Miqdor topa olamizmi? Osonlik bilan. Keling, eng oddiyini qilaylik ikkita noma'lumli ikkita chiziqli tenglamalar tizimi("a" va "bo'l"). Biz tizimni hal qilamiz, masalan, Kramer usuli, buning natijasida biz statsionar nuqtani olamiz. Tekshirish ekstremum uchun etarli shart, biz ushbu nuqtada funktsiyani tekshirishimiz mumkin aniq yetib boradi eng kam. Tekshiruv qo'shimcha hisob-kitoblarni o'z ichiga oladi va shuning uchun biz uni sahna ortida qoldiramiz (agar kerak bo'lsa, etishmayotgan ramkani ko'rish mumkin). Yakuniy xulosa chiqaramiz:

Funktsiya eng yaxshi yo'l (hech bo'lmaganda boshqa har qanday chiziqli funktsiyaga nisbatan) tajriba nuqtalarini yaqinlashtiradi . Taxminan aytganda, uning grafigi bu nuqtalarga imkon qadar yaqin o'tadi. An'anaga ko'ra ekonometriya olingan yaqinlashuvchi funksiya ham deyiladi juft chiziqli regressiya tenglamasi .

Ko'rib chiqilayotgan muammo katta amaliy ahamiyatga ega. Bizning misolimizda, Eq. qanday savdo aylanmasini bashorat qilish imkonini beradi ("Igrek") do'kon savdo maydonining u yoki bu qiymatiga ega bo'ladi ("x" ning u yoki bu ma'nosi). Ha, natijada olingan prognoz faqat prognoz bo'ladi, lekin ko'p hollarda u juda aniq bo'lib chiqadi.

Men "haqiqiy" raqamlar bilan bitta muammoni tahlil qilaman, chunki unda hech qanday qiyinchilik yo'q - barcha hisob-kitoblar o'z darajasida maktab o'quv dasturi 7-8 sinflar. 95 foiz hollarda sizdan faqat chiziqli funktsiyani topishingiz so'raladi, ammo maqolaning oxirida men optimal giperbola, eksponensial va boshqa ba'zi funktsiyalarning tenglamalarini topish qiyin emasligini ko'rsataman.

Aslida, va'da qilingan sovg'alarni tarqatish qoladi - siz bunday misollarni nafaqat aniq, balki tezda hal qilishni o'rganishingiz mumkin. Biz standartni diqqat bilan o'rganamiz:

Vazifa

Ikki ko'rsatkich o'rtasidagi munosabatlarni o'rganish natijasida quyidagi raqamlar juftligi olindi:

Eng kichik kvadratlar usulidan foydalanib, empirikga eng yaqin keladigan chiziqli funksiyani toping (tajribali) ma'lumotlar. Dekart to'rtburchaklar koordinata tizimida eksperimental nuqtalar va yaqinlashuvchi funktsiya grafigini qurish uchun chizma tuzing. . Empirik va nazariy qiymatlar orasidagi kvadratik og‘ishlar yig‘indisini toping. Bu xususiyat yaxshiroq bo'ladimi yoki yo'qligini bilib oling (eng kichik kvadratlar usuli nuqtai nazaridan) eksperimental nuqtalarni yaqinlashtirish.

E'tibor bering, "x" ma'nolari tabiiydir va bu xarakterli ma'noli ma'noga ega, men bu haqda biroz keyinroq gaplashaman; lekin ular, albatta, kasrli ham bo'lishi mumkin. Bundan tashqari, ma'lum bir vazifaning mazmuniga qarab, "X" va "o'yin" qiymatlari to'liq yoki qisman salbiy bo'lishi mumkin. Xo'sh, bizga "yuzsiz" vazifa berildi va biz uni boshlaymiz yechim:

Imkoniyatlar optimal funktsiya Biz tizimga yechim sifatida topamiz:

Keyinchalik ixchamroq ro'yxatga olish uchun "hisoblagich" o'zgaruvchisini o'tkazib yuborish mumkin, chunki yig'ish 1 dan 1 gacha amalga oshirilganligi allaqachon aniq.

Kerakli miqdorlarni jadval shaklida hisoblash qulayroqdir:


Hisob-kitoblar mikrokalkulyatorda amalga oshirilishi mumkin, ammo Exceldan foydalanish ancha yaxshi - ham tezroq, ham xatosiz; qisqa videoni tomosha qiling:

Shunday qilib, biz quyidagilarni olamiz tizimi:

Bu erda siz ikkinchi tenglamani 3 va ga ko'paytirishingiz mumkin 1-tenglamaning haddan 2-sonini ayirish. Ammo bu omad - amalda tizimlar ko'pincha sovg'a emas va bunday hollarda u tejaydi Kramer usuli:
, ya'ni tizim noyob yechimga ega.

Keling, tekshiramiz. Siz xohlamasligingizni tushunaman, lekin nima uchun xatolarni o'tkazib yubormaslik kerak? Topilgan yechimni ga almashtiramiz chap tomoni tizimning har bir tenglamasi:

Tegishli tenglamalarning o'ng tomonlari olinadi, ya'ni tizim to'g'ri echilgan.

Shunday qilib, kerakli yaqinlashuvchi funktsiya: – dan barcha chiziqli funktsiyalar Aynan u eksperimental ma'lumotlarni eng yaxshi taxmin qiladi.

Undan farqli o'laroq Streyt do'kon aylanmasining uning maydoniga bog'liqligi, topilgan bog'liqligi teskari ("qancha ko'p bo'lsa, shuncha kam" tamoyili), va bu haqiqat darhol salbiy tomonidan ochib beriladi qiyalik. Funktsiya ma'lum bir ko'rsatkichning 1 birlikka o'sishi bilan bog'liq ko'rsatkichning qiymati kamayishini aytadi o'rtacha 0,65 birlikka. Ular aytganidek, grechkaning narxi qancha yuqori bo'lsa, shuncha kam sotiladi.

Taxminlovchi funksiyaning grafigini tuzish uchun uning ikkita qiymatini topamiz:

va chizmani bajaring:


Tuzilgan to'g'ri chiziq deyiladi trend chizig'i (ya'ni, chiziqli trend chizig'i, ya'ni umumiy holat trend to'g'ri chiziq bo'lishi shart emas). "Trendda bo'lish" iborasi hammaga tanish va menimcha, bu atama qo'shimcha izohlarga muhtoj emas.

Keling, kvadrat og'ishlar yig'indisini hisoblaylik empirik va nazariy qadriyatlar o'rtasida. Geometrik jihatdan, bu "malina" segmentlarining uzunliklari kvadratlarining yig'indisi (ikkitasi shunchalik kichikki, ular hatto ko'rinmaydi).

Jadvalda hisob-kitoblarni umumlashtiramiz:


Shunga qaramay, ular qo'lda bajarilishi mumkin; har holda, men 1-bandga misol keltiraman:

lekin buni allaqachon ma'lum bo'lgan usulda qilish ancha samarali:

Yana bir bor takrorlaymiz: Olingan natijaning ma'nosi nima? Kimdan barcha chiziqli funktsiyalar y funktsiyasi ko'rsatkich eng kichik, ya'ni uning oilasida bu eng yaxshi yaqinlikdir. Va bu erda, aytmoqchi, muammoning yakuniy savoli tasodifiy emas: agar taklif qilingan eksponensial funktsiya nima bo'lsa? eksperimental nuqtalarni yaqinlashtirish yaxshiroqmi?

Keling, kvadrat og'ishlarning tegishli yig'indisini topamiz - farqlash uchun men ularni "epsilon" harfi bilan belgilayman. Texnika mutlaqo bir xil:


Va yana, har qanday holatda, 1-band uchun hisob-kitoblar:

Excelda biz standart funksiyadan foydalanamiz EXP (sintaksisni Excel Yordamida topish mumkin).

Xulosa: , ya'ni eksponensial funktsiya to'g'ri chiziqdan ko'ra yomonroq tajriba nuqtalariga yaqinlashadi. .

Ammo bu erda "yomonroq" ekanligini ta'kidlash kerak hali degani emas, nima bo'ldi. Endi men buning grafigini tuzdim eksponensial funktsiya- va u ham nuqtalarga yaqin o'tadi - shunchalik ko'pki, analitik tadqiqotlarsiz qaysi funktsiya aniqroq ekanligini aytish qiyin.

Bu yechimni yakunlaydi va men argumentning tabiiy qadriyatlari haqidagi savolga qaytaman. IN turli tadqiqotlar, qoida tariqasida, iqtisodiy yoki sotsiologik, tabiiy "X"lar oylar, yillar yoki boshqa teng vaqt oralig'ini raqamlash uchun ishlatiladi. Masalan, quyidagi muammoni ko'rib chiqing.

Eng kichik kvadrat usuli

Eng kichik kvadrat usuli ( OLS, OLS, oddiy eng kichik kvadratlar) - namunaviy ma'lumotlardan foydalangan holda regressiya modellarining noma'lum parametrlarini baholash uchun regressiya tahlilining asosiy usullaridan biri. Usul regressiya qoldiqlarining kvadratlari yig'indisini minimallashtirishga asoslangan.

Shuni ta'kidlash kerakki, eng kichik kvadratlar usulining o'zini har qanday sohada muammoni hal qilish usuli deb atash mumkin, agar yechim talab qilinadigan o'zgaruvchilarning ba'zi funktsiyalari kvadratlari yig'indisini minimallashtirish uchun biron bir mezonga mos keladigan yoki qanoatlantirsa. Shuning uchun, eng kichik kvadratlar usuli, shuningdek, tenglamalar yoki cheklovlarni qanoatlantiradigan, soni ushbu miqdorlar sonidan oshib ketadigan miqdorlar to'plamini topishda, berilgan funktsiyani boshqa (oddiyroq) funktsiyalar bilan taxminiy ko'rsatish (yaqinlash) uchun ham qo'llanilishi mumkin. , va boshqalar.

MNCning mohiyati

(tushuntirilgan) o'zgaruvchi o'rtasidagi ehtimollik (regressiya) munosabatining ba'zi (parametrik) modeli berilsin. y va ko'plab omillar (tushuntiruvchi o'zgaruvchilar) x

noma'lum model parametrlarining vektori qayerda

- tasodifiy model xatosi.

Ushbu o'zgaruvchilar qiymatlari bo'yicha namunaviy kuzatishlar ham bo'lsin. Kuzatuv raqami () bo'lsin. Keyin kuzatuvdagi o'zgaruvchilarning qiymatlari. Keyin b parametrlarining berilgan qiymatlari uchun tushuntirilgan y o'zgaruvchining nazariy (model) qiymatlarini hisoblash mumkin:

Qoldiqlarning o'lchami parametrlarning qiymatlariga bog'liq b.

Eng kichik kvadratlar usulining (oddiy, klassik) mohiyati b parametrlarini topishdan iborat bo'lib, ular uchun qoldiq kvadratlari yig'indisi (ingliz. Kvadratlarning qoldiq yig'indisi) minimal bo'ladi:

Umumiy holatda bu muammoni sonli optimallashtirish (minimallashtirish) usullari bilan hal qilish mumkin. Bu holatda ular haqida gapirishadi chiziqli bo'lmagan eng kichik kvadratlar(NLS yoki NLLS - inglizcha) Chiziqli bo'lmagan eng kichik kvadratlar). Ko'p hollarda analitik yechimni olish mumkin. Minimallashtirish masalasini yechish uchun funktsiyani noma’lum parametrlarga nisbatan farqlash, hosilalarini nolga tenglashtirish va hosil bo‘lgan tenglamalar tizimini yechish yo‘li bilan funksiyaning statsionar nuqtalarini topish kerak:

Agar modelning tasodifiy xatolari normal taqsimlangan bo'lsa, bir xil dispersiyaga ega bo'lsa va o'zaro bog'liq bo'lmasa, OLS parametrlarining taxminlari maksimal ehtimollik taxminlari (MLM) bilan bir xil bo'ladi.

Chiziqli model holatida OLS

Regressiyaga bog'liqlik chiziqli bo'lsin:

Mayli y izohlangan o'zgaruvchini kuzatishning ustun vektori va omillar kuzatuvlari matritsasi (matritsaning satrlari faktor qiymatlarining vektorlari bu kuzatish, ustunlarda - barcha kuzatishlarda berilgan omil qiymatlari vektori). Chiziqli modelning matritsali tasviri:

U holda tushuntirilgan o'zgaruvchining baholash vektori va regressiya qoldiqlari vektori teng bo'ladi.

Shunga ko'ra, regressiya qoldiqlarining kvadratlari yig'indisi teng bo'ladi

Ushbu funktsiyani parametrlar vektoriga nisbatan farqlash va hosilalarni nolga tenglashtirib, biz tenglamalar tizimini olamiz (matritsa shaklida):

.

Bu tenglamalar tizimining yechimi beradi umumiy formula Chiziqli model uchun OLS taxminlari:

Analitik maqsadlar uchun ushbu formulaning oxirgi ko'rinishi foydalidir. Agar regressiya modelida ma'lumotlar markazlashtirilgan, u holda bu tasvirda birinchi matritsa omillarning tanlanma kovariatsiya matritsasi ma'nosiga ega, ikkinchisi esa bog'liq o'zgaruvchiga ega bo'lgan omillarning kovariantlari vektoridir. Agar qo'shimcha ma'lumotlar ham bo'lsa normallashtirilgan MSE ga (ya'ni, oxir-oqibat standartlashtirilgan), keyin birinchi matritsa omillarning tanlanma korrelyatsiya matritsasi ma'nosiga ega bo'ladi, ikkinchi vektor - bog'liq o'zgaruvchi bilan omillarning tanlama korrelyatsiya vektori.

Modellar uchun OLS baholarining muhim xususiyati doimiy bilan- tuzilgan regressiya chizig'i namuna ma'lumotlarining og'irlik markazidan o'tadi, ya'ni tenglik bajariladi:

Xususan, ekstremal holatda, yagona regressor doimiy bo'lsa, biz yagona parametrning OLS bahosi (konstantaning o'zi) tushuntirilgan o'zgaruvchining o'rtacha qiymatiga teng ekanligini aniqlaymiz. Ya'ni, o'rtacha arifmetik, uning uchun ma'lum yaxshi xususiyatlar katta sonlar qonunlaridan, shuningdek, eng kichik kvadratlar bahosi hisoblanadi - u undan chetlanish kvadratlarining minimal yig'indisi mezonini qondiradi.

Misol: eng oddiy (juftlik) regressiya

Juftlangan chiziqli regressiya holatida hisoblash formulalari soddalashtirilgan (siz matritsa algebrasisiz ham qilishingiz mumkin):

OLS hisoblagichlarining xossalari

Avvalo, chiziqli modellar uchun OLS baholari ekanligini ta'kidlaymiz chiziqli taxminlar, yuqoridagi formuladan quyidagicha. OLSni xolis baholash uchun bajarish zarur va yetarli eng muhim shart regressiya tahlili: omillarga bog'liq holda, tasodifiy xatoning matematik kutilishi nolga teng bo'lishi kerak. Bu holat, xususan, agar qanoatlansa

  1. kutilgan qiymat tasodifiy xatolar nolga teng, va
  2. omillar va tasodifiy xatolar mustaqil tasodifiy o'zgaruvchilardir.

Ikkinchi shart - omillarning ekzogenlik sharti - asosiy hisoblanadi. Agar bu xususiyat bajarilmasa, deyarli har qanday hisob-kitoblar juda qoniqarsiz bo'ladi deb taxmin qilishimiz mumkin: ular hatto izchil bo'lmaydi (ya'ni, hatto juda katta miqdordagi ma'lumotlar ham bu holatda yuqori sifatli hisob-kitoblarni olishga imkon bermaydi). ). Klassik holatda tasodifiy xatodan farqli ravishda omillarning determinizmi haqida kuchliroq taxmin qilinadi, bu avtomatik ravishda ekzogenlik sharti bajarilganligini bildiradi. Umumiy holatda, hisob-kitoblarning izchilligi uchun matritsaning ba'zi yagona bo'lmagan matritsaga yaqinlashishi bilan birga ekzogenlik shartini qondirish kifoya, chunki tanlama hajmi cheksizgacha oshadi.

Muvofiqlik va xolislikdan tashqari (oddiy) eng kichik kvadratlarni baholash ham samarali bo'lishi uchun (chiziqli xolis baholar sinfidagi eng yaxshisi) tasodifiy xatoning qo'shimcha xususiyatlariga rioya qilish kerak:

Ushbu taxminlar tasodifiy xato vektorining kovariatsiya matritsasi uchun shakllantirilishi mumkin

Ushbu shartlarni qondiradigan chiziqli model deyiladi klassik. Klassik chiziqli regressiya uchun OLS baholari xolis, izchil va barcha chiziqli xolis baholar sinfidagi eng samarali baholardir (ingliz adabiyotida ba'zan qisqartma ishlatiladi). KO‘K (Eng yaxshi chiziqli asossiz hisoblagich) - eng yaxshi chiziqli xolis baho; rus adabiyotida Gauss-Markov teoremasi ko'proq keltiriladi). Ko'rsatish oson bo'lganidek, koeffitsientlarni baholash vektorining kovariatsiya matritsasi quyidagilarga teng bo'ladi:

Umumiy OLS

Eng kichik kvadratlar usuli keng umumlashtirish imkonini beradi. Qoldiqlar kvadratlari yig'indisini minimallashtirish o'rniga, qoldiqlar vektorining qandaydir ijobiy aniq kvadratik shaklini minimallashtirish mumkin, bu erda qandaydir simmetrik musbat aniq og'irlik matritsasi. An'anaviy eng kichik kvadratlar bu yondashuvning alohida holati bo'lib, unda og'irlik matritsasi identifikatsiya matritsasiga mutanosibdir. Simmetrik matritsalar (yoki operatorlar) nazariyasidan ma'lumki, bunday matritsalar uchun parchalanish mavjud. Binobarin, ko'rsatilgan funktsiyani quyidagicha ifodalash mumkin, ya'ni bu funktsiyani o'zgartirilgan ba'zi "qoldiqlar" kvadratlari yig'indisi sifatida ko'rsatish mumkin. Shunday qilib, biz eng kichik kvadratlar usullari sinfini - LS usullarini (Eng kichik kvadratlar) ajratishimiz mumkin.

Umumlashtirilgan chiziqli regressiya modeli uchun (tasodifiy xatolarning kovariatsiya matritsasiga hech qanday cheklovlar qo'yilmagan) eng samarali (chiziqli xolis baholar sinfida) taxminlar deb ataladiganligi isbotlangan (Aitken teoremasi). umumlashtirilgan eng kichik kvadratlar (GLS - umumlashtirilgan eng kichik kvadratlar)- Tasodifiy xatolarning teskari kovariatsiya matritsasiga teng vazn matritsasi bilan LS usuli: .

Chiziqli model parametrlarini GLS baholash formulasi shaklga ega ekanligini ko'rsatish mumkin

Bu baholarning kovariatsiya matritsasi mos ravishda teng bo'ladi

Aslida, OLSning mohiyati dastlabki ma'lumotlarning ma'lum (chiziqli) transformatsiyasida (P) va o'zgartirilgan ma'lumotlarga oddiy OLSni qo'llashda yotadi. Ushbu transformatsiyaning maqsadi shundaki, o'zgartirilgan ma'lumotlar uchun tasodifiy xatolar allaqachon klassik taxminlarni qondiradi.

Og'irlangan OLS

Diagonal og'irlik matritsasi (va shuning uchun tasodifiy xatolarning kovariatsiya matritsasi) bo'lsa, bizda eng kichik kvadratlar (WLS) deb ataladigan narsa bor. IN Ushbu holatda model qoldiqlari kvadratlarining vaznli yig'indisi minimallashtiriladi, ya'ni har bir kuzatish ushbu kuzatishdagi tasodifiy xatoning dispersiyasiga teskari proportsional "vazn" oladi:. Darhaqiqat, ma'lumotlar kuzatuvlarni tortish yo'li bilan o'zgartiriladi (kutilgan miqdorga proportsional miqdorga bo'linadi). standart og'ish tasodifiy xatolar) va odatdagi OLS vaznli ma'lumotlarga qo'llaniladi.

MNCni amalda qo'llashning ayrim maxsus holatlari

Chiziqli bog'liqlikning yaqinlashishi

Keling, ma'lum bir skalyar miqdorning ma'lum bir skalyar miqdorga bog'liqligini o'rganish natijasida (Bu, masalan, kuchlanishning oqim kuchiga bog'liqligi bo'lishi mumkin: , bu erda doimiy qiymat, qarshilik o'tkazgich), bu miqdorlarni o'lchash amalga oshirildi, buning natijasida qiymatlar va ularning tegishli qiymatlari. O'lchov ma'lumotlari jadvalga yozilishi kerak.

Jadval. O'lchov natijalari.

O'lchov raqami.
1
2
3
4
5
6

Savol tug'iladi: bog'liqlikni eng yaxshi tavsiflash uchun koeffitsientning qaysi qiymatini tanlash mumkin? Eng kichik kvadratlar usuliga ko'ra, bu qiymat qiymatlarning qiymatlardan kvadratik og'ishlarining yig'indisi bo'lishi kerak.

minimal edi

Kvadrat og'ishlar yig'indisi bitta ekstremumga ega - minimal, bu bizga ushbu formuladan foydalanishga imkon beradi. Ushbu formuladan koeffitsientning qiymatini topamiz. Buning uchun biz uning chap tomonini quyidagicha aylantiramiz:

Oxirgi formula koeffitsientning qiymatini topishga imkon beradi, bu masalada talab qilingan narsadir.

Hikoya

Oldin XIX boshi V. olimlar noma'lumlar soni tenglamalar sonidan kam bo'lgan tenglamalar tizimini echish uchun ma'lum qoidalarga ega emas edilar; O'sha vaqtga qadar tenglamalar turiga va kalkulyatorlarning aqliga bog'liq bo'lgan shaxsiy texnikalar qo'llanilgan va shuning uchun bir xil kuzatish ma'lumotlariga asoslangan turli xil kalkulyatorlar paydo bo'lgan. turli xulosalar. Gauss (1795) usulning birinchi qo'llanilishi uchun mas'ul edi va Legendre (1805) uni mustaqil ravishda kashf qildi va nashr etdi. zamonaviy ism(fr. Méthode des moindres quarrés ). Laplas usulni ehtimollar nazariyasi bilan bog'ladi va amerikalik matematik Adrain (1808) uning ehtimollik-nazariy qo'llanilishini ko'rib chiqdi. Usul Encke, Bessel, Hansen va boshqalarning keyingi tadqiqotlari natijasida keng tarqaldi va takomillashtirildi.

OLSdan muqobil foydalanish

Eng kichik kvadratlar usuli g'oyasi regressiya tahlili bilan bevosita bog'liq bo'lmagan boshqa holatlarda ham qo'llanilishi mumkin. Gap shundaki, kvadratlar yig'indisi vektorlar uchun eng keng tarqalgan yaqinlik o'lchovlaridan biridir (cheklangan o'lchovli fazolarda Evklid metrikasi).

Ilovalardan biri tizimlarni "hal qilish" uchundir chiziqli tenglamalar, unda tenglamalar soni ko'proq raqam o'zgaruvchilar

bu erda matritsa kvadrat emas, balki o'lchamdagi to'rtburchaklardir.

Bunday tenglamalar tizimi, umumiy holatda, hech qanday yechimga ega emas (agar daraja haqiqatda o'zgaruvchilar sonidan katta bo'lsa). Shuning uchun, bu tizim faqat vektorlar orasidagi "masofa" ni minimallashtirish uchun bunday vektorni tanlash ma'nosida "echilishi" mumkin. Buning uchun siz chap va kvadrat farqlarining yig'indisini minimallashtirish mezonini qo'llashingiz mumkin. to'g'ri qismlar sistemaning tenglamalari, ya'ni. Ushbu minimallashtirish muammosini hal qilish yechimga olib kelishini ko'rsatish oson keyingi tizim tenglamalar

Eng kichik kvadrat usuli

Eng kichik kvadrat usuli ( OLS, OLS, oddiy eng kichik kvadratlar) - namunaviy ma'lumotlardan foydalangan holda regressiya modellarining noma'lum parametrlarini baholash uchun regressiya tahlilining asosiy usullaridan biri. Usul regressiya qoldiqlarining kvadratlari yig'indisini minimallashtirishga asoslangan.

Shuni ta'kidlash kerakki, eng kichik kvadratlar usulining o'zini har qanday sohada muammoni hal qilish usuli deb atash mumkin, agar yechim talab qilinadigan o'zgaruvchilarning ba'zi funktsiyalari kvadratlari yig'indisini minimallashtirish uchun biron bir mezonga mos keladigan yoki qanoatlantirsa. Shuning uchun, eng kichik kvadratlar usuli, shuningdek, tenglamalar yoki cheklovlarni qanoatlantiradigan, soni ushbu miqdorlar sonidan oshib ketadigan miqdorlar to'plamini topishda, berilgan funktsiyani boshqa (oddiyroq) funktsiyalar bilan taxminiy ko'rsatish (yaqinlash) uchun ham qo'llanilishi mumkin. , va boshqalar.

MNCning mohiyati

(tushuntirilgan) o'zgaruvchi o'rtasidagi ehtimollik (regressiya) munosabatining ba'zi (parametrik) modeli berilsin. y va ko'plab omillar (tushuntiruvchi o'zgaruvchilar) x

noma'lum model parametrlarining vektori qayerda

- tasodifiy model xatosi.

Ushbu o'zgaruvchilar qiymatlari bo'yicha namunaviy kuzatishlar ham bo'lsin. Kuzatuv raqami () bo'lsin. Keyin kuzatuvdagi o'zgaruvchilarning qiymatlari. Keyin b parametrlarining berilgan qiymatlari uchun tushuntirilgan y o'zgaruvchining nazariy (model) qiymatlarini hisoblash mumkin:

Qoldiqlarning o'lchami parametrlarning qiymatlariga bog'liq b.

Eng kichik kvadratlar usulining (oddiy, klassik) mohiyati b parametrlarini topishdan iborat bo'lib, ular uchun qoldiq kvadratlari yig'indisi (ingliz. Kvadratlarning qoldiq yig'indisi) minimal bo'ladi:

Umumiy holatda bu muammoni sonli optimallashtirish (minimallashtirish) usullari bilan hal qilish mumkin. Bu holatda ular haqida gapirishadi chiziqli bo'lmagan eng kichik kvadratlar(NLS yoki NLLS - inglizcha) Chiziqli bo'lmagan eng kichik kvadratlar). Ko'p hollarda analitik yechimni olish mumkin. Minimallashtirish masalasini yechish uchun funktsiyani noma’lum parametrlarga nisbatan farqlash, hosilalarini nolga tenglashtirish va hosil bo‘lgan tenglamalar tizimini yechish yo‘li bilan funksiyaning statsionar nuqtalarini topish kerak:

Agar modelning tasodifiy xatolari normal taqsimlangan bo'lsa, bir xil dispersiyaga ega bo'lsa va o'zaro bog'liq bo'lmasa, OLS parametrlarining taxminlari maksimal ehtimollik taxminlari (MLM) bilan bir xil bo'ladi.

Chiziqli model holatida OLS

Regressiyaga bog'liqlik chiziqli bo'lsin:

Mayli y izohlangan o'zgaruvchini kuzatishning ustun vektori va omillar kuzatuvlari matritsasi (matritsa qatorlari ma'lum bir kuzatishdagi omil qiymatlari vektorlari, ustunlar ma'lum bir omil qiymatlari vektoridir. barcha kuzatishlarda). Chiziqli modelning matritsali tasviri:

U holda tushuntirilgan o'zgaruvchining baholash vektori va regressiya qoldiqlari vektori teng bo'ladi.

Shunga ko'ra, regressiya qoldiqlarining kvadratlari yig'indisi teng bo'ladi

Ushbu funktsiyani parametrlar vektoriga nisbatan farqlash va hosilalarni nolga tenglashtirib, biz tenglamalar tizimini olamiz (matritsa shaklida):

.

Ushbu tenglamalar tizimining yechimi chiziqli model uchun eng kichik kvadratlarni baholashning umumiy formulasini beradi:

Analitik maqsadlar uchun ushbu formulaning oxirgi ko'rinishi foydalidir. Agar regressiya modelida ma'lumotlar markazlashtirilgan, u holda bu tasvirda birinchi matritsa omillarning tanlanma kovariatsiya matritsasi ma'nosiga ega, ikkinchisi esa bog'liq o'zgaruvchiga ega bo'lgan omillarning kovariantlari vektoridir. Agar qo'shimcha ma'lumotlar ham bo'lsa normallashtirilgan MSE ga (ya'ni, oxir-oqibat standartlashtirilgan), keyin birinchi matritsa omillarning tanlanma korrelyatsiya matritsasi ma'nosiga ega bo'ladi, ikkinchi vektor - bog'liq o'zgaruvchi bilan omillarning tanlama korrelyatsiya vektori.

Modellar uchun OLS baholarining muhim xususiyati doimiy bilan- tuzilgan regressiya chizig'i namuna ma'lumotlarining og'irlik markazidan o'tadi, ya'ni tenglik bajariladi:

Xususan, ekstremal holatda, yagona regressor doimiy bo'lsa, biz yagona parametrning OLS bahosi (konstantaning o'zi) tushuntirilgan o'zgaruvchining o'rtacha qiymatiga teng ekanligini aniqlaymiz. Ya'ni, katta sonlar qonunlaridan o'zining yaxshi xossalari bilan ma'lum bo'lgan o'rtacha arifmetik qiymat ham eng kichik kvadratlar bahosi hisoblanadi - u undan kvadratik chetlanishlarning minimal yig'indisi mezonini qondiradi.

Misol: eng oddiy (juftlik) regressiya

Juftlangan chiziqli regressiya holatida hisoblash formulalari soddalashtirilgan (siz matritsa algebrasisiz ham qilishingiz mumkin):

OLS hisoblagichlarining xossalari

Avvalo shuni ta'kidlaymizki, chiziqli modellar uchun OLS baholari yuqoridagi formuladan kelib chiqqan holda chiziqli taxminlardir. Ob'ektiv OLS baholashlari uchun regressiya tahlilining eng muhim shartini bajarish zarur va etarli: omillarga bog'liq bo'lgan tasodifiy xatoning matematik kutilishi nolga teng bo'lishi kerak. Bu shart, xususan, agar qondiriladi

  1. tasodifiy xatolarning matematik kutish nolga teng, va
  2. omillar va tasodifiy xatolar mustaqil tasodifiy o'zgaruvchilardir.

Ikkinchi shart - omillarning ekzogenlik sharti - asosiy hisoblanadi. Agar bu xususiyat bajarilmasa, deyarli har qanday hisob-kitoblar juda qoniqarsiz bo'ladi deb taxmin qilishimiz mumkin: ular hatto izchil bo'lmaydi (ya'ni, hatto juda katta miqdordagi ma'lumotlar ham bu holatda yuqori sifatli hisob-kitoblarni olishga imkon bermaydi). ). Klassik holatda tasodifiy xatodan farqli ravishda omillarning determinizmi haqida kuchliroq taxmin qilinadi, bu avtomatik ravishda ekzogenlik sharti bajarilganligini bildiradi. Umumiy holatda, hisob-kitoblarning izchilligi uchun matritsaning ba'zi yagona bo'lmagan matritsaga yaqinlashishi bilan birga ekzogenlik shartini qondirish kifoya, chunki tanlama hajmi cheksizgacha oshadi.

Muvofiqlik va xolislikdan tashqari (oddiy) eng kichik kvadratlarni baholash ham samarali bo'lishi uchun (chiziqli xolis baholar sinfidagi eng yaxshisi) tasodifiy xatoning qo'shimcha xususiyatlariga rioya qilish kerak:

Ushbu taxminlar tasodifiy xato vektorining kovariatsiya matritsasi uchun shakllantirilishi mumkin

Ushbu shartlarni qondiradigan chiziqli model deyiladi klassik. Klassik chiziqli regressiya uchun OLS baholari xolis, izchil va barcha chiziqli xolis baholar sinfidagi eng samarali baholardir (ingliz adabiyotida ba'zan qisqartma ishlatiladi). KO‘K (Eng yaxshi chiziqli asossiz hisoblagich) - eng yaxshi chiziqli xolis baho; rus adabiyotida Gauss-Markov teoremasi ko'proq keltiriladi). Ko'rsatish oson bo'lganidek, koeffitsientlarni baholash vektorining kovariatsiya matritsasi quyidagilarga teng bo'ladi:

Umumiy OLS

Eng kichik kvadratlar usuli keng umumlashtirish imkonini beradi. Qoldiqlar kvadratlari yig'indisini minimallashtirish o'rniga, qoldiqlar vektorining qandaydir ijobiy aniq kvadratik shaklini minimallashtirish mumkin, bu erda qandaydir simmetrik musbat aniq og'irlik matritsasi. An'anaviy eng kichik kvadratlar bu yondashuvning alohida holati bo'lib, unda og'irlik matritsasi identifikatsiya matritsasiga mutanosibdir. Simmetrik matritsalar (yoki operatorlar) nazariyasidan ma'lumki, bunday matritsalar uchun parchalanish mavjud. Binobarin, ko'rsatilgan funktsiyani quyidagicha ifodalash mumkin, ya'ni bu funktsiyani o'zgartirilgan ba'zi "qoldiqlar" kvadratlari yig'indisi sifatida ko'rsatish mumkin. Shunday qilib, biz eng kichik kvadratlar usullari sinfini - LS usullarini (Eng kichik kvadratlar) ajratishimiz mumkin.

Umumlashtirilgan chiziqli regressiya modeli uchun (tasodifiy xatolarning kovariatsiya matritsasiga hech qanday cheklovlar qo'yilmagan) eng samarali (chiziqli xolis baholar sinfida) taxminlar deb ataladiganligi isbotlangan (Aitken teoremasi). umumlashtirilgan eng kichik kvadratlar (GLS - umumlashtirilgan eng kichik kvadratlar)- Tasodifiy xatolarning teskari kovariatsiya matritsasiga teng vazn matritsasi bilan LS usuli: .

Chiziqli model parametrlarini GLS baholash formulasi shaklga ega ekanligini ko'rsatish mumkin

Bu baholarning kovariatsiya matritsasi mos ravishda teng bo'ladi

Aslida, OLSning mohiyati dastlabki ma'lumotlarning ma'lum (chiziqli) transformatsiyasida (P) va o'zgartirilgan ma'lumotlarga oddiy OLSni qo'llashda yotadi. Ushbu transformatsiyaning maqsadi shundaki, o'zgartirilgan ma'lumotlar uchun tasodifiy xatolar allaqachon klassik taxminlarni qondiradi.

Og'irlangan OLS

Diagonal og'irlik matritsasi (va shuning uchun tasodifiy xatolarning kovariatsiya matritsasi) bo'lsa, bizda eng kichik kvadratlar (WLS) deb ataladigan narsa bor. Bunday holda, model qoldiqlari kvadratlarining vaznli yig'indisi minimallashtiriladi, ya'ni har bir kuzatish ushbu kuzatishdagi tasodifiy xatoning dispersiyasiga teskari proportsional bo'lgan "vazn" oladi: . Darhaqiqat, ma'lumotlar kuzatuvlarni tortish yo'li bilan o'zgartiriladi (tasodifiy xatolarning taxminiy standart og'ishiga proportsional miqdorga bo'linadi) va vaznli ma'lumotlarga oddiy OLS qo'llaniladi.

MNCni amalda qo'llashning ayrim maxsus holatlari

Chiziqli bog'liqlikning yaqinlashishi

Keling, ma'lum bir skalyar miqdorning ma'lum bir skalyar miqdorga bog'liqligini o'rganish natijasida (Bu, masalan, kuchlanishning oqim kuchiga bog'liqligi bo'lishi mumkin: , bu erda doimiy qiymat, qarshilik o'tkazgich), bu miqdorlarni o'lchash amalga oshirildi, buning natijasida qiymatlar va ularning tegishli qiymatlari. O'lchov ma'lumotlari jadvalga yozilishi kerak.

Jadval. O'lchov natijalari.

O'lchov raqami.
1
2
3
4
5
6

Savol tug'iladi: bog'liqlikni eng yaxshi tavsiflash uchun koeffitsientning qaysi qiymatini tanlash mumkin? Eng kichik kvadratlar usuliga ko'ra, bu qiymat qiymatlarning qiymatlardan kvadratik og'ishlarining yig'indisi bo'lishi kerak.

minimal edi

Kvadrat og'ishlar yig'indisi bitta ekstremumga ega - minimal, bu bizga ushbu formuladan foydalanishga imkon beradi. Ushbu formuladan koeffitsientning qiymatini topamiz. Buning uchun biz uning chap tomonini quyidagicha aylantiramiz:

Oxirgi formula koeffitsientning qiymatini topishga imkon beradi, bu masalada talab qilingan narsadir.

Hikoya

19-asr boshlarigacha. olimlar noma'lumlar soni tenglamalar sonidan kam bo'lgan tenglamalar tizimini echish uchun ma'lum qoidalarga ega emas edilar; O'sha vaqtga qadar, tenglamalar turiga va kalkulyatorlarning aqliga bog'liq bo'lgan shaxsiy texnikalar qo'llanilgan va shuning uchun bir xil kuzatish ma'lumotlariga asoslangan turli xil kalkulyatorlar turli xil xulosalarga kelishgan. Usulni birinchi bo'lib Gauss (1795) qo'llagan va Legendre (1805) uni mustaqil ravishda kashf etgan va zamonaviy nomi bilan nashr etgan (frantsuz. Méthode des moindres quarrés ). Laplas usulni ehtimollar nazariyasi bilan bog'ladi va amerikalik matematik Adrain (1808) uning ehtimollik-nazariy qo'llanilishini ko'rib chiqdi. Usul Encke, Bessel, Hansen va boshqalarning keyingi tadqiqotlari natijasida keng tarqaldi va takomillashtirildi.

OLSdan muqobil foydalanish

Eng kichik kvadratlar usuli g'oyasi regressiya tahlili bilan bevosita bog'liq bo'lmagan boshqa holatlarda ham qo'llanilishi mumkin. Gap shundaki, kvadratlar yig'indisi vektorlar uchun eng keng tarqalgan yaqinlik o'lchovlaridan biridir (cheklangan o'lchovli fazolarda Evklid metrikasi).

Ilovalardan biri - tenglamalar soni o'zgaruvchilar sonidan ko'p bo'lgan chiziqli tenglamalar tizimlarining "yechimi"

bu erda matritsa kvadrat emas, balki o'lchamdagi to'rtburchaklardir.

Bunday tenglamalar tizimi, umumiy holatda, hech qanday yechimga ega emas (agar daraja haqiqatda o'zgaruvchilar sonidan katta bo'lsa). Shuning uchun, bu tizim faqat vektorlar orasidagi "masofa" ni minimallashtirish uchun bunday vektorni tanlash ma'nosida "echilishi" mumkin. Buning uchun siz tizim tenglamalarining chap va o'ng tomonlari orasidagi farqlarning kvadratlari yig'indisini minimallashtirish mezonini qo'llashingiz mumkin, ya'ni. Ushbu minimallashtirish masalasini hal qilish quyidagi tenglamalar tizimini echishga olib kelishini ko'rsatish oson

Agar ba'zi jismoniy miqdor boshqa miqdorga bog'liq bo'lsa, u holda bu bog'liqlikni x ning turli qiymatlarida y ni o'lchash orqali o'rganish mumkin. O'lchovlar natijasida bir qator qiymatlar olinadi:

x 1, x 2, ..., x i, ..., x n;

y 1, y 2, ..., y i, ..., y n.

Bunday tajriba ma'lumotlari asosida y = ƒ(x) bog'liqlik grafigini qurish mumkin. Olingan egri chiziq ƒ(x) funksiyaning shakli haqida xulosa chiqarish imkonini beradi. Biroq, bu funktsiyaga kiradigan doimiy koeffitsientlar noma'lum bo'lib qoladi. Ularni eng kichik kvadratlar usuli yordamida aniqlash mumkin. Tajriba nuqtalari, qoida tariqasida, egri chiziqda aniq yotmaydi. Eng kichik kvadratlar usuli eksperimental nuqtalarning egri chiziqdan og'ish kvadratlari yig'indisini talab qiladi, ya'ni. 2 eng kichik edi.

Amalda, bu usul ko'pincha (va eng oddiy) chiziqli munosabatlar holatida qo'llaniladi, ya'ni. Qachon

y = kx yoki y = a + bx.

Chiziqli bog'liqlik fizikada juda keng tarqalgan. Va munosabatlar chiziqli bo'lmagan taqdirda ham, ular odatda to'g'ri chiziqni olish uchun grafik qurishga harakat qilishadi. Misol uchun, agar shisha n ning sindirish ko'rsatkichi yorug'lik to'lqin uzunligi l bilan n = a + b/l 2 munosabati bilan bog'liq deb faraz qilinsa, u holda n ning l -2 ga bog'liqligi grafikda chiziladi.

Qaramlikni ko'rib chiqing y = kx(bosh nuqtadan oʻtuvchi toʻgʻri chiziq). Nuqtalarimiz to‘g‘ri chiziqdan chetlanish kvadratlari yig‘indisidan ph qiymatini tuzamiz.

ph qiymati har doim ijobiy bo'lib, nuqtalarimiz to'g'ri chiziqqa qanchalik yaqin bo'lsa, shuncha kichikroq bo'ladi. Eng kichik kvadratlar usuli k ning qiymati ph minimumga ega bo'ladigan tarzda tanlanishi kerakligini bildiradi


yoki
(19)

Hisoblash shuni ko'rsatadiki, k ning qiymatini aniqlashda o'rtacha kvadrat ildiz xatosi tengdir.

, (20)
bu erda n - o'lchovlar soni.

Endi biroz ko'proq ko'rib chiqaylik qiyin ish, nuqtalar formulani qondirishi kerak bo'lganda y = a + bx(bosh nuqtadan oʻtmaydigan toʻgʻri chiziq).

Vazifa x i , y i qiymatlari to'plamini hisobga olgan holda topishdir eng yaxshi qadriyatlar a va b.

Keling, yana ph kvadrat shaklini tuzamiz, miqdoriga teng x i, y i nuqtalarning to'g'ri chiziqdan kvadrat og'ishlari

va ph minimal bo'lgan a va b qiymatlarini toping

;

.

.

Bu tenglamalarning birgalikdagi yechimi beradi

(21)

a va b ni aniqlashning o'rtacha kvadratik xatolari teng

(23)

.  (24)

Ushbu usul yordamida o'lchov natijalarini qayta ishlashda barcha ma'lumotlarni (19) (24) formulalarga kiritilgan barcha miqdorlar oldindan hisoblab chiqilgan jadvalda umumlashtirish qulay. Ushbu jadvallarning shakllari quyidagi misollarda keltirilgan.

1-misol. Dinamikaning asosiy tenglamasi o'rganildi aylanish harakati e = M/J (bosh nuqtadan o'tuvchi chiziq). M momentining turli qiymatlarida ma'lum bir jismning burchak tezlanishi e o'lchandi. Bu jismning inersiya momentini aniqlash talab qilinadi. Kuch momenti va burchak tezlanishini o'lchash natijalari ikkinchi va uchinchi ustunlarda keltirilgan. jadval 5.

5-jadval
n M, N m e, s -1 M 2 M e e - km (e - km) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Formula (19) yordamida biz quyidagilarni aniqlaymiz:

.

O'rtacha kvadrat xatoni aniqlash uchun (20) formuladan foydalanamiz.

0.005775kg-1 · m -2 .

Formula (18) bo'yicha bizda mavjud

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Ishonchliligini P = 0,95 o'rnatib, n = 5 uchun Student koeffitsientlari jadvalidan foydalanib, biz t = 2,78 ni topamiz va aniqlaymiz. mutlaq xato DJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Natijalarni quyidagi shaklda yozamiz:

J = (3,0 ± 0,2) kg m2;


2-misol. Eng kichik kvadratlar usuli yordamida metall qarshiligining harorat koeffitsientini hisoblaymiz. Qarshilik chiziqli ravishda haroratga bog'liq

R t = R 0 (1 + a t°) = R 0 + R 0 a t°.

Erkin atama 0 ° C haroratda R 0 qarshiligini aniqlaydi va Nishab koeffitsienti a harorat koeffitsienti va R 0 qarshiligining mahsulotidir.

O'lchovlar va hisob-kitoblar natijalari jadvalda keltirilgan ( 6-jadvalga qarang).

6-jadval
n t°, s r, Om t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

(21), (22) formulalar yordamida aniqlaymiz

R 0 = ¯ R- a R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 ohm.

Keling, a ning ta'rifida xato topaylik. dan boshlab, (18) formulaga muvofiq bizda:

.

Formulalar (23), (24) yordamida biz mavjud

;

0.014126 ohm.

Ishonchlilikni P = 0,95 ga o'rnatib, n = 6 uchun Student koeffitsientlari jadvalidan foydalanib, biz t = 2,57 ni topamiz va mutlaq xatoni aniqlaymiz DA = 2,57 0,000132 = 0,000338 -1 daraja.

a = (23 ± 4) 10 -4 do'l P = 0,95 da -1.


3-misol. Nyuton halqalari yordamida linzalarning egrilik radiusini aniqlash talab qilinadi. Nyuton halqalarining radiuslari r m o’lchandi va bu halqalarning sonlari m aniqlandi. Nyuton halqalarining radiuslari linzaning egrilik radiusi R va halqa raqami tenglama bilan bog'liq.

r 2 m = mLR - 2d 0 R,

bu erda d 0 linza va tekislik-parallel plastinka orasidagi bo'shliqning qalinligi (yoki linzaning deformatsiyasi),

l tushayotgan yorug'likning to'lqin uzunligi.

l = (600 ± 6) nm;
r 2 m = y;
m = x;
lR = b;
-2d 0 R = a,

keyin tenglama shaklni oladi y = a + bx.

.

O'lchov va hisob-kitoblarning natijalari kiritiladi jadval 7.

7-jadval
n x = m y = r 2, 10 -2 mm 2 m -¯ m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –



Saytda yangi

>

Eng mashhur