घर प्रोस्थेटिक्स और इम्प्लांटेशन बिंदु न्यूनतम वर्ग विधि. न्यूनतम वर्ग विधि का प्रयोग कहाँ किया जाता है?

बिंदु न्यूनतम वर्ग विधि. न्यूनतम वर्ग विधि का प्रयोग कहाँ किया जाता है?

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सऔर परतालिका में दिए गए हैं।

इनके संरेखण के फलस्वरूप फलन प्राप्त होता है

का उपयोग करते हुए तरीका कम से कम वर्गों , इन आंकड़ों को एक रैखिक निर्भरता द्वारा अनुमानित करें y=ax+b(पैरामीटर खोजें और बी). पता लगाएं कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ.

न्यूनतम वर्ग विधि (एलएसएम) का सार।

कार्य रैखिक निर्भरता गुणांक को ढूंढना है जिस पर दो चर का कार्य होता है और बी सबसे छोटा मान लेता है. अर्थात् दिया हुआ और बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण को हल करने से दो चर वाले फ़ंक्शन का चरम ज्ञात हो जाता है।

गुणांक ज्ञात करने के लिए सूत्र व्युत्पन्न करना।

दो अज्ञात वाले दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। किसी फ़ंक्शन का आंशिक व्युत्पन्न ढूँढना चर द्वारा और बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि (उदाहरण के लिए) का उपयोग करके हल करते हैं प्रतिस्थापन विधि द्वाराया क्रैमर विधि) और न्यूनतम वर्ग विधि (एलएसएम) का उपयोग करके गुणांक खोजने के लिए सूत्र प्राप्त करें।

दिया गया और बीसमारोह सबसे छोटा मान लेता है. इस बात का प्रमाण दिया गया है पृष्ठ के अंत में नीचे दिए गए पाठ में.

यह न्यूनतम वर्गों की पूरी विधि है। पैरामीटर खोजने का सूत्र इसमें योग ,,, और पैरामीटर शामिल हैं एन- प्रयोगात्मक डेटा की मात्रा. हम इन राशियों के मूल्यों की अलग से गणना करने की अनुशंसा करते हैं। गुणक बीगणना के बाद पाया गया .

मूल उदाहरण को याद करने का समय आ गया है।

समाधान।

हमारे उदाहरण में एन=5. आवश्यक गुणांकों के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका भरते हैं।

तालिका की चौथी पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों का वर्ग करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम कॉलम के मान पंक्तियों के मानों का योग हैं।

गुणांक ज्ञात करने के लिए हम न्यूनतम वर्ग विधि के सूत्रों का उपयोग करते हैं और बी. हम तालिका के अंतिम कॉलम से संबंधित मानों को उनमें प्रतिस्थापित करते हैं:

इस तरह, y = 0.165x+2.184- वांछित सन्निकटन सीधी रेखा।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ हैं y = 0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी न्यूनतम वर्ग विधि का उपयोग करके अनुमान लगाता है।

न्यूनतम वर्ग विधि का त्रुटि अनुमान.

ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन के योग की गणना करने की आवश्यकता है और , एक छोटा मान उस रेखा से मेल खाता है जो न्यूनतम वर्ग विधि के अर्थ में मूल डेटा का बेहतर अनुमान लगाता है।

चूँकि , तो सीधा y = 0.165x+2.184मूल डेटा का बेहतर अनुमान लगाएं।

न्यूनतम वर्ग (एलएस) विधि का ग्राफिक चित्रण।

ग्राफ़ पर सब कुछ स्पष्ट रूप से दिखाई देता है। लाल रेखा पाई गई सीधी रेखा है y = 0.165x+2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं।

व्यवहार में, विभिन्न प्रक्रियाओं की मॉडलिंग करते समय - विशेष रूप से, आर्थिक, भौतिक, तकनीकी, सामाजिक - कुछ निश्चित बिंदुओं पर उनके ज्ञात मूल्यों से कार्यों के अनुमानित मूल्यों की गणना करने की एक या दूसरी विधि का व्यापक रूप से उपयोग किया जाता है।

इस प्रकार की फ़ंक्शन सन्निकटन समस्या अक्सर उत्पन्न होती है:

    प्रयोग के परिणामस्वरूप प्राप्त सारणीबद्ध डेटा का उपयोग करके अध्ययन के तहत प्रक्रिया की विशिष्ट मात्राओं के मूल्यों की गणना के लिए अनुमानित सूत्र बनाते समय;

    संख्यात्मक एकीकरण, विभेदन, समाधान में विभेदक समीकरणवगैरह।;

    यदि आवश्यक हो, तो विचारित अंतराल के मध्यवर्ती बिंदुओं पर कार्यों के मूल्यों की गणना करें;

    विचारित अंतराल के बाहर किसी प्रक्रिया की विशिष्ट मात्राओं के मूल्यों का निर्धारण करते समय, विशेष रूप से पूर्वानुमान लगाते समय।

यदि, तालिका द्वारा निर्दिष्ट एक निश्चित प्रक्रिया को मॉडल करने के लिए, हम एक फ़ंक्शन का निर्माण करते हैं जो कम से कम वर्ग विधि के आधार पर इस प्रक्रिया का लगभग वर्णन करता है, तो इसे एक अनुमानित फ़ंक्शन (प्रतिगमन) कहा जाएगा, और अनुमानित कार्यों के निर्माण की समस्या को स्वयं कहा जाएगा एक सन्निकटन समस्या.

यह आलेख इस प्रकार की समस्या को हल करने के लिए एमएस एक्सेल पैकेज की क्षमताओं पर चर्चा करता है, इसके अलावा, यह सारणीबद्ध कार्यों के लिए प्रतिगमन (जो प्रतिगमन विश्लेषण का आधार है) के निर्माण के लिए तरीके और तकनीक प्रदान करता है।

एक्सेल में प्रतिगमन के निर्माण के लिए दो विकल्प हैं।

    अध्ययन के तहत प्रक्रिया विशेषता के लिए डेटा तालिका के आधार पर बनाए गए आरेख में चयनित प्रतिगमन (ट्रेंडलाइन) जोड़ना (केवल तभी उपलब्ध होता है जब आरेख का निर्माण किया गया हो);

    एक्सेल वर्कशीट के अंतर्निहित सांख्यिकीय कार्यों का उपयोग करके, आप सीधे स्रोत डेटा तालिका से प्रतिगमन (प्रवृत्ति रेखाएं) प्राप्त कर सकते हैं।

चार्ट में ट्रेंड लाइनें जोड़ना

डेटा की एक तालिका के लिए जो एक प्रक्रिया का वर्णन करती है और एक आरेख द्वारा दर्शायी जाती है, एक्सेल में एक प्रभावी प्रतिगमन विश्लेषण उपकरण है जो आपको इसकी अनुमति देता है:

    न्यूनतम वर्ग विधि के आधार पर निर्माण करें और आरेख में पांच प्रकार के प्रतिगमन जोड़ें, जो सटीकता की अलग-अलग डिग्री के साथ अध्ययन के तहत प्रक्रिया को मॉडल करते हैं;

    आरेख में निर्मित प्रतिगमन समीकरण जोड़ें;

    चार्ट पर प्रदर्शित डेटा के लिए चयनित प्रतिगमन के पत्राचार की डिग्री निर्धारित करें।

चार्ट डेटा के आधार पर, एक्सेल आपको रैखिक, बहुपद, लघुगणक, शक्ति, घातीय प्रकार के प्रतिगमन प्राप्त करने की अनुमति देता है, जो समीकरण द्वारा निर्दिष्ट हैं:

वाई = वाई(एक्स)

जहां x एक स्वतंत्र चर है जो अक्सर प्राकृतिक संख्याओं (1; 2; 3; ...) के अनुक्रम का मान लेता है और उदाहरण के लिए, अध्ययन के तहत प्रक्रिया (विशेषताओं) के समय की उलटी गिनती उत्पन्न करता है।

1 . रैखिक प्रतिगमन उन विशेषताओं के मॉडलिंग के लिए अच्छा है जिनके मान स्थिर दर पर बढ़ते या घटते हैं। अध्ययनाधीन प्रक्रिया के निर्माण के लिए यह सबसे सरल मॉडल है। इसका निर्माण समीकरण के अनुसार किया गया है:

वाई = एमएक्स + बी

जहाँ m झुकाव कोण की स्पर्शरेखा है रेखीय प्रतिगमनभुज अक्ष पर; बी - कोटि अक्ष के साथ रैखिक प्रतिगमन के प्रतिच्छेदन बिंदु का समन्वय।

2 . एक बहुपद प्रवृत्ति रेखा उन विशेषताओं का वर्णन करने के लिए उपयोगी होती है जिनमें कई अलग-अलग चरम सीमाएँ (मैक्सिमा और मिनिमा) होती हैं। बहुपद डिग्री का चुनाव अध्ययन की जा रही विशेषता के चरम की संख्या से निर्धारित होता है। इस प्रकार, एक दूसरी-डिग्री बहुपद एक ऐसी प्रक्रिया का अच्छी तरह से वर्णन कर सकता है जिसमें केवल एक अधिकतम या न्यूनतम होता है; तीसरी डिग्री का बहुपद - दो से अधिक एक्स्ट्रेमा नहीं; चौथी डिग्री का बहुपद - तीन चरम से अधिक नहीं, आदि।

इस मामले में, प्रवृत्ति रेखा का निर्माण समीकरण के अनुसार किया जाता है:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

जहां गुणांक c0, c1, c2,... c6 स्थिरांक हैं जिनके मान निर्माण के दौरान निर्धारित किए जाते हैं।

3 . लॉगरिदमिक ट्रेंड लाइन का उपयोग उन विशेषताओं को मॉडलिंग करते समय सफलतापूर्वक किया जाता है जिनके मान शुरू में तेजी से बदलते हैं और फिर धीरे-धीरे स्थिर होते हैं।

y = c ln(x) + b

4 . यदि अध्ययन के तहत रिश्ते के मूल्यों को विकास दर में निरंतर परिवर्तन की विशेषता दी जाती है तो एक पावर-लॉ प्रवृत्ति रेखा अच्छे परिणाम देती है। ऐसी निर्भरता का एक उदाहरण कार की समान रूप से त्वरित गति का ग्राफ है। यदि डेटा में शून्य या नकारात्मक मान हैं, तो आप पावर ट्रेंड लाइन का उपयोग नहीं कर सकते।

समीकरण के अनुसार निर्मित:

वाई = सी एक्सबी

जहाँ गुणांक b, c स्थिरांक हैं।

5 . जब डेटा में परिवर्तन की दर लगातार बढ़ रही हो तो घातीय प्रवृत्ति रेखा का उपयोग किया जाना चाहिए। शून्य या ऋणात्मक मान वाले डेटा के लिए, इस प्रकार का सन्निकटन भी लागू नहीं होता है।

समीकरण के अनुसार निर्मित:

वाई = सी ईबीएक्स

जहाँ गुणांक b, c स्थिरांक हैं।

एक पंक्ति का चयन करते समय एक्सेल ट्रेंडस्वचालित रूप से R2 के मान की गणना करता है, जो सन्निकटन की विश्वसनीयता को दर्शाता है: से निकट मूल्यआर2 से एकता तक, प्रवृत्ति रेखा उतनी ही अधिक विश्वसनीय रूप से अध्ययन के तहत प्रक्रिया का अनुमान लगाती है। यदि आवश्यक हो, तो R2 मान हमेशा चार्ट पर प्रदर्शित किया जा सकता है।

सूत्र द्वारा निर्धारित:

किसी डेटा शृंखला में एक प्रवृत्ति रेखा जोड़ने के लिए:

    डेटा की एक श्रृंखला के आधार पर एक चार्ट सक्रिय करें, यानी चार्ट क्षेत्र के भीतर क्लिक करें। आरेख आइटम मुख्य मेनू में दिखाई देगा;

    इस आइटम पर क्लिक करने के बाद स्क्रीन पर एक मेनू दिखाई देगा जिसमें आपको ट्रेंड लाइन जोड़ें कमांड का चयन करना होगा।

डेटा श्रृंखला में से किसी एक के अनुरूप ग्राफ़ पर माउस पॉइंटर को ले जाकर और राइट-क्लिक करके समान क्रियाएं आसानी से कार्यान्वित की जा सकती हैं; दिखाई देने वाले संदर्भ मेनू में, ट्रेंड लाइन जोड़ें कमांड का चयन करें। टाइप टैब खुलने पर ट्रेंडलाइन डायलॉग बॉक्स स्क्रीन पर दिखाई देगा (चित्र 1)।

इसके बाद आपको चाहिए:

टाइप टैब पर आवश्यक ट्रेंड लाइन प्रकार का चयन करें (रैखिक प्रकार डिफ़ॉल्ट रूप से चयनित है)। बहुपद प्रकार के लिए, डिग्री फ़ील्ड में, चयनित बहुपद की डिग्री निर्दिष्ट करें।

1 . बिल्ट ऑन सीरीज़ फ़ील्ड प्रश्न में चार्ट में सभी डेटा श्रृंखलाओं को सूचीबद्ध करता है। किसी विशिष्ट डेटा श्रृंखला में एक प्रवृत्ति रेखा जोड़ने के लिए, निर्मित श्रृंखला फ़ील्ड में उसका नाम चुनें।

यदि आवश्यक हो, तो पैरामीटर टैब (चित्र 2) पर जाकर, आप ट्रेंड लाइन के लिए निम्नलिखित पैरामीटर सेट कर सकते हैं:

    अनुमानित (सुचारू) वक्र क्षेत्र के नाम में प्रवृत्ति रेखा का नाम बदलें।

    पूर्वानुमान फ़ील्ड में पूर्वानुमान के लिए अवधियों की संख्या (आगे या पीछे) निर्धारित करें;

    आरेख क्षेत्र में प्रवृत्ति रेखा का समीकरण प्रदर्शित करें, जिसके लिए आपको आरेख चेकबॉक्स पर समीकरण दिखाने को सक्षम करना चाहिए;

    आरेख क्षेत्र में सन्निकटन विश्वसनीयता मान R2 प्रदर्शित करें, जिसके लिए आपको आरेख (R^2) चेकबॉक्स पर सन्निकटन विश्वसनीयता मान रखें को सक्षम करना चाहिए;

    Y अक्ष के साथ ट्रेंड लाइन का प्रतिच्छेदन बिंदु सेट करें, जिसके लिए आपको एक बिंदु पर Y अक्ष के साथ वक्र के प्रतिच्छेदन के लिए चेकबॉक्स को सक्षम करना चाहिए;

    डायलॉग बॉक्स बंद करने के लिए ओके बटन पर क्लिक करें।

पहले से खींची गई ट्रेंड लाइन का संपादन शुरू करने के लिए, तीन तरीके हैं:

    पहले ट्रेंड लाइन का चयन करने के बाद, फ़ॉर्मेट मेनू से चयनित ट्रेंड लाइन कमांड का उपयोग करें;

    संदर्भ मेनू से फ़ॉर्मेट ट्रेंड लाइन कमांड का चयन करें, जिसे ट्रेंड लाइन पर राइट-क्लिक करके बुलाया जाता है;

    ट्रेंड लाइन पर डबल क्लिक करें।

ट्रेंड लाइन फॉर्मेट डायलॉग बॉक्स स्क्रीन पर दिखाई देगा (चित्र 3), जिसमें तीन टैब होंगे: दृश्य, प्रकार, पैरामीटर, और अंतिम दो की सामग्री पूरी तरह से ट्रेंड लाइन डायलॉग बॉक्स के समान टैब से मेल खाती है (चित्र 1)। -2). व्यू टैब पर, आप लाइन का प्रकार, उसका रंग और मोटाई सेट कर सकते हैं।

पहले से खींची गई ट्रेंड लाइन को हटाने के लिए, डिलीट की जाने वाली ट्रेंड लाइन का चयन करें और डिलीट कुंजी दबाएं।

सुविचारित प्रतिगमन विश्लेषण उपकरण के लाभ हैं:

    डेटा तालिका बनाए बिना चार्ट पर ट्रेंड लाइन बनाने की सापेक्ष आसानी;

    प्रस्तावित प्रवृत्ति रेखाओं के प्रकारों की एक काफी विस्तृत सूची, और इस सूची में प्रतिगमन के सबसे अधिक उपयोग किए जाने वाले प्रकार शामिल हैं;

    मनमाने ढंग से (सामान्य ज्ञान की सीमा के भीतर) कदमों की आगे और पीछे की संख्या द्वारा अध्ययन के तहत प्रक्रिया के व्यवहार की भविष्यवाणी करने की क्षमता;

    विश्लेषणात्मक रूप में प्रवृत्ति रेखा समीकरण प्राप्त करने की क्षमता;

    संभावना, यदि आवश्यक हो, सन्निकटन की विश्वसनीयता का आकलन प्राप्त करने की।

नुकसान में निम्नलिखित शामिल हैं:

    ट्रेंड लाइन का निर्माण तभी किया जाता है जब डेटा की श्रृंखला पर कोई आरेख बनाया गया हो;

    इसके लिए प्राप्त ट्रेंड लाइन समीकरणों के आधार पर अध्ययन के तहत विशेषता के लिए डेटा श्रृंखला उत्पन्न करने की प्रक्रिया कुछ हद तक अव्यवस्थित है: आवश्यक प्रतिगमन समीकरण मूल डेटा श्रृंखला के मूल्यों में प्रत्येक परिवर्तन के साथ अद्यतन किए जाते हैं, लेकिन केवल आरेख क्षेत्र के भीतर , जबकि डेटा श्रृंखलापुराने ट्रेंड लाइन समीकरण के आधार पर उत्पन्न, अपरिवर्तित रहता है;

    PivotChart रिपोर्ट में, किसी चार्ट या संबद्ध PivotTable रिपोर्ट का दृश्य बदलने से मौजूदा ट्रेंडलाइन संरक्षित नहीं होती हैं, जिसका अर्थ है कि ट्रेंडलाइन खींचने या अन्यथा PivotChart रिपोर्ट को प्रारूपित करने से पहले, आपको यह सुनिश्चित करना चाहिए कि रिपोर्ट लेआउट आवश्यक आवश्यकताओं को पूरा करता है।

ट्रेंड लाइनों का उपयोग ग्राफ, हिस्टोग्राम, फ्लैट गैर-मानकीकृत क्षेत्र चार्ट, बार चार्ट, स्कैटर चार्ट, बबल चार्ट और स्टॉक चार्ट जैसे चार्ट पर प्रस्तुत डेटा श्रृंखला को पूरक करने के लिए किया जा सकता है।

आप 3डी, सामान्यीकृत, रडार, पाई और डोनट चार्ट में डेटा श्रृंखला में ट्रेंड लाइनें नहीं जोड़ सकते।

एक्सेल के अंतर्निहित कार्यों का उपयोग करना

एक्सेल में चार्ट क्षेत्र के बाहर प्रवृत्ति रेखाओं को प्लॉट करने के लिए एक प्रतिगमन विश्लेषण उपकरण भी है। इस उद्देश्य के लिए आप कई सांख्यिकीय वर्कशीट फ़ंक्शंस का उपयोग कर सकते हैं, लेकिन वे सभी आपको केवल रैखिक या घातीय प्रतिगमन बनाने की अनुमति देते हैं।

एक्सेल में विशेष रूप से रैखिक प्रतिगमन के निर्माण के लिए कई कार्य हैं:

    रुझान;

  • ढलान और कट.

साथ ही विशेष रूप से एक घातीय प्रवृत्ति रेखा के निर्माण के लिए कई कार्य:

    LGRFPRIBL.

यह ध्यान दिया जाना चाहिए कि TREND और ग्रोथ फ़ंक्शंस का उपयोग करके प्रतिगमन के निर्माण की तकनीकें लगभग समान हैं। LINEST और LGRFPRIBL फ़ंक्शंस की जोड़ी के बारे में भी यही कहा जा सकता है। इन चार कार्यों के लिए, मूल्यों की एक तालिका बनाने में एक्सेल सुविधाओं जैसे सरणी सूत्रों का उपयोग किया जाता है, जो कुछ हद तक प्रतिगमन निर्माण की प्रक्रिया को अव्यवस्थित करता है। आइए हम यह भी ध्यान दें कि रैखिक प्रतिगमन का निर्माण, हमारी राय में, SLOPE और INTERCEPT फ़ंक्शंस का उपयोग करके सबसे आसानी से पूरा किया जाता है, जहां उनमें से पहला रैखिक प्रतिगमन के ढलान को निर्धारित करता है, और दूसरा प्रतिगमन द्वारा अवरोधित खंड को निर्धारित करता है y-अक्ष.

प्रतिगमन विश्लेषण के लिए अंतर्निहित फ़ंक्शन टूल के लाभ हैं:

    प्रवृत्ति रेखाओं को परिभाषित करने वाले सभी अंतर्निहित सांख्यिकीय कार्यों के लिए अध्ययन के तहत विशेषता की डेटा श्रृंखला उत्पन्न करने की एक काफी सरल, समान प्रक्रिया;

    उत्पन्न डेटा श्रृंखला के आधार पर प्रवृत्ति रेखाओं के निर्माण के लिए मानक पद्धति;

    आगे या पीछे कदमों की आवश्यक संख्या द्वारा अध्ययन के तहत प्रक्रिया के व्यवहार की भविष्यवाणी करने की क्षमता।

नुकसान में यह तथ्य शामिल है कि एक्सेल में अन्य (रैखिक और घातीय को छोड़कर) प्रकार की ट्रेंड लाइनें बनाने के लिए अंतर्निहित फ़ंक्शन नहीं हैं। यह परिस्थिति अक्सर अध्ययन के तहत प्रक्रिया का पर्याप्त सटीक मॉडल चुनने के साथ-साथ वास्तविकता के करीब पूर्वानुमान प्राप्त करने की अनुमति नहीं देती है। इसके अलावा, ट्रेंड और ग्रोथ फ़ंक्शंस का उपयोग करते समय, ट्रेंड लाइनों के समीकरण ज्ञात नहीं होते हैं।

यह ध्यान दिया जाना चाहिए कि लेखकों ने प्रतिगमन विश्लेषण के पाठ्यक्रम को पूर्णता की किसी भी डिग्री के साथ प्रस्तुत करने का लक्ष्य निर्धारित नहीं किया है। इसका मुख्य कार्य विशिष्ट उदाहरणों का उपयोग करके, सन्निकटन समस्याओं को हल करते समय एक्सेल पैकेज की क्षमताओं को दिखाना है; प्रदर्शित करें कि प्रतिगमन और पूर्वानुमान के निर्माण के लिए एक्सेल के पास कौन से प्रभावी उपकरण हैं; स्पष्ट करें कि ऐसी समस्याओं को ऐसे उपयोगकर्ता द्वारा भी अपेक्षाकृत आसानी से कैसे हल किया जा सकता है, जिसके पास प्रतिगमन विश्लेषण का व्यापक ज्ञान नहीं है।

विशिष्ट समस्याओं को हल करने के उदाहरण

आइए सूचीबद्ध एक्सेल टूल का उपयोग करके विशिष्ट समस्याओं को हल करने पर नजर डालें।

समस्या 1

1995-2002 के लिए एक मोटर परिवहन उद्यम के लाभ पर डेटा की एक तालिका के साथ। आपको निम्नलिखित कार्य करने की आवश्यकता है:

    एक आरेख बनाएं.

    चार्ट में रैखिक और बहुपद (द्विघात और घन) प्रवृत्ति रेखाएँ जोड़ें।

    ट्रेंड लाइन समीकरणों का उपयोग करके, 1995-2004 के लिए प्रत्येक ट्रेंड लाइन के लिए उद्यम लाभ पर सारणीबद्ध डेटा प्राप्त करें।

    2003 और 2004 के लिए उद्यम के लाभ का पूर्वानुमान लगाएं।

समस्या का समाधान

    एक्सेल वर्कशीट के सेल A4:C11 की रेंज में, चित्र में दिखाई गई वर्कशीट दर्ज करें। 4.

    कोशिकाओं की श्रेणी B4:C11 का चयन करने के बाद, हम एक आरेख बनाते हैं।

    हम निर्मित आरेख को सक्रिय करते हैं और, ऊपर वर्णित विधि के अनुसार, ट्रेंड लाइन संवाद बॉक्स में ट्रेंड लाइन के प्रकार का चयन करने के बाद (चित्र 1 देखें), हम बारी-बारी से आरेख में रैखिक, द्विघात और घन प्रवृत्ति रेखाओं को जोड़ते हैं। उसी संवाद बॉक्स में, पैरामीटर टैब खोलें (चित्र 2 देखें), अनुमानित (सुचारू) वक्र फ़ील्ड के नाम में, जोड़े जा रहे रुझान का नाम दर्ज करें, और पूर्वानुमान फॉरवर्ड फॉर: पीरियड्स फ़ील्ड में, सेट करें मान 2, क्योंकि आगे दो वर्षों के लिए लाभ का पूर्वानुमान लगाने की योजना बनाई गई है। आरेख क्षेत्र में प्रतिगमन समीकरण और सन्निकटन विश्वसनीयता मान R2 प्रदर्शित करने के लिए, स्क्रीन चेकबॉक्स पर समीकरण दिखाएं सक्षम करें और आरेख पर सन्निकटन विश्वसनीयता मान (R^2) रखें। बेहतर दृश्य धारणा के लिए, हम निर्मित ट्रेंड लाइनों के प्रकार, रंग और मोटाई को बदलते हैं, जिसके लिए हम ट्रेंड लाइन प्रारूप संवाद बॉक्स के व्यू टैब का उपयोग करते हैं (चित्र 3 देखें)। अतिरिक्त प्रवृत्ति रेखाओं के साथ परिणामी आरेख चित्र में दिखाया गया है। 5.

    1995-2004 के लिए प्रत्येक प्रवृत्ति रेखा के लिए उद्यम लाभ पर सारणीबद्ध डेटा प्राप्त करना। आइए चित्र में प्रस्तुत प्रवृत्ति रेखा समीकरणों का उपयोग करें। 5. ऐसा करने के लिए, श्रेणी D3:F3 की कोशिकाओं में, चयनित प्रवृत्ति रेखा के प्रकार के बारे में पाठ्य जानकारी दर्ज करें: रैखिक प्रवृत्ति, द्विघात प्रवृत्ति, घन प्रवृत्ति। इसके बाद, सेल D4 में रैखिक प्रतिगमन सूत्र दर्ज करें और, भरण मार्कर का उपयोग करके, इस सूत्र को सेल श्रेणी D5:D13 के सापेक्ष संदर्भों के साथ कॉपी करें। यह ध्यान दिया जाना चाहिए कि कोशिकाओं की श्रेणी D4:D13 से रैखिक प्रतिगमन सूत्र वाले प्रत्येक कक्ष में एक तर्क के रूप में श्रेणी A4:A13 से संबंधित कोशिका होती है। इसी प्रकार, द्विघात प्रतिगमन के लिए, कोशिकाओं की सीमा E4:E13 भरें, और घन प्रतिगमन के लिए, कोशिकाओं की सीमा F4:F13 भरें। इस प्रकार, 2003 और 2004 के लिए उद्यम के लाभ का पूर्वानुमान संकलित किया गया है। तीन प्रवृत्तियों का उपयोग करना। मूल्यों की परिणामी तालिका चित्र में दिखाई गई है। 6.

समस्या 2

    एक आरेख बनाएं.

    चार्ट में लघुगणक, शक्ति और घातांकीय प्रवृत्ति रेखाएँ जोड़ें।

    प्राप्त प्रवृत्ति रेखाओं के समीकरण, साथ ही उनमें से प्रत्येक के लिए सन्निकटन R2 के विश्वसनीयता मान प्राप्त करें।

    ट्रेंड लाइन समीकरणों का उपयोग करके, 1995-2002 के लिए प्रत्येक ट्रेंड लाइन के लिए उद्यम के लाभ पर सारणीबद्ध डेटा प्राप्त करें।

    इन ट्रेंड लाइनों का उपयोग करके 2003 और 2004 के लिए कंपनी के लाभ का पूर्वानुमान लगाएं।

समस्या का समाधान

समस्या 1 को हल करने में दी गई पद्धति का पालन करते हुए, हमें लघुगणक, शक्ति और घातीय प्रवृत्ति रेखाओं के साथ एक आरेख प्राप्त होता है (चित्र 7)। इसके बाद, प्राप्त ट्रेंड लाइन समीकरणों का उपयोग करते हुए, हम उद्यम के लाभ के लिए मूल्यों की एक तालिका भरते हैं, जिसमें 2003 और 2004 के लिए अनुमानित मूल्य शामिल हैं। (चित्र 8)।

चित्र में. 5 और अंजीर. यह देखा जा सकता है कि लघुगणकीय प्रवृत्ति वाला मॉडल सन्निकटन विश्वसनीयता के न्यूनतम मूल्य से मेल खाता है

आर2 = 0.8659

R2 के उच्चतम मान बहुपद प्रवृत्ति वाले मॉडल के अनुरूप हैं: द्विघात (R2 = 0.9263) और घन (R2 = 0.933)।

समस्या 3

कार्य 1 में दी गई 1995-2002 के लिए एक मोटर परिवहन उद्यम के लाभ पर डेटा की तालिका के साथ, आपको निम्नलिखित चरणों का पालन करना होगा।

    TREND और GROW फ़ंक्शंस का उपयोग करके रैखिक और घातीय प्रवृत्ति रेखाओं के लिए डेटा श्रृंखला प्राप्त करें।

    ट्रेंड और ग्रोथ फ़ंक्शन का उपयोग करके, 2003 और 2004 के लिए उद्यम के लाभ का पूर्वानुमान लगाएं।

    मूल डेटा और परिणामी डेटा श्रृंखला के लिए एक आरेख बनाएं।

समस्या का समाधान

आइए समस्या 1 के लिए वर्कशीट का उपयोग करें (चित्र 4 देखें)। आइए TREND फ़ंक्शन से शुरुआत करें:

    कक्षों की श्रेणी D4:D11 का चयन करें, जो उद्यम के लाभ पर ज्ञात डेटा के अनुरूप TREND फ़ंक्शन के मानों से भरी होनी चाहिए;

    इन्सर्ट मेनू से फ़ंक्शन कमांड को कॉल करें। दिखाई देने वाले फ़ंक्शन विज़ार्ड संवाद बॉक्स में, सांख्यिकीय श्रेणी से ट्रेंड फ़ंक्शन का चयन करें और फिर ओके बटन पर क्लिक करें। मानक टूलबार पर (इन्सर्ट फंक्शन) बटन पर क्लिक करके समान ऑपरेशन किया जा सकता है।

    दिखाई देने वाले फ़ंक्शन तर्क संवाद बॉक्स में, Known_values_y फ़ील्ड में कक्ष C4:C11 की श्रेणी दर्ज करें; Known_values_x फ़ील्ड में - कोशिकाओं की श्रेणी B4:B11;

    दर्ज किए गए सूत्र को एक सरणी सूत्र बनाने के लिए, कुंजी संयोजन + + का उपयोग करें।

हमने फॉर्मूला बार में जो फॉर्मूला दर्ज किया है वह इस तरह दिखेगा: =(TREND(C4:C11,B4:B11)).

परिणामस्वरूप, कोशिकाओं की श्रेणी D4:D11 TREND फ़ंक्शन के संबंधित मानों से भर जाती है (चित्र 9)।

2003 और 2004 के लिए उद्यम के लाभ का पूर्वानुमान लगाना। ज़रूरी:

    कक्षों की श्रेणी D12:D13 का चयन करें जहां TREND फ़ंक्शन द्वारा अनुमानित मान दर्ज किए जाएंगे।

    TREND फ़ंक्शन को कॉल करें और दिखाई देने वाले फ़ंक्शन तर्क संवाद बॉक्स में, Known_values_y फ़ील्ड में दर्ज करें - कोशिकाओं की श्रेणी C4:C11; Known_values_x फ़ील्ड में - कोशिकाओं की श्रेणी B4:B11; और New_values_x फ़ील्ड में - कक्षों की श्रेणी B12:B13।

    कुंजी संयोजन Ctrl + Shift + Enter का उपयोग करके इस सूत्र को एक सरणी सूत्र में बदलें।

    दर्ज किया गया फॉर्मूला इस तरह दिखेगा: =(TREND(C4:C11;B4:B11;B12:B13)), और कोशिकाओं की श्रेणी D12:D13 TREND फ़ंक्शन के अनुमानित मानों से भरी जाएगी (चित्र देखें)। 9).

डेटा श्रृंखला इसी प्रकार ग्रोथ फ़ंक्शन का उपयोग करके भरी जाती है, जिसका उपयोग गैर-रेखीय निर्भरता के विश्लेषण में किया जाता है और इसके रैखिक समकक्ष ट्रेंड के समान ही काम करता है।

चित्र 10 तालिका को सूत्र प्रदर्शन मोड में दिखाता है।

प्रारंभिक डेटा और प्राप्त डेटा श्रृंखला के लिए, चित्र में दिखाया गया आरेख। ग्यारह।

समस्या 4

चालू माह की 1 से 11 तारीख की अवधि के लिए मोटर परिवहन उद्यम की प्रेषण सेवा द्वारा सेवाओं के लिए आवेदनों की प्राप्ति पर डेटा की तालिका के साथ, आपको निम्नलिखित क्रियाएं करनी होंगी।

    रैखिक प्रतिगमन के लिए डेटा श्रृंखला प्राप्त करें: SLOPE और INTERCEPT फ़ंक्शंस का उपयोग करना; LINEST फ़ंक्शन का उपयोग करना।

    LGRFPRIBL फ़ंक्शन का उपयोग करके घातीय प्रतिगमन के लिए डेटा की एक श्रृंखला प्राप्त करें।

    उपरोक्त कार्यों का उपयोग करते हुए, चालू माह की 12 से 14 तारीख की अवधि के लिए प्रेषण सेवा को आवेदनों की प्राप्ति के बारे में पूर्वानुमान लगाएं।

    मूल और प्राप्त डेटा श्रृंखला के लिए एक आरेख बनाएं।

समस्या का समाधान

ध्यान दें कि, TREND और ग्रोथ फ़ंक्शंस के विपरीत, ऊपर सूचीबद्ध कोई भी फ़ंक्शंस (SLOPE, INTERCEPT, LINEST, LGRFPRIB) प्रतिगमन नहीं हैं। ये फ़ंक्शन केवल सहायक भूमिका निभाते हैं, आवश्यक प्रतिगमन मापदंडों का निर्धारण करते हैं।

SLOPE, INTERCEPT, LINEST, LGRFPRIB फ़ंक्शंस का उपयोग करके बनाए गए रैखिक और घातीय प्रतिगमन के लिए, उनके समीकरणों की उपस्थिति हमेशा ज्ञात होती है, TREND और ग्रोथ फ़ंक्शंस के अनुरूप रैखिक और घातीय प्रतिगमन के विपरीत।

1 . आइए समीकरण के साथ एक रेखीय प्रतिगमन बनाएं:

वाई = एमएक्स+बी

SLOPE और INTERCEPT फ़ंक्शन का उपयोग करते हुए, प्रतिगमन ढलान m को SLOPE फ़ंक्शन द्वारा निर्धारित किया जाता है, और मुक्त पद b को INTERCEPT फ़ंक्शन द्वारा निर्धारित किया जाता है।

ऐसा करने के लिए, हम निम्नलिखित क्रियाएं करते हैं:

    मूल तालिका को सेल रेंज A4:B14 में दर्ज करें;

    पैरामीटर m का मान सेल C19 में निर्धारित किया जाएगा। सांख्यिकीय श्रेणी से ढलान फ़ंक्शन का चयन करें; Known_values_y फ़ील्ड में कक्षों की श्रेणी B4:B14 और ज्ञात_values_x फ़ील्ड में कक्षों A4:A14 की श्रेणी दर्ज करें। सूत्र सेल C19 में दर्ज किया जाएगा: =SLOPE(B4:B14,A4:A14);

    एक समान तकनीक का उपयोग करके, सेल D19 में पैरामीटर b का मान निर्धारित किया जाता है। और इसकी सामग्री इस तरह दिखेगी: =सेगमेंट(बी4:बी14,ए4:ए14)। इस प्रकार, एक रेखीय प्रतिगमन के निर्माण के लिए आवश्यक पैरामीटर एम और बी के मान क्रमशः कोशिकाओं सी19, डी19 में संग्रहीत किए जाएंगे;

    इसके बाद, सेल C4 में रैखिक प्रतिगमन सूत्र को इस रूप में दर्ज करें: =$C*A4+$D। इस सूत्र में, सेल C19 और D19 को पूर्ण संदर्भ के साथ लिखा गया है (संभावित प्रतिलिपि के दौरान सेल का पता नहीं बदलना चाहिए)। पूर्ण संदर्भ चिह्न $ को सेल पते पर कर्सर रखने के बाद या तो कीबोर्ड से या F4 कुंजी का उपयोग करके टाइप किया जा सकता है। भरण हैंडल का उपयोग करके, इस सूत्र को कक्ष C4:C17 की श्रेणी में कॉपी करें। हमें आवश्यक डेटा श्रृंखला प्राप्त होती है (चित्र 12)। इस तथ्य के कारण कि अनुरोधों की संख्या एक पूर्णांक है, आपको सेल प्रारूप विंडो के नंबर टैब पर दशमलव स्थानों की संख्या के साथ संख्या प्रारूप को 0 पर सेट करना चाहिए।

2 . आइए अब समीकरण द्वारा दिए गए एक रेखीय प्रतिगमन का निर्माण करें:

वाई = एमएक्स+बी

LINEST फ़ंक्शन का उपयोग करना।

इसके लिए:

    सेल श्रेणी C20:D20: =(LINEST(B4:B14,A4:A14)) में एक सरणी सूत्र के रूप में LINEST फ़ंक्शन दर्ज करें। परिणामस्वरूप, हमें सेल C20 में पैरामीटर m का मान और सेल D20 में पैरामीटर b का मान प्राप्त होता है;

    सेल D4 में सूत्र दर्ज करें: =$C*A4+$D;

    भरण मार्कर का उपयोग करके इस सूत्र को सेल श्रेणी D4:D17 में कॉपी करें और वांछित डेटा श्रृंखला प्राप्त करें।

3 . हम समीकरण के साथ एक घातांकीय प्रतिगमन बनाते हैं:

LGRFPRIBL फ़ंक्शन का उपयोग करके इसे इसी प्रकार निष्पादित किया जाता है:

    सेल श्रेणी C21:D21 में हम LGRFPRIBL फ़ंक्शन को एक सरणी सूत्र के रूप में दर्ज करते हैं: =( LGRFPRIBL (B4:B14,A4:A14))। इस स्थिति में, पैरामीटर m का मान सेल C21 में निर्धारित किया जाएगा, और पैरामीटर b का मान सेल D21 में निर्धारित किया जाएगा;

    सूत्र सेल E4 में दर्ज किया गया है: =$D*$C^A4;

    भरण मार्कर का उपयोग करके, इस सूत्र को कोशिकाओं की श्रेणी E4:E17 में कॉपी किया जाता है, जहां घातीय प्रतिगमन के लिए डेटा श्रृंखला स्थित होगी (चित्र 12 देखें)।

चित्र में. चित्र 13 एक तालिका दिखाता है जहां आप आवश्यक सेल श्रेणियों के साथ-साथ सूत्रों के साथ हमारे द्वारा उपयोग किए जाने वाले फ़ंक्शन देख सकते हैं।

परिमाण आर 2 बुलाया निर्धारण का गुणांक.

प्रतिगमन निर्भरता के निर्माण का कार्य मॉडल (1) के गुणांक एम के वेक्टर को ढूंढना है जिस पर गुणांक आर अधिकतम मूल्य लेता है।

आर के महत्व का आकलन करने के लिए, फिशर एफ परीक्षण का उपयोग किया जाता है, जिसकी गणना सूत्र का उपयोग करके की जाती है

कहाँ एन- नमूना आकार (प्रयोगों की संख्या);

k मॉडल गुणांकों की संख्या है।

यदि F डेटा के लिए कुछ महत्वपूर्ण मान से अधिक है एनऔर और स्वीकृत आत्मविश्वास संभावना, तो R का मान महत्वपूर्ण माना जाता है। टेबल महत्वपूर्ण मूल्यएफ गणितीय आंकड़ों पर संदर्भ पुस्तकों में दिए गए हैं।

इस प्रकार, आर का महत्व न केवल इसके मूल्य से निर्धारित होता है, बल्कि प्रयोगों की संख्या और मॉडल के गुणांक (पैरामीटर) की संख्या के बीच के अनुपात से भी निर्धारित होता है। दरअसल, एक साधारण रैखिक मॉडल के लिए n=2 का सहसंबंध अनुपात 1 के बराबर है (एक सीधी रेखा हमेशा एक समतल पर 2 बिंदुओं के माध्यम से खींची जा सकती है)। हालाँकि, यदि प्रयोगात्मक डेटा यादृच्छिक चर हैं, तो आर के ऐसे मूल्य पर बहुत सावधानी से भरोसा किया जाना चाहिए। आमतौर पर, महत्वपूर्ण आर और विश्वसनीय प्रतिगमन प्राप्त करने के लिए, वे यह सुनिश्चित करने का प्रयास करते हैं कि प्रयोगों की संख्या मॉडल गुणांक (एन>के) की संख्या से काफी अधिक है।

एक रेखीय प्रतिगमन मॉडल बनाने के लिए आपको चाहिए:

1) प्रयोगात्मक डेटा (आउटपुट मान वाले कॉलम) वाले एन पंक्तियों और एम कॉलम की एक सूची तैयार करें वाईसूची में या तो प्रथम या अंतिम होना चाहिए); उदाहरण के लिए, आइए पिछले कार्य से डेटा लें, "अवधि संख्या" नामक एक कॉलम जोड़ें, अवधि संख्याओं को 1 से 12 तक क्रमांकित करें। (ये मान होंगे एक्स)

2) डेटा/डेटा विश्लेषण/प्रतिगमन मेनू पर जाएं

यदि "टूल्स" मेनू में "डेटा विश्लेषण" आइटम गायब है, तो आपको उसी मेनू में "ऐड-इन्स" आइटम पर जाना चाहिए और "विश्लेषण पैकेज" चेकबॉक्स को चेक करना चाहिए।

3) "रिग्रेशन" संवाद बॉक्स में, सेट करें:

· इनपुट अंतराल Y;

· इनपुट अंतराल एक्स;

· आउटपुट अंतराल - अंतराल का ऊपरी बायां कक्ष जिसमें गणना परिणाम रखे जाएंगे (उन्हें एक नई वर्कशीट पर रखने की अनुशंसा की जाती है);

4) "ओके" पर क्लिक करें और परिणामों का विश्लेषण करें।

जो सबसे ज्यादा मिलता है व्यापक अनुप्रयोगविज्ञान और व्यावहारिक गतिविधि के विभिन्न क्षेत्रों में। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र, समाजशास्त्र, मनोविज्ञान इत्यादि हो सकता है। भाग्य की इच्छा से, मुझे अक्सर अर्थव्यवस्था से निपटना पड़ता है, और इसलिए आज मैं आपके लिए एक अद्भुत देश की यात्रा की व्यवस्था करूंगा जिसे कहा जाता है अर्थमिति=) ...आप इसे कैसे नहीं चाह सकते?! यह वहां बहुत अच्छा है - आपको बस अपना मन बनाने की जरूरत है! ...लेकिन आप निश्चित रूप से यह सीखना चाहेंगे कि समस्याओं को कैसे हल किया जाए न्यूनतम वर्ग विधि. और विशेष रूप से मेहनती पाठक उन्हें न केवल सटीक रूप से, बल्कि बहुत जल्दी हल करना सीखेंगे ;-) लेकिन पहले समस्या का सामान्य विवरण+ साथ में दिया गया उदाहरण:

आइए हम एक निश्चित विषय क्षेत्र में संकेतकों का अध्ययन करें जिनकी मात्रात्मक अभिव्यक्ति होती है। साथ ही, यह मानने का हर कारण है कि संकेतक संकेतक पर निर्भर करता है। यह धारणा या तो वैज्ञानिक परिकल्पना हो सकती है या बुनियादी सामान्य ज्ञान पर आधारित हो सकती है। हालाँकि, आइए विज्ञान को एक तरफ छोड़ दें, और अधिक स्वादिष्ट क्षेत्रों का पता लगाएं - अर्थात् किराना स्टोर। आइए निरूपित करें:

– किराना दुकान का खुदरा क्षेत्र, वर्ग मीटर,
- किराना स्टोर का वार्षिक कारोबार, मिलियन रूबल।

यह बिल्कुल स्पष्ट है कि स्टोर का क्षेत्रफल जितना बड़ा होगा, अधिकांश मामलों में उसका टर्नओवर उतना ही अधिक होगा।

मान लीजिए कि डफ के साथ अवलोकन/प्रयोग/गणना/नृत्य करने के बाद हमारे पास संख्यात्मक डेटा है:

किराने की दुकानों के साथ, मुझे लगता है कि सब कुछ स्पष्ट है: - यह पहली दुकान का क्षेत्र है, - इसका वार्षिक कारोबार, - दूसरी दुकान का क्षेत्र, - इसका वार्षिक कारोबार, आदि। वैसे, वर्गीकृत सामग्रियों तक पहुंच होना बिल्कुल भी आवश्यक नहीं है - व्यापार कारोबार का काफी सटीक आकलन इसके माध्यम से प्राप्त किया जा सकता है गणितीय सांख्यिकी. हालाँकि, विचलित न हों, वाणिज्यिक जासूसी पाठ्यक्रम का भुगतान पहले ही किया जा चुका है =)

सारणीबद्ध डेटा को बिंदुओं के रूप में भी लिखा जा सकता है और परिचित रूप में दर्शाया जा सकता है कार्तीय प्रणाली .

हम जवाब देंगे महत्वपूर्ण सवाल: गुणात्मक अध्ययन के लिए कितने अंक आवश्यक हैं?

जितना बड़ा उतना बेहतर। न्यूनतम स्वीकार्य सेट में 5-6 अंक होते हैं। इसके अलावा, जब डेटा की मात्रा छोटी होती है, तो "विसंगतिपूर्ण" परिणामों को नमूने में शामिल नहीं किया जा सकता है। इसलिए, उदाहरण के लिए, एक छोटा संभ्रांत स्टोर "अपने सहयोगियों" की तुलना में अधिक परिमाण के ऑर्डर अर्जित कर सकता है, जिससे विकृत हो सकता है सामान्य पैटर्न, जिसे आपको खोजने की आवश्यकता है!

इसे बहुत सरलता से कहें तो, हमें एक फ़ंक्शन का चयन करना होगा, अनुसूचीजो जितना संभव हो सके बिंदुओं के करीब से गुजरता है . इस फ़ंक्शन को कहा जाता है अनुमान करने वाले (अनुमान - सन्निकटन)या सैद्धांतिक कार्य . सामान्यतया, एक स्पष्ट "दावेदार" तुरंत यहां प्रकट होता है - एक उच्च-डिग्री बहुपद, जिसका ग्राफ सभी बिंदुओं से होकर गुजरता है। लेकिन यह विकल्प जटिल है और अक्सर गलत भी होता है। (चूँकि ग्राफ़ हर समय "लूप" करेगा और मुख्य प्रवृत्ति को खराब रूप से प्रतिबिंबित करेगा).

इस प्रकार, मांगा गया कार्य काफी सरल होना चाहिए और साथ ही निर्भरता को पर्याप्त रूप से प्रतिबिंबित करना चाहिए। जैसा कि आप अनुमान लगा सकते हैं, ऐसे फ़ंक्शंस को खोजने के तरीकों में से एक को कहा जाता है न्यूनतम वर्ग विधि. सबसे पहले, आइए इसके सार को देखें सामान्य रूप से देखें. कुछ कार्यों को प्रायोगिक डेटा का अनुमान लगाने दें:


इस सन्निकटन की सटीकता का मूल्यांकन कैसे करें? आइए हम प्रयोगात्मक और के बीच अंतर (विचलन) की भी गणना करें कार्यात्मक अर्थ (हम ड्राइंग का अध्ययन करते हैं). पहला विचार जो मन में आता है वह यह अनुमान लगाना है कि राशि कितनी बड़ी है, लेकिन समस्या यह है कि अंतर नकारात्मक हो सकते हैं (उदाहरण के लिए, ) और ऐसे योग के परिणामस्वरूप विचलन एक दूसरे को रद्द कर देंगे। इसलिए, सन्निकटन की सटीकता के अनुमान के रूप में, योग लेना आवश्यक है मॉड्यूलविचलन:

या ढह गया: (यदि किसी को पता नहीं है: - यह योग चिह्न है, और - एक सहायक "काउंटर" चर, जो 1 से मान लेता है).

प्रायोगिक बिंदुओं को करीब लाना विभिन्न कार्य, हम प्राप्त करेंगे विभिन्न अर्थ, और जाहिर है, जहां यह राशि छोटी है, वह फ़ंक्शन अधिक सटीक है।

ऐसी एक विधि मौजूद है और इसे कहा जाता है न्यूनतम मापांक विधि. हालाँकि, व्यवहार में यह बहुत अधिक व्यापक हो गया है न्यूनतम वर्ग विधि, जिसमें संभावित नकारात्मक मानों को मॉड्यूल द्वारा नहीं, बल्कि विचलनों का वर्ग करके समाप्त किया जाता है:

, जिसके बाद प्रयासों का उद्देश्य एक फ़ंक्शन का चयन करना है ताकि वर्ग विचलन का योग हो जितना संभव हो उतना छोटा था. दरअसल, यहीं से विधि का नाम आता है।

और अब हम किसी और चीज़ पर वापस जा रहे हैं महत्वपूर्ण बिंदु: जैसा कि ऊपर बताया गया है, चयनित फ़ंक्शन काफी सरल होना चाहिए - लेकिन ऐसे कई फ़ंक्शन भी हैं: रेखीय , अतिपरवलिक, घातीय, लघुगणक, द्विघात वगैरह। और, निःसंदेह, यहां मैं तुरंत "गतिविधि के क्षेत्र को कम करना" चाहूंगा। अनुसंधान के लिए मुझे किस श्रेणी के कार्यों का चयन करना चाहिए? आदिम, लेकिन प्रभावी तकनीक:

– सबसे आसान तरीका है बिंदुओं को चित्रित करना ड्राइंग पर और उनके स्थान का विश्लेषण करें। यदि वे एक सीधी रेखा में चलते हैं, तो आपको तलाश करनी चाहिए एक रेखा का समीकरण साथ इष्टतम मूल्यऔर । दूसरे शब्दों में, कार्य ऐसे गुणांक ढूंढना है ताकि वर्ग विचलन का योग सबसे छोटा हो।

यदि बिंदु स्थित हैं, उदाहरण के लिए, साथ में अतिशयोक्ति, तो यह स्पष्ट रूप से स्पष्ट है कि रैखिक फ़ंक्शन खराब सन्निकटन देगा। इस मामले में, हम हाइपरबोला समीकरण के लिए सबसे "अनुकूल" गुणांक की तलाश कर रहे हैं - वे जो वर्गों का न्यूनतम योग देते हैं .

अब ध्यान दीजिए कि हम दोनों ही मामलों में किसकी बात कर रहे हैं दो चर के कार्य, किसके तर्क हैं निर्भरता पैरामीटर खोजे गए:

और अनिवार्य रूप से हमें एक मानक समस्या को हल करने की आवश्यकता है - खोजें दो चरों का न्यूनतम कार्य.

आइए अपना उदाहरण याद रखें: मान लीजिए कि "स्टोर" बिंदु एक सीधी रेखा में स्थित होते हैं और उपस्थिति पर विश्वास करने का हर कारण है रैखिक निर्भरताखुदरा स्थान से कारोबार। आइए ऐसे गुणांक "ए" और "बी" ढूंढें जैसे कि वर्ग विचलन का योग सबसे छोटा था. सब कुछ हमेशा की तरह है - पहला प्रथम क्रम आंशिक व्युत्पन्न. के अनुसार रैखिकता नियमआप योग चिह्न के ठीक नीचे अंतर कर सकते हैं:

यदि आप उपयोग करना चाहते हैं यह जानकारीएक निबंध या पाठ्यक्रम के लिए - मैं स्रोतों की सूची में लिंक के लिए बहुत आभारी रहूंगा; आपको ऐसी विस्तृत गणना कुछ स्थानों पर मिलेगी:

आइए एक मानक प्रणाली बनाएं:

हम प्रत्येक समीकरण को "दो" से कम करते हैं और, इसके अलावा, योग को "विभाजित" करते हैं:

टिप्पणी : स्वतंत्र रूप से विश्लेषण करें कि "ए" और "बी" को योग चिह्न से परे क्यों निकाला जा सकता है। वैसे, औपचारिक तौर पर रकम से ऐसा किया जा सकता है

आइए सिस्टम को "लागू" रूप में फिर से लिखें:

जिसके बाद हमारी समस्या को हल करने के लिए एल्गोरिदम उभरना शुरू होता है:

क्या हम बिंदुओं के निर्देशांक जानते हैं? हम जानते हैं। राशियाँ क्या हम इसे ढूंढ सकते हैं? आसानी से। आइए सबसे सरल बनाएं दो अज्ञात में दो रैखिक समीकरणों की प्रणाली("ए" और "बी")। हम सिस्टम को हल करते हैं, उदाहरण के लिए, क्रैमर विधि, जिसके परिणामस्वरूप हमें एक स्थिर बिंदु प्राप्त होता है। चेकिंग चरम सीमा के लिए पर्याप्त स्थिति, हम इस बिंदु पर फ़ंक्शन को सत्यापित कर सकते हैं बिल्कुल पहुंचता है न्यूनतम. जाँच में अतिरिक्त गणनाएँ शामिल हैं और इसलिए हम इसे पर्दे के पीछे छोड़ देंगे (यदि आवश्यक हो, तो लापता फ़्रेम को देखा जा सकता है). हम अंतिम निष्कर्ष निकालते हैं:

समारोह सबसे अच्छा तरीका (कम से कम किसी अन्य रैखिक फ़ंक्शन की तुलना में)प्रयोगात्मक बिंदुओं को करीब लाता है . मोटे तौर पर कहें तो इसका ग्राफ जितना संभव हो सके इन बिंदुओं के करीब से गुजरता है। परंपरा में अर्थमितिपरिणामी सन्निकटन फलन को भी कहा जाता है युग्मित रैखिक प्रतिगमन समीकरण .

विचाराधीन समस्या अत्यधिक व्यावहारिक महत्व की है। हमारी उदाहरण स्थिति में, Eq. आपको यह अनुमान लगाने की अनुमति देता है कि व्यापार का टर्नओवर क्या होगा ("इग्रेक")स्टोर में बिक्री क्षेत्र का एक या दूसरा मूल्य होगा ("x" का एक या दूसरा अर्थ). हां, परिणामी पूर्वानुमान केवल पूर्वानुमान ही होगा, लेकिन कई मामलों में यह काफी सटीक साबित होगा।

मैं "वास्तविक" संख्याओं के साथ सिर्फ एक समस्या का विश्लेषण करूंगा, क्योंकि इसमें कोई कठिनाई नहीं है - सभी गणनाएं स्तर पर हैं स्कूल के पाठ्यक्रम 7-8 ग्रेड. 95 प्रतिशत मामलों में, आपको केवल एक रैखिक फ़ंक्शन खोजने के लिए कहा जाएगा, लेकिन लेख के अंत में मैं दिखाऊंगा कि इष्टतम हाइपरबोला, घातीय और कुछ अन्य कार्यों के समीकरण ढूंढना अब और मुश्किल नहीं है।

वास्तव में, जो कुछ बचा है वह वादा किए गए उपहारों को वितरित करना है - ताकि आप ऐसे उदाहरणों को न केवल सटीक रूप से, बल्कि जल्दी से हल करना सीख सकें। हम मानक का ध्यानपूर्वक अध्ययन करते हैं:

काम

दो संकेतकों के बीच संबंध का अध्ययन करने के परिणामस्वरूप, संख्याओं के निम्नलिखित जोड़े प्राप्त हुए:

न्यूनतम वर्ग विधि का उपयोग करके, वह रैखिक फ़ंक्शन ढूंढें जो अनुभवजन्य का सबसे अच्छा अनुमान लगाता है (अनुभव)डेटा। एक चित्र बनाएं जिस पर कार्टेशियन आयताकार समन्वय प्रणाली में प्रयोगात्मक बिंदु और अनुमानित फ़ंक्शन का एक ग्राफ बनाया जा सके . अनुभवजन्य और सैद्धांतिक मूल्यों के बीच वर्ग विचलन का योग ज्ञात कीजिए। पता करें कि क्या सुविधा बेहतर होगी (न्यूनतम वर्ग विधि की दृष्टि से)प्रायोगिक बिंदुओं को करीब लाएँ।

कृपया ध्यान दें कि "x" अर्थ प्राकृतिक हैं, और इसका एक विशिष्ट अर्थपूर्ण अर्थ है, जिसके बारे में मैं थोड़ी देर बाद बात करूंगा; लेकिन निस्संदेह, वे भिन्नात्मक भी हो सकते हैं। इसके अलावा, किसी विशेष कार्य की सामग्री के आधार पर, "X" और "गेम" दोनों मान पूरी तरह या आंशिक रूप से नकारात्मक हो सकते हैं। खैर, हमें एक "फेसलेस" कार्य दिया गया है, और हम इसे शुरू करते हैं समाधान:

कठिनाइयाँ इष्टतम कार्यहम सिस्टम के समाधान के रूप में पाते हैं:

अधिक संक्षिप्त रिकॉर्डिंग के प्रयोजन के लिए, "काउंटर" वेरिएबल को छोड़ा जा सकता है, क्योंकि यह पहले से ही स्पष्ट है कि योग 1 से 1 तक किया जाता है।

आवश्यक राशियों की गणना सारणीबद्ध रूप में करना अधिक सुविधाजनक है:


गणना माइक्रोकैलकुलेटर पर की जा सकती है, लेकिन एक्सेल का उपयोग करना बहुत बेहतर है - तेज और त्रुटियों के बिना; एक छोटा वीडियो देखें:

इस प्रकार, हमें निम्नलिखित प्राप्त होता है प्रणाली:

यहां आप दूसरे समीकरण को 3 से गुणा कर सकते हैं पहले समीकरण से दूसरे को पद दर पद घटाएँ. लेकिन यह भाग्य है - व्यवहार में, सिस्टम अक्सर कोई उपहार नहीं होते हैं, और ऐसे मामलों में यह बचाता है क्रैमर विधि:
, जिसका अर्थ है कि सिस्टम के पास एक अद्वितीय समाधान है।

की जाँच करें। मैं समझता हूं कि आप ऐसा नहीं करना चाहते, लेकिन उन त्रुटियों को क्यों छोड़ें जहां उन्हें बिल्कुल भी नहीं छोड़ा जा सकता है? आइए हम पाए गए समाधान को इसमें प्रतिस्थापित करें बाईं तरफसिस्टम का प्रत्येक समीकरण:

संबंधित समीकरणों के दाहिने पक्ष प्राप्त होते हैं, जिसका अर्थ है कि सिस्टम सही ढंग से हल हो गया है।

इस प्रकार, वांछित सन्निकटन फलन:- से सभी रैखिक कार्यवह वह है जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाती है।

भिन्न सीधा स्टोर के टर्नओवर की उसके क्षेत्र पर निर्भरता, पाई गई निर्भरता है रिवर्स (सिद्धांत "जितना अधिक, उतना कम"), और यह तथ्य तुरंत नकारात्मक द्वारा प्रकट हो जाता है ढलान. समारोह हमें बताता है कि एक निश्चित संकेतक में 1 इकाई की वृद्धि के साथ, आश्रित संकेतक का मूल्य घट जाता है औसत 0.65 इकाइयों द्वारा. जैसा कि वे कहते हैं, एक प्रकार का अनाज की कीमत जितनी अधिक होगी, वह उतना ही कम बिकेगा।

अनुमानित फ़ंक्शन का ग्राफ़ बनाने के लिए, हम इसके दो मान पाते हैं:

और ड्राइंग निष्पादित करें:


निर्मित सीधी रेखा कहलाती है प्रवृत्ति रेखा (अर्थात्, एक रेखीय प्रवृत्ति रेखा, अर्थात सामान्य मामलाएक प्रवृत्ति जरूरी नहीं कि एक सीधी रेखा हो). हर कोई "प्रवृत्ति में रहना" अभिव्यक्ति से परिचित है और मुझे लगता है कि इस शब्द को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।

आइए वर्ग विचलनों के योग की गणना करें अनुभवजन्य और सैद्धांतिक मूल्यों के बीच. ज्यामितीय रूप से, यह "रास्पबेरी" खंडों की लंबाई के वर्गों का योग है (जिनमें से दो इतने छोटे हैं कि दिखाई भी नहीं देते).

आइए एक तालिका में गणनाओं को संक्षेप में प्रस्तुत करें:


फिर, उन्हें मैन्युअल रूप से किया जा सकता है; बस मामले में, मैं पहले बिंदु के लिए एक उदाहरण दूंगा:

लेकिन इसे पहले से ज्ञात तरीके से करना कहीं अधिक प्रभावी है:

हम एक बार फिर दोहराते हैं: प्राप्त परिणाम का क्या अर्थ है?से सभी रैखिक कार्य y फ़ंक्शन सूचक सबसे छोटा है, अर्थात अपने परिवार में यह सबसे अच्छा सन्निकटन है। और यहाँ, वैसे, समस्या का अंतिम प्रश्न आकस्मिक नहीं है: क्या होगा यदि प्रस्तावित घातीय फ़ंक्शन क्या प्रायोगिक बिंदुओं को करीब लाना बेहतर होगा?

आइए वर्ग विचलनों का संगत योग ज्ञात करें - अंतर करने के लिए, मैं उन्हें "एप्सिलॉन" अक्षर से निरूपित करूंगा। तकनीक बिल्कुल वैसी ही है:


और फिर, बस मामले में, पहले बिंदु के लिए गणना:

एक्सेल में हम मानक फ़ंक्शन का उपयोग करते हैं ऍक्स्प (सिंटैक्स एक्सेल हेल्प में पाया जा सकता है).

निष्कर्ष: , जिसका अर्थ है कि घातांकीय फ़ंक्शन एक सीधी रेखा से भी बदतर प्रयोगात्मक बिंदुओं का अनुमान लगाता है .

लेकिन यहां यह ध्यान दिया जाना चाहिए कि "बदतर" है अभी तक इसका मतलब नहीं है, गलत क्या है। अब मैंने इसका एक ग्राफ़ बना लिया है घातांक प्रकार्य- और यह बिंदुओं के करीब से भी गुजरता है - इतना कि विश्लेषणात्मक शोध के बिना यह कहना मुश्किल है कि कौन सा फ़ंक्शन अधिक सटीक है।

यह समाधान समाप्त करता है, और मैं तर्क के प्राकृतिक मूल्यों के प्रश्न पर लौटता हूं। में विभिन्न अध्ययन, एक नियम के रूप में, आर्थिक या समाजशास्त्रीय, प्राकृतिक "एक्स" का उपयोग महीनों, वर्षों या अन्य समान समय अंतरालों की संख्या के लिए किया जाता है। उदाहरण के लिए, निम्नलिखित समस्या पर विचार करें।

न्यूनतम वर्ग विधि

न्यूनतम वर्ग विधि ( ओएलएस, ओएलएस, साधारण न्यूनतम वर्ग) - नमूना डेटा का उपयोग करके प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक। यह विधि प्रतिगमन अवशेषों के वर्गों के योग को न्यूनतम करने पर आधारित है।

यह ध्यान दिया जाना चाहिए कि न्यूनतम वर्ग विधि को किसी भी क्षेत्र में किसी समस्या को हल करने के लिए एक विधि कहा जा सकता है यदि समाधान आवश्यक चर के कुछ कार्यों के वर्गों के योग को कम करने के लिए कुछ मानदंड में निहित है या संतुष्ट करता है। इसलिए, कम से कम वर्ग विधि का उपयोग अन्य (सरल) कार्यों द्वारा किसी दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व (अनुमान) के लिए भी किया जा सकता है, जब समीकरणों या बाधाओं को संतुष्ट करने वाली मात्राओं का एक सेट ढूंढते हैं, जिनकी संख्या इन मात्राओं की संख्या से अधिक होती है , वगैरह।

एमएनसी का सार

(स्पष्ट) चर के बीच संभाव्य (प्रतिगमन) संबंध का कुछ (पैरामीट्रिक) मॉडल दिया जाए और कई कारक (व्याख्यात्मक चर) एक्स

अज्ञात मॉडल मापदंडों का वेक्टर कहां है

- यादृच्छिक मॉडल त्रुटि.

इन चरों के मानों का नमूना अवलोकन भी होने दें। मान लीजिए अवलोकन संख्या ()। फिर वें अवलोकन में चर के मान हैं। फिर, पैरामीटर बी के दिए गए मानों के लिए, समझाए गए चर y के सैद्धांतिक (मॉडल) मानों की गणना करना संभव है:

अवशेषों का आकार पैरामीटर बी के मूल्यों पर निर्भर करता है।

न्यूनतम वर्ग विधि (साधारण, शास्त्रीय) का सार पैरामीटर बी ढूंढना है जिसके लिए अवशेषों के वर्गों का योग (इंग्लैंड)। वर्गों का अवशिष्ट योग) न्यूनतम होगा:

सामान्य स्थिति में, इस समस्या को संख्यात्मक अनुकूलन (न्यूनतमीकरण) विधियों द्वारा हल किया जा सकता है। ऐसे में वे बात करते हैं अरैखिक न्यूनतम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी) अरैखिक न्यूनतम वर्ग). कई मामलों में विश्लेषणात्मक समाधान प्राप्त करना संभव है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को अज्ञात पैरामीटर बी के संबंध में विभेदित करके, डेरिवेटिव को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना आवश्यक है:

यदि मॉडल की यादृच्छिक त्रुटियां सामान्य रूप से वितरित की जाती हैं, समान भिन्नता होती है, और असंबद्ध होती हैं, तो ओएलएस पैरामीटर अनुमान अधिकतम संभावना अनुमान (एमएलएम) के समान होते हैं।

रैखिक मॉडल के मामले में ओएलएस

प्रतिगमन निर्भरता को रैखिक होने दें:

होने देना समझाए गए चर के अवलोकनों का एक स्तंभ वेक्टर है, और कारक अवलोकनों का एक मैट्रिक्स है (मैट्रिक्स की पंक्तियाँ कारक मानों के वेक्टर हैं यह अवलोकन, कॉलम में - सभी अवलोकनों में किसी दिए गए कारक के मूल्यों का एक वेक्टर)। रैखिक मॉडल का मैट्रिक्स प्रतिनिधित्व है:

तब समझाए गए चर के अनुमानों का वेक्टर और प्रतिगमन अवशेषों का वेक्टर बराबर होगा

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

मापदंडों के वेक्टर के संबंध में इस फ़ंक्शन को अलग करने और डेरिवेटिव को शून्य के बराबर करने पर, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

.

समीकरणों की इस प्रणाली का समाधान देता है सामान्य सूत्ररैखिक मॉडल के लिए ओएलएस अनुमान:

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का बाद वाला प्रतिनिधित्व उपयोगी है। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का एक वेक्टर है। यदि इसके अतिरिक्त डेटा भी है सामान्यीकृतएमएसई के लिए (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंधों का एक वेक्टर।

मॉडलों के लिए ओएलएस अनुमान की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता संतुष्ट है:

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी एक स्थिरांक होता है, तो हम पाते हैं कि एकमात्र पैरामीटर (स्थिरांक स्वयं) का ओएलएस अनुमान समझाए गए चर के औसत मूल्य के बराबर है। यानी अंकगणितीय माध्य, इसके लिए जाना जाता है अच्छे गुणबड़ी संख्या के नियमों से, न्यूनतम वर्ग अनुमान भी है - यह वर्ग विचलन के न्यूनतम योग की कसौटी को पूरा करता है।

उदाहरण: सरलतम (जोड़ीवार) प्रतिगमन

युग्मित रैखिक प्रतिगमन के मामले में, गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं):

ओएलएस अनुमानकों के गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए ओएलएस अनुमान हैं रैखिक अनुमान, जैसा कि उपरोक्त सूत्र से होता है। निष्पक्ष ओएलएस अनुमानों के लिए, प्रदर्शन करना आवश्यक और पर्याप्त है सबसे महत्वपूर्ण शर्तप्रतिगमन विश्लेषण: कारकों पर सशर्त, यादृच्छिक त्रुटि की गणितीय अपेक्षा शून्य के बराबर होनी चाहिए। यह स्थिति, विशेष रूप से, संतुष्ट है अगर

  1. अपेक्षित मूल्ययादृच्छिक त्रुटियाँ शून्य हैं, और
  2. कारक और यादृच्छिक त्रुटियाँ स्वतंत्र यादृच्छिक चर हैं।

दूसरी स्थिति - कारकों की बहिर्जातता की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी हमें इस मामले में उच्च-गुणवत्ता वाले अनुमान प्राप्त करने की अनुमति नहीं देता है) ). शास्त्रीय मामले में, यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जातता की स्थिति पूरी हो गई है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, नमूना आकार अनंत तक बढ़ने पर मैट्रिक्स के कुछ गैर-एकवचन मैट्रिक्स में अभिसरण के साथ बहिर्जातता की स्थिति को संतुष्ट करना पर्याप्त है।

निरंतरता और निष्पक्षता के अलावा, (सामान्य) न्यूनतम वर्गों के अनुमान भी प्रभावी होने के लिए (रैखिक निष्पक्ष अनुमानों की श्रेणी में सर्वोत्तम), यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा किया जाना चाहिए:

इन धारणाओं को यादृच्छिक त्रुटि वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है उसे कहा जाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानों की श्रेणी में सबसे प्रभावी अनुमान हैं (अंग्रेजी साहित्य में कभी-कभी संक्षिप्त नाम का उपयोग किया जाता है) नीला (सर्वश्रेष्ठ लीनियर अनबाइज्ड एस्टीमेटर) - सर्वोत्तम रैखिक निष्पक्ष अनुमान; रूसी साहित्य में गॉस-मार्कोव प्रमेय को अक्सर उद्धृत किया जाता है)। जैसा कि दिखाना आसान है, गुणांक अनुमान के वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

सामान्यीकृत ओएलएस

न्यूनतम वर्ग विधि व्यापक सामान्यीकरण की अनुमति देती है। अवशेषों के वर्गों के योग को कम करने के बजाय, कोई अवशेषों के वेक्टर के कुछ सकारात्मक निश्चित द्विघात रूप को कम कर सकता है, जहां कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स है। पारंपरिक न्यूनतम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जहां भार मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि सममित मैट्रिक्स (या ऑपरेटरों) के सिद्धांत से जाना जाता है, ऐसे मैट्रिक्स के लिए एक अपघटन होता है। नतीजतन, निर्दिष्ट फ़ंक्शनल को निम्नानुसार दर्शाया जा सकता है, अर्थात, इस फ़ंक्शनल को कुछ रूपांतरित "शेषों" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम न्यूनतम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस विधियाँ (न्यूनतम वर्ग)।

यह साबित हो चुका है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है) के लिए, सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित अनुमान हैं। सामान्यीकृत न्यूनतम वर्ग (जीएलएस - सामान्यीकृत न्यूनतम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस विधि:।

यह दिखाया जा सकता है कि एक रैखिक मॉडल के मापदंडों के जीएलएस अनुमान के सूत्र का रूप है

इन अनुमानों का सहप्रसरण मैट्रिक्स तदनुसार बराबर होगा

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा पर साधारण ओएलएस के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित ओएलएस

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों का एक सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (डब्ल्यूएलएस) हैं। में इस मामले मेंमॉडल अवशेषों के वर्गों का भारित योग कम से कम किया जाता है, अर्थात, प्रत्येक अवलोकन को इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती "भार" प्राप्त होता है:। वास्तव में, डेटा को अवलोकनों को भारित करके (अपेक्षित के आनुपातिक राशि से विभाजित करके) रूपांतरित किया जाता है मानक विचलनयादृच्छिक त्रुटियाँ), और सामान्य OLS भारित डेटा पर लागू होता है।

व्यवहार में बहुराष्ट्रीय कंपनी का उपयोग करने के कुछ विशेष मामले

रैखिक निर्भरता का अनुमान

आइए उस मामले पर विचार करें, जब एक निश्चित स्केलर मात्रा पर एक निश्चित स्केलर मात्रा की निर्भरता का अध्ययन करने के परिणामस्वरूप (यह हो सकता है, उदाहरण के लिए, वर्तमान ताकत पर वोल्टेज की निर्भरता:, जहां एक स्थिर मूल्य है, का प्रतिरोध कंडक्टर), इन मात्राओं का मापन किया गया, जिसके परिणामस्वरूप मूल्य और उनके संबंधित मूल्य। माप डेटा को एक तालिका में दर्ज किया जाना चाहिए।

मेज़। माप परिणाम।

माप नं.
1
2
3
4
5
6

प्रश्न यह है कि निर्भरता का सर्वोत्तम वर्णन करने के लिए गुणांक का कौन सा मान चुना जा सकता है? न्यूनतम वर्ग विधि के अनुसार यह मान इस प्रकार होना चाहिए कि मानों के वर्ग विचलनों का योग मानों से हो

न्यूनतम था

वर्ग विचलनों के योग का एक चरम होता है - न्यूनतम, जो हमें इस सूत्र का उपयोग करने की अनुमति देता है। आइए इस सूत्र से गुणांक का मान ज्ञात करें। ऐसा करने के लिए, हम इसके बाईं ओर को इस प्रकार बदलते हैं:

अंतिम सूत्र हमें गुणांक का मान ज्ञात करने की अनुमति देता है, जो कि समस्या में आवश्यक था।

कहानी

पहले प्रारंभिक XIXवी वैज्ञानिकों के पास समीकरणों की ऐसी प्रणाली को हल करने के लिए कुछ निश्चित नियम नहीं थे जिनमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, निजी तकनीकों का उपयोग किया जाता था जो समीकरणों के प्रकार और कैलकुलेटर की बुद्धि पर निर्भर करती थीं, और इसलिए एक ही अवलोकन डेटा के आधार पर अलग-अलग कैलकुलेटर आए। विभिन्न निष्कर्ष. गॉस (1795) विधि के पहले अनुप्रयोग के लिए जिम्मेदार थे, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसकी खोज की और इसे प्रकाशित किया। आधुनिक नाम(fr. मेथोड डेस मोइंड्रेस क्वारेस ) . लाप्लास ने विधि को संभाव्यता सिद्धांत से संबंधित किया, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्यता-सैद्धांतिक अनुप्रयोगों पर विचार किया। एनके, बेसेल, हैनसेन और अन्य के आगे के शोध से यह विधि व्यापक हो गई और इसमें सुधार हुआ।

ओएलएस का वैकल्पिक उपयोग

न्यूनतम वर्ग विधि के विचार का उपयोग अन्य मामलों में भी किया जा सकता है जो सीधे प्रतिगमन विश्लेषण से संबंधित नहीं हैं। तथ्य यह है कि वर्गों का योग वैक्टर के लिए सबसे आम निकटता उपायों में से एक है (परिमित-आयामी स्थानों में यूक्लिडियन मीट्रिक)।

एक अनुप्रयोग सिस्टम को "हल" करना है रेखीय समीकरण, जिसमें समीकरणों की संख्या अधिक संख्याचर

जहां मैट्रिक्स वर्गाकार नहीं, बल्कि आयताकार आकार का है।

सामान्य स्थिति में, समीकरणों की ऐसी प्रणाली का कोई समाधान नहीं होता है (यदि रैंक वास्तव में चर की संख्या से अधिक है)। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है जो वैक्टर और के बीच "दूरी" को कम करता है। ऐसा करने के लिए, आप बाएँ और के वर्ग अंतरों के योग को न्यूनतम करने का मानदंड लागू कर सकते हैं सही भागसिस्टम के समीकरण, अर्थात्। यह दिखाना आसान है कि इस न्यूनतमकरण समस्या को हल करने से समाधान निकलता है अगली प्रणालीसमीकरण

न्यूनतम वर्ग विधि

न्यूनतम वर्ग विधि ( ओएलएस, ओएलएस, साधारण न्यूनतम वर्ग) - नमूना डेटा का उपयोग करके प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक। यह विधि प्रतिगमन अवशेषों के वर्गों के योग को न्यूनतम करने पर आधारित है।

यह ध्यान दिया जाना चाहिए कि न्यूनतम वर्ग विधि को किसी भी क्षेत्र में किसी समस्या को हल करने के लिए एक विधि कहा जा सकता है यदि समाधान आवश्यक चर के कुछ कार्यों के वर्गों के योग को कम करने के लिए कुछ मानदंड में निहित है या संतुष्ट करता है। इसलिए, कम से कम वर्ग विधि का उपयोग अन्य (सरल) कार्यों द्वारा किसी दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व (अनुमान) के लिए भी किया जा सकता है, जब समीकरणों या बाधाओं को संतुष्ट करने वाली मात्राओं का एक सेट ढूंढते हैं, जिनकी संख्या इन मात्राओं की संख्या से अधिक होती है , वगैरह।

एमएनसी का सार

(स्पष्ट) चर के बीच संभाव्य (प्रतिगमन) संबंध का कुछ (पैरामीट्रिक) मॉडल दिया जाए और कई कारक (व्याख्यात्मक चर) एक्स

अज्ञात मॉडल मापदंडों का वेक्टर कहां है

- यादृच्छिक मॉडल त्रुटि.

इन चरों के मानों का नमूना अवलोकन भी होने दें। मान लीजिए अवलोकन संख्या ()। फिर वें अवलोकन में चर के मान हैं। फिर, पैरामीटर बी के दिए गए मानों के लिए, समझाए गए चर y के सैद्धांतिक (मॉडल) मानों की गणना करना संभव है:

अवशेषों का आकार पैरामीटर बी के मूल्यों पर निर्भर करता है।

न्यूनतम वर्ग विधि (साधारण, शास्त्रीय) का सार पैरामीटर बी ढूंढना है जिसके लिए अवशेषों के वर्गों का योग (इंग्लैंड)। वर्गों का अवशिष्ट योग) न्यूनतम होगा:

सामान्य स्थिति में, इस समस्या को संख्यात्मक अनुकूलन (न्यूनतमीकरण) विधियों द्वारा हल किया जा सकता है। ऐसे में वे बात करते हैं अरैखिक न्यूनतम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी) अरैखिक न्यूनतम वर्ग). कई मामलों में विश्लेषणात्मक समाधान प्राप्त करना संभव है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को अज्ञात पैरामीटर बी के संबंध में विभेदित करके, डेरिवेटिव को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना आवश्यक है:

यदि मॉडल की यादृच्छिक त्रुटियां सामान्य रूप से वितरित की जाती हैं, समान भिन्नता होती है, और असंबद्ध होती हैं, तो ओएलएस पैरामीटर अनुमान अधिकतम संभावना अनुमान (एमएलएम) के समान होते हैं।

रैखिक मॉडल के मामले में ओएलएस

प्रतिगमन निर्भरता को रैखिक होने दें:

होने देना समझाए गए चर के अवलोकनों का एक कॉलम वेक्टर है, और कारक अवलोकनों का एक मैट्रिक्स है (मैट्रिक्स की पंक्तियां किसी दिए गए अवलोकन में कारक मानों के वेक्टर हैं, कॉलम किसी दिए गए कारक के मानों के वेक्टर हैं सभी अवलोकनों में)। रैखिक मॉडल का मैट्रिक्स प्रतिनिधित्व है:

तब समझाए गए चर के अनुमानों का वेक्टर और प्रतिगमन अवशेषों का वेक्टर बराबर होगा

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

मापदंडों के वेक्टर के संबंध में इस फ़ंक्शन को अलग करने और डेरिवेटिव को शून्य के बराबर करने पर, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

.

समीकरणों की इस प्रणाली का समाधान एक रैखिक मॉडल के लिए न्यूनतम वर्ग अनुमान के लिए सामान्य सूत्र देता है:

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का बाद वाला प्रतिनिधित्व उपयोगी है। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का एक वेक्टर है। यदि इसके अतिरिक्त डेटा भी है सामान्यीकृतएमएसई के लिए (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंधों का एक वेक्टर।

मॉडलों के लिए ओएलएस अनुमान की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता संतुष्ट है:

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी एक स्थिरांक होता है, तो हम पाते हैं कि एकमात्र पैरामीटर (स्थिरांक स्वयं) का ओएलएस अनुमान समझाए गए चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्या के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग की कसौटी को पूरा करता है।

उदाहरण: सरलतम (जोड़ीवार) प्रतिगमन

युग्मित रैखिक प्रतिगमन के मामले में, गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं):

ओएलएस अनुमानकों के गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, ओएलएस अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से पता चलता है। निष्पक्ष ओएलएस अनुमानों के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त एक यादृच्छिक त्रुटि की गणितीय अपेक्षा, शून्य के बराबर होनी चाहिए। यह शर्त, विशेष रूप से, संतुष्ट होती है यदि

  1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
  2. कारक और यादृच्छिक त्रुटियाँ स्वतंत्र यादृच्छिक चर हैं।

दूसरी स्थिति - कारकों की बहिर्जातता की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी हमें इस मामले में उच्च-गुणवत्ता वाले अनुमान प्राप्त करने की अनुमति नहीं देता है) ). शास्त्रीय मामले में, यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जातता की स्थिति पूरी हो गई है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, नमूना आकार अनंत तक बढ़ने पर मैट्रिक्स के कुछ गैर-एकवचन मैट्रिक्स में अभिसरण के साथ बहिर्जातता की स्थिति को संतुष्ट करना पर्याप्त है।

निरंतरता और निष्पक्षता के अलावा, (सामान्य) न्यूनतम वर्गों के अनुमान भी प्रभावी होने के लिए (रैखिक निष्पक्ष अनुमानों की श्रेणी में सर्वोत्तम), यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा किया जाना चाहिए:

इन धारणाओं को यादृच्छिक त्रुटि वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है उसे कहा जाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानों की श्रेणी में सबसे प्रभावी अनुमान हैं (अंग्रेजी साहित्य में कभी-कभी संक्षिप्त नाम का उपयोग किया जाता है) नीला (सर्वश्रेष्ठ लीनियर अनबाइज्ड एस्टीमेटर) - सर्वोत्तम रैखिक निष्पक्ष अनुमान; रूसी साहित्य में गॉस-मार्कोव प्रमेय को अक्सर उद्धृत किया जाता है)। जैसा कि दिखाना आसान है, गुणांक अनुमान के वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

सामान्यीकृत ओएलएस

न्यूनतम वर्ग विधि व्यापक सामान्यीकरण की अनुमति देती है। अवशेषों के वर्गों के योग को कम करने के बजाय, कोई अवशेषों के वेक्टर के कुछ सकारात्मक निश्चित द्विघात रूप को कम कर सकता है, जहां कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स है। पारंपरिक न्यूनतम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जहां भार मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि सममित मैट्रिक्स (या ऑपरेटरों) के सिद्धांत से जाना जाता है, ऐसे मैट्रिक्स के लिए एक अपघटन होता है। नतीजतन, निर्दिष्ट फ़ंक्शनल को निम्नानुसार दर्शाया जा सकता है, अर्थात, इस फ़ंक्शनल को कुछ रूपांतरित "शेषों" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम न्यूनतम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस विधियाँ (न्यूनतम वर्ग)।

यह साबित हो चुका है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है) के लिए, सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित अनुमान हैं। सामान्यीकृत न्यूनतम वर्ग (जीएलएस - सामान्यीकृत न्यूनतम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस विधि:।

यह दिखाया जा सकता है कि एक रैखिक मॉडल के मापदंडों के जीएलएस अनुमान के सूत्र का रूप है

इन अनुमानों का सहप्रसरण मैट्रिक्स तदनुसार बराबर होगा

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा पर साधारण ओएलएस के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित ओएलएस

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों का एक सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (डब्ल्यूएलएस) हैं। इस मामले में, मॉडल अवशेषों के वर्गों का भारित योग कम से कम किया जाता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती होता है:। वास्तव में, डेटा को अवलोकनों को भारित करके (यादृच्छिक त्रुटियों के अनुमानित मानक विचलन के आनुपातिक राशि से विभाजित करके) रूपांतरित किया जाता है, और सामान्य ओएलएस को भारित डेटा पर लागू किया जाता है।

व्यवहार में बहुराष्ट्रीय कंपनी का उपयोग करने के कुछ विशेष मामले

रैखिक निर्भरता का अनुमान

आइए उस मामले पर विचार करें, जब एक निश्चित स्केलर मात्रा पर एक निश्चित स्केलर मात्रा की निर्भरता का अध्ययन करने के परिणामस्वरूप (यह हो सकता है, उदाहरण के लिए, वर्तमान ताकत पर वोल्टेज की निर्भरता:, जहां एक स्थिर मूल्य है, का प्रतिरोध कंडक्टर), इन मात्राओं का मापन किया गया, जिसके परिणामस्वरूप मूल्य और उनके संबंधित मूल्य। माप डेटा को एक तालिका में दर्ज किया जाना चाहिए।

मेज़। माप परिणाम।

माप नं.
1
2
3
4
5
6

प्रश्न यह है कि निर्भरता का सर्वोत्तम वर्णन करने के लिए गुणांक का कौन सा मान चुना जा सकता है? न्यूनतम वर्ग विधि के अनुसार यह मान इस प्रकार होना चाहिए कि मानों के वर्ग विचलनों का योग मानों से हो

न्यूनतम था

वर्ग विचलनों के योग का एक चरम होता है - न्यूनतम, जो हमें इस सूत्र का उपयोग करने की अनुमति देता है। आइए इस सूत्र से गुणांक का मान ज्ञात करें। ऐसा करने के लिए, हम इसके बाईं ओर को इस प्रकार बदलते हैं:

अंतिम सूत्र हमें गुणांक का मान ज्ञात करने की अनुमति देता है, जो कि समस्या में आवश्यक था।

कहानी

19वीं सदी की शुरुआत तक. वैज्ञानिकों के पास समीकरणों की ऐसी प्रणाली को हल करने के लिए कुछ निश्चित नियम नहीं थे जिनमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, निजी तकनीकों का उपयोग किया जाता था जो समीकरणों के प्रकार और कैलकुलेटर की बुद्धि पर निर्भर करती थीं, और इसलिए एक ही अवलोकन संबंधी डेटा के आधार पर अलग-अलग कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) इस पद्धति का उपयोग करने वाले पहले व्यक्ति थे, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे इसके आधुनिक नाम (फ्रेंच) के तहत खोजा और प्रकाशित किया। मेथोड डेस मोइंड्रेस क्वारेस ) . लाप्लास ने विधि को संभाव्यता सिद्धांत से संबंधित किया, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्यता-सैद्धांतिक अनुप्रयोगों पर विचार किया। एनके, बेसेल, हैनसेन और अन्य के आगे के शोध से यह विधि व्यापक हो गई और इसमें सुधार हुआ।

ओएलएस का वैकल्पिक उपयोग

न्यूनतम वर्ग विधि के विचार का उपयोग अन्य मामलों में भी किया जा सकता है जो सीधे प्रतिगमन विश्लेषण से संबंधित नहीं हैं। तथ्य यह है कि वर्गों का योग वैक्टर के लिए सबसे आम निकटता उपायों में से एक है (परिमित-आयामी स्थानों में यूक्लिडियन मीट्रिक)।

एक अनुप्रयोग रैखिक समीकरणों की प्रणालियों का "समाधान" है जिसमें समीकरणों की संख्या चर की संख्या से अधिक है

जहां मैट्रिक्स वर्गाकार नहीं, बल्कि आयताकार आकार का है।

सामान्य स्थिति में, समीकरणों की ऐसी प्रणाली का कोई समाधान नहीं होता है (यदि रैंक वास्तव में चर की संख्या से अधिक है)। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है जो वैक्टर और के बीच "दूरी" को कम करता है। ऐसा करने के लिए, आप सिस्टम समीकरणों के बाएँ और दाएँ पक्षों के बीच अंतर के वर्गों के योग को न्यूनतम करने की कसौटी लागू कर सकते हैं। यह दिखाना आसान है कि इस न्यूनतमकरण समस्या को हल करने से समीकरणों की निम्नलिखित प्रणाली को हल किया जा सकता है

यदि कुछ भौतिक मात्राकिसी अन्य मात्रा पर निर्भर करता है, तो इस निर्भरता का अध्ययन x के विभिन्न मानों पर y मापकर किया जा सकता है। माप के परिणामस्वरूप, कई मान प्राप्त होते हैं:

एक्स 1, एक्स 2, ..., एक्स आई, ..., एक्स एन;

आप 1 , आप 2 , ..., आप मैं , ... , आप नहीं .

ऐसे प्रयोग के आंकड़ों के आधार पर, निर्भरता y = ƒ(x) का एक ग्राफ बनाना संभव है। परिणामी वक्र फ़ंक्शन (x) के रूप का न्याय करना संभव बनाता है। हालाँकि, इस फ़ंक्शन में प्रवेश करने वाले स्थिर गुणांक अज्ञात रहते हैं। उन्हें न्यूनतम वर्ग विधि का उपयोग करके निर्धारित किया जा सकता है। प्रायोगिक बिंदु, एक नियम के रूप में, वक्र पर बिल्कुल नहीं स्थित होते हैं। न्यूनतम वर्ग विधि के लिए आवश्यक है कि वक्र से प्रयोगात्मक बिंदुओं के विचलन के वर्गों का योग हो, अर्थात। 2 सबसे छोटा था.

व्यवहार में, इस पद्धति का उपयोग अक्सर (और सबसे सरल रूप से) रैखिक संबंध के मामले में किया जाता है, अर्थात। कब

वाई = केएक्सया वाई = ए + बीएक्स.

रैखिक निर्भरताभौतिकी में बहुत व्यापक। और यहां तक ​​कि जब संबंध अरेखीय होता है, तब भी वे आम तौर पर एक ग्राफ़ बनाने का प्रयास करते हैं ताकि एक सीधी रेखा प्राप्त हो सके। उदाहरण के लिए, यदि यह माना जाता है कि ग्लास n का अपवर्तक सूचकांक प्रकाश तरंग दैर्ध्य λ से संबंध n = a + b/λ 2 से संबंधित है, तो λ -2 पर n की निर्भरता ग्राफ पर अंकित की जाती है।

निर्भरता पर विचार करें वाई = केएक्स(मूल बिंदु से होकर गुजरने वाली एक सीधी रेखा)। आइए मान बनाते हैं φ सीधी रेखा से हमारे बिंदुओं के विचलन के वर्गों का योग

φ का मान हमेशा धनात्मक होता है और हमारे बिंदु सीधी रेखा के जितने करीब होंगे, वह उतना ही छोटा होता जाएगा। न्यूनतम वर्ग विधि बताती है कि k का मान इस प्रकार चुना जाना चाहिए कि φ का मान न्यूनतम हो


या
(19)

गणना से पता चलता है कि k का मान निर्धारित करने में मूल-माध्य-वर्ग त्रुटि के बराबर है

, (20)
जहाँ n मापों की संख्या है।

आइए अब थोड़ा और विचार करें कठिन मामला, जब बिंदुओं को सूत्र को पूरा करना होगा वाई = ए + बीएक्स(एक सीधी रेखा जो मूल बिंदु से नहीं गुजरती है)।

कार्य x i , y i मानों के एक सेट को देखते हुए खोजना है सर्वोत्तम मूल्यए और बी.

आइए हम फिर से द्विघात रूप φ की रचना करें, राशि के बराबरसीधी रेखा से बिंदुओं x i, y i का वर्ग विचलन

और a और b के मान ज्ञात करें जिनके लिए φ न्यूनतम है

;

.

.

इन समीकरणों का संयुक्त समाधान प्राप्त होता है

(21)

ए और बी के निर्धारण की मूल माध्य वर्ग त्रुटियां बराबर हैं

(23)

.  (24)

इस पद्धति का उपयोग करके माप परिणामों को संसाधित करते समय, सभी डेटा को एक तालिका में संक्षेपित करना सुविधाजनक होता है जिसमें सूत्र (19)(24) में शामिल सभी राशियों की प्रारंभिक गणना की जाती है। इन तालिकाओं के रूप नीचे दिए गए उदाहरणों में दिए गए हैं।

उदाहरण 1।गतिकी के मूल समीकरण का अध्ययन किया गया घूर्णी गतिε = एम/जे (मूल बिंदु से गुजरने वाली रेखा)। क्षण M के विभिन्न मानों पर, एक निश्चित पिंड का कोणीय त्वरण ε मापा गया। इस पिंड की जड़ता के क्षण को निर्धारित करना आवश्यक है। बल के क्षण और कोणीय त्वरण के माप के परिणाम दूसरे और तीसरे कॉलम में सूचीबद्ध हैं तालिका 5.

तालिका 5
एन एम, एन एम ε, एस -1 एम 2 एम ε ε - किमी (ε - किमी) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

सूत्र (19) का उपयोग करके हम निर्धारित करते हैं:

.

मूल माध्य वर्ग त्रुटि निर्धारित करने के लिए, हम सूत्र (20) का उपयोग करते हैं

0.005775किलोग्राम-1· एम -2 .

सूत्र (18) के अनुसार हमारे पास है

; .

एस जे = (2.996 0.005775)/0.3337 = 0.05185 किग्रा एम2.

विश्वसनीयता P = 0.95 निर्धारित करने के बाद, n = 5 के लिए छात्र गुणांक की तालिका का उपयोग करके, हम t = 2.78 पाते हैं और निर्धारित करते हैं पूर्ण गलतीΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 किग्रा एम2.

आइए परिणामों को इस रूप में लिखें:

जे = (3.0 ± 0.2) किग्रा एम2;


उदाहरण 2.आइए न्यूनतम वर्ग विधि का उपयोग करके धातु प्रतिरोध के तापमान गुणांक की गणना करें। प्रतिरोध तापमान पर रैखिक रूप से निर्भर करता है

आर टी = आर 0 (1 + α टी°) = आर 0 + आर 0 α टी°।

मुक्त पद 0 डिग्री सेल्सियस के तापमान पर प्रतिरोध आर 0 निर्धारित करता है, और ढलान गुणांक तापमान गुणांक α और प्रतिरोध आर 0 का उत्पाद है।

माप और गणना के परिणाम तालिका में दिए गए हैं ( तालिका 6 देखें).

तालिका 6
एन टी°, एस आर, ओम टी-¯टी (t-¯t) 2 (t-¯t)r आर - बीटी - ए (आर - बीटी - ए) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/एन 85.83333 1.4005 – – – – –

सूत्र (21), (22) का उपयोग करके हम निर्धारित करते हैं

आर 0 = ¯ आर- α आर 0 ¯ टी = 1.4005 - 0.002645 85.83333 = 1.1735 ओम.

आइए α की परिभाषा में त्रुटि खोजें। चूँकि, सूत्र (18) के अनुसार हमारे पास है:

.

सूत्र (23), (24) का उपयोग करते हुए हमारे पास है

;

0.014126 ओम.

विश्वसनीयता को पी = 0.95 पर सेट करने के बाद, एन = 6 के लिए छात्र गुणांक की तालिका का उपयोग करके, हम टी = 2.57 पाते हैं और पूर्ण त्रुटि निर्धारित करते हैं Δα = 2.57 0.000132 = 0.000338 डिग्री -1.

α = (23 ± 4) 10 -4 ओलों-1 पी = 0.95 पर।


उदाहरण 3.न्यूटन के छल्ले का उपयोग करके लेंस की वक्रता की त्रिज्या निर्धारित करना आवश्यक है। न्यूटन के छल्लों r m की त्रिज्याएँ मापी गईं और इन छल्लों m की संख्या निर्धारित की गईं। न्यूटन के छल्ले की त्रिज्या लेंस आर की वक्रता की त्रिज्या और समीकरण द्वारा रिंग संख्या से संबंधित है

आर 2 एम = एमλआर - 2डी 0 आर,

जहाँ d 0 लेंस और समतल-समानांतर प्लेट (या लेंस की विकृति) के बीच के अंतर की मोटाई है,

λ आपतित प्रकाश की तरंगदैर्घ्य.

λ = (600 ± 6) एनएम;
आर 2 एम = वाई;
एम = एक्स;
λR = बी;
-2डी 0 आर = ए,

तब समीकरण बनेगा वाई = ए + बीएक्स.

.

माप और गणना के परिणाम दर्ज किए जाते हैं तालिका 7.

तालिका 7
एन एक्स = एम वाई = आर 2, 10 -2 मिमी 2 एम -¯ एम (एम -¯एम) 2 (एम -¯ एम)वाई वाई - बीएक्स - ए, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/एन 3.5 20.8548333 – – – – –



साइट पर नया

>

सबसे लोकप्रिय