3. સરેરાશની સમાનતા વિશેની પૂર્વધારણા તપાસવી
દરખાસ્તને ચકાસવા માટે વપરાય છે કે નમૂનાઓ દ્વારા રજૂ કરાયેલા બે સૂચકાંકોનો સરેરાશ નોંધપાત્ર રીતે અલગ છે. પરીક્ષણના ત્રણ પ્રકાર છે: એક સંબંધિત નમૂનાઓ માટે, અને બે અસંબંધિત નમૂનાઓ માટે (સમાન અને વિવિધ ભિન્નતા સાથે). જો નમૂનાઓ જોડાયેલા ન હોય, તો કયા માપદંડનો ઉપયોગ કરવો તે નિર્ધારિત કરવા માટે ભિન્નતાની સમાનતાની પૂર્વધારણાને પ્રથમ ચકાસવી આવશ્યક છે. જેમ ભિન્નતાઓની તુલના કરવાના કિસ્સામાં, સમસ્યાને હલ કરવાની 2 રીતો છે, જેને આપણે ઉદાહરણનો ઉપયોગ કરીને ધ્યાનમાં લઈશું.
ઉદાહરણ 3. બે શહેરોમાં માલના વેચાણની સંખ્યાનો ડેટા છે. આંકડાકીય પૂર્વધારણાને 0.01 ના મહત્વના સ્તરે પરીક્ષણ કરો કે શહેરોમાં ઉત્પાદન વેચાણની સરેરાશ સંખ્યા અલગ છે.
23 | 25 | 23 | 22 | 23 | 24 | 28 | 16 | 18 | 23 | 29 | 26 | 31 | 19 |
22 | 28 | 26 | 26 | 35 | 20 | 27 | 28 | 28 | 26 | 22 | 29 |
અમે ડેટા એનાલિસિસ પેકેજનો ઉપયોગ કરીએ છીએ. માપદંડના પ્રકાર પર આધાર રાખીને, ત્રણમાંથી એક પસંદ કરવામાં આવે છે: "સંબંધિત નમૂનાઓ માટે જોડી કરેલ બે-નમૂના ટી-ટેસ્ટ" - અને "સમાન ભિન્નતા સાથે બે-નમૂના ટી-ટેસ્ટ" અથવા "સાથે બે-નમૂના ટી-ટેસ્ટ વિવિધ ભિન્નતા" - ડિસ્કનેક્ટ થયેલા નમૂનાઓ માટે. "વેરિયેબલ ઈન્ટરવલ 1" અને "વેરિયેબલ ઈન્ટરવલ 2" ફીલ્ડમાં ખુલતી વિન્ડોમાં સમાન ભિન્નતા સાથે ટેસ્ટને કૉલ કરો, જો ડેટા લેબલ્સ હોય તો, ડેટાની લિંક્સ દાખલ કરો (અનુક્રમે A1-N1 અને A2-L2); , પછી "લેબલ્સ" "ની બાજુના બોક્સને ચેક કરો (અમારી પાસે તે નથી, તેથી ચેકબોક્સ ચેક કરેલ નથી). આગળ, "આલ્ફા" ફીલ્ડમાં મહત્વ સ્તર દાખલ કરો - 0.01. "હાયપોથેટીકલ સરેરાશ તફાવત" ફીલ્ડ ખાલી છોડી દેવામાં આવ્યું છે. "આઉટપુટ વિકલ્પો" વિભાગમાં, "આઉટપુટ અંતરાલ" ની બાજુમાં એક ચેકમાર્ક મૂકો અને, શિલાલેખની સામે દેખાતા ક્ષેત્રમાં કર્સર મૂકીને, સેલ B7 માં ડાબું બટન ક્લિક કરો. પરિણામ આ સેલથી શરૂ થતા આઉટપુટ હશે. "ઓકે" પર ક્લિક કરવાથી, પરિણામોનું કોષ્ટક દેખાય છે. કૉલમ B અને C, C અને D, D અને E કૉલમ B, C અને Dની પહોળાઈ વધારીને વચ્ચેની સરહદને ખસેડો જેથી કરીને બધા લેબલ્સ ફિટ થઈ જાય. પ્રક્રિયા નમૂનાની મુખ્ય લાક્ષણિકતાઓ દર્શાવે છે, ટી-આંકડાઓ, નિર્ણાયક મૂલ્યોઆ આંકડા અને નિર્ણાયક સ્તરોમહત્વ "P(T<=t) одностороннее» и «Р(Т<=t) двухстороннее». Если по модулю t-статистика меньше критического, то средние показатели с заданной вероятностью равны. В нашем случае│-1,784242592│ < 2,492159469, следовательно, среднее число продаж значимо не отличается. Следует отметить, что если взять уровень значимости α=0,05, то результаты исследования будут совсем иными.
સમાન ભિન્નતા સાથે બે-નમૂના ટી-ટેસ્ટ |
||
સરેરાશ | 23,57142857 | 26,41666667 |
વિખેરી નાખવું | 17,34065934 | 15,35606061 |
અવલોકનો | 14 | 12 |
પૂલ્ડ વેરિઅન્સ | 16,43105159 | |
અનુમાનિત સરેરાશ તફાવત | 0 | |
ડીએફ | 24 | |
t-આંકડા | -1,784242592 | |
પી(ટી<=t) одностороннее | 0,043516846 | |
ટી જટિલ એકતરફી | 2,492159469 | |
પી(ટી<=t) двухстороннее | 0,087033692 | |
ટી જટિલ દ્વિ-માર્ગી | 2,796939498 |
લેબોરેટરી વર્ક નંબર 3
જોડી લીનિયર રીગ્રેશન
ધ્યેય: કમ્પ્યુટરનો ઉપયોગ કરીને જોડી રીગ્રેસનનું રેખીય સમીકરણ બનાવવાની પદ્ધતિઓમાં નિપુણતા મેળવવી, રીગ્રેસન સમીકરણની મુખ્ય લાક્ષણિકતાઓ કેવી રીતે મેળવવી અને તેનું વિશ્લેષણ કરવું તે શીખવું.
ચાલો ઉદાહરણનો ઉપયોગ કરીને રીગ્રેસન સમીકરણ બનાવવા માટેની પદ્ધતિને ધ્યાનમાં લઈએ.
ઉદાહરણ. પરિબળ x i અને y i ના નમૂનાઓ આપવામાં આવ્યા છે. આ નમૂનાઓનો ઉપયોગ કરીને, રેખીય રીગ્રેશન સમીકરણ ỹ = ax + b શોધો. જોડી સહસંબંધ ગુણાંક શોધો. મહત્વના સ્તર a = 0.05 પર પર્યાપ્તતા માટે રીગ્રેસન મોડલ તપાસો.
એક્સ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
વાય | 6,7 | 6,3 | 4,4 | 9,5 | 5,2 | 4,3 | 7,7 | 7,1 | 7,1 | 7,9 |
રીગ્રેસન સમીકરણના a અને b ગુણાંક શોધવા માટે, SLOPE અને INTERCEPT ફંક્શન્સ, શ્રેણીઓ "આંકડાકીય" નો ઉપયોગ કરો. અમે A5 માં સહી “a=” દાખલ કરીએ છીએ અને બાજુના સેલ B5 માં TILT ફંક્શન દાખલ કરીએ છીએ, કર્સરને “Iz_value_y” ફીલ્ડમાં મૂકીએ છીએ અને માઉસ વડે ચક્કર લગાવીને સેલ B2-K2 ની લિંક સેટ કરીએ છીએ. પરિણામ 0.14303 છે. ચાલો હવે ગુણાંક b શોધીએ. અમે A6 માં સહી “b=” દાખલ કરીએ છીએ, અને B6 માં TILT ફંક્શન્સ જેવા જ પરિમાણો સાથે CUT ફંક્શન દાખલ કરીએ છીએ. પરિણામ 5.976364 છે. તેથી, રેખીય રીગ્રેશન સમીકરણ y=0.14303x+5.976364 છે.
ચાલો રીગ્રેસન સમીકરણને કાવતરું કરીએ. આ કરવા માટે, કોષ્ટકની ત્રીજી લાઇનમાં આપણે આપેલ બિંદુઓ X (પ્રથમ લાઇન) – y(x 1) પર ફંક્શનની કિંમતો દાખલ કરીએ છીએ. આ મૂલ્યો મેળવવા માટે, આંકડાકીય શ્રેણીના TREND કાર્યનો ઉપયોગ કરો. અમે A3 માં સહી “Y(X)” દાખલ કરીએ છીએ અને, કર્સરને B3 માં મૂકીને, TREND ફંક્શનને કૉલ કરીએ છીએ. “From_value_y” અને “From_value_x” ફીલ્ડમાં અમે B2-K2 અને B1-K1 ની લિંક આપીએ છીએ. "New_value_x" ફીલ્ડમાં અમે B1-K1 ની લિંક પણ દાખલ કરીએ છીએ. "કોન્સ્ટન્ટ" ફીલ્ડમાં જો રીગ્રેશન સમીકરણ y=ax+b હોય તો 1 દાખલ કરો અને જો y=ax હોય તો 0. અમારા કિસ્સામાં, અમે એક દાખલ કરીએ છીએ. TREND ફંક્શન એ એરે છે, તેથી તેના તમામ મૂલ્યો દર્શાવવા માટે, વિસ્તાર B3-K3 પસંદ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામ એ આપેલ બિંદુઓ પર રીગ્રેસન સમીકરણના મૂલ્યો છે. અમે શેડ્યૂલ બનાવી રહ્યા છીએ. કર્સરને કોઈપણ ફ્રી સેલમાં મૂકો, ડાયાગ્રામ વિઝાર્ડને કૉલ કરો, "શાર્પ્ડ" કેટેગરી પસંદ કરો, ગ્રાફનો પ્રકાર - બિંદુઓ વિનાની રેખા (નીચલા જમણા ખૂણે), "આગલું" ક્લિક કરો, B3-K3 ની લિંક દાખલ કરો. "ડાયગ્નોસ્ટિક" ફીલ્ડ. “રો” ટૅબ પર જાઓ અને “X મૂલ્યો” ફીલ્ડમાં B1-K1 ની લિંક દાખલ કરો, “Finish” પર ક્લિક કરો. પરિણામ એક સીધી રીગ્રેસન રેખા છે. ચાલો જોઈએ કે પ્રાયોગિક ડેટા અને રીગ્રેશન સમીકરણોના આલેખ કેવી રીતે અલગ પડે છે. આ કરવા માટે, કર્સરને કોઈપણ ફ્રી સેલમાં મૂકો, ચાર્ટ વિઝાર્ડને કૉલ કરો, શ્રેણી "ગ્રાફ", ગ્રાફનો પ્રકાર - બિંદુઓ સાથે તૂટેલી રેખા (ઉપર ડાબેથી બીજી), "આગલું" ક્લિક કરો, "રેન્જ" ફીલ્ડમાં એક દાખલ કરો. બીજી અને ત્રીજી લાઇન B2- K3 સાથે લિંક કરો. “રો” ટૅબ પર જાઓ અને “X-axis labels” ફીલ્ડમાં B1-K1 ની લિંક દાખલ કરો, “Finish” પર ક્લિક કરો. પરિણામ બે લીટીઓ છે (વાદળી - મૂળ, લાલ - રીગ્રેસન સમીકરણ). તે જોઈ શકાય છે કે રેખાઓ એકબીજાથી થોડી અલગ છે.
a= | 0,14303 |
b= | 5,976364 |
સહસંબંધ ગુણાંક r xy ની ગણતરી કરવા માટે, PEARSON ફંક્શનનો ઉપયોગ કરો. અમે ગ્રાફ મુકીએ છીએ જેથી કરીને તે લાઇન 25 ની ઉપર સ્થિત હોય, અને A25 માં અમે સહી "સહસંબંધ" બનાવીએ છીએ, B25 માં અમે PEARSON ફંક્શન કહીએ છીએ, જેનાં ક્ષેત્રોમાં "એરે 2" અમે સ્રોત ડેટા B1 ની લિંક દાખલ કરીએ છીએ. -K1 અને B2-K2. પરિણામ 0.993821 છે. નિર્ધારણનો ગુણાંક R xy એ સહસંબંધ ગુણાંક r xy નો વર્ગ છે. A26 માં આપણે "નિર્ધારણ" પર સહી કરીએ છીએ, અને B26 માં આપણે "=B25*B25" સૂત્ર લખીએ છીએ. પરિણામ 0.265207 છે.
જો કે, એક્સેલમાં એક કાર્ય છે જે રેખીય રીગ્રેશનની તમામ મૂળભૂત લાક્ષણિકતાઓની ગણતરી કરે છે. આ LINEST ફંક્શન છે. કર્સરને B28 માં મૂકો અને LINEST ફંક્શનને કૉલ કરો, કેટેગરી “આંકડાકીય”. “From_value_y” અને “From_value_x” ફીલ્ડમાં અમે B2-K2 અને B1-K1 ની લિંક આપીએ છીએ. "કોન્સ્ટન્ટ" ફીલ્ડનો અર્થ TREND ફંક્શન જેવો જ છે. અમારા કિસ્સામાં તે 1 ની બરાબર છે. જો તમારે રીગ્રેશન વિશે સંપૂર્ણ આંકડા દર્શાવવાની જરૂર હોય તો "Stat" ફીલ્ડમાં 1 હોવો જોઈએ. અમારા કિસ્સામાં, અમે ત્યાં એક મૂકીએ છીએ. ફંક્શન 2 કૉલમ અને 5 પંક્તિઓની એરે આપે છે. દાખલ કર્યા પછી, માઉસ વડે સેલ B28-C32 પસંદ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામ એ મૂલ્યોનું કોષ્ટક છે, જેમાં સંખ્યાઓ નીચેના અર્થ ધરાવે છે:
ગુણાંક એ | ગુણાંક b |
માનક ભૂલ m o | માનક ભૂલ m h |
નિર્ધારણ ગુણાંક R xy | પ્રમાણભૂત વિચલન |
F - આંકડા | સ્વતંત્રતાની ડિગ્રી n-2 |
સ્ક્વેરનો રીગ્રેશન સરવાળો S n 2 | ચોરસનો શેષ સરવાળો S n 2 |
0,14303 | 5,976364 |
0,183849 | 0,981484 |
0,070335 | 1,669889 |
0,60525 | 8 |
1,687758 | 22,30824 |
પરિણામનું વિશ્લેષણ: પ્રથમ લીટીમાં - રીગ્રેસન સમીકરણના ગુણાંક, તેમને ગણતરી કરેલ કાર્યો SLOPE અને INTERCEPT સાથે સરખાવો. બીજી લાઇન એ ગુણાંકની પ્રમાણભૂત ભૂલો છે. જો તેમાંથી એક ગુણાંક કરતાં ચોક્કસ મૂલ્યમાં વધારે હોય, તો ગુણાંક શૂન્ય ગણવામાં આવે છે. નિર્ધારણનો ગુણાંક પરિબળો વચ્ચેના સંબંધની ગુણવત્તાને દર્શાવે છે. 0.070335 નું પરિણામી મૂલ્ય પરિબળો વચ્ચે ખૂબ જ સારો સંબંધ દર્શાવે છે, F - આંકડાઓ રીગ્રેસન મોડેલની પર્યાપ્તતા વિશેની પૂર્વધારણાનું પરીક્ષણ કરે છે. આ સંખ્યાને નિર્ણાયક મૂલ્ય સાથે સરખાવવી આવશ્યક છે, તેને મેળવવા માટે આપણે E33 માં સહી "F-ક્રિટિકલ" દાખલ કરીએ છીએ, અને F33 માં FRIST ફંક્શન, જેની દલીલો આપણે અનુક્રમે "0.05" (મહત્વનું સ્તર), "1" દાખલ કરીએ છીએ. (પરિબળોની સંખ્યા X) અને "8" (સ્વતંત્રતાની ડિગ્રી).
F- જટિલ | 5,317655 |
તે જોઈ શકાય છે કે F-આંકડા F-ક્રિટિકલ કરતા ઓછા છે, જેનો અર્થ છે કે રીગ્રેશન મોડલ પર્યાપ્ત નથી. છેલ્લી લીટી ચોરસનો રીગ્રેશન સરવાળો દર્શાવે છે અને ચોરસનો શેષ સરવાળો . તે મહત્વનું છે કે રીગ્રેસન સરવાળો (રીગ્રેસન દ્વારા સમજાવાયેલ) શેષ (રીગ્રેસન દ્વારા સમજાવાયેલ નથી, રેન્ડમ પરિબળોને કારણે) કરતાં ઘણો મોટો છે. અમારા કિસ્સામાં, આ સ્થિતિ પૂરી થઈ નથી, જે નબળી રીગ્રેસન સૂચવે છે.
નિષ્કર્ષ: મારા કાર્ય દરમિયાન, મેં કમ્પ્યુટરનો ઉપયોગ કરીને જોડી રીગ્રેસનનું રેખીય સમીકરણ બનાવવાની પદ્ધતિઓમાં નિપુણતા મેળવી, રીગ્રેસન સમીકરણની મુખ્ય લાક્ષણિકતાઓ મેળવવા અને તેનું વિશ્લેષણ કરવાનું શીખ્યા.
લેબોરેટરી વર્ક નંબર 4
નોનલાઇનર રીગ્રેશન
ધ્યેય: કોમ્પ્યુટર (આંતરિક રેખીય મોડલ્સ) નો ઉપયોગ કરીને મુખ્ય પ્રકારનાં બિનરેખીય જોડી પ્રમાણે રીગ્રેસન સમીકરણો બનાવવા માટેની પદ્ધતિઓમાં નિપુણતા મેળવવા માટે, રીગ્રેસન સમીકરણોના ગુણવત્તા સૂચકાંકો મેળવવા અને તેનું વિશ્લેષણ કરવાનું શીખો.
ચાલો તે કેસને ધ્યાનમાં લઈએ જ્યારે ડેટા ટ્રાન્સફોર્મેશન (આંતરિક રેખીય મોડલ) નો ઉપયોગ કરીને બિનરેખીય મોડલ્સને રેખીયમાં ઘટાડી શકાય છે.
ઉદાહરણ. નમૂના x n y n (f = 1,2,…,10) માટે રીગ્રેશન સમીકરણ y = f(x) બનાવો. f(x) તરીકે, ચાર પ્રકારનાં કાર્યોને ધ્યાનમાં લો - રેખીય, શક્તિ, ઘાતાંકીય અને હાઇપરબોલા:
y = Ax + B; y = Ax B; y = Ae Bx; y = A/x + B.
તેમના ગુણાંક A અને B શોધવા માટે જરૂરી છે, અને ગુણવત્તા સૂચકાંકોની તુલના કર્યા પછી, તે કાર્ય પસંદ કરો જે શ્રેષ્ઠ રીતે અવલંબનનું વર્ણન કરે છે.
નફો વાય | 0,3 | 1,2 | 2,8 | 5,2 | 8,1 | 11,0 | 16,8 | 16,9 | 24,7 | 29,4 |
નફો X | 0,25 | 0,50 | 0,75 | 1,00 | 1,25 | 1,50 | 1,75 | 2,00 | 2,25 | 2,50 |
ચાલો સહીઓ (સેલ્સ A1-K2) સાથે કોષ્ટકમાં ડેટા દાખલ કરીએ. ચાલો રૂપાંતરિત ડેટા દાખલ કરવા માટે કોષ્ટકની નીચે ત્રણ લીટીઓ ખાલી છોડીએ, 1 થી 5 સુધીની સંખ્યાઓ સાથે ડાબી ગ્રે બોર્ડર સાથે સ્વાઇપ કરીને પ્રથમ પાંચ લીટીઓ પસંદ કરો અને પૃષ્ઠભૂમિને રંગ આપવા માટે રંગ (આછો - પીળો અથવા ગુલાબી) પસંદ કરો. કોષો આગળ, A6 થી શરૂ કરીને, અમે રેખીય રીગ્રેસન પરિમાણો પ્રદર્શિત કરીએ છીએ. આ કરવા માટે, સેલ A6 માં "લિનિયર" લખો અને નજીકના સેલ B6 માં LINEST ફંક્શન દાખલ કરો. “Izv_value_x” ફીલ્ડમાં આપણે B2-K2 અને B1-K1ની લિંક આપીએ છીએ, પછીના બે ફીલ્ડ એકના મૂલ્યો લે છે. આગળ, નીચેના વિસ્તારને 5 લીટીઓમાં અને ડાબી બાજુએ 2 લીટીઓમાં વર્તુળ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામ એ રીગ્રેસન પરિમાણો સાથેનું કોષ્ટક છે, જેમાંથી પ્રથમ કૉલમમાં નિર્ધારણનો ગુણાંક, ટોચથી ત્રીજા, સૌથી વધુ રસ ધરાવે છે. અમારા કિસ્સામાં, તે R 1 = 0.951262 ની બરાબર છે. F- માપદંડનું મૂલ્ય, જે મોડેલ F 1 = 156.1439 ની પર્યાપ્તતા તપાસવાની મંજૂરી આપે છે
(ચોથી પંક્તિ, પ્રથમ કૉલમ). રીગ્રેસન સમીકરણ છે
y = 12.96 x +6.18 (ગુણાંકો a અને b કોષો B6 અને C6 માં આપેલ છે).
રેખીય | 12,96 | -6,18 |
1,037152 | 1,60884 | |
0,951262 | 2,355101 | |
156,1439 | 8 | |
866,052 | 44,372 |
ચાલો આપણે અન્ય રીગ્રેસન માટે સમાન લાક્ષણિકતાઓ નક્કી કરીએ અને, નિર્ધારણના ગુણાંકની તુલના કરવાના પરિણામે, અમે શ્રેષ્ઠ રીગ્રેસન મોડેલ શોધીશું. ચાલો હાયપરબોલિક રીગ્રેશનને ધ્યાનમાં લઈએ. તેને મેળવવા માટે, અમે ડેટાને રૂપાંતરિત કરીએ છીએ. ત્રીજી લાઇનમાં, સેલ A3 માં આપણે સહી "1/x" દાખલ કરીએ છીએ અને સેલ B3 માં આપણે "=1/B2" સૂત્ર દાખલ કરીએ છીએ. ચાલો આ સેલને B3-K3 વિસ્તાર પર ઓટોફિલ કરીએ. ચાલો રીગ્રેસન મોડેલની લાક્ષણિકતાઓ મેળવીએ. સેલ A12 માં આપણે સહી "હાયપરબોલા" દાખલ કરીએ છીએ, અને બાજુના LINEST ફંક્શનમાં. “From_value_y” અને “From_value_x2” ફીલ્ડમાં અમે B1-K1 અને દલીલ x – B3-K3ના કન્વર્ટેડ ડેટાની લિંક આપીએ છીએ, પછીના બે ફીલ્ડ એકના મૂલ્યો લે છે. આગળ, 5 લીટીઓ અને ડાબી બાજુની 2 લીટીઓ નીચેના વિસ્તારને વર્તુળ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. અમને રીગ્રેસન પરિમાણોનું ટેબલ મળે છે. માં નિર્ધારણનો ગુણાંક આ કિસ્સામાં R 2 = 0.475661 ની બરાબર છે, જે રેખીય રીગ્રેશનના કિસ્સામાં કરતાં ઘણું ખરાબ છે. F-આંકડા F 2 = 7.257293 છે. રીગ્રેશન સમીકરણ y = -6.25453x 18.96772 છે.
હાયપરબોલા | -6,25453 | 18,96772 |
2,321705 | 3,655951 | |
0,475661 | 7,724727 | |
7,257293 | 8 | |
433,0528 | 477,3712 |
ચાલો ઘાતાંકીય રીગ્રેસનને ધ્યાનમાં લઈએ. તેને રેખીય બનાવવા માટે, આપણે સમીકરણ મેળવીએ છીએ, જ્યાં ỹ = ln y, ã = b, = ln a. તે જોઈ શકાય છે કે ડેટા ટ્રાન્સફોર્મેશન કરવાની જરૂર છે - y ને ln y સાથે બદલો. કર્સરને સેલ A4 માં મૂકો અને હેડિંગ "ln y" બનાવો. કર્સરને B4 માં મૂકો અને LN ફોર્મ્યુલા દાખલ કરો (કેટેગરી “ગાણિતિક”). દલીલ તરીકે, અમે B1 નો સંદર્ભ આપીએ છીએ. ઑટોફિલનો ઉપયોગ કરીને, અમે ફોર્મ્યુલાને ચોથી પંક્તિ સુધી કોષો B4-K4 સુધી લંબાવીએ છીએ. આગળ, સેલ F6 માં આપણે સહી "ઘાત" સેટ કરીએ છીએ અને નજીકના G6 માં આપણે LINEST ફંક્શન દાખલ કરીએ છીએ, જેની દલીલો રૂપાંતરિત ડેટા B4-K4 હશે ("Measured_value_y" ફીલ્ડમાં), અને બાકીના ફીલ્ડ્સ છે. રેખીય રીગ્રેશન (B2-K2, 1, 1) ના કિસ્સામાં સમાન. આગળ, કોષો G6-H10 પર વર્તુળ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામ R 3 = 0.89079, F 3 = 65.25304 છે, જે ખૂબ જ સારી રીગ્રેશન સૂચવે છે. રીગ્રેસન સમીકરણ b = ã ના ગુણાંક શોધવા માટે; કર્સરને J6 માં મૂકો અને મથાળું “a=” બનાવો, અને પડોશી K6 માં સૂત્ર “=EXP(H6)”, J7 માં આપણે મથાળું આપીએ છીએ “b=”, અને K7 માં સૂત્ર “=G6”. રીગ્રેશન સમીકરણ y = 0.511707· e 6.197909 x છે.
પ્રદર્શક | 1,824212 | -0,67 | a= | 0,511707 | |
0,225827 | 0,350304 | b= | 6,197909 | ||
0,89079 | 0,512793 | ||||
65,25304 | 8 | ||||
17,15871 | 2,103652 |
ચાલો પાવર રીગ્રેશનને ધ્યાનમાં લઈએ. તેને રેખીય બનાવવા માટે, આપણે સમીકરણ ỹ = ã મેળવીએ છીએ, જ્યાં ỹ = ln y, = ln x, ã = b, = ln a. તે જોઈ શકાય છે કે ડેટાને રૂપાંતરિત કરવું જરૂરી છે - y ને ln y સાથે બદલો અને x ને ln x સાથે બદલો. અમારી પાસે પહેલેથી જ ln y સાથેની રેખા છે. ચાલો x ચલોને રૂપાંતરિત કરીએ. સેલ A5 માં આપણે સહી "ln x" લખીએ છીએ, અને સેલ B5 માં આપણે ફોર્મ્યુલા LN (કેટેગરી "ગાણિતિક") દાખલ કરીએ છીએ. દલીલ તરીકે, અમે B2 નો સંદર્ભ આપીએ છીએ. ઑટોફિલનો ઉપયોગ કરીને, અમે ફોર્મ્યુલાને પાંચમી પંક્તિ સુધી કોષો B5-K5 સુધી લંબાવીએ છીએ. આગળ, સેલ F12 માં આપણે હસ્તાક્ષર "પાવર" સેટ કરીએ છીએ અને નજીકના G12 માં આપણે LINEST ફંક્શન દાખલ કરીએ છીએ, જેની દલીલો રૂપાંતરિત ડેટા B4-K4 (“From_value_y” ફીલ્ડમાં), અને B5-K5 (માં “From_value_x” ફીલ્ડ), બાકીના ફીલ્ડ એક છે. આગળ, ફ્રી સેલ G12-H16 અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામ R 4 = 0.997716, F 4 = 3494.117 છે, જે સારા રીગ્રેશન સૂચવે છે. રીગ્રેસન સમીકરણ b = ã ના ગુણાંક શોધવા માટે; કર્સરને J12 માં મુકો અને મથાળું “a=” બનાવીએ, અને પડોશી K12 માં સૂત્ર “=EXP(H12)”, J13 માં આપણે મથાળું “b=” આપીએ, અને K13 માં સૂત્ર “=G12”. રીગ્રેશન સમીકરણ y = 4.90767/x+ 7.341268 છે.
શક્તિ | 1,993512 | 1,590799 | a= | 4,90767 | |
0,033725 | 0,023823 | b= | 7,341268 | ||
0,997716 | 0,074163 | ||||
3494,117 | 8 | ||||
19,21836 | 0,044002 |
ચાલો તપાસ કરીએ કે શું બધા સમીકરણો પર્યાપ્ત રીતે ડેટાનું વર્ણન કરે છે. આ કરવા માટે, તમારે દરેક માપદંડના F-આંકડાને નિર્ણાયક મૂલ્ય સાથે સરખાવવાની જરૂર છે. તેને મેળવવા માટે, અમે A21 માં સહી "F-ક્રિટિકલ" દાખલ કરીએ છીએ, અને B21 માં FRIST ફંક્શન, જેની દલીલો આપણે દાખલ કરીએ છીએ, અનુક્રમે, "0.05" (મહત્વનું સ્તર), "1" (માં પરિબળની સંખ્યા X લીટી “મહત્વનું સ્તર 1”) અને “8” (સ્વતંત્રતાની ડિગ્રી 2 = n – 2). પરિણામ 5.317655 છે. F – ક્રિટિકલ એ F – આંકડા કરતા વધારે છે, જેનો અર્થ છે કે મોડેલ પર્યાપ્ત છે. બાકીના રીગ્રેસન પણ પર્યાપ્ત છે. કયું મોડેલ ડેટાનું શ્રેષ્ઠ વર્ણન કરે છે તે નિર્ધારિત કરવા માટે, અમે દરેક મોડેલ R 1, R 2, R 3, R 4 માટે નિર્ધારણ સૂચકાંકોની તુલના કરીએ છીએ. સૌથી મોટો R4 = 0.997716 છે. આનો અર્થ એ છે કે પ્રાયોગિક ડેટા y = 4.90767/x + 7.341268 દ્વારા વધુ સારી રીતે વર્ણવવામાં આવે છે.
નિષ્કર્ષ: મારા કાર્ય દરમિયાન, મેં કમ્પ્યુટર (આંતરિક રેખીય મોડલ્સ) નો ઉપયોગ કરીને મુખ્ય પ્રકારનાં બિનરેખીય જોડી પ્રમાણે રીગ્રેસન સમીકરણો બનાવવા માટેની પદ્ધતિઓમાં નિપુણતા મેળવી, રીગ્રેસન સમીકરણોના ગુણવત્તા સૂચકાંકો મેળવવા અને તેનું વિશ્લેષણ કરવાનું શીખ્યા.
વાય | 0,3 | 1,2 | 2,8 | 5,2 | 8,1 | 11 | 16,8 | 16,9 | 24,7 | 29,4 |
એક્સ | 0,25 | 0,5 | 0,75 | 1 | 1,25 | 1,5 | 1,75 | 2 | 2,25 | 2,5 |
1/x | 4 | 2 | 1,333333 | 1 | 0,8 | 0,666667 | 0,571429 | 0,5 | 0,444444 | 0,4 |
y માં | -1,20397 | 0,182322 | 1,029619 | 1,648659 | 2,0918641 | 2,397895 | 2,821379 | 2,827314 | 3,206803 | 3,380995 |
ln x | -1,38629 | -0,69315 | -0,28768 | 0 | 0,2231436 | 0,405465 | 0,559616 | 0,693147 | 0,81093 | 0,916291 |
રેખીય | 12,96 | -6,18 | પ્રદર્શક | 1,824212 | -0,67 | a= | 0,511707 | |||
1,037152 | 1,60884 | 0,225827 | 0,350304 | b= | 6,197909 | |||||
0,951262 | 2,355101 | 0,89079 | 0,512793 | |||||||
156,1439 | 8 | 65,25304 | 8 | |||||||
866,052 | 44,372 | 17,15871 | 2,103652 | |||||||
હાયપરબોલા | -6,25453 | 18,96772 | શક્તિ | 1,993512 | 1,590799 | a= | 4,90767 | |||
2,321705 | 3,655951 | 0,033725 | 0,023823 | b= | 7,341268 | |||||
0,475661 | 7,724727 | 0,997716 | 0,074163 | |||||||
7,257293 | 8 | 3494,117 | 8 | |||||||
433,0528 | 477,3712 | 19,21836 | 0,044002 | |||||||
F - જટિલ | 5,317655 | |||||||||
લેબોરેટરી વર્ક નંબર 5
બહુપદી રીગ્રેશન
હેતુ: પ્રાયોગિક ડેટાનો ઉપયોગ કરીને, y = ax 2 + bx + c ફોર્મનું રીગ્રેસન સમીકરણ બનાવો.
પ્રગતિ:
ચોક્કસ પાક y iની ઉપજની અવલંબનને જમીન પર લાગુ કરાયેલા ખનિજ ખાતરોની માત્રા પર ગણવામાં આવે છે. એવું માનવામાં આવે છે કે આ અવલંબન ચતુર્થાંશ છે. ફોર્મ ỹ = ax 2 + bx + c નું રીગ્રેશન સમીકરણ શોધવાનું જરૂરી છે.
x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
y | 29,8 | 58,8 | 72,2 | 101,5 | 141 | 135,1 | 156,6 | 181,7 | 216,6 | 208,2 |
ચાલો આ ડેટાને A1-K2 સેલમાં સહીઓ સાથે સ્પ્રેડશીટમાં દાખલ કરીએ. ચાલો ગ્રાફ બનાવીએ. આ કરવા માટે, ડેટા Y (કોષો B2-K2) પર વર્તુળ કરો, ચાર્ટ વિઝાર્ડને કૉલ કરો, ચાર્ટ પ્રકાર "ગ્રાફ" પસંદ કરો, ચાર્ટ પ્રકાર - બિંદુઓ સાથેનો આલેખ (ઉપર ડાબી બાજુથી બીજો), "આગલું" ક્લિક કરો, "આગલું" પર જાઓ. “શ્રેણી” ટૅબ અને “X-axis લેબલ્સ” માં B2-K2 ની લિંક બનાવો, “Finish” ક્લિક કરો. આલેખને ડિગ્રી 2 y = ax 2 + bx + c ના બહુપદી દ્વારા અંદાજિત કરી શકાય છે. a, b, c ગુણાંક શોધવા માટે, તમારે સમીકરણોની સિસ્ટમ હલ કરવાની જરૂર છે:
ચાલો રકમની ગણતરી કરીએ. આ કરવા માટે, સેલ A3 માં "X^2" સહી દાખલ કરો, અને સેલ B3 માં "= B1*B1" ફોર્મ્યુલા દાખલ કરો અને ઑટોફિલનો ઉપયોગ કરીને તેને સમગ્ર લાઇન B3-K3 પર સ્થાનાંતરિત કરો. સેલ A4 માં આપણે સહી "X^3" દાખલ કરીએ છીએ, અને B4 માં ફોર્મ્યુલા "=B1*B3" અને ઑટોફિલ તેને સમગ્ર લાઇન B4-K4 પર સ્થાનાંતરિત કરીએ છીએ. સેલ A5 માં આપણે “X^4” દાખલ કરીએ છીએ, અને B5 માં ફોર્મ્યુલા “=B4*B1”, લાઇન ઓટોફિલ કરીએ છીએ. સેલ A6 માં આપણે “X*Y” દાખલ કરીએ છીએ, અને B8 માં ફોર્મ્યુલા “=B2*B1”, લાઇનને સ્વતઃ ભરો. સેલ A7 માં આપણે “X^2*Y” દાખલ કરીએ છીએ, અને B9 માં સૂત્ર “=B3*B2”, લાઇનને ઓટોફિલ કરીએ છીએ. હવે અમે રકમની ગણતરી કરીએ છીએ. હેડર પર ક્લિક કરીને અને રંગ પસંદ કરીને અલગ રંગ સાથે કૉલમ L હાઇલાઇટ કરો. કર્સરને સેલ L1 માં મૂકો અને પ્રથમ પંક્તિના સરવાળાની ગણતરી કરવા માટે ∑ ચિહ્ન સાથે ઓટોસમ બટન પર ક્લિક કરો. ઑટોફિલનો ઉપયોગ કરીને, અમે સૂત્રને કોષો L1-710 માં સ્થાનાંતરિત કરીએ છીએ.
હવે આપણે સમીકરણોની સિસ્ટમ હલ કરીએ છીએ. આ કરવા માટે, અમે સિસ્ટમના મુખ્ય મેટ્રિક્સને રજૂ કરીએ છીએ. સેલ A13 માં આપણે સહી "A=" દાખલ કરીએ છીએ, અને મેટ્રિક્સ સેલ B13-D15 માં આપણે કોષ્ટકમાં પ્રતિબિંબિત લિંક્સ દાખલ કરીએ છીએ.
બી | સી | ડી | |
13 | =L5 | =L4 | =L3 |
14 | =L3 | =L2 | =L1 |
15 | =L2 | =L1 | =9 |
અમે સમીકરણોની સિસ્ટમની જમણી બાજુઓ પણ રજૂ કરીએ છીએ. G13 માં આપણે સહી “B=” દાખલ કરીએ છીએ, અને H13-H15 માં આપણે અનુક્રમે, “=L7”, “=L6”, “=L2” કોષોની લિંક્સ દાખલ કરીએ છીએ. અમે મેટ્રિક્સ પદ્ધતિનો ઉપયોગ કરીને સિસ્ટમને હલ કરીએ છીએ. ઉચ્ચ ગણિતમાંથી તે જાણી શકાય છે કે ઉકેલ A -1 B બરાબર છે. વ્યસ્ત મેટ્રિક્સ શોધો. આ કરવા માટે, સેલ J13 માં સહી દાખલ કરો. અને, કર્સરને K13 માં મૂકીને, MOBR ફોર્મ્યુલા સેટ કરો (કેટેગરી “ગાણિતિક”). એરે દલીલ તરીકે, અમે કોષો B13:D15 માટે એક લિંક પ્રદાન કરીએ છીએ. પરિણામ પણ 4x4 મેટ્રિક્સ હોવું જોઈએ. તેને મેળવવા માટે, K13-M15 કોષોને માઉસ વડે વર્તુળ કરો, તેમને પસંદ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામ મેટ્રિક્સ A -1 છે. ચાલો હવે આ મેટ્રિક્સ અને કૉલમ B (કોષ H13-H15) નું ઉત્પાદન શોધીએ. અમે સેલ A18 માં સહી "ગુણાંક" દાખલ કરીએ છીએ અને B18 માં અમે બહુવિધ કાર્ય (કેટેગરી "ગાણિતિક") સેટ કરીએ છીએ. "એરે 1" ફંક્શનની દલીલો એ મેટ્રિક્સ A -1 (સેલ્સ K13-M15) ની લિંક છે, અને "એરે 2" ફીલ્ડમાં અમે કૉલમ B (કોષો H13-H16) ની લિંક પ્રદાન કરીએ છીએ. આગળ, B18-B20 પસંદ કરો અને F2 અને Ctrl+Shift+Enter દબાવો. પરિણામી એરે એ રીગ્રેશન સમીકરણ a, b, c ના ગુણાંક છે. પરિણામે, અમે ફોર્મનું રીગ્રેશન સમીકરણ મેળવીએ છીએ: y = 1.201082x 2 – 5.619177x + 78.48095.
ચાલો મૂળ ડેટા અને રીગ્રેશન સમીકરણના આધારે મેળવેલા આલેખ બનાવીએ. આ કરવા માટે, સેલ A8 માં સહી "રીગ્રેશન" દાખલ કરો અને B8 માં "=$B$18*B3+$B$19*B1+$B$20" સૂત્ર દાખલ કરો. ઑટોફિલનો ઉપયોગ કરીને, અમે ફોર્મ્યુલાને B8-K8 કોષોમાં સ્થાનાંતરિત કરીએ છીએ. ગ્રાફ બનાવવા માટે, સેલ B8-K8 પસંદ કરો અને, Ctrl કી દબાવી રાખીને, સેલ B2-M2 પણ પસંદ કરો. ચાર્ટ વિઝાર્ડને કૉલ કરો, ચાર્ટ પ્રકાર “ગ્રાફ” પસંદ કરો, ચાર્ટ પ્રકાર – પોઈન્ટ્સ સાથેનો ગ્રાફ (ઉપર ડાબેથી સેકન્ડ), “આગલું” ક્લિક કરો, “શ્રેણી” ટૅબ પર જાઓ અને “X-axis લેબલ્સ” ફીલ્ડમાં બનાવો B2-M2 ની લિંક, "તૈયાર" ક્લિક કરો. તે જોઈ શકાય છે કે વણાંકો લગભગ એકરૂપ છે.
નિષ્કર્ષ: કાર્યની પ્રક્રિયામાં, પ્રાયોગિક ડેટાનો ઉપયોગ કરીને, મેં y = ax 2 + bx + c ફોર્મનું રીગ્રેસન સમીકરણ બનાવવાનું શીખ્યું.
x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |||
y | 29,8 | 58,8 | 72,2 | 101,5 | 141 | 135,1 | 156,6 | 181,7 | 216,6 | 208,2 | |||
X^2 | 0 | 1 | 4 | 9 | 16 | 25 | 36 | 49 | 64 | 81 | |||
X^3 | 0 | 1 | 8 | 27 | 64 | 125 | 216 | 343 | 512 | 729 | |||
X^4 | 0 | 1 | 16 | 81 | 256 | 625 | 1296 | 2401 | 4096 | 6561 | |||
X*Y | 0 | 58,8 | 144,4 | 304,5 | 564 | 675,5 | 939,6 | 1271,9 | 1732,8 | 1873,8 | |||
X^2*Y | 0 | 58,8 | 288,8 | 913,5 | 2256 | 3377,5 | 5637,6 | 8903,3 | 13862,4 | 16864,2 | |||
રીગ્રેશન. | 78,48095 | 85,30121 | 94,52364 | 106,1482 | 120,175 | 136,6039 | 155,435 | 176,6682 | 200,3036 | 226,3412 | |||
A= | 15333 | 2025 | 285 | B= | 52162,1 | A Arr. | 0,003247 | -0,03247 | 0,059524 | ||||
2025 | 285 | 45 | 7565,3 | -0,03247 | 0,341342 | -0,67857 | |||||||
285 | 45 | 9 | 1301,5 | 0,059524 | -0,67857 | 1,619048 | |||||||
ગુણાંક | 1,201082 | a | |||||||||||
5,619177 |
નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 વ્યાખ્યાન 6. બે નમૂનાઓની સરખામણી 6-1. સાધનની સમાનતાની પૂર્વધારણા. માધ્યમોમાં તફાવત માટે 6-2 જોડી કરેલ નમૂનાઓ. જોડી નમૂનાઓ 6-3. ભિન્નતા 6-4ની સમાનતાની પૂર્વધારણા. શેરની સમાનતાની પૂર્વધારણા 6-5. પ્રમાણ માં તફાવત માટે વિશ્વાસ અંતરાલ
2 ઇવાનવ ઓ.વી., 2005 આ લેક્ચરમાં... અગાઉના લેક્ચરમાં અમે બે સામાન્ય વસ્તીના માધ્યમની સમાનતા વિશેની પૂર્વધારણાનું પરીક્ષણ કર્યું હતું અને આત્મવિશ્વાસ અંતરાલસ્વતંત્ર નમૂનાઓના કિસ્સામાં અર્થના તફાવત માટે. હવે આપણે માધ્યમોની સમાનતાની પૂર્વધારણાને ચકાસવા માટેના માપદંડ પર વિચાર કરીશું અને જોડી (આશ્રિત) નમૂનાઓના કિસ્સામાં માધ્યમોમાં તફાવત માટે વિશ્વાસ અંતરાલ બનાવીશું. પછી વિભાગ 6-3 માં ભિન્નતાની સમાનતાની પૂર્વધારણાની ચકાસણી કરવામાં આવશે, વિભાગ 6-4 માં - શેરની સમાનતાની પૂર્વધારણા. અંતે, અમે પ્રમાણના તફાવત માટે વિશ્વાસ અંતરાલ બનાવીએ છીએ.
નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 અર્થની સમાનતાની પૂર્વધારણા. જોડી નમૂનાઓ સમસ્યાનું નિવેદન પૂર્વધારણા અને આંકડા ક્રિયાઓનો ક્રમ ઉદાહરણ
4 ઇવાનવ ઓ.વી., 2005 જોડી નમૂનાઓ. સમસ્યાનું વર્ણન આપણી પાસે શું છે 1. બે સામાન્ય વસ્તીમાંથી મેળવેલ બે સરળ રેન્ડમ નમૂનાઓ. નમૂનાઓ જોડી (આશ્રિત) છે. 2. બંને નમૂનાનું કદ n 30 છે. જો નહીં, તો બંને નમૂના સામાન્ય રીતે વિતરિત વસ્તીમાંથી લેવામાં આવે છે. અમે જે ઇચ્છીએ છીએ તે બે વસ્તીના માધ્યમો વચ્ચેના તફાવત વિશેની પૂર્વધારણાને ચકાસવા માટે છે:
5 ઇવાનવ ઓ.વી., 2005 જોડી નમૂનાઓ માટેના આંકડા પૂર્વધારણાને ચકાસવા માટે, આંકડાઓનો ઉપયોગ કરવામાં આવે છે: એક જોડીમાં બે મૂલ્યો વચ્ચેનો તફાવત ક્યાં છે - જોડી કરેલ તફાવતો માટે સામાન્ય સરેરાશ - જોડી કરેલ તફાવતો માટે નમૂનાની સરેરાશ - પ્રમાણભૂત વિચલનનમૂના માટે તફાવત - જોડીની સંખ્યા
6 ઇવાનવ ઓ.વી., 2005 ઉદાહરણ. વિદ્યાર્થીઓની તાલીમ 15 વિદ્યાર્થીઓના જૂથે તાલીમ પહેલા અને પછી એક કસોટી લીધી. પરીક્ષણ પરિણામો કોષ્ટકમાં છે. ચાલો 0.05 ના મહત્વના સ્તરે વિદ્યાર્થીઓની તૈયારી પર તાલીમના પ્રભાવની ગેરહાજરી માટે જોડી નમૂનાઓ માટે પૂર્વધારણાનું પરીક્ષણ કરીએ. ઉકેલ. ચાલો તફાવતો અને તેમના વર્ગોની ગણતરી કરીએ. વિદ્યાર્થી પહેલા Σ= 21 Σ= 145
7 ઇવાનવ ઓ.વી., 2005 સોલ્યુશન પગલું 1. મુખ્ય અને વૈકલ્પિક પૂર્વધારણાઓ: પગલું 2. મહત્વ સ્તર = 0.05 સેટ છે. પગલું 3. df = 15 – 1=14 માટે કોષ્ટકનો ઉપયોગ કરીને, આપણે નિર્ણાયક મૂલ્ય t = 2.145 શોધીએ છીએ અને નિર્ણાયક પ્રદેશ લખીએ છીએ: t > 2.145. ૨.૧૪૫. = 15 – 1=14 આપણે નિર્ણાયક મૂલ્ય t = 2.145 શોધીએ છીએ અને નિર્ણાયક પ્રદેશ લખીએ છીએ: t > 2.145."> title="7 ઇવાનવ ઓ.વી., 2005 સોલ્યુશન પગલું 1. મુખ્ય અને વૈકલ્પિક પૂર્વધારણાઓ: પગલું 2. મહત્વ સ્તર = 0.05 સેટ છે. પગલું 3. df = 15 – 1=14 માટે કોષ્ટકનો ઉપયોગ કરીને, આપણે નિર્ણાયક મૂલ્ય t = 2.145 શોધીએ છીએ અને નિર્ણાયક પ્રદેશ લખીએ છીએ: t > 2.145."> !}
9 ઇવાનવ ઓ.વી., 2005 સોલ્યુશન સ્ટેટિસ્ટિક્સ મૂલ્ય લે છે: પગલું 5. નિર્ણાયક પ્રદેશ સાથે પ્રાપ્ત મૂલ્યની તુલના કરો. 1.889
નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 અર્થમાં તફાવત માટે વિશ્વાસ અંતરાલ. જોડી કરેલ નમૂનાઓ કોન્ફીડન્સ ઈન્ટરવલ બનાવવા માટે પ્રોબ્લેમ સ્ટેટમેન્ટ પદ્ધતિ ઉદાહરણ
11 ઇવાનવ ઓ.વી., 2005 સમસ્યાનું વર્ણન અમારી પાસે શું છે અમારી પાસે બે સામાન્ય વસ્તીમાંથી કદ n ના બે રેન્ડમ જોડી (આશ્રિત) નમૂનાઓ છે. સામાન્ય વસ્તીમાં પેરામીટર્સ 1, 1 અને 2, 2 સાથે સામાન્ય વિતરણ કાયદો હોય છે અથવા બંને સેમ્પલની માત્રા 30 હોય છે. આપણે જે જોઈએ છે તે બે સામાન્ય વસ્તી માટે જોડી તફાવતના સરેરાશ મૂલ્યનો અંદાજ કાઢવાનો છે. આ કરવા માટે, ફોર્મમાં સરેરાશ માટે આત્મવિશ્વાસ અંતરાલ બનાવો:
નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 ભિન્નતાની સમાનતાની પૂર્વધારણા સમસ્યાનું નિવેદન પૂર્વધારણા અને આંકડા ક્રિયાઓનો ક્રમ ઉદાહરણ
15 ઇવાનવ ઓ.વી., 2005 અભ્યાસ દરમિયાન... સંશોધકને એ ધારણા તપાસવાની જરૂર પડી શકે છે કે અભ્યાસ કરવામાં આવી રહેલી બે વસ્તીના તફાવતો સમાન છે. કિસ્સામાં જ્યાં આ સામાન્ય વસ્તી છે સામાન્ય વિતરણ, આ માટે એક એફ-ટેસ્ટ છે, જેને ફિશર માપદંડ પણ કહેવાય છે. સ્ટુડન્ટથી વિપરીત, ફિશર દારૂની ભઠ્ઠીમાં કામ કરતો ન હતો.
16 ઇવાનવ ઓ.વી., 2005 સમસ્યાનું વર્ણન આપણી પાસે શું છે 1. બે સામાન્ય રીતે વિતરિત વસ્તીમાંથી મેળવેલ બે સરળ રેન્ડમ નમૂનાઓ. 2. નમૂનાઓ સ્વતંત્ર છે. આનો અર્થ એ છે કે નમૂના વિષયો વચ્ચે કોઈ સંબંધ નથી. અમે જે ઇચ્છીએ છીએ તે વસ્તી ભિન્નતાની સમાનતાની પૂર્વધારણાને ચકાસવા માટે છે:
23 ઇવાનવ ઓ.વી., 2005 ઉદાહરણ તબીબી સંશોધક એ તપાસવા માંગે છે કે શું ધૂમ્રપાન અને ધૂમ્રપાન ન કરનારા દર્દીઓના હૃદયના ધબકારા (મિનિટ દીઠ ધબકારાઓની સંખ્યા) વચ્ચે તફાવત છે. બે અવ્યવસ્થિત રીતે પસંદ કરેલા જૂથોના પરિણામો નીચે દર્શાવેલ છે. α = 0.05 નો ઉપયોગ કરીને, ડૉક્ટર સાચા છે કે કેમ તે શોધો. ધૂમ્રપાન કરનારાઓ બિન-ધૂમ્રપાન કરનારાઓ
24 ઇવાનવ ઓ.વી., 2005 સોલ્યુશન પગલું 1. મુખ્ય અને વૈકલ્પિક પૂર્વધારણાઓ: પગલું 2. મહત્વ સ્તર = 0.05 સેટ છે. પગલું 3. અંશ 25 અને છેદ 17 ની સ્વતંત્રતાની ડિગ્રીની સંખ્યા માટે કોષ્ટકનો ઉપયોગ કરીને, આપણે નિર્ણાયક મૂલ્ય f = 2.19 અને નિર્ણાયક પ્રદેશ શોધીએ છીએ: f > 2.19. પગલું 4. નમૂનાનો ઉપયોગ કરીને, અમે આંકડાકીય મૂલ્યની ગણતરી કરીએ છીએ: 2.19. પગલું 4. નમૂનાનો ઉપયોગ કરીને, અમે આંકડાકીય મૂલ્યની ગણતરી કરીએ છીએ: ">
નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 સમાન શેરની પૂર્વધારણા સમસ્યાનું નિવેદન પૂર્વધારણા અને આંકડા ક્રિયાઓનો ક્રમ ઉદાહરણ
27 ઇવાનવ ઓ.વી., 2005 પ્રશ્ન સમાજશાસ્ત્ર ફેકલ્ટીના 100 અવ્યવસ્થિત રીતે પસંદ કરાયેલા વિદ્યાર્થીઓમાંથી, 43 વિશેષ અભ્યાસક્રમોમાં હાજરી આપે છે. 200 અવ્યવસ્થિત રીતે પસંદ કરાયેલ અર્થશાસ્ત્રના વિદ્યાર્થીઓમાંથી, 90 વિશેષ અભ્યાસક્રમોમાં હાજરી આપે છે. શું સમાજશાસ્ત્ર અને અર્થશાસ્ત્ર વિભાગો વચ્ચે વિશેષ અભ્યાસક્રમોમાં હાજરી આપતા વિદ્યાર્થીઓનું પ્રમાણ અલગ છે? તે નોંધપાત્ર રીતે અલગ હોય તેવું લાગતું નથી. હું આ કેવી રીતે તપાસી શકું? વિશેષ અભ્યાસક્રમોમાં ભાગ લેનારાઓનો હિસ્સો એ વિશેષતાનો હિસ્સો છે. 43 - "સફળતાઓ" ની સંખ્યા. 43/100 - સફળતાનો હિસ્સો. પરિભાષા બર્નૌલીની યોજના જેવી જ છે.
28 ઇવાનવ ઓ.વી., 2005 અમારી પાસે શું છે સમસ્યાનું વર્ણન 1. બે સામાન્ય રીતે વિતરિત વસ્તીમાંથી મેળવેલ બે સરળ રેન્ડમ નમૂનાઓ. નમૂનાઓ સ્વતંત્ર છે. 2. નમૂનાઓ માટે, np 5 અને nq 5 પૂરા થાય છે આનો અર્થ એ છે કે નમૂનાના ઓછામાં ઓછા 5 તત્વોમાં અભ્યાસ કરેલ લાક્ષણિક મૂલ્ય છે, અને ઓછામાં ઓછા 5 નથી. અમે જે ઇચ્છીએ છીએ તે બે સામાન્ય વસ્તીમાં લાક્ષણિકતાના શેરની સમાનતા વિશેની પૂર્વધારણાને ચકાસવા માટે છે:
31 ઇવાનવ ઓ.વી., 2005 ઉદાહરણ. બે ફેકલ્ટીના વિશેષ અભ્યાસક્રમો સમાજશાસ્ત્ર ફેકલ્ટીના 100 અવ્યવસ્થિત રીતે પસંદ કરાયેલા વિદ્યાર્થીઓમાંથી, 43 વિશેષ અભ્યાસક્રમોમાં હાજરી આપે છે. અર્થશાસ્ત્રના 200 વિદ્યાર્થીઓમાંથી 90 વિશેષ અભ્યાસક્રમોમાં હાજરી આપે છે. મહત્વના સ્તરે = 0.05, પૂર્વધારણાનું પરીક્ષણ કરો કે આ બે ફેકલ્ટીઓમાં વિશેષ અભ્યાસક્રમોમાં હાજરી આપતા વિદ્યાર્થીઓના પ્રમાણ વચ્ચે કોઈ તફાવત નથી.
33 Ivanov O.V., 2005 સોલ્યુશન પગલું 1. મુખ્ય અને વૈકલ્પિક પૂર્વધારણાઓ: પગલું 2. મહત્વ સ્તર = 0.05 સેટ છે. પગલું 3. સામાન્ય વિતરણ કોષ્ટકનો ઉપયોગ કરીને, અમે નિર્ણાયક મૂલ્યો z = – 1.96 અને z = 1.96 શોધીએ છીએ, અને નિર્ણાયક પ્રદેશનું નિર્માણ કરીએ છીએ: z 1.96. પગલું 4. નમૂનાના આધારે, અમે આંકડાઓની કિંમતની ગણતરી કરીએ છીએ.
34 ઇવાનવ ઓ.વી., 2005 સોલ્યુશન પગલું 5. પ્રાપ્ત મૂલ્યની નિર્ણાયક પ્રદેશ સાથે સરખામણી કરો. પરિણામી આંકડાકીય મૂલ્ય નિર્ણાયક ક્ષેત્રની અંદર આવતું નથી. પગલું 6. નિષ્કર્ષ ઘડવો. મુખ્ય પૂર્વધારણાને નકારવાનું કોઈ કારણ નથી. વિશેષ અભ્યાસક્રમોમાં ભાગ લેનારાઓનો હિસ્સો આંકડાકીય રીતે નોંધપાત્ર રીતે અલગ નથી.
નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 નવેમ્બર 5, 2012 પ્રમાણના તફાવત માટે વિશ્વાસ અંતરાલ સમસ્યાનું નિવેદન આત્મવિશ્વાસ અંતરાલ બનાવવા માટેની પદ્ધતિ
બે સ્વતંત્ર નમૂનાઓ ધ્યાનમાં લો x 1, x 2, ….., x n અને y 1, y 2, …, y n, સમાન ભિન્નતા સાથે સામાન્ય વસ્તીમાંથી કાઢવામાં આવે છે, નમૂનાના કદ n અને m, અનુક્રમે, અને સરેરાશ μ x, μy અને વિચલન σ 2 અજ્ઞાત છે. સ્પર્ધાત્મક H 1: μ x μy સાથે મુખ્ય પૂર્વધારણા H 0: μ x = μy નું પરીક્ષણ કરવું જરૂરી છે.
જેમ જાણીતું છે, નમૂનાની સરેરાશમાં નીચેના ગુણધર્મો હશે: ~N(μ x, σ 2 /n), ~N(μy, σ 2 /m). તેમનો તફાવત સરેરાશ સાથે સામાન્ય મૂલ્ય છે
~ (23).
અને તફાવત, તેથી ચાલો એક ક્ષણ માટે માની લઈએ કે મુખ્ય પૂર્વધારણા H 0 સાચી છે: μ x – μ y =0. પછી અને મૂલ્યને તેના પ્રમાણભૂત વિચલન દ્વારા વિભાજીત કરીને, અમે પ્રમાણભૂત સામાન્ય sl મેળવીએ છીએ. કદ
~N(0,1). તે અગાઉ નોંધ્યું હતું કે તીવ્રતા સ્વતંત્રતાની (n-1)મી ડિગ્રી સાથે કાયદા અનુસાર વિતરિત, a - સ્વતંત્રતાની (m-1) ડિગ્રી સાથે કાયદા અનુસાર. આ બે રકમોની સ્વતંત્રતાને ધ્યાનમાં લેતા, આપણે શોધીએ છીએ કે તે છે કુલ રકમ
સ્વતંત્રતાના n+m-2 ડિગ્રી સાથે કાયદા અનુસાર વિતરિત. સ્વતંત્રતાના ν=m+n-2 ડિગ્રી સાથે t-વિતરણ (વિદ્યાર્થી) નું પાલન કરે છે: Z=t. આ હકીકત ત્યારે જ થાય છે જ્યારે પૂર્વધારણા H 0 સાચી હોય.
ξ અને Q ને તેમના અભિવ્યક્તિઓ સાથે બદલીને, અમે Z માટે વિસ્તૃત સૂત્ર મેળવીએ છીએ:
(24)
આગળનું Z મૂલ્ય, જેને માપદંડ આંકડા કહે છે, તમને નીચેની ક્રિયાઓના ક્રમ સાથે નિર્ણય લેવાની મંજૂરી આપે છે:
1. વિસ્તાર D=[-t β,ν , +t β,ν ] સ્થાપિત થયેલ છે, જેમાં t ν વિતરણ વળાંક (કોષ્ટક 10) હેઠળ β=1–α વિસ્તારો છે.
2. આંકડાઓ Z પર પ્રાયોગિક મૂલ્ય Z ની ગણતરી સૂત્ર (24) નો ઉપયોગ કરીને કરવામાં આવે છે, જેના માટે ચોક્કસ નમૂનાઓના મૂલ્યો x 1 અને y 1, તેમજ તેમના નમૂનાનો અર્થ અને , X 1 અને Y 1 ને બદલે બદલવામાં આવે છે. .
3. જો D પર Z, તો પૂર્વધારણા H 0 એ પ્રાયોગિક ડેટાનો વિરોધાભાસ ન હોવાનું માનવામાં આવે છે અને તેને સ્વીકારવામાં આવે છે.
જો D પર Z, તો પૂર્વધારણા H 1 સ્વીકારવામાં આવે છે.
જો પૂર્વધારણા H 0 સાચી હોય, તો Z એ શૂન્ય સરેરાશ સાથે જાણીતા t ν - વિતરણનું પાલન કરે છે અને ઉચ્ચ સંભાવના સાથે β = 1–α એ પૂર્વધારણા H 0 ની સ્વીકૃતિના D- પ્રદેશમાં આવે છે. જ્યારે અવલોકન કરેલ, ઝોનનું પ્રાયોગિક મૂલ્ય D માં આવે છે. અમે તેને H 0 ની પૂર્વધારણાની તરફેણમાં પુરાવા તરીકે માનીએ છીએ.
જ્યારે Z 0 n એ D ની બહાર આવેલું છે (જેમ કે તેઓ કહે છે, K ના નિર્ણાયક પ્રદેશમાં આવેલું છે), જે સ્વાભાવિક છે જો પૂર્વધારણા H 1 સાચી હોય, પરંતુ અસંભવિત જો H 0 સાચી હોય, તો પછી આપણે H 0 ને સ્વીકારીને જ પૂર્વધારણાને નકારી શકીએ. એચ 1 .
ઉદાહરણ 31.
ગેસોલિનના બે ગ્રેડની સરખામણી કરવામાં આવે છે. સમાન પાવરના 11 વાહનો પર, એક વખત ગોળાકાર ચેસીસ પર ગ્રેડ A અને B ગેસોલિનનું પરીક્ષણ કરવામાં આવ્યું હતું અને એક કાર રસ્તામાં તૂટી ગઈ હતી અને તેના માટે ગેસોલિન B પર કોઈ ડેટા નથી.
100 કિમી દીઠ ગેસોલિન વપરાશ
કોષ્ટક 12
i | ||||||||||||
X i | 10,51 | 11,86 | 10,5 | 9,1 | 9,21 | 10,74 | 10,75 | 10,3 | 11,3 | 11,8 | 10,9 | n=11 |
યુ i | 13,22 | 13,0 | 11,5 | 10,4 | 11,8 | 11,6 | 10,64 | 12,3 | 11,1 | 11,6 | - | m=10 |
ગેસોલિન ગ્રેડ A અને B ના વપરાશમાં તફાવત અજ્ઞાત છે અને તે સમાન હોવાનું માનવામાં આવે છે. શું α=0.05 ના મહત્વના સ્તરે, આ પ્રકારની ગેસોલિનની સાચી સરેરાશ કિંમત μ A અને μ B સમાન છે તેવી પૂર્વધારણા સ્વીકારવી શક્ય છે?
ઉકેલ. હરીફ સાથે H 0: μ A -μ B = 0 પૂર્વધારણાનું પરીક્ષણ કરવું. H 1:μ 1 μ 2 નીચે મુજબ કરો:
1. નમૂનાનો અર્થ અને વર્ગ વિચલનોનો સરવાળો શોધો Q.
;
;
2. Z આંકડાઓના પ્રાયોગિક મૂલ્યની ગણતરી કરો
3. t-વિતરણના કોષ્ટક 10માંથી આપણે સ્વતંત્રતાની ડિગ્રીની સંખ્યા માટે t β,ν મર્યાદા શોધીએ છીએ ν=m+n–2=19 અને β=1–α=0.95. કોષ્ટક 10 માં t 0.95.20 =2.09 અને t 0.95.15 =2.13 છે, પરંતુ t 0.95.19 નથી. અમે પ્રક્ષેપ દ્વારા શોધીએ છીએ t 0.95.19 =2.09+ =2.10.
4. તપાસો કે બેમાંથી કયા ક્ષેત્રમાં D અથવા K નંબર ઝોન ધરાવે છે. ઝોન=-2.7 ડી=[-2.10; -2.10].
Z પરનું અવલોકન કરેલ મૂલ્ય નિર્ણાયક પ્રદેશમાં આવેલ હોવાથી, K = R\D, અમે તેને કાઢી નાખીએ છીએ. H 0 અને પૂર્વધારણા H 1 સ્વીકારો. આ કિસ્સામાં, તેઓ કહે છે કે તેમનો તફાવત નોંધપાત્ર છે. જો, આ ઉદાહરણની બધી શરતો હેઠળ, ફક્ત Q બદલાયો હોત, કહો, Q બમણું થયું હોત, તો અમારું નિષ્કર્ષ બદલાઈ ગયું હોત. Qને બમણું કરવાથી પરિબળ દ્વારા ઝોનના મૂલ્યમાં ઘટાડો થશે, અને પછી Zon સંખ્યા સ્વીકાર્ય પ્રદેશ Dમાં આવશે, જેથી H 0 ની પૂર્વધારણા કસોટી પર ઊતરી જશે અને સ્વીકારવામાં આવશે. આ કિસ્સામાં, અને વચ્ચેની વિસંગતતા માહિતીના કુદરતી પ્રસાર દ્વારા સમજાવવામાં આવશે, અને એ હકીકત દ્વારા નહીં કે μ A μ B.
પૂર્વધારણા પરીક્ષણનો સિદ્ધાંત ખૂબ વ્યાપક છે; પૂર્વધારણાઓ વિતરણ કાયદાના પ્રકાર વિશે, નમૂનાઓની એકરૂપતા વિશે, આગામી જથ્થાઓની સ્વતંત્રતા વિશે, વગેરે વિશે હોઈ શકે છે.
માપદંડ c 2 (પિયરસન)
સરળ પૂર્વધારણાના પરીક્ષણ માટે વ્યવહારમાં સૌથી સામાન્ય માપદંડ. જ્યારે વિતરણ કાયદો અજાણ હોય ત્યારે લાગુ થાય છે. રેન્ડમ ચલ X ને ધ્યાનમાં લો જેની ઉપર n સ્વતંત્ર પરીક્ષણો. અનુભૂતિ x 1, x 2,...,x n પ્રાપ્ત થાય છે. આ રેન્ડમ ચલના વિતરણ કાયદા વિશેની પૂર્વધારણાને ચકાસવી જરૂરી છે.
ચાલો એક સરળ પૂર્વધારણાના કેસને ધ્યાનમાં લઈએ. એક સરળ પૂર્વધારણા સામાન્ય રીતે વિતરિત (જાણીતી) વસ્તી સાથેના નમૂનાના ફિટનું પરીક્ષણ કરે છે. અમે નમૂનાઓ અનુસાર બનાવીએ છીએ વિવિધતા શ્રેણી x (1), x (2), ..., x (n) . અમે અંતરાલને પેટા અંતરાલોમાં વિભાજીત કરીએ છીએ. આ અંતરાલોને r થવા દો. પછી આપણે સંભાવના શોધીશું કે X, પરીક્ષણના પરિણામે, અંતરાલ Di, i=1 ,..., r માં આવશે જો પરીક્ષણ કરવામાં આવી રહેલી પૂર્વધારણા સાચી છે.
માપદંડ સંભાવના ઘનતાના સત્યને તપાસતો નથી, પરંતુ સંખ્યાઓની સત્યતા તપાસે છે
દરેક અંતરાલ Di સાથે આપણે એક રેન્ડમ ઘટના A i - આ અંતરાલમાં એક હિટ (D માં તેના અમલીકરણના પરિણામના X પર પરીક્ષણના પરિણામે હિટ) જોડીએ છીએ. ચાલો રેન્ડમ ચલોનો પરિચય કરીએ. m i એ n માંથી લેવાયેલ પરીક્ષણોની સંખ્યા છે જેમાં ઘટના A i બની હતી. m i દ્વિપદી કાયદા અનુસાર વિતરિત કરવામાં આવે છે અને જો પૂર્વધારણા સાચી હોય
Dm i =np i (1-p i)
માપદંડ c 2 ફોર્મ ધરાવે છે
p 1 +p 2 +...p r =1
m 1 +m 2 +...m r =n
જો ચકાસવામાં આવી રહેલી પૂર્વધારણા સાચી હોય, તો m i એ ઘટનાની ઘટનાની આવર્તન રજૂ કરે છે કે જેની દરેક n ટ્રાયલમાં સંભાવના pi હોય, તેથી, અમે m i ને બિંદુ npi પર કેન્દ્રિત દ્વિપદી કાયદાના રેન્ડમ ચલ વિષય તરીકે ગણી શકીએ. જ્યારે n મોટું હોય, ત્યારે આપણે ધારી શકીએ કે આવર્તન સમાન પરિમાણો સાથે અસમપ્રમાણ રીતે સામાન્ય રીતે વિતરિત કરવામાં આવે છે. જો પૂર્વધારણા સાચી હોય, તો આપણે અપેક્ષા રાખવી જોઈએ કે તેઓ અસમપ્રમાણ રૂપે સામાન્ય રીતે વિતરિત કરવામાં આવશે
સંબંધ દ્વારા એકબીજા સાથે જોડાયેલા
નમૂનાના ડેટા m 1 +m 2 +...m r અને સૈદ્ધાંતિક np 1 +np 2 +...np r વચ્ચેના વિસંગતતાના માપ તરીકે, મૂલ્યને ધ્યાનમાં લો
c 2 - એસિમ્પટોટિકલી સામાન્ય જથ્થાના વર્ગોનો સરવાળો સંકળાયેલ છે રેખીય અવલંબન. અમે અગાઉ સમાન કેસનો સામનો કર્યો છે અને જાણીએ છીએ કે રેખીય જોડાણની હાજરીને કારણે સ્વતંત્રતાની ડિગ્રીની સંખ્યામાં એક દ્વારા ઘટાડો થયો છે.
જો ચકાસવામાં આવી રહેલી પૂર્વધારણા સાચી હોય, તો માપદંડ c 2 એક વિતરણ ધરાવે છે જે સ્વતંત્રતાના r-1 ડિગ્રી સાથે c 2 ના વિતરણ માટે n®¥ તરીકે વલણ ધરાવે છે.
ચાલો ધારીએ કે પૂર્વધારણા ખોટી છે. પછી સરવાળોની શરતોમાં વધારો થવાનું વલણ છે, એટલે કે. જો પૂર્વધારણા ખોટી છે, તો આ રકમ c 2 ના મોટા મૂલ્યોના ચોક્કસ ક્ષેત્રમાં આવશે. નિર્ણાયક પ્રદેશ તરીકે, અમે માપદંડના હકારાત્મક મૂલ્યોના પ્રદેશને લઈએ છીએ
|
અજ્ઞાત વિતરણ પરિમાણોના કિસ્સામાં, દરેક પરિમાણ પીયર્સન માપદંડ માટે સ્વતંત્રતાની ડિગ્રીની સંખ્યાને એકથી ઘટાડે છે.
8.1. આશ્રિત અને સ્વતંત્ર નમૂનાઓનો ખ્યાલ.
પૂર્વધારણા ચકાસવા માટે માપદંડ પસંદ કરી રહ્યા છીએ
વિચારણા હેઠળના નમૂનાઓ આશ્રિત છે કે સ્વતંત્ર છે તેના દ્વારા પ્રાથમિક રીતે નિર્ધારિત કરવામાં આવે છે. ચાલો અનુરૂપ વ્યાખ્યાઓ રજૂ કરીએ.
ડેફ.નમૂનાઓ બોલાવવામાં આવે છે સ્વતંત્ર, જો પ્રથમ નમૂનામાં એકમો પસંદ કરવાની પ્રક્રિયા બીજા નમૂનામાં એકમો પસંદ કરવાની પ્રક્રિયા સાથે કોઈ રીતે જોડાયેલી નથી.
બે સ્વતંત્ર નમૂનાઓનું ઉદાહરણ એક જ એન્ટરપ્રાઈઝ (સમાન ઉદ્યોગમાં, વગેરે) પર કામ કરતા પુરુષો અને સ્ત્રીઓના ઉપરોક્ત નમૂનાઓ હશે.
નોંધ કરો કે બે નમૂનાઓની સ્વતંત્રતાનો અર્થ એ નથી કે આ નમૂનાઓની ચોક્કસ પ્રકારની સમાનતા (તેમની એકરૂપતા) માટે કોઈ આવશ્યકતા નથી. આમ, પુરુષો અને સ્ત્રીઓની આવકના સ્તરનો અભ્યાસ કરતી વખતે, અમે એવી પરિસ્થિતિને મંજૂરી આપીએ તેવી શક્યતા નથી કે જ્યાં મોસ્કોના ઉદ્યોગપતિઓમાંથી પુરુષો અને ઑસ્ટ્રેલિયાના આદિવાસીઓમાંથી સ્ત્રીઓની પસંદગી કરવામાં આવે. સ્ત્રીઓ પણ Muscovites અને વધુમાં, "વ્યાપારી મહિલા" હોવી જોઈએ. પરંતુ અહીં આપણે નમૂનાઓની અવલંબન વિશે વાત કરી રહ્યા નથી, પરંતુ પદાર્થોની અભ્યાસ કરેલ વસ્તીની એકરૂપતાની આવશ્યકતા વિશે, જે સમાજશાસ્ત્રીય ડેટા એકત્રિત કરતી વખતે અને વિશ્લેષણ કરતી વખતે સંતુષ્ટ થવી જોઈએ.
ડેફ.નમૂનાઓ બોલાવવામાં આવે છે આશ્રિત, અથવા જોડી,જો એક નમૂનાનું દરેક એકમ બીજા નમૂનાના ચોક્કસ એકમ સાથે "લિંક" હોય.
જો આપણે આશ્રિત નમૂનાઓનું ઉદાહરણ આપીએ તો આ છેલ્લી વ્યાખ્યા કદાચ વધુ સ્પષ્ટ થઈ જશે.
ધારો કે આપણે એ જાણવા માગીએ છીએ કે પિતાની સામાજિક સ્થિતિ, સરેરાશ, પુત્રના સામાજિક દરજ્જા કરતા ઓછી છે કે કેમ (અમે માનીએ છીએ કે આપણે આ જટિલ અને અસ્પષ્ટ રીતે સમજી શકીએ છીએ. સામાજિક લાક્ષણિકતાઓવ્યક્તિ). તે સ્પષ્ટ લાગે છે કે આવી પરિસ્થિતિમાં ઉત્તરદાતાઓની જોડી (પિતા, પુત્ર) પસંદ કરવાની સલાહ આપવામાં આવે છે અને માની લો કે પ્રથમ નમૂનાના દરેક તત્વ (પિતામાંથી એક) બીજા નમૂનાના ચોક્કસ તત્વ સાથે "બંધાયેલ" છે (તેના પુત્ર). આ બે નમૂનાઓ નિર્ભર કહેવાશે.
8.2. સ્વતંત્ર નમૂનાઓ માટે પૂર્વધારણા પરીક્ષણ
માટે સ્વતંત્રનમૂનાઓ, માપદંડની પસંદગી તેના પર આધાર રાખે છે કે શું આપણે અભ્યાસ કરી રહેલા નમૂનાઓ માટે વિચારણા હેઠળની લાક્ષણિકતાના સામાન્ય ભિન્નતા s 1 2 અને s 2 2 જાણીએ છીએ. અમે આ સમસ્યાને ઉકેલી ગણીશું, એમ માનીને કે નમૂનાના ભિન્નતા સામાન્ય મુદ્દાઓ સાથે સુસંગત છે. આ કિસ્સામાં, માપદંડ એ મૂલ્ય છે:
જ્યારે સામાન્ય ભિન્નતાઓ (અથવા તેમાંથી ઓછામાં ઓછું એક) અમને અજાણ હોય ત્યારે પરિસ્થિતિની ચર્ચા કરવા આગળ વધતા પહેલા, અમે નીચેની નોંધ કરીએ છીએ.
માપદંડ (8.1) નો ઉપયોગ કરવાનો તર્ક એ "ચી-સ્ક્વેર" માપદંડ (7.2) ને ધ્યાનમાં લેતી વખતે અમે વર્ણવેલ તેના જેવું જ છે. માત્ર એક જ મૂળભૂત તફાવત છે. માપદંડ (7.2) ના અર્થ વિશે બોલતા, અમે n કદના નમૂનાઓની અસંખ્ય સંખ્યા ધ્યાનમાં લીધી, જે અમારી સામાન્ય વસ્તીમાંથી "દોરી" છે. અહીં, માપદંડ (8.1) ના અર્થનું વિશ્લેષણ કરીને, અમે અનંત સંખ્યાને ધ્યાનમાં લઈએ છીએ. વરાળકદ n 1 અને n 2 ના નમૂનાઓ. દરેક જોડી માટે, ફોર્મના આંકડા (8.1) ગણવામાં આવે છે. આવા આંકડાઓના પ્રાપ્ત મૂલ્યોનો સમૂહ, અમારા સંકેત અનુસાર, સામાન્ય વિતરણને અનુરૂપ છે (જેમ કે અમે સંમત થયા છીએ, અક્ષર z નો ઉપયોગ આવા માપદંડને દર્શાવવા માટે થાય છે કે જે સામાન્ય વિતરણને અનુરૂપ છે).
તેથી, જો સામાન્ય ભિન્નતાઓ અમને અજાણ હોય, તો અમને તેના બદલે તેમના નમૂના અંદાજ s 1 2 અને s 2 2 નો ઉપયોગ કરવાની ફરજ પડી છે. જો કે, આ કિસ્સામાં, સામાન્ય વિતરણને વિદ્યાર્થી વિતરણ દ્વારા બદલવું જોઈએ - z ને t દ્વારા બદલવું જોઈએ (જેમ કે ગાણિતિક અપેક્ષા માટે આત્મવિશ્વાસ અંતરાલ બાંધતી વખતે સમાન પરિસ્થિતિમાં હતો). જો કે, પૂરતા પ્રમાણમાં મોટા નમૂનાના કદ સાથે (n 1, n 2 ³ 30), જેમ આપણે પહેલાથી જ જાણીએ છીએ, વિદ્યાર્થી વિતરણ વ્યવહારીક રીતે સામાન્ય સાથે એકરુપ છે. બીજા શબ્દોમાં કહીએ તો, મોટા નમૂનાઓ સાથે આપણે માપદંડનો ઉપયોગ કરવાનું ચાલુ રાખી શકીએ છીએ:
જ્યારે તફાવતો અજાણ્યા હોય અને ઓછામાં ઓછા એક નમૂનાનું કદ નાનું હોય ત્યારે પરિસ્થિતિ વધુ જટિલ હોય છે. પછી અન્ય પરિબળ રમતમાં આવે છે. માપદંડનો પ્રકાર તેના પર આધાર રાખે છે કે શું આપણે બે વિશ્લેષિત નમૂનાઓમાં વિચારણા હેઠળની લાક્ષણિકતાના અજાણ્યા ભિન્નતાને સમાન ગણી શકીએ. શોધવા માટે, આપણે પૂર્વધારણાને ચકાસવાની જરૂર છે:
H 0: s 1 2 = s 2 2. (8.3)
આ પૂર્વધારણાને ચકાસવા માટે, માપદંડનો ઉપયોગ કરવામાં આવે છે
આ માપદંડનો ઉપયોગ કરવાની વિશિષ્ટતાઓ વિશે અમે વાત કરીશુંનીચે, અને હવે અમે ગાણિતિક અપેક્ષાઓની સમાનતા વિશે અનુમાનોને ચકાસવા માટે ઉપયોગમાં લેવાતા માપદંડને પસંદ કરવા માટેના અલ્ગોરિધમની ચર્ચા કરવાનું ચાલુ રાખીશું.
જો પૂર્વધારણા (8.3) નકારવામાં આવે છે, તો પછી અમને રસનો માપદંડ આ સ્વરૂપ લે છે:
(8.5)
(એટલે કે, તે માપદંડ (8.2) થી અલગ છે, જેનો ઉપયોગ મોટા નમૂનાઓ માટે કરવામાં આવ્યો હતો, જેમાં સંબંધિત આંકડામાં સામાન્ય વિતરણ નથી, પરંતુ વિદ્યાર્થી વિતરણ છે). જો પૂર્વધારણા (8.3) સ્વીકારવામાં આવે છે, તો પછી વપરાયેલ માપદંડનો પ્રકાર બદલાય છે:
(8.6)
ચાલો આપણે સારાંશ આપીએ કે બે સ્વતંત્ર નમૂનાઓના વિશ્લેષણના આધારે સામાન્ય ગાણિતિક અપેક્ષાઓની સમાનતા વિશેની પૂર્વધારણાને ચકાસવા માટે માપદંડ કેવી રીતે પસંદ કરવામાં આવે છે.
જાણીતું
અજ્ઞાત
નમૂનાનું કદ મોટું છે
H 0: s 1 = s 2 નકારેલ
સ્વીકાર્યું
8.3. આશ્રિત નમૂનાઓ માટે પૂર્વધારણા પરીક્ષણ
ચાલો આશ્રિત નમૂનાઓને ધ્યાનમાં લેવા આગળ વધીએ. સંખ્યાઓનો ક્રમ ચાલો
X 1, X 2, …, X n;
Y 1 , Y 2 , … , Y n –
આ બે આશ્રિત નમૂનાઓના ઘટકો માટે રેન્ડમ ગણવામાં આવતા મૂલ્યો છે. ચાલો નોટેશન રજૂ કરીએ:
D i = X i - Y i , i = 1, ... , n.
માટે આશ્રિતનમૂના માપદંડ જે તમને પૂર્વધારણાનું પરીક્ષણ કરવાની મંજૂરી આપે છે
આના જેવો દેખાય છે:
નોંધ કરો કે s D માટે હમણાં જ આપેલ અભિવ્યક્તિ એ નવી અભિવ્યક્તિ કરતાં વધુ કંઈ નથી પ્રખ્યાત સૂત્ર, પ્રમાણભૂત વિચલન વ્યક્ત કરે છે. આ કિસ્સામાં આપણે D i ના મૂલ્યોના પ્રમાણભૂત વિચલન વિશે વાત કરી રહ્યા છીએ. સમાન ફોર્મ્યુલાનો ઉપયોગ વ્યવહારમાં ઘણી વખત સરળ તરીકે થાય છે (સંબંધિત અંકગણિત સરેરાશથી વિચારણા હેઠળના મૂલ્યોના વર્ગ વિચલનોના સરવાળાની "હેડ-ઓન" ગણતરીની તુલનામાં) વિક્ષેપની ગણતરી કરવાની પદ્ધતિ.
જો આપણે વિશ્વાસ અંતરાલના નિર્માણના સિદ્ધાંતોની ચર્ચા કરતી વખતે ઉપરોક્ત સૂત્રોની તુલના કરીએ, તો તે નોંધવું સરળ છે કે આશ્રિત નમૂનાઓના કિસ્સામાં અર્થની સમાનતાની પૂર્વધારણાનું પરીક્ષણ કરવું આવશ્યકપણે ગાણિતિક અપેક્ષાની સમાનતાનું પરીક્ષણ કરે છે. મૂલ્યો D i થી શૂન્ય. તીવ્રતા
D i માટે પ્રમાણભૂત વિચલન છે. તેથી, માત્ર વર્ણવેલ માપદંડ t n -1 નું મૂલ્ય આવશ્યકપણે પ્રમાણભૂત વિચલનના અપૂર્ણાંક તરીકે દર્શાવવામાં આવેલ D i ના મૂલ્ય જેટલું છે. આપણે ઉપર કહ્યું તેમ (આત્મવિશ્વાસના અંતરાલો બાંધવા માટેની પદ્ધતિઓની ચર્ચા કરતી વખતે), આ સૂચકનો ઉપયોગ માનવામાં આવતા મૂલ્યની સંભાવનાને નક્કી કરવા માટે થઈ શકે છે. તફાવત એ છે કે ઉપર આપણે એક સરળ અંકગણિત સરેરાશ વિશે વાત કરી રહ્યા હતા, સામાન્ય રીતે વિતરિત, અને અહીં આપણે સરેરાશ તફાવતો વિશે વાત કરી રહ્યા છીએ, આવી સરેરાશમાં વિદ્યાર્થી વિતરણ હોય છે. પરંતુ નમૂનાના અંકગણિતના વિચલનની સંભાવના વચ્ચેના સંબંધ વિશેનો તર્ક શૂન્યમાંથી સરેરાશ (સાથે ગાણિતિક અપેક્ષા, શૂન્યની બરાબર) કેટલા એકમો સાથે આ વિચલન અમલમાં રહે છે.
ઉદાહરણ. ચોક્કસ સમયગાળા માટે શહેરના એક માઇક્રોડિસ્ટ્રિક્ટમાં ફાર્મસીઓની આવક 128 જેટલી હતી; 192; 223; 398; 205; 266; 219; 260; 264; 98 (પરંપરાગત એકમો). પડોશી માઇક્રોડિસ્ટ્રિક્ટમાં તે જ સમય માટે તેઓ 286 જેટલા હતા; 240; 263; 266; 484; 223; 335.
બંને નમૂનાઓ માટે, સરેરાશ, સુધારેલ ભિન્નતા અને પ્રમાણભૂત વિચલનની ગણતરી કરો. વિવિધતાની શ્રેણી શોધો, સરેરાશ નિરપેક્ષ (રેખીય) વિચલન, વિવિધતાના ગુણાંક, રેખીય ગુણાંકભિન્નતા, ઓસિલેશન ગુણાંક.
એમ ધારી રહ્યા છીએ કે આ રેન્ડમ ચલસામાન્ય વિતરણ છે, સામાન્ય સરેરાશ (બંને કિસ્સાઓમાં) માટે વિશ્વાસ અંતરાલ નક્કી કરો.
ફિશરની કસોટીનો ઉપયોગ કરીને, સમાનતાની પૂર્વધારણાનું પરીક્ષણ કરો સામાન્ય ભિન્નતા. વિદ્યાર્થીની કસોટીનો ઉપયોગ કરીને, સામાન્ય માધ્યમોની સમાનતા વિશેની પૂર્વધારણા તપાસો (વૈકલ્પિક પૂર્વધારણા તેમની અસમાનતા વિશે છે).
તમામ ગણતરીઓમાં, મહત્વ સ્તર α = 0.05 છે.
અમે કેલ્ક્યુલેટરનો ઉપયોગ કરીને ભિન્નતાની સમાનતાની પૂર્વધારણાનું પરીક્ષણ કરીએ છીએ.
1. પ્રથમ નમૂના માટે વિવિધતા સૂચકાંકો શોધો.
x | |x - x av | | (x - x સરેરાશ) 2 |
98 | 127.3 | 16205.29 |
128 | 97.3 | 9467.29 |
192 | 33.3 | 1108.89 |
205 | 20.3 | 412.09 |
219 | 6.3 | 39.69 |
223 | 2.3 | 5.29 |
260 | 34.7 | 1204.09 |
264 | 38.7 | 1497.69 |
266 | 40.7 | 1656.49 |
398 | 172.7 | 29825.29 |
2253 | 573.6 | 61422.1 |
.
વિવિધતા સૂચકાંકો.
.
R = X મહત્તમ - X મિનિટ
આર = 398 - 98 = 300
સરેરાશ રેખીય વિચલન
શ્રેણીનું દરેક મૂલ્ય 57.36 ની સરેરાશથી બીજા કરતા અલગ પડે છે
વિખેરી નાખવું
નિષ્પક્ષ ભિન્નતા અનુમાનક
.
શ્રેણીનું દરેક મૂલ્ય 225.3 ના સરેરાશ મૂલ્યથી 78.37 ની સરેરાશથી અલગ છે
.
.
વિવિધતાનો ગુણાંક
v>30% થી, પરંતુ v અથવા
ઓસિલેશન ગુણાંક
.
.
વિદ્યાર્થીના ટેબલનો ઉપયોગ કરીને અમને મળે છે:
T ટેબલ (n-1;α/2) = T ટેબલ (9;0.025) = 2.262
(225.3 - 59.09;225.3 + 59.09) = (166.21;284.39)
2. બીજા નમૂના માટે વિવિધતા સૂચકાંકો શોધો.
ચાલો પંક્તિને ક્રમાંક આપીએ. આ કરવા માટે, અમે તેના મૂલ્યોને ચડતા ક્રમમાં સૉર્ટ કરીએ છીએ.
સૂચકોની ગણતરી માટેનું કોષ્ટક.
x | |x - x av | | (x - x સરેરાશ) 2 |
223 | 76.57 | 5863.18 |
240 | 59.57 | 3548.76 |
263 | 36.57 | 1337.47 |
266 | 33.57 | 1127.04 |
286 | 13.57 | 184.18 |
335 | 35.43 | 1255.18 |
484 | 184.43 | 34013.9 |
2097 | 439.71 | 47329.71 |
વિતરણ શ્રેણીનું મૂલ્યાંકન કરવા માટે, અમને નીચેના સૂચકાંકો મળે છે:
વિતરણ કેન્દ્ર સૂચકાંકો.
સરળ અંકગણિત સરેરાશ
વિવિધતા સૂચકાંકો.
સંપૂર્ણ ભિન્નતા.
વિવિધતાની શ્રેણી એ પ્રાથમિક શ્રેણીની લાક્ષણિકતાના મહત્તમ અને લઘુત્તમ મૂલ્યો વચ્ચેનો તફાવત છે.
R = X મહત્તમ - X મિનિટ
આર = 484 - 223 = 261
સરેરાશ રેખીય વિચલન- અભ્યાસ હેઠળની વસ્તીના તમામ એકમોના તફાવતોને ધ્યાનમાં લેવા માટે ગણતરી કરવામાં આવે છે.
શ્રેણીનું દરેક મૂલ્ય 62.82 ની સરેરાશથી બીજા કરતા અલગ પડે છે
વિખેરી નાખવું- તેના સરેરાશ મૂલ્યની આસપાસ વિક્ષેપના માપને લાક્ષણિકતા આપે છે (વિક્ષેપનું માપ, એટલે કે સરેરાશથી વિચલન).
નિષ્પક્ષ ભિન્નતા અનુમાનક- ભિન્નતાનો સુસંગત અંદાજ (સુધારેલ વિચલન).
પ્રમાણભૂત વિચલન.
શ્રેણીનું દરેક મૂલ્ય 299.57 ના સરેરાશ મૂલ્યથી 82.23 ની સરેરાશથી અલગ છે
પ્રમાણભૂત વિચલનનો અંદાજ.
સંબંધિત વિવિધતાના પગલાં.
વિવિધતાના સંબંધિત સૂચકોમાં સમાવેશ થાય છે: ઓસિલેશનના ગુણાંક, વિવિધતાના રેખીય ગુણાંક, સંબંધિત રેખીય વિચલન.
વિવિધતાનો ગુણાંક- વસ્તી મૂલ્યોના સાપેક્ષ વિક્ષેપનું માપ: બતાવે છે કે આ મૂલ્યના સરેરાશ મૂલ્યનું પ્રમાણ તેનું સરેરાશ વિખેરવું છે.
v ≤ 30% થી, વસ્તી સજાતીય છે અને ભિન્નતા નબળી છે. પ્રાપ્ત પરિણામો પર વિશ્વાસ કરી શકાય છે.
વિવિધતાનો રેખીય ગુણાંકઅથવા સંબંધિત રેખીય વિચલન- સરેરાશ મૂલ્યમાંથી સંપૂર્ણ વિચલનોના ચિહ્નના સરેરાશ મૂલ્યના શેરને લાક્ષણિકતા આપે છે.
ઓસિલેશન ગુણાંક- સરેરાશની આસપાસ લાક્ષણિકતાના આત્યંતિક મૂલ્યોના સંબંધિત વધઘટને પ્રતિબિંબિત કરે છે.
વસ્તી કેન્દ્રનો અંતરાલ અંદાજ.
સામાન્ય સરેરાશ માટે વિશ્વાસ અંતરાલ.
વિદ્યાર્થી વિતરણ કોષ્ટકનો ઉપયોગ કરીને t kp મૂલ્ય નક્કી કરો
વિદ્યાર્થીના ટેબલનો ઉપયોગ કરીને અમને મળે છે:
T ટેબલ (n-1;α/2) = T ટેબલ (6;0.025) = 2.447
(299.57 - 82.14;299.57 + 82.14) = (217.43;381.71)
0.95 ની સંભાવના સાથે, એવું કહી શકાય કે મોટા નમૂનાના કદ સાથે સરેરાશ મૂલ્ય મળેલા અંતરાલની બહાર નહીં આવે.
અમે ભિન્નતાની સમાનતાની પૂર્વધારણાનું પરીક્ષણ કરીએ છીએ:
H 0: D x = D y ;
H 1: D x ચાલો ફિશર માપદંડનું અવલોકન કરેલ મૂલ્ય શોધીએ:
ત્યારથી s y 2 > s x 2, પછી s b 2 = s y 2, s m 2 = s x 2
સ્વતંત્રતાની ડિગ્રીની સંખ્યા:
f 1 = n y – 1 = 7 – 1 = 6
f 2 = n x – 1 = 10 – 1 = 9
α = 0.05 ના મહત્વના સ્તરે ફિશર-સ્નેડેકોર વિતરણના નિર્ણાયક બિંદુઓના કોષ્ટકનો ઉપયોગ કરીને અને સ્વતંત્રતાની ડિગ્રીની સંખ્યા આપેલ છે, અમે F cr (6;9) = 3.37 શોધીએ છીએ
કારણ કે F obs અમે સામાન્ય માધ્યમોની સમાનતા વિશેની પૂર્વધારણાનું પરીક્ષણ કરીએ છીએ:
ચાલો વિદ્યાર્થીના માપદંડનું પ્રાયોગિક મૂલ્ય શોધીએ:
સ્વતંત્રતાની ડિગ્રીની સંખ્યા f = n x + n y – 2 = 10 + 7 – 2 = 15
વિદ્યાર્થી વિતરણ કોષ્ટકનો ઉપયોગ કરીને t kp મૂલ્ય નક્કી કરો
વિદ્યાર્થીના ટેબલનો ઉપયોગ કરીને અમને મળે છે:
T ટેબલ (f;α/2) = T ટેબલ (15;0.025) = 2.131
α = 0.05 ના મહત્વના સ્તરે વિદ્યાર્થી વિતરણના નિર્ણાયક બિંદુઓના કોષ્ટકનો ઉપયોગ કરીને અને સ્વતંત્રતાના ડિગ્રીની આપેલ સંખ્યા, અમે tcr = 2.131 શોધીએ છીએ
કારણ કે ટી ઓબીએસ.