بيت التهاب الفم الكثافة الاحتمالية لتقدير التوزيع الموحد. تحويل متغير عشوائي موزع بشكل منتظم إلى متغير موزع بشكل طبيعي

الكثافة الاحتمالية لتقدير التوزيع الموحد. تحويل متغير عشوائي موزع بشكل منتظم إلى متغير موزع بشكل طبيعي

كمثال على المستمر متغير عشوائيالنظر في متغير عشوائي X موزعة بشكل موحد على الفترة (أ، ب). ويقال أن المتغير العشوائي X هو وزعت بالتساوي على الفترة (أ؛ ب)، إذا كانت كثافة التوزيع غير ثابتة على هذه الفترة:

من شرط التطبيع نحدد قيمة الثابت c. يجب أن تكون المساحة الواقعة تحت منحنى كثافة التوزيع مساوية للوحدة، ولكنها في حالتنا هي مساحة مستطيل قاعدته (b - α) وارتفاعه c (الشكل 1).

أرز. 1 كثافة التوزيع الموحدة
ومن هنا نجد قيمة الثابت c:

إذن، كثافة المتغير العشوائي الموزع بشكل منتظم تساوي

دعونا الآن نجد دالة التوزيع باستخدام الصيغة:
1) ل
2) ل
3) لـ 0+1+0=1.
هكذا،

دالة التوزيع مستمرة ولا تتناقص (الشكل 2).

أرز. 2 دالة التوزيع لمتغير عشوائي موزع بشكل موحد

سوف نجد القيمة المتوقعةمتغير عشوائي موزع بشكل موحدوفقا للصيغة:

تشتت التوزيع الموحديتم حسابه بواسطة الصيغة ويساوي

المثال رقم 1. قيمة قسمة المقياس لجهاز القياس هي 0.2. يتم تقريب قراءات الأجهزة إلى أقرب قسم كامل. أوجد احتمال حدوث خطأ أثناء العد: أ) أقل من 0.04؛ ب) كبير 0.02
حل. خطأ التقريب هو متغير عشوائي موزع بشكل موحد على الفاصل الزمني بين أقسام الأعداد الصحيحة المتجاورة. دعونا ننظر في الفاصل الزمني (0؛ 0.2) على هذا النحو التقسيم (الشكل أ). يمكن إجراء التقريب في اتجاه الحد الأيسر - 0، وفي اتجاه اليمين - 0.2، مما يعني أنه يمكن ارتكاب خطأ أقل من أو يساوي 0.04 مرتين، وهو ما يجب أخذه في الاعتبار عند حساب الاحتمال:



ف = 0.2 + 0.2 = 0.4

بالنسبة للحالة الثانية، يمكن أن تتجاوز قيمة الخطأ أيضًا 0.02 على حدي التقسيم، أي أنها يمكن أن تكون إما أكثر من 0.02 أو أقل من 0.18.


ثم احتمال حدوث خطأ مثل هذا:

المثال رقم 2. كان من المفترض أن يتم الحكم على استقرار الوضع الاقتصادي في البلاد (غياب الحروب والكوارث الطبيعية وما إلى ذلك) على مدى الخمسين عامًا الماضية من خلال طبيعة توزيع السكان حسب العمر: في حالة الهدوء يجب أن يكون كذلك زي مُوحد. ونتيجة للدراسة تم الحصول على البيانات التالية لإحدى الدول.

هل هناك أي سبب للاعتقاد بوجود حالة من عدم الاستقرار في البلاد؟

نقوم بتنفيذ الحل باستخدام الآلة الحاسبة اختبار الفرضيات. جدول لحساب المؤشرات.

مجموعاتنقطة منتصف الفاصل الزمني، x iالكمية، وس ط * و طالتردد المتراكم، S|x - x av |*f(س - س متوسط) 2 *والتردد، و أنا / ن
0 - 10 5 0.14 0.7 0.14 5.32 202.16 0.14
10 - 20 15 0.09 1.35 0.23 2.52 70.56 0.09
20 - 30 25 0.1 2.5 0.33 1.8 32.4 0.1
30 - 40 35 0.08 2.8 0.41 0.64 5.12 0.08
40 - 50 45 0.16 7.2 0.57 0.32 0.64 0.16
50 - 60 55 0.13 7.15 0.7 1.56 18.72 0.13
60 - 70 65 0.12 7.8 0.82 2.64 58.08 0.12
70 - 80 75 0.18 13.5 1 5.76 184.32 0.18
1 43 20.56 572 1
مؤشرات مراكز التوزيع.
متوسط ​​الوزن


مؤشرات التباين.
الاختلافات المطلقة.
نطاق التباين هو الفرق بين القيم القصوى والدنيا لخاصية السلسلة الأساسية.
R = X ماكس - X دقيقة
ص = 70 - 0 = 70
تشتت- يميز مقياس التشتت حول قيمته المتوسطة (مقياس التشتت، أي الانحراف عن المتوسط).


الانحراف المعياري.

وتختلف كل قيمة من السلسلة عن القيمة المتوسطة 43 بما لا يزيد عن 23.92
اختبار الفرضيات حول نوع التوزيع.
4. اختبار الفرضية حول توزيع موحدعامه السكان.
من أجل اختبار الفرضية حول التوزيع الموحد لـ X، أي. وفقا للقانون: f(x) = 1/(b-a) في الفترة (a,b)
ضروري:
1. قم بتقدير المعلمات a وb - نهايات الفاصل الزمني الذي القيم الممكنة X، وفقًا للصيغ (تشير العلامة * إلى تقديرات المعلمات):

2. أوجد الكثافة الاحتمالية للتوزيع المتوقع f(x) = 1/(b * - a *)
3. أوجد التكرارات النظرية:
ن 1 = nP 1 = ن = ن*1/(ب * - أ *)*(س 1 - أ *)
n 2 = n 3 = ... = n s-1 = n*1/(b * - a *)*(x i - x i-1)
ن ق = ن*1/(ب * - أ *)*(ب * - س ق-1)
4. قارن بين التكرارات التجريبية والنظرية باستخدام معيار بيرسون، مع أخذ عدد درجات الحرية k = s-3، حيث s هو عدد فترات أخذ العينات الأولية؛ إذا تم تنفيذ مجموعة من الترددات الصغيرة، وبالتالي الفواصل الزمنية نفسها، فإن s هو عدد الفواصل الزمنية المتبقية بعد المجموعة.

حل:
1. ابحث عن تقديرات المعلمات أ * و ب * للتوزيع الموحد باستخدام الصيغ:


2. أوجد كثافة التوزيع الموحد المفترض:
و(س) = 1/(ب * - أ *) = 1/(84.42 - 1.58) = 0.0121
3. لنجد التكرارات النظرية:
ن 1 = ن*و(س)(س 1 - أ *) = 1 * 0.0121(10-1.58) = 0.1
ن 8 = ن*و(س)(ب * - س 7) = 1 * 0.0121(84.42-70) = 0.17
ما تبقى من n s سيكون مساوياً لـ:
ن ق = ن*و(س)(س ط - س ط-1)

أنان طن * طن ط - ن * ط(ن ط - ن * ط) 2(ن ط - ن * ط) 2 /ن * ط
1 0.14 0.1 0.0383 0.00147 0.0144
2 0.09 0.12 -0.0307 0.000943 0.00781
3 0.1 0.12 -0.0207 0.000429 0.00355
4 0.08 0.12 -0.0407 0.00166 0.0137
5 0.16 0.12 0.0393 0.00154 0.0128
6 0.13 0.12 0.0093 8.6E-5 0.000716
7 0.12 0.12 -0.000701 0 4.0E-6
8 0.18 0.17 0.00589 3.5E-5 0.000199
المجموع 1 0.0532
دعونا نحدد حدود المنطقة الحرجة. وبما أن إحصائية بيرسون تقيس الفرق بين التوزيعات التجريبية والنظرية، فكلما زادت قيمتها المرصودة K obs، أصبحت الحجة ضد الفرضية الرئيسية أقوى.
لذلك، فإن المنطقة الحرجة لهذه الإحصائية تكون دائمًا يمينًا: إذا كانت كثافة احتمالها ثابتة على هذا المقطع، وخارجها تساوي 0 (أي متغير عشوائي) Xتركزت على الجزء [ أ, ب]، حيث تكون كثافته ثابتة). بواسطة هذا التعريفالكثافة موزعة بشكل موحد على القطعة [ أ, ب] متغير عشوائي Xلديه النموذج:

أين معهناك عدد معين. ومع ذلك، فمن السهل العثور عليها باستخدام خاصية الكثافة الاحتمالية للمتغيرات العشوائية المركزة على المقطع [ أ, ب]:
. إنه يتبع هذا
، أين
. ولذلك، فإن الكثافة موزعة بشكل موحد على القطعة [ أ, ب] متغير عشوائي Xلديه النموذج:

.

الحكم على توحيد توزيع nsv. Xممكن من الاعتبارات التالية. المتغير العشوائي المستمر له توزيع موحدعلى المقطع [ أ, ب]، إذا كان يأخذ قيماً من هذه القطعة فقط، وأي رقم من هذه القطعة ليس له أفضلية على الأرقام الأخرى في هذه القطعة بمعنى أنه قادر على أن يكون قيمة لهذا المتغير العشوائي.

تتضمن المتغيرات العشوائية التي لها توزيع موحد قيمًا مثل وقت انتظار النقل عند المحطة (مع فاصل زمني ثابت لحركة المرور، يتم توزيع مدة الانتظار بشكل موحد على هذا الفاصل الزمني)، والخطأ في تقريب الرقم إلى عدد صحيح (بشكل موحد موزعة على [−0.5 , 0.5 ]) و اخرين.

نوع وظيفة التوزيع F(س) أ, ب] متغير عشوائي Xبحثت عن طريق الكثافة الاحتمالية المعروفة F(س) باستخدام الصيغة للاتصال بهم
. ونتيجة للحسابات المقابلة، نحصل على الصيغة التالية لوظيفة التوزيع F(س) قطعة موزعة بشكل موحد [ أ, ب] متغير عشوائي X :

.

توضح الأشكال الرسوم البيانية للكثافة الاحتمالية F(س) ووظائف التوزيع F(س) قطعة موزعة بشكل موحد [ أ, ب] متغير عشوائي X :


التوقع والتباين والانحراف المعياري والوضع والوسيط لقطعة موزعة بشكل موحد [ أ, ب] متغير عشوائي Xتحسب بواسطة كثافة الاحتمال F(س) بالطريقة المعتادة (وبكل بساطة لأنه نوع بسيط F(س) ). والنتيجة هي الصيغ التالية:

والموضة د(X) هو أي رقم في الفترة [ أ, ب].

دعونا نجد احتمال ضرب قطعة موزعة بشكل موحد [ أ, ب] متغير عشوائي Xفي الفاصل الزمني
، مستلقيًا تمامًا في الداخل [ أ, ب]. وبأخذ الشكل المعروف لدالة التوزيع نحصل على:

وبالتالي، فإن احتمال ضرب قطعة موزعة بشكل موحد [ أ, ب] متغير عشوائي Xفي الفاصل الزمني
، مستلقيًا تمامًا في الداخل [ أ, ب]، لا يعتمد على موضع هذا الفاصل، بل يعتمد فقط على طوله ويتناسب طرديًا مع هذا الطول.

مثال. الفاصل الزمني للحافلة هو 10 دقائق. ما هو احتمال أن ينتظر الراكب الذي يصل إلى محطة الحافلات أقل من 3 دقائق للحافلة؟ ما هو متوسط ​​وقت انتظار الحافلة؟

التوزيع الطبيعي

غالبًا ما يتم مواجهة هذا التوزيع في الممارسة العملية ويلعب دورًا استثنائيًا في نظرية الاحتمالات والإحصاء الرياضي وتطبيقاتها، نظرًا لأن العديد من المتغيرات العشوائية في العلوم الطبيعية والاقتصاد وعلم النفس وعلم الاجتماع والعلوم العسكرية وما إلى ذلك لها مثل هذا التوزيع. هذا التوزيع هو قانون مقيد، تقترب منه العديد من قوانين التوزيع الأخرى (في ظل ظروف طبيعية معينة). باستخدام قانون التوزيع الطبيعي، يتم أيضًا وصف الظواهر التي تخضع لعمل العديد من العوامل العشوائية المستقلة من أي طبيعة وأي قانون لتوزيعها. دعنا ننتقل إلى التعريفات.

يسمى المتغير العشوائي المستمر الموزع على القانون العادي (أو قانون غاوس)، إذا كانت كثافة الاحتمالية لها الشكل:

,

أين الأرقام أو σ (σ>0 ) هي معلمات هذا التوزيع.

كما ذكرنا سابقًا، فإن قانون غاوس لتوزيع المتغيرات العشوائية له تطبيقات عديدة. بموجب هذا القانون، يتم توزيع أخطاء القياس بواسطة الأجهزة، والانحراف عن مركز الهدف عند إطلاق النار، وأبعاد الأجزاء المصنعة، ووزن الأشخاص وارتفاعهم، وهطول الأمطار السنوي، وعدد المواليد الجدد وغير ذلك الكثير.

تحتوي الصيغة المعطاة للكثافة الاحتمالية لمتغير عشوائي موزع بشكل طبيعي، كما قيل، على معلمتين أو σ وبالتالي يحدد مجموعة من الوظائف التي تختلف باختلاف قيم هذه المعلمات. إذا طبقنا الطرق المعتادة للتحليل الرياضي لدراسة الدوال والرسوم البيانية على الكثافة الاحتمالية للتوزيع الطبيعي، فيمكننا استخلاص الاستنتاجات التالية.


هي نقاط انعطافها.

بناءً على المعلومات الواردة، قمنا ببناء رسم بياني للكثافة الاحتمالية F(س) التوزيع الطبيعي (يسمى المنحنى الغوسي - الشكل).

دعونا نكتشف كيف يؤثر تغيير المعلمات أو σ إلى شكل المنحنى الغوسي. من الواضح (وهذا يمكن رؤيته من صيغة كثافة التوزيع الطبيعية) أن هناك تغييرًا في المعلمة ألا يغير شكل المنحنى، بل يؤدي فقط إلى تحوله إلى اليمين أو اليسار على طول المحور X. الاعتماد σ أكثر صعوبة. يتضح من الدراسة أعلاه كيف تعتمد قيمة الحد الأقصى وإحداثيات نقاط الانعطاف على المعلمة σ . بالإضافة إلى ذلك، يجب أن نأخذ في الاعتبار ذلك بالنسبة لأي معلمات أو σ تظل المساحة الواقعة تحت المنحنى الغوسي مساوية لـ 1 (وهذه خاصية عامة لكثافة الاحتمالية). مما سبق يترتب على ذلك مع زيادة المعلمة σ يصبح المنحنى مسطحًا ويمتد على طول المحور X. يوضح الشكل منحنيات غاوسية لقيم مختلفة للمعلمة σ (σ 1 < σ< σ 2 ) ونفس قيمة المعلمة أ.

دعونا معرفة المعنى الاحتمالي للمعلمات أو σ التوزيع الطبيعي. بالفعل من تماثل المنحنى الغوسي نسبة إلى الخط العمودي الذي يمر عبر الرقم أعلى المحور Xومن الواضح أن القيمة المتوسطة (أي التوقع الرياضي م (س)) لمتغير عشوائي موزع بشكل طبيعي يساوي أ. ولنفس الأسباب، يجب أيضًا أن يكون المنوال والوسيط مساويًا للرقم أ. الحسابات الدقيقة باستخدام الصيغ المناسبة تؤكد ذلك. إذا استخدمنا التعبير المكتوب أعلاه لـ F(س) استبدال في صيغة التباين
، ثم بعد عملية حسابية (معقدة نوعًا ما) للتكامل نحصل على الرقم الموجود في الإجابة σ 2 . وهكذا بالنسبة للمتغير العشوائي X، موزعة وفق القانون العادي، وتم الحصول على الخصائص العددية الرئيسية التالية:

ولذلك، فإن المعنى الاحتمالي لمعلمات التوزيع الطبيعي أو σ التالي. إذا ر.ف. Xأو σ أ σ.

دعونا الآن نجد دالة التوزيع F(س) للمتغير العشوائي X، موزعة وفقًا للقانون الطبيعي، باستخدام التعبير أعلاه لكثافة الاحتمال F(س) والصيغة
. عند الاستبدال F(س) والنتيجة هي تكامل "غير مأخوذ". أي شيء يمكن القيام به لتبسيط التعبير عن F(س), هذا هو تمثيل هذه الوظيفة على النحو التالي:

,

أين و(خ)- ما يسمى وظيفة لابلاس، والتي لديها النموذج

.

التكامل الذي يتم من خلاله التعبير عن وظيفة لابلاس غير مأخوذ أيضًا (ولكن لكل منهما Xيمكن حساب هذا التكامل تقريبًا بأي دقة محددة مسبقًا). ومع ذلك، ليست هناك حاجة لحسابها، لأنه في نهاية أي كتاب مدرسي حول نظرية الاحتمالات يوجد جدول لتحديد قيم الوظيفة و(خ)بقيمة معينة X. فيما يلي سنحتاج إلى خاصية الشذوذ في دالة لابلاس: Ф(−×)=و(خ)لجميع الأرقام X.

دعونا الآن نجد احتمال أن تكون r.v موزعة بشكل طبيعي. Xسوف تأخذ قيمة من الفاصل الرقمي المحدد (α, β) . من الخصائص العامة لوظيفة التوزيع Р(α< X< β)= F(β) F(α) . أستعاض α و β في التعبير أعلاه ل F(س) ، نحن نحصل

.

كما هو مذكور أعلاه، إذا كان r.v. Xموزعة بشكل طبيعي مع المعلمات أو σ ، فإن متوسط ​​قيمته هو أ، والانحراف المعياري يساوي σ. لهذا متوسطانحراف قيم هذا r.v. عند الاختبار من الرقم أيساوي σ. ولكن هذا هو متوسط ​​الانحراف. لذلك، من الممكن حدوث انحرافات أكبر. دعونا نكتشف مدى احتمالية حدوث انحرافات معينة عن القيمة المتوسطة. دعونا نجد احتمال أن تكون قيمة المتغير العشوائي موزعة وفقا للقانون العادي Xتنحرف عن قيمتها المتوسطة م(س)=أأقل من عدد معين δ، أي. ر(| Xأ|<δ ): . هكذا،

.

استبدال في هذه المساواة δ = 3σ، نحصل على احتمال أن تكون قيمة r.v. X(في اختبار واحد) سوف ينحرف عن متوسط ​​القيمة بأقل من ثلاثة أضعاف القيمة σ (مع متوسط ​​الانحراف، كما نتذكر، يساوي σ ): (معنى ف(3)مأخوذة من جدول قيم دالة لابلاس). انها تقريبا 1 ! ثم احتمال الحدث المعاكس (انحراف القيمة بما لا يقل عن ) مساوي ل 1 0.997=0.003 ، وهو قريب جدًا 0 . ولذلك فإن هذا الحدث “شبه مستحيل” نادرا ما يحدث (في المتوسط 3 انتهى الوقت 1000 ). وهذا المنطق هو الأساس المنطقي لقاعدة "ثلاثة سيجما" المعروفة.

قاعدة ثلاثة سيجما. متغير عشوائي موزع بشكل طبيعي في اختبار واحدعمليا لا ينحرف عن متوسطه أبعد من .

دعونا نؤكد مرة أخرى أننا نتحدث عن اختبار واحد. إذا كان هناك العديد من الاختبارات للمتغير العشوائي، فمن المحتمل جدًا أن تتحرك بعض قيمه بعيدًا عن المتوسط ​​أكثر من المتوسط . وهذا ما يؤكده ما يلي

مثال. ما هو احتمال أن يكون في 100 تجربة متغير عشوائي موزع توزيعًا طبيعيًا؟ Xهل ستنحرف إحدى قيمها على الأقل عن المتوسط ​​بأكثر من ثلاثة أضعاف الانحراف المعياري؟ ماذا عن 1000 اختبار؟

حل. دع الحدث أيعني أنه عند اختبار متغير عشوائي Xانحرفت قيمته عن المتوسط ​​بأكثر من 3σ.كما تم توضيح احتمالية هذا الحدث ع = ف (أ) = 0.003.تم إجراء 100 اختبار من هذا القبيل. نحن بحاجة لمعرفة احتمال وقوع هذا الحدث أحدث على الأقلمرات، أي. جاء من 1 قبل 100 مرة واحدة. هذه مشكلة نموذجية في دائرة برنولي مع المعلمات ن=100 (عدد التجارب المستقلة)، ع = 0.003(احتمال الحدث أفي تجربة واحدة) س=1− ص=0.997 . تحتاج لتجد ر 100 (1≤ ك≤100) . في في هذه الحالةبالطبع، من الأسهل أولًا إيجاد احتمال الحدث المعاكس ر 100 (0) - احتمال وقوع الحدث ألم يحدث ولو مرة واحدة (أي حدث 0 مرات). ومع مراعاة الارتباط بين احتمالات الحدث نفسه وعكسه نحصل على:

ليس بالقليل. قد يحدث ذلك (يحدث في المتوسط ​​في كل سلسلة رابعة من الاختبارات). في 1000 الاختبارات باستخدام نفس المخطط، يمكن الحصول على أن احتمال وجود انحراف واحد على الأقل أكبر من ، يساوي: . لذلك يمكننا أن نتوقع بثقة كبيرة انحرافًا واحدًا على الأقل من هذا القبيل.

مثال. يتم توزيع طول الرجال في فئة عمرية معينة بشكل طبيعي مع التوقعات الرياضية أ، والانحراف المعياري σ . ما نسبة الدعاوى كوينبغي إدراج النمو في إجمالي الإنتاج لفئة عمرية معينة إذا كيتم تحديد النمو الخامس بالحدود التالية:

1 ارتفاع : 158 164 سم 2ارتفاع : 164 - 170 سم 3ارتفاع : 170 - 176 سم 4ارتفاع : 176 - 182 سم

حل. دعونا نحل المشكلة بقيم المعلمات التالية: أ = 178،σ = 6،ك=3 . دع ر.ف. X ارتفاع الرجل الذي تم اختياره عشوائيًا (يتم توزيعه بشكل طبيعي باستخدام المعلمات المحددة). دعونا نجد الاحتمال الذي سيحتاجه الرجل الذي تم اختياره عشوائيًا 3 -الارتفاع. باستخدام غرابة وظيفة لابلاس و(خ)وجدول قيمه : ف(170 ولذلك، في إجمالي حجم الإنتاج من الضروري توفير 0.2789*100%=27.89% بدلة 3 -الارتفاع.

تمت دراسة هذه المسألة بالتفصيل منذ فترة طويلة، والطريقة الأكثر استخدامًا هي طريقة الإحداثيات القطبية، التي اقترحها جورج بوكس، وميرفين مولر، وجورج مارساليا في عام 1958. تتيح لك هذه الطريقة الحصول على زوج من المتغيرات العشوائية المستقلة الموزعة بشكل طبيعي مع التوقع الرياضي 0 والتباين 1 كما يلي:

حيث Z 0 وZ 1 هي القيم المطلوبة، s = u 2 + v 2، وu وv متغيرات عشوائية موزعة بشكل موحد على الفترة (-1، 1)، مختارة بطريقة تحقق الشرط 0< s < 1.
يستخدم الكثير من الناس هذه الصيغ دون حتى التفكير، والعديد منهم لا يشككون في وجودها، لأنهم يستخدمون تطبيقات جاهزة. لكن هناك من يتساءل: من أين جاءت هذه الصيغة؟ ولماذا تحصل على كميتين في وقت واحد؟ بعد ذلك، سأحاول تقديم إجابة واضحة على هذه الأسئلة.


في البداية، اسمحوا لي أن أذكرك بكثافة الاحتمالية ووظيفة التوزيع للمتغير العشوائي والوظيفة العكسية. لنفترض أن هناك متغير عشوائي معين، يتم تحديد توزيعه بواسطة دالة الكثافة f(x)، والتي لها النموذج التالي:

وهذا يعني أن احتمال أن تكون قيمة المتغير العشوائي المعطى في الفترة (A، B) يساوي مساحة المنطقة المظللة. ونتيجة لذلك، يجب أن تكون مساحة المنطقة المظللة بأكملها مساوية لواحد، لأنه في أي حال، فإن قيمة المتغير العشوائي سوف تقع في مجال تعريف الدالة f.
دالة التوزيع لمتغير عشوائي هي تكامل دالة الكثافة. وفي هذه الحالة سيكون مظهره التقريبي كالتالي:

المعنى هنا هو أن قيمة المتغير العشوائي ستكون أقل من A مع الاحتمال B. ونتيجة لذلك، فإن الدالة لا تتناقص أبدًا، وتقع قيمها في الفترة.

الدالة العكسية هي دالة تقوم بإرجاع وسيطة إلى الدالة الأصلية إذا تم تمرير قيمة الدالة الأصلية إليها. على سبيل المثال، بالنسبة للدالة x 2، فإن المعكوس هو دالة استخراج الجذر، وبالنسبة لـ sin(x) فهو arcsin(x)، وما إلى ذلك.

نظرًا لأن معظم مولدات الأرقام العشوائية الزائفة تنتج فقط توزيعًا موحدًا كمخرجات، فغالبًا ما تكون هناك حاجة لتحويله إلى توزيع آخر. في هذه الحالة، إلى غاوسي العادي:

أساس جميع طرق تحويل التوزيع الموحد إلى أي توزيع آخر هو طريقة التحويل العكسي. يعمل على النحو التالي. تم العثور على دالة عكسية لدالة التوزيع المطلوبة، وتم تمرير متغير عشوائي موزع بشكل موحد على الفترة (0، 1) إليها كوسيطة. في الإخراج نحصل على قيمة بالتوزيع المطلوب. من أجل الوضوح، أقدم الصورة التالية.

وبالتالي، يتم تلطيخ قطعة موحدة وفقًا للتوزيع الجديد، ويتم إسقاطها على محور آخر من خلال وظيفة عكسية. لكن المشكلة هي أن تكامل كثافة التوزيع الغاوسي ليس من السهل حسابه، لذلك كان على العلماء المذكورين أعلاه الغش.

يوجد توزيع مربع كاي (توزيع بيرسون)، وهو توزيع مجموع مربعات k للمتغيرات العشوائية العادية المستقلة. وفي حالة k = 2، يكون هذا التوزيع أسيًا.

هذا يعني أنه إذا كانت هناك نقطة في نظام إحداثي مستطيل لها إحداثيات X و Y عشوائية موزعة بشكل طبيعي، فبعد تحويل هذه الإحداثيات إلى النظام القطبي (r، θ)، مربع نصف القطر (المسافة من الأصل إلى النقطة) سيتم توزيعها وفقًا للقانون الأسي، حيث أن مربع نصف القطر هو مجموع مربعات الإحداثيات (وفقًا لقانون فيثاغورس). ستبدو كثافة توزيع هذه النقاط على المستوى كما يلي:


وبما أنها متساوية في جميع الاتجاهات، فإن الزاوية θ سيكون لها توزيع موحد في المدى من 0 إلى 2π. والعكس صحيح أيضًا: إذا قمت بتحديد نقطة في نظام الإحداثيات القطبية باستخدام متغيرين عشوائيين مستقلين (زاوية موزعة بشكل موحد ونصف قطر موزع بشكل أسي)، فإن الإحداثيات المستطيلة لهذه النقطة ستكون متغيرات عشوائية عادية مستقلة. ومن الأسهل بكثير الحصول على توزيع أسي من توزيع موحد باستخدام نفس طريقة التحويل العكسي. وهذا هو جوهر طريقة بوكس ​​مولر القطبية.
الآن دعونا نشتق الصيغ.

(1)

للحصول على r و θ، من الضروري توليد متغيرين عشوائيين موزعين بشكل موحد على الفترة (0، 1) (دعنا نسميهما u و v)، يجب تحويل توزيع أحدهما (على سبيل المثال v) إلى أسي إلى الحصول على نصف القطر. تبدو دالة التوزيع الأسي كما يلي:

وظيفتها العكسية هي :

بما أن التوزيع الموحد متماثل، فإن التحويل سيعمل بشكل مشابه مع الدالة

من صيغة توزيع مربع كاي يترتب على ذلك أن 0 = 0.5. عوض بـ lect, v في هذه الدالة واحصل على مربع نصف القطر، ثم نصف القطر نفسه:

نحصل على الزاوية عن طريق تمديد قطعة الوحدة إلى 2π:

الآن نستبدل r و θ في الصيغ (1) ونحصل على:

(2)

هذه الصيغ جاهزة للاستخدام بالفعل. سيكون X وY مستقلين وموزعين بشكل طبيعي بتباين 1 وتوقع رياضي 0. للحصول على توزيع بخصائص أخرى، يكفي ضرب نتيجة الدالة بالانحراف المعياري وإضافة التوقع الرياضي.
ولكن من الممكن التخلص من الدوال المثلثية عن طريق تحديد الزاوية ليس بشكل مباشر، ولكن بشكل غير مباشر من خلال الإحداثيات المستطيلة لنقطة عشوائية في الدائرة. بعد ذلك، من خلال هذه الإحداثيات، سيكون من الممكن حساب طول ناقل نصف القطر، ثم العثور على جيب التمام والجيب بقسمة x و y عليه، على التوالي. كيف ولماذا يعمل؟
دعونا نختار نقطة عشوائية من تلك الموزعة بشكل موحد في دائرة نصف قطر الوحدة ونشير إلى مربع طول متجه نصف القطر لهذه النقطة بالحرف s:

يتم التحديد عن طريق تحديد إحداثيات مستطيلة عشوائية x وy، موزعة بشكل موحد في الفاصل الزمني (-1، 1)، وتجاهل النقاط التي لا تنتمي إلى الدائرة، وكذلك النقطة المركزية التي تكون عندها زاوية متجه نصف القطر غير محدد. أي أنه يجب استيفاء الشرط 0< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

نحصل على الصيغ كما في بداية المقال. عيب هذه الطريقة هو أنها تتجاهل النقاط غير المدرجة في الدائرة. أي باستخدام 78.5% فقط من المتغيرات العشوائية المتولدة. في أجهزة الكمبيوتر القديمة، كان الافتقار إلى وظائف علم المثلثات لا يزال يمثل ميزة كبيرة. الآن، عندما يقوم أمر معالج بحساب كل من جيب التمام وجيب التمام في لحظة، أعتقد أن هذه الطرق لا تزال قادرة على المنافسة.

شخصياً لا يزال لدي سؤالان:

  • لماذا يتم توزيع قيمة s بالتساوي؟
  • لماذا يتم توزيع مجموع مربعي متغيرين عشوائيين عاديين بشكل أسي؟
نظرًا لأن s هو مربع نصف القطر (للبساطة، أسمي نصف القطر طول متجه نصف القطر الذي يحدد موضع نقطة عشوائية)، نكتشف أولاً كيفية توزيع نصف القطر. وبما أن الدائرة مملوءة بالتساوي، فمن الواضح أن عدد النقاط التي نصف قطرها r يتناسب مع طول الدائرة التي نصف قطرها r. ومحيط الدائرة يتناسب مع نصف القطر. وهذا يعني أن كثافة توزيع نصف القطر تزداد بانتظام من مركز الدائرة إلى حوافها. ودالة الكثافة لها الصيغة f(x) = 2x على الفترة (0, 1). المعامل 2 بحيث تكون مساحة الشكل تحت الرسم البياني تساوي واحدًا. وعندما يتم تربيع هذه الكثافة، فإنها تصبح موحدة. نظرًا لأنه من الضروري في هذه الحالة من الناحية النظرية تقسيم دالة الكثافة على مشتقها من دالة التحويل (أي x 2). ومن الواضح أن الأمر يحدث على النحو التالي:

إذا تم إجراء تحويل مماثل لمتغير عشوائي عادي، فإن دالة الكثافة لمربعه ستصبح مشابهة للقطع الزائد. وإضافة مربعين من المتغيرات العشوائية العادية هي عملية أكثر تعقيدًا ترتبط بالتكامل المزدوج. وحقيقة أن النتيجة ستكون توزيعًا أسيًا، لا أملك شخصيًا إلا التحقق منها باستخدام طريقة عملية أو قبولها كبديهية. ولمن يهمه الأمر أقترح عليك إلقاء نظرة فاحصة على الموضوع، واكتساب المعرفة من هذه الكتب:

  • فنتزل إي إس. نظرية الاحتمالات
  • كنوت دي. فن البرمجة، المجلد 2

في الختام، إليك مثال على تنفيذ مولد أرقام عشوائية موزعة بشكل طبيعي في جافا سكريبت:

وظيفة غاوس () ( فار جاهز = خطأ؛ فار ثانية = 0.0؛ this.next = وظيفة (يعني، ديف) ( يعني = يعني == غير محدد؟ 0.0: يعني؛ ديف = ديف == غير محدد؟ 1.0: ديف؛ إذا ( this.ready) ( this.ready = false; return this.than * dev +mean; ) else ( var u, v, s; do ( u = 2.0 * Math.random() - 1.0; v = 2.0 * Math. عشوائي () - 1.0؛ s = u * u + v * v؛ ) while (s > 1.0 || s == 0.0)؛ var r = Math.sqrt(-2.0 * Math.log(s) / s); this.sec = r * u؛ this.ready = true؛ return r * v * dev +main; ) ); ) g = new Gauss(); // إنشاء كائن a = g.next(); // أنشئ زوجًا من القيم واحصل على القيمة الأولى b = g.next(); // احصل على الثاني c = g.next(); // قم بإنشاء زوج من القيم مرة أخرى واحصل على القيمة الأولى
المعلمات يعني (التوقع الرياضي) و ديف (الانحراف المعياري) اختيارية. ألفت انتباهكم إلى حقيقة أن اللوغاريتم طبيعي.



جديد على الموقع

>

الأكثر شعبية