Mājas Stomatīts Varbūtības blīvums vienmērīga sadalījuma novērtēšanai. Vienmērīgi sadalīta gadījuma lieluma pārveidošana par normāli sadalītu

Varbūtības blīvums vienmērīga sadalījuma novērtēšanai. Vienmērīgi sadalīta gadījuma lieluma pārveidošana par normāli sadalītu

Kā nepārtrauktas piemērs nejaušais mainīgais Aplūkosim nejaušu lielumu X, kas vienmērīgi sadalīts pa intervālu (a; b). Tiek uzskatīts, ka nejaušais mainīgais X ir vienmērīgi sadalīts intervālā (a; b), ja tā sadalījuma blīvums šajā intervālā nav nemainīgs:

No normalizācijas nosacījuma nosakām konstantes c vērtību. Laukumam zem sadalījuma blīvuma līknes jābūt vienādam ar vienību, bet mūsu gadījumā tas ir taisnstūra laukums ar pamatni (b - α) un augstumu c (1. att.).

Rīsi. 1 Vienmērīgs sadalījuma blīvums
No šejienes mēs atrodam konstantes c vērtību:

Tātad vienmērīgi sadalīta gadījuma lieluma blīvums ir vienāds ar

Tagad atradīsim sadalījuma funkciju, izmantojot formulu:
1) priekš
2) par
3) 0+1+0=1.
Tādējādi

Sadales funkcija ir nepārtraukta un nesamazinās (2. att.).

Rīsi. 2 Vienmērīgi sadalīta gadījuma lieluma sadalījuma funkcija

Mēs atradīsim paredzamā vērtība vienmērīgi sadalīts gadījuma lielums pēc formulas:

Vienmērīga sadalījuma izkliede tiek aprēķināts pēc formulas un ir vienāds ar

Piemērs Nr.1. Mērierīces skalas dalījuma vērtība ir 0,2. Instrumentu rādījumi tiek noapaļoti līdz tuvākajam veselajam dalījumam. Atrodi varbūtību, ka skaitīšanas laikā tiks pieļauta kļūda: a) mazāka par 0,04; b) liels 0,02
Risinājums. Noapaļošanas kļūda ir nejaušs lielums, kas vienmērīgi sadalīts intervālā starp blakus esošajiem veseliem skaitļiem. Par šādu dalījumu uzskatīsim intervālu (0; 0,2) (a att.). Noapaļošanu var veikt gan virzienā uz kreiso robežu - 0, gan uz labo pusi - 0,2, kas nozīmē, ka kļūdu, kas ir mazāka vai vienāda ar 0,04, var izdarīt divas reizes, kas jāņem vērā, aprēķinot varbūtību:



P = 0,2 + 0,2 = 0,4

Otrajā gadījumā kļūdas vērtība var arī pārsniegt 0,02 uz abām iedalījuma robežām, tas ir, tā var būt lielāka par 0,02 vai mazāka par 0,18.


Tad šādas kļūdas iespējamība:

Piemērs Nr.2. Tika pieņemts, ka par ekonomiskās situācijas stabilitāti valstī (karu neesamība, dabas katastrofas u.c.) pēdējo 50 gadu laikā var spriest pēc iedzīvotāju vecuma sadalījuma rakstura: mierīgā situācijā tam vajadzētu būt. vienveidīgs. Pētījuma rezultātā par vienu no valstīm tika iegūti šādi dati.

Vai ir pamats uzskatīt, ka valstī valdīja nestabilitāte?

Risinājumu veicam, izmantojot kalkulatoru Hipotēžu pārbaude. Tabula rādītāju aprēķināšanai.

GrupasIntervāla viduspunkts, x iDaudzums, f ix i * f iUzkrātā frekvence, S|x - x av |*f(x - x vid.) 2 *fFrekvence, f i /n
0 - 10 5 0.14 0.7 0.14 5.32 202.16 0.14
10 - 20 15 0.09 1.35 0.23 2.52 70.56 0.09
20 - 30 25 0.1 2.5 0.33 1.8 32.4 0.1
30 - 40 35 0.08 2.8 0.41 0.64 5.12 0.08
40 - 50 45 0.16 7.2 0.57 0.32 0.64 0.16
50 - 60 55 0.13 7.15 0.7 1.56 18.72 0.13
60 - 70 65 0.12 7.8 0.82 2.64 58.08 0.12
70 - 80 75 0.18 13.5 1 5.76 184.32 0.18
1 43 20.56 572 1
Sadales centra indikatori.
Vidējais svērtais


Variācijas rādītāji.
Absolūtas variācijas.
Izmaiņu diapazons ir starpība starp primārās sērijas raksturlieluma maksimālo un minimālo vērtību.
R = X max - X min
R = 70 - 0 = 70
Izkliede- raksturo dispersijas mēru ap tā vidējo vērtību (dispersijas mēru, t.i. novirzi no vidējā).


Standarta novirze.

Katra sērijas vērtība no vidējās vērtības 43 atšķiras ne vairāk kā par 23,92
Hipotēžu pārbaude par sadalījuma veidu.
4. Hipotēzes pārbaude par vienmērīgs sadalījums vispārējā populācija.
Lai pārbaudītu hipotēzi par X vienmērīgu sadalījumu, t.i. saskaņā ar likumu: f(x) = 1/(b-a) intervālā (a,b)
nepieciešams:
1. Novērtējiet parametrus a un b - tā intervāla galus, kurā iespējamās vērtības X, saskaņā ar formulām (zīme * apzīmē parametru aplēses):

2. Atrodiet paredzamā sadalījuma f(x) = 1/(b * - a *) varbūtības blīvumu.
3. Atrodiet teorētiskās frekvences:
n 1 = nP 1 = n = n*1/(b * - a *)* (x 1 - a *)
n 2 = n 3 = ... = n s-1 = n*1/(b * - a *)* (x i - x i-1)
n s = n*1/(b * - a *)* (b * - x s-1)
4. Salīdzināt empīriskās un teorētiskās frekvences, izmantojot Pīrsona kritēriju, ņemot brīvības pakāpju skaitu k = s-3, kur s ir sākotnējo iztveršanas intervālu skaits; ja tika veikta mazu frekvenču kombinācija un līdz ar to arī paši intervāli, tad s ir intervālu skaits, kas paliek pēc kombinācijas.

Risinājums:
1. Atrodiet vienmērīgā sadalījuma parametru a * un b * aplēses, izmantojot formulas:


2. Atrodiet pieņemtā vienmērīgā sadalījuma blīvumu:
f(x) = 1/(b * - a *) = 1/(84,42 - 1,58) = 0,0121
3. Atradīsim teorētiskās frekvences:
n 1 = n*f(x) (x 1 - a *) = 1 * 0,0121 (10-1,58) = 0,1
n 8 = n*f(x) (b * - x 7) = 1 * 0,0121 (84,42-70) = 0,17
Atlikušie n s būs vienādi ar:
n s = n*f(x)(x i - x i-1)

in in*in i - n * i(n i - n* i) 2(n i - n * i) 2 /n * i
1 0.14 0.1 0.0383 0.00147 0.0144
2 0.09 0.12 -0.0307 0.000943 0.00781
3 0.1 0.12 -0.0207 0.000429 0.00355
4 0.08 0.12 -0.0407 0.00166 0.0137
5 0.16 0.12 0.0393 0.00154 0.0128
6 0.13 0.12 0.0093 8.6E-5 0.000716
7 0.12 0.12 -0.000701 0 4.0E-6
8 0.18 0.17 0.00589 3.5E-5 0.000199
Kopā 1 0.0532
Noteiksim kritiskā apgabala robežu. Tā kā Pīrsona statistika mēra atšķirību starp empīrisko un teorētisko sadalījumu, jo lielāka ir tās novērotā vērtība K obs, jo spēcīgāks ir arguments pret galveno hipotēzi.
Tāpēc šīs statistikas kritiskais apgabals vienmēr ir labajā pusē: ja tā varbūtības blīvums šajā segmentā ir nemainīgs un ārpus tā ir vienāds ar 0 (t.i., nejaušs mainīgais lielums). X koncentrējas uz segmentu [ a, b], uz kura tam ir nemainīgs blīvums). Autors šī definīcija blīvums vienmērīgi sadalīts segmentā [ a, b] nejaušais mainīgais X ir šāda forma:

Kur Ar ir noteikts skaits. Tomēr to ir viegli atrast, izmantojot varbūtības blīvuma īpašību nejaušiem mainīgajiem, kas koncentrēti segmentā [ a, b]:
. No tā izriet, ka
, kur
. Tāpēc blīvums vienmērīgi sadalīts segmentā [ a, b] nejaušais mainīgais X ir šāda forma:

.

Spriediet par n.s.v sadalījuma vienveidību. X iespējams, ņemot vērā šādus apsvērumus. Nepārtrauktam nejaušam mainīgajam ir vienmērīgs sadalījums segmentā [ a, b], ja tas ņem vērtības tikai no šī segmenta un jebkuram skaitlim no šī segmenta nav priekšrocību salīdzinājumā ar citiem skaitļiem šajā segmentā tādā nozīmē, ka tas var būt šī nejaušā mainīgā vērtība.

Nejaušie mainīgie, kuriem ir vienmērīgs sadalījums, ietver tādas vērtības kā transporta gaidīšanas laiks pieturā (ar pastāvīgu satiksmes intervālu gaidīšanas ilgums tiek vienmērīgi sadalīts pa šo intervālu), kļūda, noapaļojot skaitli līdz veselam skaitlim (vienmērīgi sadalīts pa [−0.5 , 0.5 ]) un citi.

Sadales funkcijas veids F(x) a, b] nejaušais mainīgais X meklēts pēc zināma varbūtības blīvuma f(x) izmantojot to savienojuma formulu
. Attiecīgo aprēķinu rezultātā iegūstam šādu sadalījuma funkcijas formulu F(x) vienmērīgi sadalīts segments [ a, b] nejaušais mainīgais X :

.

Attēlos parādīti varbūtības blīvuma grafiki f(x) un izplatīšanas funkcijas f(x) vienmērīgi sadalīts segments [ a, b] nejaušais mainīgais X :


Vienmērīgi sadalīta segmenta prognoze, dispersija, standartnovirze, režīms un mediāna [ a, b] nejaušais mainīgais X aprēķina pēc varbūtības blīvuma f(x) parastajā veidā (un gluži vienkārši tāpēc vienkāršs tips f(x) ). Rezultāts ir šādas formulas:

un mode d(X) ir jebkurš skaitlis intervālā [ a, b].

Ļaujiet mums atrast varbūtību trāpīt vienmērīgi sadalītā segmentā [ a, b] nejaušais mainīgais X intervālā
, pilnībā guļ iekšā [ a, b]. Ņemot vērā zināmo sadalījuma funkcijas formu, mēs iegūstam:

Tādējādi varbūtība trāpīt vienmērīgi sadalītā segmentā [ a, b] nejaušais mainīgais X intervālā
, pilnībā guļ iekšā [ a, b], nav atkarīgs no šī intervāla stāvokļa, bet ir atkarīgs tikai no tā garuma un ir tieši proporcionāls šim garumam.

Piemērs. Autobusu intervāls ir 10 minūtes. Kāda ir varbūtība, ka pasažieris, kas ierodas pieturā, gaidīs autobusu mazāk par 3 minūtēm? Kāds ir vidējais autobusa gaidīšanas laiks?

Normāls sadalījums

Šis sadalījums visbiežāk sastopams praksē, un tam ir izņēmuma loma varbūtību teorijā un matemātiskajā statistikā un to lietojumos, jo daudziem nejaušiem mainīgajiem dabaszinātnēs, ekonomikā, psiholoģijā, socioloģijā, militārajās zinātnēs un tā tālāk ir šāds sadalījums. Šis sadalījums ir ierobežojošs likums, kuram tuvojas daudzi citi sadalījuma likumi (noteiktos dabiskos apstākļos). Izmantojot normālā sadalījuma likumu, tiek aprakstītas arī parādības, kas ir pakļautas daudzu neatkarīgu jebkura rakstura nejaušības faktoru iedarbībai un jebkura to sadalījuma likumam. Pāriesim pie definīcijām.

Nepārtrauktu gadījuma lielumu sauc par sadalītu parastais likums (vai Gausa likums), ja tā varbūtības blīvumam ir šāda forma:

,

kur ir cipari A Un σ (σ>0 ) ir šī sadalījuma parametri.

Kā jau minēts, Gausa nejaušo mainīgo sadalījuma likumam ir daudz pielietojumu. Saskaņā ar šo likumu tiek sadalītas mērīšanas kļūdas ar instrumentiem, novirze no mērķa centra šaušanas laikā, izgatavoto detaļu izmēri, cilvēku svars un augstums, gada nokrišņi, jaundzimušo skaits un daudz kas cits.

Dotā normāli sadalīta gadījuma lieluma varbūtības blīvuma formula satur, kā tika teikts, divus parametrus A Un σ , un tāpēc definē funkciju saimi, kas mainās atkarībā no šo parametru vērtībām. Ja normālā sadalījuma varbūtības blīvumam pielietojam parastās funkciju izpētes matemātiskās analīzes un grafiku zīmēšanas metodes, varam izdarīt šādus secinājumus.


ir tā lēciena punkti.

Pamatojoties uz saņemto informāciju, mēs veidojam varbūtības blīvuma grafiku f(x) normālais sadalījums (to sauc par Gausa līkni - figūru).

Noskaidrosim, kā ietekmē parametru maiņa A Un σ līdz Gausa līknes formai. Ir skaidrs (to var redzēt no normālā sadalījuma blīvuma formulas), ka parametra izmaiņas A nemaina līknes formu, bet tikai noved pie tās nobīdes pa asi pa labi vai pa kreisi X. Atkarība σ grūtāk. No iepriekš minētā pētījuma ir skaidrs, kā maksimālā vērtība un lēciena punktu koordinātas ir atkarīgas no parametra σ . Turklāt mums tas ir jāņem vērā attiecībā uz visiem parametriem A Un σ laukums zem Gausa līknes paliek vienāds ar 1 (tā ir varbūtības blīvuma vispārēja īpašība). No iepriekš minētā izriet, ka, palielinoties parametram σ līkne kļūst plakanāka un stiepjas gar asi X. Attēlā parādītas Gausa līknes dažādām parametra vērtībām σ (σ 1 < σ< σ 2 ) un tā pati parametra vērtība A.

Noskaidrosim parametru varbūtības nozīmi A Un σ normālais sadalījums. Jau no Gausa līknes simetrijas attiecībā pret vertikālo līniju, kas iet caur skaitli A uz ass X ir skaidrs, ka vidējā vērtība (t.i., matemātiskā cerība M(X)) no normāli sadalīta gadījuma lieluma ir vienāds ar A. To pašu iemeslu dēļ režīmam un mediānai arī jābūt vienādiem ar skaitli a. Precīzi aprēķini, izmantojot atbilstošās formulas, to apstiprina. Ja mēs izmantojam izteicienu, kas rakstīts iepriekš par f(x) aizvietot dispersijas formulā
, tad pēc (diezgan sarežģīta) integrāļa aprēķina saņemam atbildē skaitli σ 2 . Tādējādi nejaušam mainīgajam X, sadalīts saskaņā ar parasto likumu, tika iegūti šādi galvenie skaitliskie raksturlielumi:

Tāpēc normālā sadalījuma parametru varbūtības nozīme A Un σ Nākamais. Ja r.v. XA Un σ A σ.

Tagad atradīsim sadalījuma funkciju F(x) nejaušam mainīgajam X, sadalīts saskaņā ar parasto likumu, izmantojot iepriekš minēto varbūtības blīvuma izteiksmi f(x) un formula
. Aizstājot f(x) rezultāts ir “nepaņemts” integrālis. Jebkas, ko var darīt, lai vienkāršotu izteiksmi F(x), Šis ir šīs funkcijas attēlojums kā:

,

Kur F(x)− t.s Laplasa funkcija, kam ir forma

.

Integrālis, caur kuru tiek izteikta Laplasa funkcija, arī nav ņemts (bet katram Xšo integrāli var aprēķināt aptuveni ar jebkuru iepriekš noteiktu precizitāti). Tomēr tas nav jāaprēķina, jo jebkuras varbūtības teorijas mācību grāmatas beigās ir tabula funkcijas vērtību noteikšanai. F(x) noteiktā vērtībā X. Tālāk mums būs nepieciešams Laplasa funkcijas dīvainības īpašība: Ф(−х)=F(x) visiem skaitļiem X.

Tagad atradīsim varbūtību, ka normāli sadalīts r.v. Xņems vērtību no norādītā skaitliskā intervāla (α, β) . No sadalījuma funkcijas vispārīgajām īpašībām Р(α< X< β)= F(β) F(α) . Aizstāšana α Un β iepriekš minētajā izteiksmē F(x) , saņemam

.

Kā minēts iepriekš, ja r.v. X sadalīts normāli ar parametriem A Un σ , tad tā vidējā vērtība ir A, un standarta novirze ir vienāda ar σ. Tāpēc vidējišī r.v. vērtību novirze. kad pārbauda no numura A vienāds σ. Bet šī ir vidējā novirze. Tāpēc iespējamas lielākas novirzes. Noskaidrosim, cik iespējamas noteiktas novirzes no vidējās vērtības. Noskaidrosim varbūtību, ka gadījuma lieluma vērtība sadalās saskaņā ar normālo likumu X novirzīties no vidējās vērtības M(X)=a mazāks par noteiktu skaitli δ, t.i. R(| Xa|<δ ): . Tādējādi

.

Aizstājot šajā vienlīdzībā δ=3σ, mēs iegūstam varbūtību, ka r.v. X(vienā testā) novirzīsies no vidējās vērtības mazāk nekā trīskāršā apmērā σ (ar vidējo novirzi, kā mēs atceramies, ir vienāda ar σ ): (nozīmē F(3)ņemts no Laplasa funkciju vērtību tabulas). Tas ir gandrīz 1 ! Tad pretējā notikuma varbūtība (ka vērtība novirzīsies ne mazāk kā par ) ir vienāds ar 1 0.997=0.003 , kas ir ļoti tuvu 0 . Tāpēc šis notikums ir "gandrīz neiespējams" notiek ārkārtīgi reti (vidēji 3 laiks ir beidzies 1000 ). Šis arguments ir labi zināmā "trīs sigmu likuma" pamatojums.

Trīs sigmu noteikums. Parasti sadalīts gadījuma mainīgais vienā testā praktiski neatkāpjas no sava vidējā tālāk par .

Vēlreiz uzsvērsim, ka runa ir par vienu testu. Ja nejaušam mainīgajam ir daudz testu, tad ir pilnīgi iespējams, ka dažas no tā vērtībām novirzīsies tālāk no vidējā nekā . To apstiprina sekojošais

Piemērs. Kāda ir varbūtība, ka 100 normāli sadalīta nejauša lieluma izmēģinājumos X vai vismaz viena no tā vērtībām novirzīsies no vidējās vairāk nekā trīskāršā standarta novirze? Kā ar 1000 testiem?

Risinājums. Ļaujiet notikumam A nozīmē, ka, pārbaudot gadījuma lielumu X tā vērtība no vidējā atšķīrās par vairāk nekā 3σ. Kā tikko tika noskaidrots, šī notikuma varbūtība p=P(A)=0,003. Tika veikti 100 šādi testi. Mums ir jānoskaidro varbūtība, ka notikums A noticis vismaz reizes, t.i. nāca no 1 pirms tam 100 vienreiz. Šī ir tipiska Bernulli ķēdes problēma ar parametriem n=100 (neatkarīgu izmēģinājumu skaits), p=0,003(notikuma varbūtība A vienā izmēģinājumā) q=1− lpp=0.997 . Vajag atrast R 100 (1≤ k≤100) . IN šajā gadījumā Protams, ir vieglāk vispirms atrast pretēja notikuma iespējamību R 100 (0) − varbūtība, ka notikums A nenotika pat vienu reizi (t.i., notika 0 reizes). Ņemot vērā saikni starp paša notikuma varbūtību un tā pretstatu, mēs iegūstam:

Ne tik maz. Tas var notikt (notiek vidēji katrā ceturtajā šādā testu sērijā). Plkst 1000 testus, izmantojot to pašu shēmu, var iegūt, ka vismaz vienas novirzes varbūtība ir lielāka par , vienāds: . Tāpēc mēs ar lielu pārliecību varam sagaidīt vismaz vienu šādu novirzi.

Piemērs. Noteiktas vecuma grupas vīriešu augums ir sadalīts normāli ar matemātisku cerību a, un standarta novirze σ . Kāda proporcija uzvalkiem k pieaugums jāiekļauj kopējā produkcijā konkrētai vecuma grupai, ja k Pieaugumu nosaka šādi ierobežojumi:

1 augstums : 158 164 cm2 augstums : 164–170 cm3 augstums : 170–176 cm 4 augstums : 176 - 182 cm

Risinājums. Atrisināsim problēmu ar šādām parametru vērtībām: a=178,σ=6,k=3 . Ļaujiet r.v. X nejauši izvēlēta vīrieša augums (tas ir sadalīts normāli ar dotajiem parametriem). Atradīsim varbūtību, kāda nejauši izvēlētam vīrietim būs nepieciešama 3 - augums. Izmantojot Laplasa funkcijas dīvainību F(x) un tā vērtību tabula: P(170 Līdz ar to kopējā ražošanas apjomā ir nepieciešams nodrošināt 0.2789*100%=27.89% uzvalki 3 - augums.

Šis jautājums jau sen ir detalizēti pētīts, un visplašāk izmantotā metode ir polāro koordinātu metode, ko 1958. gadā ierosināja Džordžs Bokss, Mervins Mullers un Džordžs Marsaglia. Šī metode ļauj iegūt neatkarīgu normāli sadalītu gadījuma lielumu pāri ar matemātisko cerību 0 un dispersiju 1 šādi:

Kur Z 0 un Z 1 ir vēlamās vērtības, s = u 2 + v 2 un u un v ir gadījuma mainīgie, kas vienmērīgi sadalīti intervālā (-1, 1), kas atlasīti tā, lai nosacījums 0 būtu izpildīts.< s < 1.
Daudzi cilvēki izmanto šīs formulas, pat nedomājot, un daudzi pat nenojauš par to esamību, jo viņi izmanto gatavas implementācijas. Bet ir cilvēki, kuriem rodas jautājumi: “No kurienes radās šī formula? Un kāpēc jūs saņemat pāris daudzumus uzreiz? Tālāk es mēģināšu sniegt skaidru atbildi uz šiem jautājumiem.


Sākumā ļaujiet man atgādināt, kas ir varbūtības blīvums, gadījuma lieluma sadalījuma funkcija un apgrieztā funkcija. Pieņemsim, ka ir noteikts gadījuma lielums, kura sadalījumu nosaka blīvuma funkcija f(x), kurai ir šāda forma:

Tas nozīmē, ka varbūtība, ka noteiktā nejaušā lieluma vērtība būs intervālā (A, B), ir vienāda ar ēnotā laukuma laukumu. Un tā rezultātā visa iekrāsotā apgabala laukumam jābūt vienādam ar vienu, jo jebkurā gadījumā nejaušā mainīgā vērtība nonāks funkcijas f definīcijas jomā.
Gadījuma lieluma sadalījuma funkcija ir blīvuma funkcijas integrālis. Un šajā gadījumā tā aptuvenais izskats būs šāds:

Šeit nozīme ir tāda, ka nejaušā lieluma vērtība būs mazāka par A ar varbūtību B. Tā rezultātā funkcija nekad nesamazinās, un tās vērtības atrodas intervālā.

Apgrieztā funkcija ir funkcija, kas atgriež argumentu sākotnējai funkcijai, ja tajā tiek nodota sākotnējās funkcijas vērtība. Piemēram, funkcijai x 2 apgrieztā funkcija ir saknes iegūšanas funkcija, sin(x) tā ir arcsin(x) utt.

Tā kā lielākā daļa pseidogadījuma skaitļu ģeneratoru kā izvadi rada tikai vienmērīgu sadalījumu, bieži vien tas ir jāpārvērš citā. Šajā gadījumā uz parasto Gausa:

Visu metožu pamatā vienmērīga sadalījuma pārveidošanai jebkurā citā ir apgrieztās transformācijas metode. Tas darbojas šādi. Tiek atrasta funkcija, kas ir apgriezta vajadzīgā sadalījuma funkcijai, un tajā kā arguments tiek nodots gadījuma lielums, kas vienmērīgi sadalīts intervālā (0, 1). Izejā mēs iegūstam vērtību ar nepieciešamo sadalījumu. Skaidrības labad es sniedzu šādu attēlu.

Tādējādi viendabīgs segments tiek it kā izsmērēts saskaņā ar jauno sadalījumu, projicēts uz citu asi, izmantojot apgrieztu funkciju. Bet problēma ir tā, ka Gausa sadalījuma blīvuma integrāli nav viegli aprēķināt, tāpēc iepriekšminētajiem zinātniekiem nācās krāpties.

Pastāv hī kvadrāta sadalījums (Pīrsona sadalījums), kas ir k neatkarīgu normālu gadījuma lielumu kvadrātu summas sadalījums. Un gadījumā, ja k = 2, šis sadalījums ir eksponenciāls.

Tas nozīmē, ka, ja taisnstūra koordinātu sistēmas punktam ir nejaušas X un Y koordinātes, kas sadalītas normāli, tad pēc šo koordinātu pārvēršanas polārajā sistēmā (r, θ) rādiusa kvadrāts (attālums no sākuma līdz punktam) tiks sadalīts pēc eksponenciālā likuma, jo rādiusa kvadrāts ir koordinātu kvadrātu summa (saskaņā ar Pitagora likumu). Šādu punktu sadalījuma blīvums plaknē izskatīsies šādi:


Tā kā tas ir vienāds visos virzienos, leņķim θ būs vienmērīgs sadalījums diapazonā no 0 līdz 2π. Ir arī otrādi: ja jūs definējat punktu polāro koordinātu sistēmā, izmantojot divus neatkarīgus gadījuma lielumus (vienmērīgi sadalīts leņķis un eksponenciāli sadalīts rādiuss), tad šī punkta taisnstūra koordinātas būs neatkarīgi parastie nejaušie mainīgie. Un daudz vienkāršāk ir iegūt eksponenciālu sadalījumu no vienota, izmantojot to pašu apgrieztās transformācijas metodi. Tāda ir polārās Box-Muller metodes būtība.
Tagad atvasināsim formulas.

(1)

Lai iegūtu r un θ, ir jāģenerē divi gadījuma lielumi, kas vienmērīgi sadalīti intervālā (0, 1) (sauksim tos par u un v), no kuriem viena sadalījums (teiksim v) ir jāpārvērš par eksponenciālu uz iegūt rādiusu. Eksponenciālā sadalījuma funkcija izskatās šādi:

Tās apgrieztā funkcija ir:

Tā kā vienmērīgais sadalījums ir simetrisks, transformācija darbosies līdzīgi ar funkciju

No hī kvadrāta sadalījuma formulas izriet, ka λ = 0,5. Aizstājiet šo funkciju λ, v un iegūstiet rādiusa kvadrātu un pēc tam pašu rādiusu:

Mēs iegūstam leņķi, izstiepjot vienības segmentu līdz 2π:

Tagad mēs aizstājam r un θ formulās (1) un iegūstam:

(2)

Šīs formulas jau ir gatavas lietošanai. X un Y būs neatkarīgi un normāli sadalīti ar dispersiju 1 un matemātisko cerību 0. Lai iegūtu sadalījumu ar citiem raksturlielumiem, pietiek reizināt funkcijas rezultātu ar standartnovirzi un pievienot matemātisko cerību.
Bet no trigonometriskām funkcijām var atbrīvoties, norādot leņķi nevis tieši, bet gan netieši caur nejauša apļa punkta taisnstūra koordinātām. Pēc tam, izmantojot šīs koordinātas, būs iespējams aprēķināt rādiusa vektora garumu un pēc tam atrast kosinusu un sinusu, dalot ar to attiecīgi x un y. Kā un kāpēc tas darbojas?
Izvēlēsimies nejaušu punktu no tiem, kas vienmērīgi sadalīti aplī ar vienības rādiusu, un apzīmēsim šī punkta rādiusa vektora garuma kvadrātu ar burtu s:

Izvēle tiek veikta, norādot nejaušas taisnstūra koordinātas x un y, kas vienmērīgi sadalītas intervālā (-1, 1), un atmetot punktus, kas nepieder pie apļa, kā arī centrālo punktu, kurā atrodas rādiusa vektora leņķis. nav definēts. Tas ir, ir jāizpilda nosacījums 0< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Mēs iegūstam formulas kā raksta sākumā. Šīs metodes trūkums ir tāds, ka tā atmet punktus, kas nav iekļauti aplī. Tas ir, izmantojot tikai 78,5% no ģenerētajiem nejaušajiem mainīgajiem. Vecākos datoros trigonometrijas funkciju trūkums joprojām bija liela priekšrocība. Tagad, kad viena procesora komanda vienā mirklī aprēķina gan sinusu, gan kosinusu, es domāju, ka šīs metodes joprojām var konkurēt.

Personīgi man joprojām ir divi jautājumi:

  • Kāpēc s vērtība tiek sadalīta vienmērīgi?
  • Kāpēc divu parasto gadījuma lielumu kvadrātu summa ir sadalīta eksponenciāli?
Tā kā s ir rādiusa kvadrāts (vienkāršības labad es rādiusu saucu par rādiusa vektora garumu, kas nosaka nejauša punkta pozīciju), vispirms noskaidrojam, kā tiek sadalīti rādiusi. Tā kā aplis ir aizpildīts vienmērīgi, ir acīmredzams, ka punktu skaits ar rādiusu r ir proporcionāls apļa ar rādiusu r garumam. Un apļa apkārtmērs ir proporcionāls rādiusam. Tas nozīmē, ka rādiusu sadalījuma blīvums vienmērīgi palielinās no apļa centra līdz tā malām. Un blīvuma funkcijai ir forma f(x) = 2x intervālā (0, 1). Koeficients 2, lai skaitļa laukums zem grafika būtu vienāds ar vienu. Kad šis blīvums ir kvadrātā, tas kļūst vienmērīgs. Tā kā teorētiski šajā gadījumā blīvuma funkcija ir jāsadala ar tās transformācijas funkcijas atvasinājumu (tas ir, x 2). Un skaidrs, ka tas notiek šādi:

Ja līdzīga transformācija tiek veikta normālam gadījuma mainīgajam, tad tā kvadrāta blīvuma funkcija izrādīsies līdzīga hiperbolai. Un divu parasto nejaušo mainīgo kvadrātu pievienošana ir daudz sarežģītāks process, kas saistīts ar dubultu integrāciju. Un tas, ka rezultāts būs eksponenciāls sadalījums, man personīgi ir tikai jāpārbauda ar praktisku metodi vai jāpieņem kā aksioma. Un tiem, kam ir interese, iesaku papētīt tēmu tuvāk, smeļoties zināšanas no šīm grāmatām:

  • Ventzel E.S. Varbūtību teorija
  • Knuts D.E. Programmēšanas māksla, 2. sējums

Nobeigumā šeit ir piemērs normāli sadalīta nejaušo skaitļu ģeneratora ieviešanai JavaScript:

Funkcija Gauss() ( var gatavs = false; var second = 0,0; this.next = funkcija (vidējais, dev) ( vidējais = vidējais == nedefinēts ? 0,0: vidējais; dev = dev == nenoteikts ? 1,0: dev; if ( this.ready) ( this.ready = false; atgriež this.second * dev + mean; ) else ( var u, v, s; do ( u = 2,0 * Math.random() - 1,0; v = 2,0 * Math. random() - 1,0 s = u * u + v * v (s > 1,0 || s == 0,0 this.ready = true; vidējais ) ) g = jauns Gauss(); // izveidot objektu a = g.next(); // ģenerējiet vērtību pāri un iegūstiet pirmo b = g.next(); // iegūt otro c = g.next(); // vēlreiz ģenerējiet vērtību pāri un iegūstiet pirmo
Parametru vidējais rādītājs (matemātiskā prognoze) un dev (standarta novirze) nav obligāti. Es vēršu jūsu uzmanību uz to, ka logaritms ir dabisks.



Jaunums vietnē

>

Populārākais