Variabila aleatoare x este dată de o funcție. Așteptările matematice ale unei variabile aleatoare continue. D(C)=0, unde C=const

Prin creșterea deducerilor pentru amortizare, aceasta este o metodă de optimizare fiscală destul de riscantă și consumatoare de timp. În același timp, practica arată că mulți reușesc să mărească valoarea deprecierii (sau să reducă costul inițial al obiectului) și, prin urmare, să economisească impozitul pe venit. Să luăm în considerare ce metode de economisire permit organizațiilor să reducă impozitul pe venit prin amortizare și cât de riscantă este utilizarea lor din punct de vedere fiscal în articol "Cinci moduri simple, care va reduce impozitul pe venit datorat deprecierii”.

Contabilul însuși o determină pe baza duratei de viață utilă a obiectului conform formulei:

Notă: deoarece ratele de amortizare sunt determinate în funcție de durata de viață utilă a obiectului, iar o astfel de perioadă este determinată de așa-numita grupuri de amortizare, în tabelul nostru, indicatorul inițial este grupul de amortizare - acest lucru vă va face mai ușor să utilizați tabelul.

Ratele de amortizare estimate pentru mijloacele fixe pe grupe de amortizare

Grupa de amortizare

Durata de viață utilă a mijlocului fix în ani

Durata de viață utilă a mijlocului fix în luni

Rata anuală de amortizare în scopuri contabile (metoda liniară, metoda soldului reducător), %

Rata lunară de amortizare în scopuri contabile fiscale (metoda liniară), %

Primul grup - toate proprietățile nedurabile cu o durată de viață utilă de 1 până la 2 ani inclusiv

Al doilea grup - proprietate cu o durată de viață utilă mai mare de 2 ani până la 3 ani inclusiv

Al treilea grup - proprietate cu o durată de viață utilă mai mare de 3 ani până la 5 ani inclusiv

Al patrulea grup - proprietate cu o durată de viață utilă mai mare de 5 ani până la 7 ani inclusiv

Grupa a cincea - proprietate cu o durată de viață utilă mai mare de 7 ani până la 10 ani inclusiv

Al șaselea grup - proprietate cu o durată de viață utilă mai mare de 10 ani până la 15 ani inclusiv

A șaptea grupă - proprietate cu o durată de viață utilă mai mare de 15 ani până la 20 de ani inclusiv

Grupa a opta - proprietate cu o durată de viață utilă de peste 20 de ani până la 25 de ani inclusiv

Al nouălea grup - proprietate cu o durată de viață utilă de peste 25 de ani până la 30 de ani inclusiv

A zecea grupă - proprietate cu o durată de viață utilă de peste 30 de ani

Să verificăm dacă este îndeplinită cerința de mărginire uniformă a varianței. Să scriem legea distribuției :

Să găsim așteptarea matematică
:

Să găsim variația
:

Această funcție este în creștere, așa că pentru a calcula constanta care limitează varianța, puteți calcula limita:

Astfel, variațiile datei variabile aleatoare sunt nemărginite, ceea ce urma să fie dovedit.

B) Din formularea teoremei lui Cebyshev rezultă că cerința mărginirii uniforme a varianțelor este o condiție suficientă, dar nu necesară, prin urmare nu se poate susține că această teoremă nu poate fi aplicată unei anumite secvențe.

Secvența variabilelor aleatoare independente Х 1 , Х 2 , …, Х n , … este dată de legea distribuției

D(X n)=M(X n 2)- 2 ,

rețineți că M(X n)=0, vom găsi (calculele sunt lăsate la latitudinea cititorului)

Să presupunem temporar că n se modifică continuu (pentru a sublinia această presupunere, notăm n cu x) și examinăm funcția φ(x)=x 2 /2 x-1 pentru un extremum.

Echivalând prima derivată a acestei funcții cu zero, găsim punctele critice x 1 \u003d 0 și x 2 \u003d ln 2.

Renunțăm la primul punct ca neinteresant (n nu ia o valoare egală cu zero); este uşor de observat că în punctele x 2 =2/ln 2 funcţia φ(x) are un maxim. Având în vedere că 2/ln 2 ≈ 2,9 și că N este un întreg pozitiv, se calculează varianța D(X n)= (n 2 /2 n -1)α 2 pentru numerele întregi cele mai apropiate de 2,9 (stânga și dreapta), t . e. pentru n=2 și n=3.

La n=2, dispersia D(X2)=2a2, la n=3, dispersia D(X3)=9/4a2. Evident,

(9/4)α 2 > 2α 2 .

Astfel, cea mai mare varianță posibilă este egală cu (9/4)α 2 , adică. varianțele variabilelor aleatoare Хn sunt limitate uniform de numărul (9/4)α 2 .

Secvența variabilelor aleatoare independente X 1 , X 2 , …, X n , … este dată de legea distribuției

Este teorema lui Cebyshev aplicabilă unei anumite secvențe?

Cometariu. Deoarece variabilele aleatoare X sunt egal distribuite și independente, cititorul care este familiarizat cu teorema lui Khinchin se poate limita la calcularea așteptărilor matematice și se poate asigura că aceasta s-a terminat.

Deoarece variabilele aleatoare X n sunt independente, ele sunt chiar mai mult și independente pe perechi, adică. prima cerinţă a teoremei lui Cebişev este îndeplinită.

Este ușor de găsit că M(X n)=0, adică prima cerință a caracterului finit al așteptărilor matematice este satisfăcută.

Rămâne de verificat fezabilitatea cerinței de limitare uniformă a variațiilor. Conform formulei

D(X n)=M(X n 2)- 2 ,

rețineți că M(X n)=0, găsim

Astfel, cea mai mare varianță posibilă este 2, adică. dispersiile variabilelor aleatoare Х n sunt limitate uniform de numărul 2.

Deci, toate cerințele teoremei Chebyshev sunt îndeplinite, prin urmare, această teoremă este aplicabilă șirului luat în considerare.

Aflați probabilitatea ca, în urma testului, valoarea X să capete o valoare cuprinsă în intervalul (0, 1/3).

Variabila aleatoare Х este dată pe toată axa Оx de funcția distribuită F(x)=1/2+(arctg x)/π. Aflați probabilitatea ca, în urma testului, valoarea X să capete o valoare cuprinsă în intervalul (0, 1).

Probabilitatea ca X să ia valoarea conținută în intervalul (a, b) este egală cu incrementul funcției de distribuție pe acest interval: P(a

P(0< Х <1) = F(1)-F(0) = x =1 - x =0 = 1/4

Funcția de distribuție X variabilă aleatoare

Aflați probabilitatea ca, în urma testului, valoarea X să capete o valoare cuprinsă în intervalul (-1, 1).

Probabilitatea ca X să ia valoarea conținută în intervalul (a, b) este egală cu incrementul funcției de distribuție pe acest interval: P(a

P(-1< Х <1) = F(1)-F(-1) = x =-1 – x =1 = 1/3.

Funcția de distribuție a unei variabile aleatoare continue X (timp de funcționare a unui dispozitiv) este egală cu F(x)=1-e -x/ T (x≥0). Găsiți probabilitatea de funcționare fără defecțiuni a dispozitivului pentru timpul x≥T.

Probabilitatea ca X să ia valoarea conținută în intervalul x≥T este egală cu incrementul funcției de distribuție pe acest interval: P(0

P(x≥T) = 1 - P(T

Variabila aleatoare X este dată de funcția de distribuție

Aflați probabilitatea ca, în urma testului, X să capete o valoare: a) mai mică de 0,2; b) mai puțin de trei; c) cel puţin trei; d) cel puțin cinci.

a) Deoarece pentru x≤2 funcția F(x)=0, atunci F(0, 2)=0, i.e. P(x< 0, 2)=0;

b) P(X< 3) = F(3) = x =3 = 1.5-1 = 0.5;

c) evenimentele Х≥3 și Х<3 противоположны, поэтому Р(Х≥3)+Р(Х<3)=1. Отсюда, учитывая, что Р(Х<3)=0.5 [см. п. б.], получим Р(Х≥3) = 1-0.5 = 0.5;

d) suma probabilităților de evenimente opuse este egală cu unu, deci P(X≥5) + P(X<5)=1. Отсюда, используя условие, в силу которого при х>Cu funcția F(x)=1, obținem P(X≥5) = 1-P(X<5) = 1-F(5) = 1-1 = 0.

Variabila aleatoare X este dată de funcția de distribuție

Găsiți probabilitatea ca, în urma a patru încercări independente, valoarea lui X să ia exact de trei ori o valoare care aparține intervalului (0,25, 0,75).

Probabilitatea ca X să ia valoarea conținută în intervalul (a, b) este egală cu incrementul funcției de distribuție pe acest interval: P(a

P(0,25< X <0.75) = F(0.75)-F(0.25) = 0.5

Prin urmare, sau De aici, sau.

Variabila aleatoare X este dată pe toată axa Ox de funcția de distribuție. Găsiți o posibilă valoare care să îndeplinească condiția: cu o probabilitate aleatorie X ca rezultat al testului va lua o valoare mai mare decât

Soluţie. Evenimentele și sunt opuse, prin urmare. Prin urmare, . De atunci .

Prin definiția funcției de distribuție, .

Prin urmare, sau . De aici, sau.

Variabila aleatoare discretă X este dată de legea distribuției

Deci, funcția de distribuție dorită are forma

Variabila aleatoare discretă X este dată de legea distribuției

Găsiți funcția de distribuție și desenați graficul acesteia.

Având în vedere funcția de distribuție a unei variabile aleatoare continue X

Aflați densitatea distribuției f(x).

Densitatea distribuției este egală cu derivata întâi a funcției de distribuție:

Pentru x=0 derivata nu există.

O variabilă aleatoare continuă X este dată de densitatea distribuției în intervalul ; în afara acestui interval. Aflați probabilitatea ca X să ia o valoare care aparține intervalului .

Să folosim formula. După condiție și . Prin urmare, probabilitatea dorită

O variabilă aleatoare continuă X este dată de densitatea distribuției în interval; în afara acestui interval. Aflați probabilitatea ca X să ia o valoare care aparține intervalului .

Să folosim formula. După condiție și . Prin urmare, probabilitatea dorită

Densitatea de distribuție a unei variabile aleatoare continue X în intervalul (-π/2, π/2) este egală cu f(x)=(2/π)*cos2x ; în afara acestui interval f(x)=0. Găsiți probabilitatea ca în trei încercări independente X să ia exact de două ori valoarea conținută în interval (0, π/4).

Folosim formula Р(a

P(0

Răspuns: π+24π.

fx=0, la x≤0cosx, la 0

Folosim formula

Dacă x ≤0, atunci f(x)=0, prin urmare,

F(x)=-∞00dx=0.

Daca 0

F(x)=-∞00dx+0xcosxdx=sinx.

Dacă x≥ π2 , atunci

F(x)=-∞00dx+0π2cosxdx+π2x0dx=sinx|0π2=1.

Deci, funcția de distribuție dorită

Fx=0, la x≤0sinx, la 0 π2.

Densitatea de distribuție a unei variabile aleatoare continue X este dată:

Fx=0, la x≤0sinx, la 0 π2.

Găsiți funcția de distribuție F(x).

Folosim formula

Densitatea de distribuție a unei variabile aleatoare continue X este dată pe toată axa Oh de ecuația . Găsiți parametrul constant C.

.

. (*)

.

În acest fel,

Densitatea de distribuție a unei variabile aleatoare continue este dată pe întreaga axă de egalitatea Găsiți parametrul constant C.

Soluţie. Densitatea de distribuție trebuie să îndeplinească condiția . Cerem ca această condiție să fie îndeplinită pentru funcția dată:

.

. (*)

Să găsim mai întâi integrala nedefinită:

.

Apoi calculăm integrala improprie:

În acest fel,

Înlocuind (**) în (*), obținem în sfârșit .

Densitatea de distribuție a unei variabile aleatoare continue X în interval este ; în afara acestui interval f(x) = 0. Aflați parametrul constant C.

.

. (*)

Să găsim mai întâi integrala nedefinită:

Apoi calculăm integrala improprie:

(**)

Înlocuind (**) în (*), obținem în sfârșit .

Densitatea de distribuție a unei variabile aleatoare continue X este dată în interval de egalitatea ; în afara acestui interval f(x) = 0. Aflați parametrul constant C.

Soluţie. Densitatea distribuției trebuie să îndeplinească condiția , dar întrucât f(x) în afara intervalului este egal cu 0, este suficient să îndeplinească: Cerem ca această condiție să fie îndeplinită pentru funcția dată:

.

. (*)

Să găsim mai întâi integrala nedefinită:

Apoi calculăm integrala improprie:

(**)

Înlocuind (**) în (*), obținem în sfârșit .

Variabila aleatoare X este dată de densitatea distribuției ƒ(x) = 2x în intervalul (0,1); în afara acestui interval ƒ(x) = 0. Aflați așteptarea matematică a lui X.

R soluţie. Folosim formula

Înlocuind a = 0, b = 1, ƒ(x) = 2x, obținem

Raspuns: 2/3.

Variabila aleatoare X este dată de densitatea distribuției ƒ(x) = (1/2)x în intervalul (0;2); în afara acestui interval ƒ(x) = 0. Aflați așteptarea matematică a lui X.

R soluţie. Folosim formula

Înlocuind a = 0, b = 2, ƒ(x) = (1/2)x, obținem

M(X) = = 4/3

Raspuns: 4/3.

Variabila aleatoare X în intervalul (–s, s) este dată de densitatea distribuției

ƒ (x) = ; în afara acestui interval ƒ(x) = 0. Aflați așteptarea matematică a lui X.

R soluţie. Folosim formula

Înlocuind a = –с, b = c, ƒ(x) = , obținem

Având în vedere că integrandul este impar și limitele integrării sunt simetrice față de origine, concluzionăm că integrala este egală cu zero. Prin urmare, M(X) = 0.

Acest rezultat poate fi obținut imediat dacă ținem cont de faptul că curba de distribuție este simetrică față de dreapta x = 0.

Variabila aleatoare X în intervalul (2, 4) este dată de densitatea distribuției f(x)=

. Din aceasta se poate observa ca la x=3 densitatea de distributie atinge un maxim; Prin urmare, . Curba de distribuție este simetrică față de dreapta x=3, deci și .

Variabila aleatoare X în intervalul (3, 5) este dată de densitatea distribuției f(x)= ; în afara acestui interval f(x)=0. Găsiți modul, media și mediana lui X.

Soluţie. Reprezentăm densitatea de distribuție în formă . Din aceasta se poate observa ca la x=3 densitatea de distributie atinge un maxim; Prin urmare, . Curba de distribuție este simetrică față de dreapta x=4, deci și .

Variabila aleatoare X în intervalul (-1, 1) este dată de densitatea distribuției ; în afara acestui interval f(x)=0. Găsiți: a) modă; b) mediana X.

Exemple de rezolvare a problemelor pe tema „Variabile aleatoare”.

O sarcină 1 . Sunt 100 de bilete emise la loterie. S-a jucat o victorie de 50 USD. și zece câștiguri de 10 USD fiecare. Aflați legea distribuției valorii X - costul unui posibil câștig.

Soluţie. Valori posibile ale lui X: x 1 = 0; X 2 = 10 și x 3 = 50. Deoarece există 89 de bilete „goale”, atunci p 1 = 0,89, probabilitatea de castig este de 10 c.u. (10 bilete) – p 2 = 0,10 și pentru un câștig de 50 c.u. –p 3 = 0,01. În acest fel:

0,89

0,10

0,01

Ușor de controlat: .

O sarcină 2. Probabilitatea ca cumpărătorul să se fi familiarizat în avans cu reclama produsului este de 0,6 (p = 0,6). Controlul selectiv al calității publicității este efectuat prin sondajul cumpărătorilor înaintea primului care a studiat reclama în prealabil. Faceți o serie de distribuție a numărului de cumpărători intervievați.

Soluţie. După condiţia problemei p = 0,6. Din: q=1 -p = 0,4. Înlocuind aceste valori, obținem:și construiți o serie de distribuție:

pi

0,24

O sarcină 3. Un computer este format din trei elemente care funcționează independent: o unitate de sistem, un monitor și o tastatură. Cu o singură creștere bruscă a tensiunii, probabilitatea de defecțiune a fiecărui element este de 0,1. Pe baza distribuției Bernoulli, întocmește legea distribuției pentru numărul de elemente defectate în timpul unei supratensiuni în rețea.

Soluţie. Considera distribuția Bernoulli(sau binom): probabilitatea ca în n teste, evenimentul A va apărea exact k o singura data: , sau:

q n

p n

ÎN să revenim la sarcină.

Valori posibile ale lui X (număr de defecțiuni):

x 0 =0 - niciunul dintre elemente nu a eșuat;

x 1 =1 - defectarea unui element;

x 2 =2 - defectarea a două elemente;

x 3 =3 - defectarea tuturor elementelor.

Deoarece, prin condiție, p = 0,1, atunci q = 1 – p = 0,9. Folosind formula Bernoulli, obținem

, ,

, .

Control: .

Prin urmare, legea de distribuție dorită:

0,729

0,243

0,027

0,001

Sarcina 4. Produse 5000 de runde. Probabilitatea ca un cartuş să fie defect . Care este probabilitatea ca în întregul lot să fie exact 3 cartușe defecte?

Soluţie. Aplicabil Distribuția Poisson: această distribuție este folosită pentru a determina probabilitatea ca, având în vedere un foarte mare

număr de încercări (încercări în masă), în fiecare dintre ele probabilitatea evenimentului A este foarte mică, evenimentul A va avea loc de k ori: , Unde .

Aici n \u003d 5000, p \u003d 0,0002, k \u003d 3. Găsim , apoi probabilitatea dorită: .

Sarcina 5. Când trageți înainte de prima lovitură cu probabilitatea de a lovi p = 0,6 pentru o lovitură, trebuie să găsiți probabilitatea ca lovitura să apară la a treia lovitură.

Soluţie. Să aplicăm distribuția geometrică: să se facă încercări independente, în fiecare dintre ele evenimentul A are o probabilitate de apariție p (și de neapariție q = 1 - p). Încercările se încheie imediat ce apare evenimentul A.

În astfel de condiții, probabilitatea ca evenimentul A să se producă la testul k este determinată de formula: . Aici p = 0,6; q \u003d 1 - 0,6 \u003d 0,4;k \u003d 3. Prin urmare, .

Sarcina 6. Fie dată legea distribuției unei variabile aleatoare X:

Găsiți așteptările matematice.

Soluţie. .

Rețineți că sensul probabilistic al așteptării matematice este valoarea medie a unei variabile aleatoare.

Sarcina 7. Aflați varianța unei variabile aleatoare X cu următoarea lege de distribuție:

Soluţie. Aici .

Legea distribuției pătratului lui X 2 :

X 2

Varianta necesară: .

Dispersia caracterizează gradul de abatere (împrăștiere) a unei variabile aleatoare de la așteptarea ei matematică.

Sarcina 8. Fie variabila aleatoare dată de distribuția:

10m

Găsiți caracteristicile sale numerice.

Rezolvare: m, m 2 ,

M 2 , m.

Despre o variabilă aleatoare X, se poate spune fie - așteptarea sa matematică este de 6,4 m cu o varianță de 13,04 m 2 , sau - așteptarea sa matematică este de 6,4 m cu o abatere de m. A doua formulare este evident mai clară.

O sarcină 9. Valoare aleatoare X dat de funcția de distribuție:
.

Aflați probabilitatea ca, în urma testului, valoarea X să capete o valoare cuprinsă în interval .

Soluţie. Probabilitatea ca X să ia o valoare dintr-un interval dat este egală cu incrementul funcției integrale în acest interval, i.e. . În cazul nostru și, prin urmare

.

O sarcină 10. Variabilă aleatoare discretă X dat de legea distributiei:

Găsiți funcția de distribuție F(x ) și construiește-i graficul.

Soluţie. Deoarece funcţia de distribuţie

pentru , apoi

la ;

la ;

la ;

la ;

Grafic relevant:


Sarcina 11. Variabilă aleatoare continuă X dat de funcția de distribuție diferențială: .

Găsiți probabilitatea de a lovi X la interval

Soluţie. Rețineți că acesta este un caz special al legii distribuției exponențiale.

Să folosim formula: .

O sarcină 12. Aflați caracteristicile numerice ale unei variabile aleatoare discrete X date de legea distribuției:

–5

X 2 :

x2

. , Unde este funcția Laplace.

Valorile acestei funcții sunt găsite folosind un tabel.

În cazul nostru: .

Conform tabelului găsim:, prin urmare:

2. DESCRIEREA INCERTITUDINII ÎN TEORIA LUARE A DECIZIILOR

2.2. Metode probabilistic-statistice de descriere a incertitudinilor în teoria deciziei

2.2.4. Variabile aleatoare și distribuțiile lor

Distribuții ale variabilelor aleatoare și funcții de distribuție. Distribuția unei variabile aleatoare numerice este o funcție care determină în mod unic probabilitatea ca o variabilă aleatoare să ia o valoare dată sau să aparțină unui interval dat.

Prima este dacă variabila aleatoare ia un număr finit de valori. Atunci distribuția este dată de funcție P(X = x), dând fiecare valoare posibilă X variabilă aleatorie X probabilitatea ca X = x.

Al doilea este dacă variabila aleatoare ia infinit de valori. Acest lucru este posibil numai atunci când spațiul de probabilitate pe care este definită variabila aleatoare constă dintr-un număr infinit de evenimente elementare. Atunci distribuția este dată de mulțimea de probabilități P(a < X pentru toate perechile de numere a, b astfel încât A . Distribuția poate fi specificată folosind așa-numitul. funcția de distribuție F(x) = P(X definitoriu pentru toate reale X probabilitatea ca variabila aleatoare X ia valori mai mici decât X. Este clar că

P(a < X

Această relație arată că, așa cum distribuția poate fi calculată din funcția de distribuție, la fel, invers, funcția de distribuție poate fi calculată din distribuție.

Funcțiile de distribuție utilizate în metodele probabilistic-statistice de luare a deciziilor și alte cercetări aplicate sunt fie discrete, fie continue, fie combinații ale acestora.

Funcțiile de distribuție discretă corespund variabilelor aleatoare discrete care preiau un număr finit de valori sau valori dintr-o mulțime ale cărei elemente pot fi renumerotate prin numere naturale (astfel de mulțimi sunt numite numărabile în matematică). Graficul lor arată ca o scară (Fig. 1).

Exemplul 1 Număr X de articole defecte din lot ia valoarea 0 cu o probabilitate de 0,3, valoarea 1 cu o probabilitate de 0,4, valoarea 2 cu o probabilitate de 0,2 și valoarea 3 cu o probabilitate de 0,1. Graficul funcției de distribuție a unei variabile aleatoare X prezentat în Fig.1.

Fig.1. Graficul funcției de distribuție a numărului de produse defecte.

Funcțiile de distribuție continuă nu au salturi. Ele cresc monoton pe măsură ce argumentul crește, de la 0 pentru la 1 pentru . Variabilele aleatoare cu funcții de distribuție continuă se numesc continue.

Funcțiile de distribuție continuă utilizate în metodele decizionale probabilistic-statistice au derivate. Prima derivată f(x) functii de distributie F(x) se numește densitate de probabilitate,

Funcția de distribuție poate fi determinată din densitatea de probabilitate:

Pentru orice funcție de distribuție

prin urmare

Proprietățile enumerate ale funcțiilor de distribuție sunt utilizate constant în metodele decizionale probabilistic-statistice. În special, ultima egalitate implică o formă specifică a constantelor din formulele pentru densitățile de probabilitate considerate mai jos.

Exemplul 2 Următoarea funcție de distribuție este adesea folosită:

(1)

Unde AȘi b- unele numere A . Să găsim densitatea de probabilitate a acestei funcții de distribuție:

(la puncte x = aȘi x = b derivată de funcție F(x) nu exista).

O variabilă aleatoare cu funcție de distribuție (1) se numește „distribuită uniform pe intervalul [ A; b]».

Funcțiile de distribuție mixte apar, în special, atunci când observațiile se opresc la un moment dat. De exemplu, atunci când se analizează datele statistice obținute folosind planuri de testare de fiabilitate care prevăd terminarea testelor după o anumită perioadă de timp. Sau la analiza datelor despre produse tehnice care necesitau reparații în garanție.

Exemplul 3 Să fie, de exemplu, durata de viață a unui bec electric o variabilă aleatorie cu funcție de distribuție F(t), iar testul se efectuează până la defectarea becului, dacă aceasta are loc la mai puțin de 100 de ore de la începerea testului, sau până în momentul t0= 100 de ore. Lasa G(t)- funcția de distribuție a timpului de funcționare a lămpii în stare bună la acest test. Apoi

Funcţie G(t) are un salt la un punct t0, deoarece variabila aleatoare corespunzătoare ia valoarea t0 cu probabilitate 1- F(t0)> 0.

Caracteristicile variabilelor aleatoare.În metodele decizionale probabilistic-statistice se folosesc o serie de caracteristici ale variabilelor aleatoare, exprimate prin funcții de distribuție și densitate de probabilitate.

Când se descrie diferențierea veniturilor, când se găsesc limite de încredere pentru parametrii distribuțiilor variabilelor aleatoare și în multe alte cazuri, se folosește un concept precum „cuantila de ordin”. R", unde 0< p < 1 (обозначается x p). Comandă cuantilă R este valoarea unei variabile aleatoare pentru care funcția de distribuție ia valoarea R sau există un „salt” de la o valoare mai mică decât R până la o valoare mai mare R(Fig. 2). Se poate întâmpla ca această condiție să fie îndeplinită pentru toate valorile lui x aparținând acestui interval (adică, funcția de distribuție este constantă pe acest interval și este egală cu R). Apoi, fiecare astfel de valoare este numită „cuantilă a ordinului R».

Fig.2. Definiţia unui quantile x p Ordin R.

Pentru funcțiile de distribuție continuă, de regulă, există o singură cuantilă x p Ordin R(Fig. 2) și

F(x p) = p. (2)

Exemplul 4 Să găsim cuantila x p Ordin R pentru funcția de distribuție F(x) din (1).

La 0< p < 1 квантиль x p se găsește din ecuație

acestea. x p = a + p(b – a) = a( 1- p)+bp. La p= 0 oricare X < A este cuantila ordinului p= 0. Cuantila de ordin p= 1 este orice număr X > b.

Pentru distribuțiile discrete, de regulă, nu există x p ecuația satisfăcătoare (2). Mai precis, dacă distribuția unei variabile aleatoare este dată în Tabelul 1, unde x 1< x 2 < … < x k , apoi egalitatea (2), considerată ca o ecuație în raport cu x p, are solutii doar pt k valorile p, și anume,

p \u003d p 1,

p \u003d p 1 + p 2,

p \u003d p 1 + p 2 + p 3,

p \u003d p 1 + p 2 + ... + p m, 3< m < k,

p \u003d p 1 + p 2 + ... + p k.

Tabelul 1.

Distribuția unei variabile aleatoare discrete

Valori X variabilă aleatorie X

Probabilități P(X=x)

Pentru cele enumerate k valori de probabilitate p soluţie x p ecuația (2) nu este unică, și anume,

F(x) = p 1 + p 2 + ... + p m

pentru toți X astfel încât x m< x < xm+1. Acestea. x p - orice număr din interval (xm; xm+1). Pentru toți ceilalți R din intervalul (0;1) neinclus în lista (3), apare un „salt” de la o valoare mai mică decât R până la o valoare mai mare R. Și anume dacă

p 1 + p 2 + … + p m

apoi x p \u003d x m + 1.

Proprietatea considerată a distribuțiilor discrete creează dificultăți semnificative în tabelarea și utilizarea unor astfel de distribuții, deoarece se dovedește a fi imposibil să se mențină cu exactitate valorile numerice tipice ale caracteristicilor distribuției. În special, acest lucru este valabil pentru valorile critice și nivelurile de semnificație ale testelor statistice neparametrice (a se vedea mai jos), deoarece distribuțiile statisticilor acestor teste sunt discrete.

Cuantila de ordine este de mare importanță în statistică. R= S. Se numește mediană (variabilă aleatoare X sau funcția sa de distribuție F(x))și notat Eu (X).În geometrie, există conceptul de „mediană” - o linie dreaptă care trece prin vârful unui triunghi și își împarte latura opusă în jumătate. În statistica matematică, mediana nu bisectează latura triunghiului, ci distribuția unei variabile aleatoare: egalitatea F(x0,5)= 0,5 înseamnă că probabilitatea de a ajunge la stânga x0,5și probabilitatea de a obține dreptate x0,5(sau direct la x0,5) sunt egale între ele și egale cu S, adică.

P(X < X 0,5) = P(X > X 0,5) = S.

Mediana indică „centrul” distribuției. Din punctul de vedere al unuia dintre conceptele moderne - teoria procedurilor statistice stabile - mediana este o caracteristică mai bună a unei variabile aleatoare decât așteptarea matematică. Atunci când prelucrarea rezultatelor măsurătorii într-o scară ordinală (vezi capitolul despre teoria măsurării), mediana poate fi folosită, dar așteptările matematice nu.

O astfel de caracteristică a unei variabile aleatoare ca mod are o semnificație clară - valoarea (sau valorile) unei variabile aleatoare corespunzătoare unui maxim local al densității de probabilitate pentru o variabilă aleatoare continuă sau unui maxim local al probabilității pentru o variabilă aleatoare discretă. variabil.

Dacă x0 este modul unei variabile aleatoare cu densitate f(x), apoi, după cum se știe din calculul diferențial, .

O variabilă aleatoare poate avea mai multe moduri. Deci, pentru distribuția uniformă (1) fiecare punct X astfel încât A< x < b , este moda. Cu toate acestea, aceasta este o excepție. Majoritatea variabilelor aleatoare utilizate în metodele de luare a deciziilor probabilistic-statistice și alte cercetări aplicate au un singur mod. Variabilele aleatoare, densitățile, distribuțiile care au un singur mod sunt numite unimodale.

Așteptările matematice pentru variabile aleatoare discrete cu un număr finit de valori sunt luate în considerare în capitolul „Evenimente și probabilități”. Pentru o variabilă aleatoare continuă X valorea estimata M(X) satisface egalitatea

care este un analog al formulei (5) din afirmația 2 din capitolul „Evenimente și probabilități”.

Exemplul 5 Așteptări matematice pentru o variabilă aleatoare distribuită uniform X egală

Pentru variabilele aleatoare luate în considerare în acest capitol, sunt adevărate toate acele proprietăți ale așteptărilor și varianțelor matematice care au fost luate în considerare mai devreme pentru variabile aleatoare discrete cu un număr finit de valori. Cu toate acestea, nu oferim dovezi ale acestor proprietăți, deoarece ele necesită aprofundarea subtilităților matematice, ceea ce nu este necesar pentru înțelegerea și aplicarea calificată a metodelor probabilistic-statistice de luare a deciziilor.

Cometariu.În acest manual, subtilitățile matematice sunt evitate în mod deliberat, legate, în special, de conceptele de mulțimi măsurabile și funcții măsurabile, de -algebra evenimentelor și așa mai departe. Cei care doresc să stăpânească aceste concepte ar trebui să se refere la literatura de specialitate, în special la enciclopedie.

Fiecare dintre cele trei caracteristici - așteptare matematică, mediană, mod - descrie „centrul” distribuției probabilităților. Conceptul de „centru” poate fi definit în moduri diferite – de unde cele trei caracteristici diferite. Cu toate acestea, pentru o clasă importantă de distribuții - unimodal simetric - toate cele trei caracteristici coincid.

Densitatea de distribuție f(x) este densitatea distribuției simetrice, dacă există un număr x 0 astfel încât

. (3)

Egalitatea (3) înseamnă că graficul funcției y = f(x) simetric față de o linie verticală care trece prin centrul de simetrie X = X 0 . Din (3) rezultă că funcția de distribuție simetrică satisface relația

(4)

Pentru o distribuție simetrică cu un singur mod, media, mediana și modul sunt aceleași și egale x 0.

Cel mai important caz este simetria față de 0, adică. x 0= 0. Atunci (3) și (4) devin egalități

(6)

respectiv. Relațiile de mai sus arată că nu este nevoie să se tabulare distribuțiile simetrice pentru toate X, este suficient să aveți tabele pentru X > x0.

Observăm încă o proprietate a distribuțiilor simetrice, care este utilizată constant în metodele de luare a deciziilor probabilistic-statistice și alte cercetări aplicate. Pentru o funcție de distribuție continuă

P(|X| < a) = P(-a < X < a) = F(a) – F(-a),

Unde F este funcția de distribuție a variabilei aleatoare X. Dacă funcţia de distribuţie F este simetric în raport cu 0, i.e. formula (6) este valabilă pentru aceasta, atunci

P(|X| < a) = 2F(a) – 1.

Deseori se foloseşte o altă formulare a enunţului luat în considerare: dacă

.

Dacă și sunt cuantile de ordinul și, respectiv (vezi (2)) ale unei funcții de distribuție simetrice față de 0, atunci din (6) rezultă că

Din caracteristicile poziției - așteptarea matematică, mediană, mod - să trecem la caracteristicile răspândirii unei variabile aleatoare X: varianță, abatere standard și coeficient de variație v. Definiția și proprietățile varianței pentru variabile aleatoare discrete au fost luate în considerare în capitolul anterior. Pentru variabile aleatoare continue

Abaterea standard este valoarea nenegativă a rădăcinii pătrate a varianței:

Coeficientul de variație este raportul dintre abaterea standard și așteptarea matematică:

Coeficientul de variaţie se aplică atunci când M(X)> 0. Măsoară răspândirea în unități relative, în timp ce abaterea standard este în unități absolute.

Exemplul 6 Pentru o variabilă aleatoare distribuită uniform X găsiți varianța, abaterea standard și coeficientul de variație. Dispersia este:

Substituția variabilă face posibilă scrierea:

Unde c = (bA)/ 2. Prin urmare, abaterea standard este egală cu și coeficientul de variație este:

Pentru fiecare variabilă aleatoare X determina inca trei marimi - centrate Y, normalizat Vși dat U. Variabilă aleatoare centrată Y este diferența dintre variabila aleatoare dată Xși așteptările sale matematice M(X), acestea. Y = X - M(X). Așteptările matematice ale unei variabile aleatoare centrate Y este egală cu 0, iar varianța este varianța variabilei aleatoare date: M(Y) = 0, D(Y) = D(X). funcția de distribuție FY(X) variabilă aleatoare centrată Y legate de funcţia de distribuţie F(X) variabilă aleatoare inițială X raport:

FY(X) = F(X + M(X)).

Pentru densitățile acestor variabile aleatoare, egalitatea

fY(X) = f(X + M(X)).

Variabila aleatorie normalizata V este raportul acestei variabile aleatoare X la abaterea sa standard, adică . Așteptările matematice și varianța unei variabile aleatoare normalizate V exprimate prin caracteristici X Asa de:

,

Unde v este coeficientul de variație al variabilei aleatoare originale X. Pentru funcția de distribuție F V(X) si densitate f V(X) variabilă aleatoare normalizată V avem:

Unde F(X) este funcția de distribuție a variabilei aleatoare originale X, dar f(X) este densitatea sa de probabilitate.

Variabilă aleatoare redusă U este o variabilă aleatoare centrată și normalizată:

.

Pentru o variabilă aleatoare redusă

Variabilele aleatoare normalizate, centrate și reduse sunt utilizate în mod constant atât în ​​cercetarea teoretică, cât și în algoritmi, produse software, documentație de reglementare și tehnică și instructivă și metodologică. În special, pentru că egalitățile fac posibilă simplificarea fundamentarii metodelor, formulărilor de teoreme și formulelor de calcul.

Se folosesc transformări ale variabilelor aleatoare și un plan mai general. Astfel, dacă Y = topor + b, Unde AȘi b sunt niște numere, atunci

Exemplul 7 Daca atunci Y este variabila aleatoare redusă, iar formulele (8) sunt transformate în formule (7).

Cu fiecare variabilă aleatoare X puteți conecta o mulțime de variabile aleatorii Y dat de formula Y = topor + b la diverse A> 0 și b. Acest set se numește familie cu schimbare la scară, generat de o variabilă aleatoare X. Funcții de distribuție FY(X) constituie o familie de distribuții cu schimbare la scară generată de funcția de distribuție F(X). În loc de Y = topor + b notație folosită frecvent

Număr din se numește parametrul de schimbare și numărul d- parametrul de scară. Formula (9) arată că X- rezultatul măsurării unei anumite cantităţi - intră în La- rezultatul măsurării aceleiași valori, dacă începutul măsurării este mutat în punct din, apoi utilizați noua unitate de măsură, în d ori mai mare decât cea veche.

Pentru familia scale-shift (9), distribuția X se numește standard. În metodele probabilistic-statistice de luare a deciziilor și în alte cercetări aplicate se utilizează distribuția normală standard, distribuția standard Weibull-Gnedenko, distribuția gamma standard etc. (vezi mai jos).

Sunt folosite și alte transformări ale variabilelor aleatoare. De exemplu, pentru o variabilă aleatoare pozitivă X considera Y= jurnal X, unde lg X este logaritmul zecimal al numărului X. Lanț de egalități

F Y (x) = P( lg X< x) = P(X < 10x) = F( 10X)

raportează funcțiile de distribuție XȘi Y.

La procesarea datelor, sunt utilizate astfel de caracteristici ale unei variabile aleatorii X ca momentele de ordine q, adică așteptările matematice ale unei variabile aleatorii X q, q= 1, 2, … Astfel, așteptarea matematică în sine este un moment de ordin 1. Pentru o variabilă aleatoare discretă, momentul de ordin q poate fi calculat ca

Pentru o variabilă aleatoare continuă

Momente de ordine q numite şi momentele iniţiale ale ordinului q, spre deosebire de caracteristicile conexe – momentele centrale ale ordinului q, dat de formula

Astfel, dispersia este un moment central de ordinul 2.

Distribuția normală și teorema limitei centrale.În metodele probabilistic-statistice de luare a deciziilor, vorbim adesea despre o distribuție normală. Uneori încearcă să-l folosească pentru a modela distribuția datelor inițiale (aceste încercări nu sunt întotdeauna justificate - vezi mai jos). Mai important, multe metode de procesare a datelor se bazează pe faptul că valorile calculate au distribuții apropiate de normal.

Lasa X 1 , X 2 ,…, X n M(X i) = m si dispersii D(X i) = , i= 1, 2,…, n,… După cum rezultă din rezultatele capitolului anterior,

Luați în considerare variabila aleatoare redusă U n pentru suma , și anume,

După cum rezultă din formulele (7), M(U n) = 0, D(U n) = 1.

(pentru termeni distribuiti identic). Lasa X 1 , X 2 ,…, X n, … sunt variabile aleatoare independente distribuite identic cu așteptări matematice M(X i) = m si dispersii D(X i) = , i= 1, 2,…, n,… Atunci pentru orice x există o limită

Unde F(x) este funcția de distribuție normală standard.

Mai multe despre funcție F(x) - mai jos (se citește „fi din x”, pentru că F- Literă mare greacă „phi”).

Teorema limită centrală (CLT) își ia numele de la faptul că este rezultatul matematic central, cel mai frecvent utilizat al teoriei probabilităților și al statisticii matematice. Istoria CLT durează aproximativ 200 de ani - din 1730, când matematicianul englez A. De Moivre (1667-1754) a publicat primul rezultat legat de CLT (vezi mai jos despre teorema Moivre-Laplace), până în anii douăzeci - treizeci. al secolului al XX-lea, când Finn J.W. Lindeberg, francezul Paul Levy (1886-1971), iugoslav V. Feller (1906-1970), rusul A.Ya. Khinchin (1894-1959) și alți oameni de știință au obținut condiții necesare și suficiente pentru valabilitatea teoremei limitei centrale clasice.

Dezvoltarea subiectului luat în considerare nu s-a oprit deloc aici - au studiat variabile aleatoare care nu au dispersie, adică. cei pentru care

(academician B.V. Gnedenko și alții), situația în care se însumează variabile aleatoare (mai precis, elemente aleatoare) de natură mai complexă decât numerele (academicienii Yu.V. Prokhorov, A.A. Borovkov și asociații lor), etc. .d.

funcția de distribuție F(x) este dat de egalitate

,

unde este densitatea distribuției normale standard, care are o expresie destul de complicată:

.

Aici \u003d 3,1415925 ... este un număr cunoscut în geometrie, egal cu raportul dintre circumferință și diametru, e\u003d 2,718281828 ... - baza logaritmilor naturali (pentru a ne aminti acest număr, rețineți că 1828 este anul nașterii scriitorului Lev Tolstoi). După cum se știe din analiza matematică,

La procesarea rezultatelor observațiilor, funcția de distribuție normală nu este calculată conform formulelor de mai sus, ci se găsește folosind tabele speciale sau programe de calculator. Cele mai bune „Tabele de statistici matematice” în limba rusă au fost întocmite de membrii corespondenți ai Academiei de Științe a URSS L.N. Bolşev şi N.V. Smirnov.

Forma densității distribuției normale standard decurge din teoria matematică, pe care nu o putem considera aici, precum și demonstrația CLT.

Pentru ilustrare, prezentăm mici tabele ale funcției de distribuție F(x)(Tabelul 2) și cuantilele sale (Tabelul 3). Funcţie F(x) este simetrică față de 0, ceea ce este reflectat în tabelele 2-3.

Masa 2.

Funcția distribuției normale standard.

Dacă variabila aleatoare X are o funcție de distribuție F(x), apoi M(X) = 0, D(X) = 1. Această afirmație este dovedită în teoria probabilității pe baza formei densității probabilității . Este de acord cu o afirmație similară pentru caracteristicile variabilei aleatoare reduse U n, ceea ce este destul de firesc, deoarece CLT afirmă că, cu o creștere infinită a numărului de termeni, funcția de distribuție U n tinde spre funcția de distribuție normală standard F(x), si pentru orice X.

Tabelul 3

Cuantile ale distribuției normale standard.

Comandă cuantilă R

Comandă cuantilă R

Să introducem conceptul de familie de distribuții normale. Prin definiție, o distribuție normală este distribuția unei variabile aleatoare X, pentru care distribuția variabilei aleatoare reduse este F(x). După cum rezultă din proprietățile generale ale familiilor de distribuții cu schimbare la scară (vezi mai sus), distribuția normală este distribuția unei variabile aleatoare

Unde X este o variabilă aleatoare cu distribuție F(X),și m = M(Y), = D(Y). Distribuție normală cu parametrii de deplasare m iar scara este de obicei indicată N(m, ) (uneori notația N(m, ) ).

După cum rezultă din (8), densitatea de probabilitate a distribuției normale N(m, ) mânca

Distribuțiile normale formează o familie cu schimbare la scară. În acest caz, parametrul de scară este d= 1/ și parametrul de deplasare c = - m/ .

Pentru momentele centrale ale ordinului trei și al patrulea ale distribuției normale, egalitățile sunt adevărate

Aceste egalități formează baza metodelor clasice de verificare a faptului că rezultatele observațiilor urmează o distribuție normală. În prezent, normalitatea este de obicei recomandată a fi verificată prin criteriu W Shapiro - Wilka. Problema verificării normalității este discutată mai jos.

Dacă variabile aleatorii X 1Și X 2 au funcții de distribuție N(m 1 , 1 ) Și N(m 2 , 2 ) respectiv, atunci X 1+ X 2 are o distributie Prin urmare, dacă variabilele aleatoare X 1 , X 2 ,…, X n N(m, ) , apoi media lor aritmetică

are o distributie N(m, ) . Aceste proprietăți ale distribuției normale sunt utilizate în mod constant în diferite metode probabilistic-statistice de luare a deciziilor, în special, în controlul statistic al proceselor tehnologice și în controlul acceptării statistice printr-un atribut cantitativ.

Distribuția normală definește trei distribuții care sunt acum adesea folosite în procesarea datelor statistice.

Distribuție (chi - pătrat) - distribuția unei variabile aleatoare

unde variabile aleatorii X 1 , X 2 ,…, X n sunt independente și au aceeași distribuție N(0,1). În acest caz, numărul de termeni, adică n, se numește „numărul de grade de libertate” al distribuției chi-pătrat.

Distributie t Student este distribuția unei variabile aleatoare

unde variabile aleatorii UȘi X independent, U are o distribuție normală standard N(0,1) și X– distribuție chi – pătrat cu n grade de libertate. în care n se numește „numărul de grade de libertate” al distribuției Studentului. Această distribuție a fost introdusă în 1908 de statisticianul englez W. Gosset, care lucra la o fabrică de bere. Pentru luarea deciziilor economice și tehnice la această fabrică s-au folosit metode probabilistic-statistice, așa că conducerea acesteia i-a interzis lui V. Gosset să publice articole științifice sub nume propriu. În acest fel a fost protejat un secret comercial, „know-how” sub forma metodelor probabilistic-statistice dezvoltate de W. Gosset. Cu toate acestea, a putut publica sub pseudonimul „Student”. Istoria lui Gosset-Student arată că încă o sută de ani, marea eficiență economică a metodelor probabilistic-statistice de luare a deciziilor a fost evidentă pentru managerii britanici.

Distribuția Fisher este distribuția unei variabile aleatoare

unde variabile aleatorii X 1Și X 2 sunt independente și au distribuții chi - pătratul cu numărul de grade de libertate k 1 Și k 2 respectiv. În același timp, un cuplu (k 1 , k 2 ) este o pereche de „numere de grade de libertate” ale distribuției Fisher și anume, k 1 este numărul de grade de libertate ale numărătorului și k 2 este numărul de grade de libertate ale numitorului. Distribuția variabilei aleatoare F este numită după marele statistician englez R. Fisher (1890-1962), care a folosit-o activ în lucrarea sa.

Expresiile pentru funcțiile de distribuție ale chi - pătrat, Student și Fisher, densitățile și caracteristicile acestora, precum și tabele pot fi găsite în literatura specială (vezi, de exemplu,).

După cum sa menționat deja, distribuțiile normale sunt adesea utilizate în modelele probabilistice în diferite domenii aplicate. De ce este această familie de distribuții cu doi parametri atât de răspândită? Se clarifică prin următoarea teoremă.

Teorema limitei centrale(pentru termeni distribuiti diferit). Lasa X 1 , X 2 ,…, X n,… sunt variabile aleatoare independente cu așteptări matematice M(X 1 ), M(X 2 ),…, M(X n), … și dispersii D(X 1 ), D(X 2 ),…, D(X n), … respectiv. Lasa

Apoi, în valabilitatea anumitor condiții care asigură micimea contribuției oricăruia dintre termenii la U n,

pentru oricine X.

Condițiile în cauză nu vor fi formulate aici. Ele pot fi găsite în literatura de specialitate (vezi, de exemplu,). „Clarificarea condițiilor în care funcționează CPT este meritul remarcabililor oameni de știință ruși A.A. Markov (1857-1922) și, în special, A.M. Lyapunov (1857-1918)” .

Teorema limită centrală arată că în cazul în care rezultatul unei măsurători (observări) se formează sub influența mai multor motive, fiecare dintre ele având doar o mică contribuție, iar rezultatul cumulat este determinat de aditiv, adică prin adăugare, atunci distribuția rezultatului măsurării (observării) este aproape de normal.

Uneori se crede că pentru ca distribuția să fie normală este suficient ca rezultatul măsurării (observării) X format sub influența mai multor cauze, fiecare având un efect mic. Nu este adevarat. Ceea ce contează este cum funcționează aceste cauze. Dacă este aditiv, atunci X are o distribuție aproximativ normală. Dacă în mod multiplicativ(adică acțiunile cauzelor individuale se înmulțesc, nu se adună), apoi distribuția X nu aproape de normal, ci de așa-zis. normal din punct de vedere logaritmic, adică nu X, iar lg X are o distribuție aproximativ normală. Dacă nu există motive să credem că unul dintre aceste două mecanisme pentru formarea rezultatului final (sau un alt mecanism bine definit) funcționează, atunci despre distribuție X nimic cert nu se poate spune.

Din cele spuse, rezultă că într-o problemă aplicată specifică, normalitatea rezultatelor măsurătorilor (observaţiilor), de regulă, nu poate fi stabilită din considerente generale, ea trebuie verificată folosind criterii statistice. Sau folosiți metode statistice neparametrice care nu se bazează pe ipoteze despre apartenența funcțiilor de distribuție a rezultatelor măsurătorilor (observațiilor) la una sau la alta familie de parametri.

Distribuții continue utilizate în metodele decizionale probabilistic-statistice.În plus față de familia de distribuții normale cu schimbare la scară, o serie de alte familii de distribuții sunt utilizate pe scară largă - distribuții normale din punct de vedere logaritmic, exponențial, Weibull-Gnedenko, gamma. Să aruncăm o privire asupra acestor familii.

Valoare aleatoare X are o distribuție log-normală dacă variabila aleatoare Y= jurnal X are o distribuție normală. Apoi Z=ln X = 2,3026…Y are de asemenea o distribuție normală N(A 1 ,σ 1), unde ln X- logaritmul natural X. Densitatea distribuției log-normale este:

Din teorema limită centrală rezultă că produsul X = X 1 X 2 X n variabile aleatoare pozitive independente X i, i = 1, 2,…, n, în mare n poate fi aproximată printr-o distribuție log-normală. În special, modelul multiplicativ al formării salariilor sau veniturilor conduce la recomandarea de a aproxima distribuțiile salariilor și veniturilor prin legi log-normale. Pentru Rusia, această recomandare s-a dovedit a fi justificată - statisticile o confirmă.

Există și alte modele probabilistice care conduc la legea log-normală. Un exemplu clasic de astfel de model este dat de A.N. morile cu bile au o distribuție log-normală.

Să trecem la o altă familie de distribuții, utilizată pe scară largă în diverse metode probabilistic-statistice de luare a deciziilor și alte cercetări aplicate, familia distribuțiilor exponențiale. Să începem cu un model probabilistic care duce la astfel de distribuții. Pentru a face acest lucru, luați în considerare „fluxul de evenimente”, adică. o succesiune de evenimente care au loc unul după altul la un moment dat în timp. Exemple sunt: ​​fluxul de apeluri la centrala telefonică; fluxul defecțiunilor echipamentelor din lanțul tehnologic; fluxul de defecțiuni ale produsului în timpul testării produsului; fluxul de cereri ale clienților către sucursala băncii; fluxul de cumpărători care solicită bunuri și servicii etc. În teoria fluxurilor de evenimente este valabilă o teoremă similară teoremei limitei centrale, dar nu se ocupă de însumarea variabilelor aleatoare, ci de însumarea fluxurilor de evenimente. Considerăm un debit total compus dintr-un număr mare de debite independente, dintre care niciunul nu are un efect predominant asupra debitului total. De exemplu, fluxul de apeluri către o centrală telefonică este alcătuit dintr-un număr mare de fluxuri de apeluri independente care provin de la abonați individuali. Se dovedește că în cazul în care caracteristicile fluxurilor nu depind de timp, debitul total este complet descris printr-un număr - intensitatea fluxului. Pentru debitul total, luați în considerare o variabilă aleatorie X- lungimea intervalului de timp dintre evenimente succesive. Funcția sa de distribuție are forma

(10)

Această distribuție se numește distribuție exponențială deoarece formula (10) implică funcția exponențială eX. Valoarea 1/λ este un parametru de scară. Uneori este introdus și un parametru de schimbare din, exponențial este distribuția unei variabile aleatoare X + c, unde distribuția X este dat de formula (10).

Distribuțiile exponențiale sunt un caz special al așa-numitelor. Distribuții Weibull - Gnedenko. Ele sunt numite după inginerul W. Weibull, care a introdus aceste distribuții în practica analizei rezultatelor testelor de oboseală, și matematicianul BV Gnedenko (1912-1995), care a primit astfel de distribuții ca fiind limitative la studierea maximului testului. rezultate. Lasa X- o variabilă aleatoare care caracterizează durata de funcționare a unui produs, sistem complex, element (adică resursă, timp de funcționare până la starea limită etc.), durata de funcționare a unei întreprinderi sau viața unei ființe vii, etc. Rata de eșec joacă un rol important

(11)

Unde F(X) Și f(X) - funcţia de distribuţie şi densitatea unei variabile aleatoare X.

Să descriem comportamentul tipic al ratei de eșec. Întregul interval de timp poate fi împărțit în trei perioade. Pe primul dintre ele, funcția λ(x) are valori ridicate și o tendință clară de scădere (cel mai adesea scade monoton). Acest lucru poate fi explicat prin prezența în lotul luat în considerare a unităților de produs cu defecte evidente și latente, care duc la o defecțiune relativ rapidă a acestor unități de produs. Prima perioadă se numește perioada de „rodare” (sau „efracție”). Acest lucru este de obicei acoperit de perioada de garanție.

Apoi urmează perioada de funcționare normală, caracterizată printr-o rată de eșec aproximativ constantă și relativ scăzută. Natura defecțiunilor în această perioadă este de natură bruscă (accidente, erori ale personalului de exploatare etc.) și nu depinde de durata de funcționare a unei unități de produs.

În sfârșit, ultima perioadă de funcționare este perioada de îmbătrânire și uzură. Natura defecțiunilor în această perioadă este în modificări fizice, mecanice și chimice ireversibile ale materialelor, ducând la o deteriorare progresivă a calității unei unități de producție și la defecțiunea finală a acesteia.

Fiecare perioadă are propriul ei tip de funcție λ(x). Luați în considerare clasa dependențelor de putere

λ(х) = λ0bxb -1 , (12)

Unde λ 0 > 0 și b> 0 - unii parametri numerici. Valori b < 1, b= 0 și b> 1 corespund tipului de defecțiune în perioadele de rodare, de funcționare normală și, respectiv, de îmbătrânire.

Relația (11) pentru o rată de eșec dată λ(x)- ecuație diferențială în raport cu funcția F(X). Din teoria ecuaţiilor diferenţiale rezultă că

(13)

Înlocuind (12) în (13), obținem asta

(14)

Distribuția dată de formula (14) se numește distribuție Weibull - Gnedenko. În măsura în care

atunci din formula (14) rezultă că cantitatea dar, dat de formula (15), este un parametru de scalare. Uneori este introdus și un parametru de schimbare, de ex. Sunt numite funcții de distribuție Weibull - Gnedenko F(X - c), Unde F(X) este dat de formula (14) pentru unele λ 0 și b.

Densitatea distribuției Weibull - Gnedenko are forma

(16)

Unde A> 0 - parametrul de scară, b> 0 - parametru de formă, din- parametru de schimbare. În acest caz, parametrul dar din formula (16) este legată de parametru λ 0 din formula (14) cu raportul indicat în formula (15).

Distribuția exponențială este un caz foarte special al distribuției Weibull - Gnedenko, corespunzătoare valorii parametrului de formă b = 1.

Distribuția Weibull - Gnedenko este folosită și în construcția modelelor probabilistice ale situațiilor în care comportamentul unui obiect este determinat de „cea mai slabă verigă”. Este implicată o analogie cu un lanț, a cărui siguranță este determinată de acea verigă care are cea mai mică rezistență. Cu alte cuvinte, lasă X 1 , X 2 ,…, X n sunt variabile aleatoare independente distribuite identic,

X(1)=min( X 1 , X 2 ,…, X n), X(n)=max( X 1 , X 2 ,…, X n).

Într-o serie de probleme aplicate, un rol important îl joacă X(1) Și X(n) , în special, atunci când se studiază valorile maxime posibile („înregistrări”) ale anumitor valori, de exemplu, plăți de asigurare sau pierderi datorate riscurilor comerciale, atunci când se studiază limitele elasticității și rezistenței oțelului, o serie de caracteristici de fiabilitate, etc. Se arată că pentru n mari distribuţiile X(1) Și X(n) , de regulă, sunt bine descrise de distribuțiile Weibull - Gnedenko. Contribuții fundamentale la studiul distribuțiilor X(1) Și X(n) a fost introdus de matematicianul sovietic B.V. Gnedenko. Lucrările lui V. Weibull, E. Gumbel, V.B. Nevzorova, E.M. Kudlaev și mulți alți specialiști.

Să trecem la familia distribuțiilor gamma. Sunt utilizate pe scară largă în economie și management, teoria și practica fiabilității și testării, în diverse domenii ale tehnologiei, meteorologiei etc. În special, în multe situații, distribuția gama este supusă unor cantități precum durata de viață totală a produsului, lungimea lanțului de particule conductoare de praf, timpul în care produsul atinge starea limită în timpul coroziunii, timpul de funcționare până la k refuzul, k= 1, 2, … etc. Speranța de viață a pacienților cu boli cronice, timpul pentru a obține un anumit efect în tratament au în unele cazuri o distribuție gamma. Această distribuție este cea mai adecvată pentru descrierea cererii în modelele economice și matematice de gestionare a stocurilor (logistică).

Densitatea distribuției gamma are forma

(17)

Densitatea de probabilitate din formula (17) este determinată de trei parametri A, b, c, Unde A>0, b>0. în care A este un parametru de formă, b- parametrul de scară și din- parametru de schimbare. Factor 1/Γ(а) este o normalizare, se introduce pentru a

Aici Γ(а)- una dintre funcțiile speciale utilizate în matematică, așa-numita „funcție gamma”, prin care se denumește și distribuția dată de formula (17),

La un fix dar formula (17) definește o familie de distribuții scale-shift generate de o distribuție cu densitate

(18)

Distribuția formei (18) se numește distribuție gamma standard. Se obtine din formula (17) cu b= 1 și din= 0.

Un caz special de distribuții gamma la dar= 1 sunt distribuții exponențiale (cu λ = 1/b). Cu naturale darȘi din=0 distribuțiile gamma se numesc distribuții Erlang. Din lucrările savantului danez K.A. Erlang (1878-1929), angajat al companiei de telefonie din Copenhaga, care a studiat în 1908-1922. funcţionarea reţelelor de telefonie, a început dezvoltarea teoriei cozilor de aşteptare. Această teorie este angajată în modelarea probabilistic-statistică a sistemelor în care fluxul de cereri este deservit pentru a lua decizii optime. Distribuțiile Erlang sunt utilizate în aceleași domenii de aplicare ca și distribuțiile exponențiale. Aceasta se bazează pe următorul fapt matematic: suma k variabile aleatoare independente distribuite exponențial cu aceiași parametri λ și din, are o distribuție gamma cu parametru de formă a =k, parametrul de scară b= 1/λ și parametrul deplasării kc. La din= 0 obținem distribuția Erlang.

Dacă variabila aleatoare X are o distribuție gamma cu parametru de formă dar astfel încât d = 2 A- un număr întreg, b= 1 și din= 0, apoi 2 X are o distribuție chi-pătrat cu d grade de libertate.

O variabilă aleatoare X cu o distribuție gvmma are următoarele caracteristici:

Valorea estimata M(X) =ab + c,

dispersie D(X) = σ 2 = ab 2 ,

Coeficientul de variație

asimetrie

Exces

Distribuția normală este un caz extrem al distribuției gamma. Mai precis, să fie Z o variabilă aleatoare cu o distribuție gamma standard dată de formula (18). Apoi

pentru orice număr real X, Unde F(x)- functie de distributie normala standard N(0,1).

În cercetarea aplicată se folosesc și alte familii parametrice de distribuții, dintre care sistemul de curbe Pearson, seriile Edgeworth și Charlier sunt cele mai cunoscute. Ele nu sunt considerate aici.

Discret distribuţii utilizate în metodele decizionale probabilistic-statistice. Cel mai adesea, sunt utilizate trei familii de distribuții discrete - binomiale, hipergeometrice și Poisson, precum și alte familii - geometrice, binom negative, multinomiale, hipergeometrice negative etc.

După cum sa menționat deja, distribuția binomială are loc în încercări independente, în fiecare dintre ele cu o probabilitate R apare evenimentul DAR. Dacă numărul total de încercări n dat, apoi numărul de încercări Y, în care a apărut evenimentul DAR, are o distribuție binomială. Pentru o distribuție binomială, probabilitatea de a fi acceptată ca variabilă aleatoare Y valorile y este determinat de formula

Numărul de combinații de la n elemente prin y cunoscut din combinatorică. Pentru toți y, cu excepția 0, 1, 2, …, n, avem P(Y= y)= 0. Distribuție binomială cu o dimensiune fixă ​​a eșantionului n este setat de parametru p, adică distribuțiile binomiale formează o familie cu un singur parametru. Ele sunt utilizate în analiza datelor de cercetare eșantion, în special, în studiul preferințelor consumatorilor, controlul selectiv al calității produselor conform planurilor de control într-o singură etapă, la testarea populațiilor de indivizi în demografie, sociologie, medicină, biologie etc.

Dacă Y 1 Și Y 2 - variabile aleatoare binomiale independente cu același parametru p 0 determinate de probe cu volume n 1 Și n 2 respectiv, atunci Y 1 + Y 2 - variabilă aleatoare binomială cu distribuţie (19) cu R = p 0 Și n= n 1 + n 2 . Această observație extinde aplicabilitatea distribuției binomiale, permițându-vă să combinați rezultatele mai multor grupuri de teste, atunci când există motive să credeți că același parametru corespunde tuturor acestor grupuri.

Caracteristicile distribuției binomiale au fost calculate mai devreme:

M(Y) = np, D(Y) = np( 1- p).

În secțiunea „Evenimente și probabilități” pentru o variabilă aleatoare binomială, se demonstrează legea numerelor mari:

pentru oricine . Cu ajutorul teoremei limitei centrale, legea numerelor mari poate fi rafinată indicând cum Y/ n difera de R.

Teorema lui De Moivre-Laplace. Pentru orice numere a și b, A< b, avem

Unde F(X) este o funcție de distribuție normală standard cu medie 0 și varianță 1.

Pentru a dovedi, este suficient să folosim reprezentarea Y ca sumă de variabile aleatoare independente corespunzătoare rezultatelor studiilor individuale, formule pentru M(Y) Și D(Y) și teorema limitei centrale.

Această teoremă este pentru caz R= S a fost dovedit de matematicianul englez A. Moivre (1667-1754) în 1730. În formularea de mai sus, a fost dovedit în 1810 de matematicianul francez Pierre Simon Laplace (1749-1827).

Distribuția hipergeometrică are loc în timpul controlului selectiv al unui set finit de obiecte de volum N conform unui atribut alternativ. Fiecare obiect controlat este clasificat fie ca având atributul DAR, sau ca nu posedă această caracteristică. Distribuția hipergeometrică are o variabilă aleatorie Y, egal cu numărul de obiecte care au atributul DARîntr-o probă aleatorie de volum n, Unde n< N. De exemplu, numărul Y unități defecte de produse dintr-un eșantion aleatoriu de volum n din volumul lotului N are o distribuţie hipergeometrică dacă n< N. Un alt exemplu este loteria. Lasă semnul DAR un bilet este un semn de „a fi câștigător”. Lasă toate biletele N, iar cineva a dobândit n dintre ei. Atunci numărul de bilete câștigătoare pentru această persoană are o distribuție hipergeometrică.

Pentru o distribuție hipergeometrică, probabilitatea ca o variabilă aleatoare Y să ia valoarea y are forma

(20)

Unde D este numărul de obiecte care au atributul DAR, în setul considerat de volum N. în care y ia valori de la max(0, n - (N - D)) la min( n, D), cu altul y probabilitatea din formula (20) este egală cu 0. Astfel, distribuția hipergeometrică este determinată de trei parametri - volumul populației generale N, numărul de obiecte Dîn ea, posedând trăsătura considerată DAR, și dimensiunea eșantionului n.

Eșantionare aleatorie simplă n din volumul total N se numește eșantion obținut ca urmare a selecției aleatorii, în care oricare dintre mulțimi din n obiectele au aceeași probabilitate de a fi selectate. Metodele de selecție aleatorie a eșantioanelor de respondenți (intervievați) sau a unităților de produse bucată sunt luate în considerare în documentele instructiv-metodice și normativ-tehnice. Una dintre metodele de selecție este următoarea: obiectele sunt selectate unul din celălalt, iar la fiecare pas fiecare dintre obiectele rămase din set are aceeași șansă de a fi selectat. În literatura de specialitate, pentru tipul de eșantioane luate în considerare, se folosesc și termenii „eșantion aleatoriu”, „probă aleatoare fără înlocuire”.

Deoarece volumele populației generale (loturi) Nși mostre n sunt cunoscute în mod obișnuit, atunci parametrul de distribuție hipergeometrică care trebuie estimat este D. În metodele statistice de management al calității produselor D- de obicei numărul de unități defecte din lot. Interesantă este și caracteristica distribuției D/ N- nivelul defectelor.

Pentru distribuția hipergeometrică

Ultimul factor din expresia varianței este aproape de 1 dacă N>10 n. Dacă, în același timp, facem și înlocuirea p = D/ N, atunci expresiile pentru așteptarea și varianța matematică a distribuției hipergeometrice se vor transforma în expresii pentru așteptarea și varianța matematică a distribuției binomiale. Aceasta nu este o coincidență. Se poate arăta că

la N>10 n, Unde p = D/ N. Raportul limitativ este valabil

iar această relaţie limitativă poate fi folosită pentru N>10 n.

A treia distribuție discretă utilizată pe scară largă este distribuția Poisson. O variabilă aleatoare Y are o distribuție Poisson dacă

,

unde λ este parametrul distribuției Poisson și P(Y= y)= 0 pentru toate celelalte y(pentru y=0, se notează 0!=1). Pentru distribuția Poisson

M(Y) = λ, D(Y) = λ.

Această distribuție este numită după matematicianul francez C.D. Poisson (1781-1840), care a derivat-o pentru prima dată în 1837. Distribuția Poisson este un caz extrem al distribuției binomiale, unde probabilitatea R implementarea evenimentului este mică, dar numărul de încercări n grozav, și np= λ. Mai exact, relația limită

Prin urmare, distribuția Poisson (în vechea terminologie, „legea distribuției”) este adesea numită și „legea evenimentelor rare”.

Distribuția Poisson apare în teoria fluxurilor de evenimente (vezi mai sus). Se dovedește că pentru cel mai simplu flux cu intensitate constantă Λ, numărul de evenimente (apeluri) care au avut loc în timpul t, are o distribuție Poisson cu parametrul λ = Λ t. Prin urmare, probabilitatea ca în timp t nu va avea loc nici un eveniment e - Λ t, adică funcţia de distribuţie a lungimii intervalului dintre evenimente este exponenţială.

Distribuția Poisson este utilizată în analiza rezultatelor anchetelor de marketing selective ale consumatorilor, în calculul caracteristicilor operaționale ale planurilor de control statistic al acceptării în cazul valorilor mici ale nivelului de acceptare al defectuosității, pentru a descrie numărul de defecțiuni. a unui proces tehnologic controlat statistic pe unitatea de timp, numărul de „cerințe de serviciu” care sosesc pe unitatea de timp în sistemul de așteptare, modelele statistice ale accidentelor și bolilor rare etc.

Descrierea altor familii parametrice de distribuții discrete și posibilitatea utilizării lor practice sunt luate în considerare în literatură.


În unele cazuri, de exemplu, atunci când se studiază prețurile, volumele de producție sau timpul total dintre eșecurile problemelor de fiabilitate, funcțiile de distribuție sunt constante pe anumite intervale în care valorile variabilelor aleatoare studiate nu pot scădea.

Anterior

Vizualizări