Distribuția gamma a unei variabile aleatoare. Distribuție gamma. Stabilirea funcției de distribuție a indicatorilor de fiabilitate pe baza rezultatelor prelucrării informațiilor statistice

Distribuție gamma

Distribuția gamma este o distribuție cu doi parametri. Ocupă un loc destul de important în teoria și practica fiabilității. Densitatea de distribuție are o limită pe o parte (). Dacă parametrul a al formei curbei de distribuție ia o valoare întreagă, aceasta indică probabilitatea aceluiași număr de evenimente (de exemplu, eșecuri)

cu condiția ca acestea să fie independente și să apară cu o intensitate constantă λ (vezi Fig. 4.4).

Distribuția gamma este utilizată pe scară largă pentru a descrie apariția defecțiunilor la elementele învechite, timpul de recuperare și MTBF ale sistemelor redundante. Cu parametri diferiți, distribuția gama ia o varietate de forme, ceea ce explică aplicarea sa largă.

Densitatea de probabilitate a distribuției gamma este definită de egalitate

unde λ > 0, α > 0.

Curbele de densitate de distribuție sunt prezentate în fig. 4.5.

Orez. 4.5.

funcția de distribuție

Așteptările matematice și, respectiv, varianța sunt egale

Pentru α< 1 интенсивность отказов монотонно убывает, что соответствует периоду приработки изделия, при α >1 - crește, ceea ce este tipic pentru perioada de uzură și îmbătrânire a elementelor.

Pentru α = 1, distribuția gamma coincide cu distribuția exponențială, pentru α > 10, distribuția gamma se apropie de legea normală. Dacă a preia valorile numerelor întregi pozitive arbitrare, atunci se numește o astfel de distribuție gamma distribuție Erlang. Dacă λ = 1/2, iar valoarea lui a este un multiplu de 1/2, atunci distribuția gamma coincide cu distribuția lui χ2 ( chi-pătrat).

Stabilirea funcției de distribuție a indicatorilor de fiabilitate pe baza rezultatelor prelucrării informațiilor statistice

Cea mai completă caracteristică de fiabilitate sistem complex este o legea distributiei, exprimat ca funcții de distribuție, densități de distribuție sau funcții de fiabilitate.

Forma funcției de distribuție teoretică poate fi judecată după funcția de distribuție empirică (Fig. 4.6), care este determinată din relația

Unde T, - numărul de defecțiuni pe interval de timp t; N- domeniul de aplicare al testelor; t i < t < t i+1 intervalul de timp în care se determină funcţia empirică.

Orez. 4.6.

Construcția unei funcții empirice se realizează prin însumarea incrementelor obținute în fiecare interval de timp:

Unde k- numărul de intervale.

Funcția de fiabilitate empirică este funcția opusă funcției de distribuție; este determinat de formula

Estimarea densității de probabilitate se găsește din histogramă. Construcția unei histograme se reduce la următoarele. Întregul interval de timp tîmpărțit în intervale t 1, t 2, ..., t i și pentru fiecare dintre ele, densitatea de probabilitate este estimată după formula

Unde T i numărul de eșecuri per i- al-lea interval, i = 1, 2,..., k; (t i+1 - t i) - interval de timp i-al-lea interval; N– domeniul de aplicare a testelor; k este numărul de intervale.

Un exemplu de histogramă este prezentat în fig. 4.7.

Orez. 4.7.

Netezirea histogramei în trepte a unei curbe netede, dar aspectul acesteia poate fi judecat pe legea distribuției unei variabile aleatoare. În practică, de exemplu, metoda celor mai mici pătrate este adesea folosită pentru a netezi curba. Pentru o stabilire mai exactă a legii distribuţiei este necesar ca numărul de intervale să fie de cel puţin cinci, iar numărul de realizări care se încadrează în fiecare interval să fie de cel puţin zece.

Discrepanțe în înțelegerea terminologiei de fiabilitate

Problema terminologiei este destul de complexă în diverse domenii ale științei și ale activității umane în general. Se știe că disputele cu privire la termeni au loc de multe secole. Dacă atingem traducerile de poezii, putem vedea o confirmare vie a acestei idei. De exemplu, traduceri ale unei astfel de capodopere de renume mondial precum „Hamlet” de B. L. Pasternak și Π. P. Gnedich diferă puternic. În primul dintre ele, sensul tragediei depășește muzica versului, în contrast cu cel de-al doilea. Iar originalul lui Hamlet, scris în limba secolului al XVI-lea, este greu de înțeles pentru cei care nu sunt englezi și pentru englezi, deoarece limba în sine a evoluat foarte mult de-a lungul mai multor secole, ca, de fapt, orice altă limbă. în conformitate cu legea sincronismului-desincronismului.

O imagine similară se observă în religiile lumii. Traducerea Bibliei din slavona bisericească în rusă, care a durat 25 de ani, a „divorțat” (până la oprirea traducerii) Sfântul Filaret de la Moscova (Drozdov) și cel mai mare scriitor bisericesc - Sfântul Teofan Reclusul (în apropiere pe viitor este planificată publicarea unei colecţii a lucrărilor sale în 42 de volume). ). Traducerile și clarificările „cărții cărților” din Biblie „traduc” oamenii în tabere de dușmani ireconciliabili în viața din lumea noastră. Se nasc secte, eretici și eroi, uneori chiar se varsă sânge. Iar numeroasele traduceri în limba rusă ale lucrării fundamentale a lui Immanuel Kant în domeniul filosofiei „Critica rațiunii pure” nu fac decât să întărească validitatea tezei noastre despre complexitatea problemei terminologiei (sistem super-larg) în diverse domenii ale științei și umane. activitate în general.

Fenomenele antinomice au loc în domeniul științei și tehnologiei. Una dintre soluţiile la problema asigurării corectitudinii şi adecvării terminologiei a fost prezentată de G. Leibniz. Este în ceea ce privește dezvoltarea științei și tehnologiei în secolul al XVII-lea. a propus să pună capăt disputelor prin definirea termenilor folosind un limbaj universal în formă digitală (0011...).

Rețineți că în știința fiabilității, modul de definire a termenilor este în mod tradițional decis la nivel de stat cu ajutorul standardele de stat(GOST). Cu toate acestea, apariția unor sisteme tehnice din ce în ce mai puternice, interacțiunea și convergența obiectelor vii și nevii care funcționează în ele, ridică sarcini noi, foarte dificile pentru predarea în pedagogie și psihologie, și ne obligă să căutăm compromisuri creative. solutii.

Pentru un angajat care este matur și a lucrat într-un domeniu științific specific, și în special în domeniul fiabilității, relevanța problemelor de terminologie este fără îndoială. După cum a scris Gottfried Wilhelm Leibniz (în lucrarea sa despre crearea unui limbaj universal), ar exista mai puține controverse dacă termenii ar fi definiți.

Vom încerca să netezim discrepanțele în înțelegerea terminologiei de fiabilitate cu următoarele observații.

Spunem „funcție de distribuție” (DF), omițând cuvântul „timp” sau „eșec”. Timpul de funcționare este cel mai adesea înțeles ca o categorie de timp. Pentru sistemele nerecuperabile, este mai corect să spunem - DF integral al timpului până la eșec, iar pentru sistemele recuperabile - timpul până la eșec. Și întrucât timpul de funcționare este cel mai adesea înțeles ca o variabilă aleatorie, se utilizează identificarea probabilității de funcționare fără defecțiuni (FBR) și (1 - FR), care în acest caz se numește funcție de fiabilitate (FN). Integritatea acestei abordări se realizează printr-un grup complet de evenimente. Apoi

VBR = FN = 1 - FR.

Același lucru este valabil și pentru densitatea de distribuție (DP), care este prima derivată a DF, în special în ceea ce privește timpul, și, la figurat vorbind, caracterizează „rata” defecțiunilor.

Completitudinea descrierii fiabilității produsului (în special pentru produsele de unică folosință), inclusiv dinamica stabilității comportamentului, este caracterizată de rata de eșec prin raportul dintre PR și FBG și este înțeleasă fizic ca o schimbare a stării produsului, iar matematic este introdus în teorie la coadă prin conceptul de flux de defecțiuni și o serie de ipoteze privind defecțiunile în sine (staționare, obișnuite etc.).

Cei interesați de aceste probleme care apar la alegerea indicatorilor de fiabilitate în etapa de proiectare a produselor pot fi referiți la lucrările unor autori eminenti precum A. M. Polovko, B. V. Gnedenko, B. R. Levin, care au venit de la Laboratorul de fiabilitate de la Universitatea din Moscova, condus de AN. Kolmogorov, precum și A. Ya. Khinchina, ES Venzel, IA Ushakova, GV Druzhinina, AD Solovyov, F. Beichelt, F. Proshan - fondatorii teoriei statistice a fiabilității .

  • Cm.: Kolmogorov A.N. Concepte de bază ale teoriei probabilităților. M. : Mir, 1974.

Cel mai simplu tip de distribuție gamma este distribuția cu densitate

Unde - parametrul de schimbare, - funcția gamma, adică

(2)

Fiecare distribuție poate fi „extinsă” într-o familie de schimbare la scară. Într-adevăr, pentru o variabilă aleatoare cu o funcție de distribuție, luați în considerare familia variabile aleatoare, unde este parametrul de scară și este parametrul de schimbare. Atunci funcția de distribuție este .

Incluzând fiecare distribuție cu o densitate de forma (1) în familia scale-shift, obținem familia distribuțiilor gamma acceptate în parametrizare:

Aici - parametrul de formă, - parametrul de scară, - parametrul de deplasare, funcția gamma este dată de formula (2).

Există și alte parametrizări în literatură. Deci, în loc de un parametru, parametrul este adesea folosit . Uneori se ia în considerare o familie cu doi parametri, omițând parametrul de schimbare, dar păstrând parametrul scară sau analogul acestuia, parametrul . Pentru unele probleme aplicate (de exemplu, atunci când se studiază fiabilitatea dispozitivelor tehnice), acest lucru este justificat, deoarece, din considerente de fond, pare firesc să presupunem că densitatea distribuției probabilităților este pozitivă pentru valorile pozitive ale argumentului și numai pentru lor. Această ipoteză este asociată cu o discuție pe termen lung în anii 80 despre „indicatorii de fiabilitate atribuiți”, asupra cărora nu ne vom opri.

Cazurile particulare ale distribuției gamma pentru anumite valori ale parametrilor au nume speciale. La , avem o distribuție exponențială. Când este naturală, distribuția gamma este distribuția Erlang, folosită în special în teoria cozilor. Dacă variabila aleatoare are o distribuție gamma cu un parametru de formă astfel încât este un întreg, u, are o distribuție chi-pătrat cu grade de libertate.

Aplicații ale distribuției gamma

Distribuția gama are aplicații largi în diverse domenii stiinte tehnice(în special, în teoria fiabilității și testelor), în meteorologie, medicină, economie. În special, durata de viață globală a produsului, lungimea lanțului de particule conductoare de praf, timpul necesar ca produsul să atingă starea limită în timpul coroziunii, timpul de funcționare până la defectarea k-a etc. pot fi subordonate distribuția gama. . Speranța de viață a pacienților cu boli cronice, timpul pentru a obține un anumit efect în tratament au în unele cazuri o distribuție gamma. Această distribuție s-a dovedit a fi cea mai adecvată pentru descrierea cererii într-o serie de modele economice și matematice de gestionare a stocurilor.

Posibilitatea utilizării distribuției gamma într-un număr de probleme aplicate poate fi uneori justificată de proprietatea de reproductibilitate: suma variabilelor aleatoare independente distribuite exponențial cu același parametru are o distribuție gamma cu parametri de formă și scară. și schimbă. Prin urmare, distribuția gamma este adesea folosită în aplicațiile în care este utilizată distribuția exponențială.

Sute de publicații sunt dedicate diverselor probleme ale teoriei statistice legate de distribuția gamma (vezi rezumatele). În acest articol, care nu pretinde a fi cuprinzător, sunt luate în considerare doar unele probleme matematice și statistice legate de elaborarea standardului de stat.

O variabilă aleatoare nenegativă are distribuția gama, dacă densitatea sa de distribuție este exprimată prin formula

unde și , este funcția gamma:

În acest fel, distribuția gama este o distribuție cu doi parametri, ea ocupă un loc important în statistica matematică și teoria fiabilității. Această distribuție este limitată, pe de o parte.

Dacă parametrul formei curbei de distribuție este un număr întreg, atunci distribuția gamma descrie timpul necesar pentru apariția evenimentelor (eșecurilor), cu condiția ca acestea să fie independente și să apară cu o intensitate constantă.

În majoritatea cazurilor, această distribuție descrie timpul de funcționare al sistemului cu defecțiuni redundante ale elementelor învechite, timpul de recuperare a sistemului cu defecțiuni redundante ale elementelor îmbătrânite, timpul de recuperare a sistemului etc. Pentru diferite valori cantitative ale parametrilor, distribuția gamma ia o varietate de forme, ceea ce explică aplicarea sa largă.

Densitatea de probabilitate a distribuției gamma este definită de egalitatea dacă

functie de distributie. (nouă)

Rețineți că funcția de fiabilitate este exprimată prin formula:

Funcția gamma are următoarele proprietăți: , , (11)

de unde rezultă că dacă este un întreg nenegativ, atunci

În plus, în viitor vom avea nevoie de încă o proprietate a funcției gamma: ; . (13)

Exemplu. Recuperarea echipamentelor electronice respectă legea distribuției gamma cu parametri și . Determinați probabilitatea restabilirii hardware-ului pe oră.

Soluţie. Pentru a determina probabilitatea de recuperare, folosim formula (9) .

Pentru valori întregi pozitive funcții , iar pentru .

Dacă trecem la variabile noi ale căror valori vor fi exprimate; , atunci obținem integrala tabelului:

În această expresie, soluția integralei din partea dreaptă poate fi determinată prin aceeași formulă:


si cand va

Pentru și , noile variabile vor fi egale cu și , iar integrala în sine va fi egală cu

Valoarea funcției va fi

Să găsim caracteristicile numerice ale unei variabile aleatoare, supuse distribuției gamma

În conformitate cu egalitatea (13), obținem . (paisprezece)

Al doilea moment inițial se găsește prin formula

Unde . (15)

Rețineți că la , rata de eșec scade monoton, ceea ce corespunde perioadei de rodare a produsului. Cu , crește rata de eșec, ceea ce caracterizează perioada de uzură și de îmbătrânire a elementelor.

La , distribuția gamma coincide cu distribuția exponențială; la , distribuția gamma se apropie de legea normală. Dacă ia valorile numerelor întregi pozitive arbitrare, atunci se numește o astfel de distribuție gamma Distribuția Erlang a ordinului al treilea:



Aici este suficient să subliniem că legea Erlang Ordinul --lea este supus sumei variabilelor aleatoare independente, fiecare dintre acestea fiind distribuită conform unei legi exponențiale cu un parametru. legea lui Erlang Ordinul este strâns legat de fluxul staționar Poisson (cel mai simplu) cu intensitate .

Într-adevăr, să existe un astfel de flux de evenimente în timp (Fig. 6).

Orez. 6. Reprezentarea grafică a fluxului de evenimente Poisson în timp

Luați în considerare un interval de timp constând din sumă intervale dintre evenimentele dintr-un astfel de flux. Se poate dovedi că o variabilă aleatoare se va supune legii Erlang -a comanda.

Densitatea de distribuție a unei variabile aleatoare distribuite conform legii Erlang de ordinul al-lea, poate fi exprimat în termenii unei funcții de distribuție Poisson tabulare:

Dacă valoarea multiplu de și , atunci distribuția gamma coincide cu distribuția chi-pătrat.

Rețineți că funcția de distribuție a unei variabile aleatoare poate fi calculată folosind următoarea formulă:

unde sunt determinate de expresiile (12) și (13).

Prin urmare, avem următoarele egalități, care ne vor fi utile în cele ce urmează:

Exemplu. Fluxul de produse produse pe transportor este cel mai simplu cu parametrul . Toate produsele fabricate sunt controlate, cele defecte sunt plasate într-o cutie specială, care nu conține mai mult de produse, probabilitatea căsătoriei este de . Determinați legea de distribuție pentru momentul umplerii cutiei cu produse defecte și valoarea , pe baza faptului că cutia nu este susceptibilă să se reverse în timpul schimbului.

Soluţie. Intensitatea celui mai simplu flux de produse defecte va fi de . Este evident că timpul de umplere a cutiei cu produse defecte este repartizat conform legii Erlang


cu parametri si:

prin urmare (18) și (19): ; .

Numărul de articole defecte în timp va fi distribuit conform legii lui Poisson cu parametrul . Prin urmare, numărul dorit trebuie găsite din condiție. (douăzeci)

De exemplu, la [produs/h]; ; [h]

din ecuația pentru

O variabilă aleatoare cu o distribuție Erlang are următoarele caracteristici numerice (Tabelul 6).

Tabelul 6

Probabilitate densitate , , unde este parametrul de scară ; - parametru de formă, ordinul de distribuire, un număr întreg pozitiv
funcția de distribuție
functie caracteristica
Valorea estimata
Modă
Dispersia
Asimetrie
Exces
Momentele inițiale , , ,
Momente centrale ,

Rețineți că o variabilă aleatorie cu o distribuție Erlang normalizată de ordinul al treilea are următoarele caracteristici numerice (Tabelul 7).

Tabelul 7

Probabilitate densitate , , unde este parametrul de scară ; - parametru de formă, ordinul de distribuire, un număr întreg pozitiv
funcția de distribuție
functie caracteristica
Valorea estimata
Modă
Dispersia
Coeficientul de variație
Asimetrie
Exces
Momentele inițiale , , ,
Momente centrale ,

2. DESCRIEREA INCERTITUDINII ÎN TEORIA LUARE A DECIZIILOR

2.3.4. Date de interval în probleme de estimare a parametrilor (pe exemplul distribuției gamma)

Să considerăm o problemă de estimare parametrică, clasică în statistica matematică aplicată. Date inițiale - eșantion X1 , x 2 , ..., x n, constând din n numere reale. Într-un model probabilistic al unui eșantion aleator simplu, elementele sale X 1 , x 2 , ..., x n sunt considerate un set de implementări n variabile aleatoare independente distribuite identic. Presupunem că aceste cantități au o densitate f (X). În teoria statistică parametrică, se presupune că densitatea f (X) este cunoscut până la un parametru finit-dimensional, adică , la unele Aceasta este, desigur, o presupunere foarte puternică care necesită fundamentare și verificare; cu toate acestea, teoria estimării parametrice este utilizată în prezent pe scară largă în diverse domenii aplicate.

Toate rezultatele observațiilor sunt determinate cu o anumită acuratețe, în special, sunt scrise folosind un număr finit de cifre semnificative (de obicei 2-5). În consecință, toate distribuțiile reale ale rezultatelor observațiilor sunt discrete. De obicei, se presupune că aceste distribuții discrete sunt destul de bine aproximate de cele continue. Rafinând această afirmație, ajungem la modelul deja luat în considerare, conform căruia doar cantitățile sunt disponibile statisticilor

y j = xj + j , j = 1, 2, ... , n ,

unde x i sunt valori „adevărate”, erori de observație (inclusiv erori de discretizare). În modelul probabilist presupunem că n aburi

formează un eșantion aleator simplu dintr-o distribuție bidimensională și X1 , x 2 , ..., x n- proba din distributie cu densitate . Trebuie avut în vedere că și sunt realizări ale variabilelor aleatoare dependente (dacă le considerăm independente, atunci distribuția yi fie continuu, nu discret). Întrucât eroarea sistematică, de regulă, nu poate fi exclusă complet, este necesar să se ia în considerare cazul Nu există motive pentru acceptarea a priori a normalității distribuției erorilor (conform rezumatelor datelor experimentale privind varietatea formelor de distribuție a erorilor). erorile de măsurare date în și , în majoritatea covârșitoare a cazurilor, ipoteza unei distribuții normale a erorilor s-a dovedit a fi inacceptabilă pentru instrumentele de măsură de diferite tipuri). Astfel, toate cele trei idei comune despre proprietățile erorilor nu sunt adecvate realității. Influența erorilor de observație asupra proprietăților modelelor statistice trebuie studiată pe baza altor modele și anume modele de statistici pe intervale.

Fie - o caracteristică a mărimii erorii, de exemplu, eroarea pătratică medie . În statisticile matematice clasice, este considerat neglijabil () pentru o dimensiune fixă ​​a eșantionului n. Rezultatele generale sunt dovedite asimptotic. Astfel, în statistica matematică clasică se face mai întâi trecerea la limită, iar apoi trecerea la limită. În statisticile datelor de interval, presupunem că dimensiunea eșantionului este suficient de mare (), dar toate măsurătorile corespund aceleiași caracteristici de eroare. Obținem teoreme limită utile pentru analiza datelor reale pentru . În statisticile de date cu intervale, se face mai întâi o tranziție limită, apoi se face o tranziție limită. Deci, ambele teorii folosesc aceleași două pasaje până la limită: și , dar într-o ordine diferită. Declarațiile ambelor teorii sunt fundamental diferite.

Prezentarea de mai jos merge pe exemplul estimării parametrilor distribuției gamma, deși se pot obține rezultate similare pentru alte familii parametrice, precum și pentru probleme de testare a ipotezelor (vezi mai jos), etc. Scopul nostru este să demonstrăm principalele caracteristici ale abordării statisticilor de date pe intervale. Dezvoltarea sa a fost stimulată de pregătirea GOST 11.011-83.

De observat că enunţurile statisticii obiectelor de natură nenumerică corespund abordării adoptate în teoria generală a stabilităţii. Conform acestei abordări, eșantionul X = (X 1 , X 2 , ..., x n ) se pune în corespondenţă setul de abateri admisibile G(X), acestea. set de valori posibile ale vectorului rezultatelor observației y = (y 1 , y 2 , ..., y n ). Dacă se știe că eroarea absolută a rezultatelor măsurării nu depășește , atunci setul de abateri admisibile are forma

Dacă se știe că eroarea relativă nu depășește , atunci setul de abateri admise are forma

Teoria stabilității face posibilă luarea în considerare a celor mai „proaste” abateri, adică. conduce la concluzii de tip minimax, în timp ce modelele specifice de eroare permit să se tragă concluzii despre comportamentul statisticilor „în medie”.

Estimări ale parametrilor de distribuție gamma. După cum știți, o variabilă aleatoare X are o distribuție gamma dacă densitatea sa este:

Unde A - parametru de formă, b– parametrul de scară, - funcția gamma. Rețineți că există și alte moduri de a parametriza familia de distribuții gamma.

În măsura în care M(X) = ab, D(X) = ab 2 , atunci estimările metodei au forma

unde este media aritmetică a eșantionului și s 2 este varianța eșantionului. Se poate arăta că pentru mari n

până la infinitezimale de ordin superior.

Estimarea probabilității maxime A * se pare ca:

(12)

unde este funcția inversă funcției

În mare n

În ceea ce privește metoda estimatorilor de momente, estimarea de maximă probabilitate b * parametrul scale are forma

În mare n până la infinitezimale de ordin superior

Folosind proprietățile funcției gamma, se poate demonstra că pentru mari dar

până la infinitezimale de ordin superior. Comparând cu formulele (11), vedem că pătratele medii ale erorilor pentru estimările metodei momentelor sunt mai mari decât pătratele medii ale erorilor corespunzătoare pentru estimările cu maximă probabilitate. Astfel, din punctul de vedere al statisticii matematice clasice, estimările de maximă probabilitate au un avantaj față de estimările metodei momentelor.

Necesitatea de a lua în considerare erorile de măsurare. Sa punem

Din proprietățile funcției rezultă că pentru v mic

Datorită validității estimării de probabilitate maximă A* din formula (13) rezultă că în termeni de probabilitate la

Conform modelului statistic de date pe intervale, rezultatele observațiilor nu sunt x i, dar y eu, în loc de v bazate pe date reale

(14)

În virtutea legii numerelor mari, cu o eroare suficient de mică , care asigură posibilitatea de aproximare pentru termenii din formula (14), sau, echivalent, cu o eroare absolută limită suficient de mică în formula (1) sau o valoare suficient de mică limitarea erorii relative, avem la

în probabilitate (presupunând că toate erorile sunt distribuite egal). Astfel, prezența erorilor introduce o schimbare care, în general, nu dispare odată cu creșterea dimensiunii eșantionului. Prin urmare, dacă atunci estimarea probabilității maxime nu este consecventă. Avem

unde valoarea A*(y) este definit prin formula (12) cu înlocuirea x i pe y eu, i=1,2,…,n. Din formula (13) rezultă că

acestea. influenţa erorilor de măsurare creşte pe măsură ce dar.

Din formule pentru vȘi w rezultă că până la infinitezimale de ordin superior

(16)

Pentru a găsi distribuţia asimptotică w izolați folosind formula (16) și formula pentru v, termeni conducători în termenii corespunzători

Astfel, valoarea w este reprezentat ca o sumă de variabile aleatoare independente distribuite identic (până la un termen de rest dependent de caz de ordinul 1/ n). În fiecare termen se disting două părți - una corespunzătoare lui Mb și a doua, care include.Pe baza reprezentării (17), se poate arăta că odată cu distribuția variabilelor aleatoare vȘi w sunt asimptotic normale și

Din coincidenţa asimptotică a varianţelor vȘi w, forma parametrilor distribuției asimptotice (at ) a estimării de probabilitate maximă A* iar formula (15) urmează una dintre principalele relații de statistică a datelor de interval

(18)

Relația (18) rafinează afirmația de insolvență A*. De asemenea, implică faptul că nu are sens să creștem la infinit dimensiunea eșantionului n pentru a îmbunătăți acuratețea estimării parametrilor dar, deoarece în acest caz doar al doilea termen din (18) scade, în timp ce primul rămâne constant.

În conformitate cu abordarea generală a statisticilor datelor de interval, standardul propune să se determine dimensiunea rațională a eșantionului n șobolan care urmează să fie determinată din condiția „erori de egalizare” (propusă în monografie) de diferite tipuri în formula (18), adică. din starea

Simplificand această ecuație în baza ipotezei, obținem asta

Conform celor de mai sus, este recomandabil să folosiți numai mostre cu volume . Depășirea dimensiunii raționale a eșantionului nu asigură o creștere semnificativă a preciziei estimării.

Aplicarea metodelor teoriei stabilităţii. Să găsim nota asimptotică. După cum rezultă din forma termenului liniar principal din formula (17), soluția problemei de optimizare

corespunzătoare restricțiilor privind erorile absolute, are forma

Cu toate acestea, în acest caz, perechile nu formează un eșantion simplu aleatoriu, deoarece este inclusă în expresiile pentru . Cu toate acestea, când poate fi înlocuit cu M(x 1). Atunci obținem asta

la A>1, unde

Astfel, până la infinitezimale de ordin superior, nota are forma

Să aplicăm rezultatele obținute la construcția intervalelor de încredere. În formularea statisticilor matematice clasice (adică, pentru ), intervalul de încredere pentru parametrul de formă dar, corespunzătoare probabilității de încredere , are forma

unde este cuantila de ordine a distribuției normale standard cu așteptări matematice 0 și varianța 1,

La stabilirea statisticilor datelor de interval (adică la ), ar trebui să se ia în considerare intervalul de încredere

într-un cadru probabilistic (perechile formează un eșantion aleator simplu) și într-un cadru de optimizare. Atât în ​​setarea probabilistică, cât și în cea de optimizare, lungimea intervalului de încredere nu tinde spre 0 când

Dacă se impun restricții asupra erorii relative limită, se dă valoarea, apoi valoarea din poate fi găsit folosind următoarele reguli de aproximare.

(I) Eroarea relativă a sumei este între cea mai mare și cea mai mică dintre erorile relative ale termenilor.

(II) Eroarea relativă a produsului și a coeficientului este egală cu suma erorilor relative ale factorilor sau, respectiv, ale dividendului și divizorului.

Se poate demonstra că, în cadrul statisticii datelor de interval cu restricții privind eroarea relativă, regulile (I) și (II) sunt afirmații stricte pentru

Să notăm eroarea relativă a unei anumite cantități t prin OP t), eroare absolută - prin AP( t).

Din regula (I) rezultă că OP() = , iar din regula (II) rezultă că

Deoarece considerentele sunt efectuate atunci, în virtutea inegalității Chebyshev

în probabilitate la, deoarece atât numărătorul cât și numitorul din (19) cu o probabilitate apropiată de 1 se află în interval unde constanta d poate fi determinată folosind inegalitatea Chebyshev menționată.

Deoarece, cu valabilitatea lui (19), până la infinitezimale de ordin superior

apoi cu ajutorul ultimelor trei relaţii pe care le avem

(20)

Să aplicăm încă o regulă de calcule aproximative.

(III) Eroarea absolută limită a sumei este egală cu suma erorilor absolute limitatoare ale termenilor.

Din (20) și regula (III) rezultă că

Din (15) și (21) rezultă că

de unde, în conformitate cu formula obținută anterior pentru dimensiunea rațională a eșantionului cu înlocuire, obținem că

În special, când A= 5,00, = 0,01 obținem i.e. într-o situație în care s-au obținut date privind timpul de funcționare al incisivilor până la starea limită, este irațional să se efectueze mai mult de 50 de observații.

În conformitate cu considerentele anterioare, intervalul de încredere asimptotic pentru A, corespunzător nivelului de încredere = 0,95, are forma

În special, când avem un interval de încredere asimptotic în loc de at

În mare dar datorită considerațiilor date în derivarea formulei (19), este posibil să se relaționeze erorile relative și absolute ale rezultatelor observației x i :

(21)

Prin urmare, în mare dar avem

Astfel, raționamentul de mai sus a făcut posibilă calcularea asimptoticei integralei care definește mărimea DAR.

Compararea metodelor de estimare. Să studiem influența erorilor de măsurare (cu restricții asupra erorii absolute) asupra estimării metodei momentelor. Avem

Eroare s 2 depinde cum calculezi s 2 . Dacă se utilizează formula

(22)

atunci este necesar să se folosească rapoartele

În comparație cu analiza influenței erorilor asupra estimării a*, apare aici un nou punct - necesitatea de a lua în considerare erorile din componenta aleatorie a abaterii estimării de la parametrul estimat, în timp ce se ia în considerare probabilitatea maximă. estimare, erorile au dat doar o părtinire. Acceptăm în conformitate cu inegalitatea Cebyshev

(23)

Dacă calculăm s 2 prin formula

(24)

atunci calcule similare dau asta

acestea. eroare în general dar substanțial mai mult. Deși părțile corecte ale formulelor (22) și (24) sunt identice, erorile de calcul care utilizează aceste formule sunt foarte diferite. Acest lucru se datorează faptului că în formula (24) ultima operație este găsirea diferenței a două numere mari, aproximativ egale ca valoare (pentru o probă din distribuția gamma la mare importanță parametru de formă).

Din rezultatele obţinute rezultă că

La derivarea acestei formule s-a folosit liniarizarea influenței erorilor (separarea termenului liniar principal). Folosind relația (21) dintre erorile absolute și relative, putem scrie

Această formulă diferă de cea dată în

dar

b) pentru a crește acuratețea estimării, se recomandă creșterea mărimii eșantionului la nesfârșit;

c) estimările de maximă probabilitate sunt mai bune decât estimările metodei momentelor,

apoi în statistica datelor de interval, luând în considerare erorile de măsurare, respectiv:

a) nu există estimări consistente: pentru orice estimare un n există o constantă din astfel încât

b) nu are sens să se ia în considerare dimensiunile eșantionului mai mari decât „dimensiunea rațională a eșantionului”

c) estimările metodei momentelor într-o gamă largă de parametri sunt mai bune decât estimările de probabilitate maximă, în special, pentru și pentru

Este clar că rezultatele de mai sus sunt valabile nu numai pentru problema considerată a estimării parametrilor distribuției gamma, ci și pentru multe alte formulări ale statisticii matematice aplicate.

Erori metrologice, metodologice, statistice și de calcul. Este recomandabil să se evidențieze o serie de tipuri de erori în datele statistice. Erorile cauzate de inexactitatea măsurării datelor inițiale se numesc metrologice. Lor valoare maximă poate fi evaluat cu ajutorul notelor. Cu toate acestea, folosind exemplul de estimare a parametrilor distribuției gamma de mai sus, se arată că trecerea de la abaterea maximă la cea reală în modelul probabilistic-statistic nu modifică concluziile (până la multiplicarea valorilor de eroare marginală ​sau prin constante). De regulă, erorile metrologice nu scad odată cu creșterea dimensiunii eșantionului.

Erorile metodologice sunt cauzate de inadecvarea modelului probabilistic-statistic, de abaterea realității de la premisele sale. Inadecvarea de obicei nu dispare pe măsură ce dimensiunea eșantionului crește. Este oportun să se studieze erorile metodologice folosind „schema generală de stabilitate”, care generalizează modelul de colmatare cu valori aberante mari, care este popular în teoria procedurilor statistice robuste. Erorile metodologice nu sunt luate în considerare în acest capitol.

Eroarea statistică este eroarea care este considerată în mod tradițional în statistica matematică. Caracteristicile sale sunt varianța estimării, adăugarea la 1 a puterii criteriului cu o alternativă fixă ​​etc. De regulă, eroarea statistică tinde spre 0 cu o creștere a dimensiunii eșantionului.

Eroarea de calcul este determinată de algoritmii de calcul, în special de regulile de rotunjire. La nivelul matematicii pure este adevărată identitatea părților din dreapta formulelor (22) și (24), care definesc varianța eșantionului s 2 , iar la nivelul matematicii computaționale, formula (22) dă, în anumite condiții, cifre semnificative semnificativ mai adevărate decât a doua .

Mai sus, folosind exemplul problemei de estimare a parametrilor distribuției gamma, a fost luat în considerare efectul combinat al erorilor metrologice și de calcul, iar erorile de calcul au fost estimate conform regulilor clasice de numărare manuală. S-a dovedit că, prin această abordare, estimările metodei momentelor au un avantaj față de estimările de maximă probabilitate într-o gamă largă de variații ale parametrilor. Cu toate acestea, dacă se iau în considerare numai erorile metrologice, așa cum sa făcut mai sus în exemplele 1-5, atunci folosind calcule similare se poate demonstra că estimările acestor două tipuri au (pentru suficient de mari n) aceeași eroare.

Eroarea de calcul nu este luată în considerare în detaliu aici. O serie de rezultate interesante despre rolul său în statistici au fost obținute de N.N. Lyashenko și M.S. Nikulin.

Anterior

Acest articol descrie sintaxa formulei și utilizarea funcției GAMMA.DISTîn Microsoft Excel.

Returnează distribuția gamma. Această caracteristică poate fi utilizată pentru a examina variabilele care au o distribuție anormală. Distribuția gamma este utilizată pe scară largă în analiza sistemelor de așteptare.

Sintaxă

GAMMA.DIST(x,alfa,beta,cumulativ)

Sintaxa funcției GAMMA.DIST are următoarele argumente:

    X este un argument necesar. Valoarea pentru care doriți să calculați distribuția.

    Alfa este un argument necesar. Parametru de distribuție.

    Beta este un argument necesar. Parametru de distribuție. Dacă beta = 1, GAMMA.DIST returnează distribuția gamma standard.

    Integral este un argument necesar. Valoare booleană care definește forma funcției. Dacă argumentul cumulativ este TRUE, GAMMA.DIST returnează funcția de distribuție cumulativă; dacă acest argument este FALS, este returnată funcția de densitate de probabilitate.

Observatii

Exemplu

Copiați eșantionul de date din următorul tabel și inserați-l în celula A1 a unei noi foi Excel. Pentru a afișa rezultatele formulei, selectați-le și apăsați F2 urmat de ENTER. Modificați lățimea coloanelor, dacă este necesar, pentru a vedea toate datele.

Date

Descriere

Valoarea pentru care doriți să calculați distribuția

Parametrul de distribuție alfa

Parametrul de distribuție beta

Formulă

Descriere

Rezultat

GAMMA.DIST(A2,A3,A4,FALSE)

Densitatea probabilității atunci când se utilizează valorile x, alfa și beta în celulele A2, A3, A4 cu argument integral FALSE.

GAMMA.DIST(A2,A3,A4,TRUE)

Distribuția cumulativă atunci când se utilizează valorile x, alfa și beta în celulele A2, A3, A4 cu argumentul cumulativ TRUE.

Vizualizări