Cunostinta va deschide lumea intelepciunii - Referate profesionale unice

Acasa » afaceri » economie » contabilitate
Modelul clasic de credibilitate al lui Bühlmann

Modelul clasic de credibilitate al lui Bühlmann

Am vazut in lectia anterioara ca , in anumite ipoteze, o aproximare a modului in care experienta afecteaza credinta noastra asupra primei brute a unui contract de asigurare C Q, X) este

h(X) = (1- z)m + zM

unde m este prima bruta teoretica EX_r = Em Q) cu m Q) = E(X_r Q) , M = este media istorica a platilor iar z este factorul de credibilitate Bühlmann, calculat dupa formula

z =

unde

a = Var(m Q)) = Em Q) - E²m Q) = Em Q) - m²

iar

s = E(Var(X_r Q)) = E(X_r² - m Q)) = EX_r² - Em Q

Problema este ca h nu este o statistica, adica nu depinde numai de rezultatele observatiilor. Mai depinde de modelul Bayesian acceptat de asigurator.

Pentru a fi aplicabil, ar fi de dorit ca cei trei parametri de care depinde (1.1) - adica m,a si s² sa poata fi estimati din observatii.

Ideea lui Bühlmann a fost sa se apeleze la contracte independente.

Presupunem ca

a. Dispunem de k contracte independente (C_j _j_k in care factorii de risc Q_j sunt identic repartizati. Notam C_j = (Q_j , X_j) . Presupunem in prima etapa ca toate contractele pe care ne bazam au aceeasi intindere in timp, deci X_j = (X_j,₁, X_j,₂, ., X_j,t). Vom nota cu X matricea (X_j)₁_j_k

b. Repartitia PoQ_j = u t nu depinde de j.

c. Modelul este acelasi in cadrul fiecarui contract. Mai mult, presupunem ca, la fel ca in cursurile anterioare, in cadrul fiecarui contract variabilele X_j,r sunt conditionat independente si identic repartizate.

In aceste conditii toate variabilele aleatoare (X_j,r)₁_j_{k ,}_r_t vor fi identic repartizate. Mai mult, vectorii X_j vor fi identic repartizati, deoarece PoX_j = UQ^t unde Q(Q) este repartitia lui X_1,1 conditionata de Q

Sa notam cu estimatorul Bayesian liniar optim al variabilei aleatoare m Q_j) dat de observatiile X = (X_j,r)_j,r . Mai precis, este o functie h_j(X) de forma

h_j(x) = c_j +

cu proprietatea ca

E(m Q_j) - h(X))² E(m Q_j) - b₀ - )² b₀ , b_i,rI A i k , 1 r t

Mai intai vom demonstra un analog al Corolarului 1.5 din lectia anterioara. De fapt pe noi ne intereseaza sa dam o predictie asupra variabilei aleatoate X_j,t+₁, si nu sa aproximam pe m Q_j

LEMA 3.1. Fie X o variabila aleatoare din L¹ . Fie F G doua s-algebre. Presupunem ca G este independent de G si de X. Atunci E(X F G) = E(X F

Demonstratie. Cum E(X F ) este F G - masurabila, trebuie aratat numai ca pentru orice multime C I F G este adevarata egalitatea E(E(X F)1_C) = E(X1_C) . Daca C = A B cu A IF , B I G atunci egalitatea este adevarata deoarece E(E(X F)1_A_B) = E(E(X F)1_A1_B) = E(E(X1_A F)1_B) = E(E(X1_A F))P(B) (caci E(X1_A F) este independenta de 1_B) = E(X1_A)P(B) = E(X1_A)E(1_B) = E(X1_A1_B) (deoarece 1_B este independenta de X1_A) = E(X1_C). Apoi urmeaza un rationament standard : multimile de forma C = A B cu A IF , B I G formeaza un sistem de generatori inchis la intersectii finite pentru F G iar multimile C cu proprietatea ca E(E(X F)1_C) = E(X1_C) formeaza un p-sistem, etc.

COROLAR 3.2. (i). E(X_j,t+₁ C_i _i_k) = E(X_j,t+₁ C_j) = E(m Q_j X_j

(ii). E(X_j,t+₁ X) = E(m Q_j X_j) = E(X_j,t+₁ X_j

Demonstratie. Am presupus ca toate contractele sunt independente. Aplicam lema de mai sus cu X_j,t₊₁ in loc de X, s C_j) in loc de F si s C_i _i_{k, i}_j) in loc de G: deci E(X_j,t+₁ C_i _i_k) = E(X_j,t+₁ C_j). A doua relatie este corolarul 1.5 din lectia anterioara. A doua relatie rezulta din faptul ca E(X_j,t+₁ X) = E(E(X_j,t+₁ C_i _i_k X) = E(E(m Q_j X_j X) = E(m Q_j X_j) ; ultima egalitate este de fapt chiar corolarul 1.5 din lectia anterioara.

Se poate demonstra mai mult.

Revenim pentru moment la Corolarul 1.5. din lectia anterioara. Se stie ca media conditionata de o s-algebra F este proiectorul ortogonal pe subspatiul Hilbert L²(F). Mai precis, daca X I L²(W K,P) , atunci E(X F) = . Cu riscul plictisirii cititorului, explicam putin ce inseamna aceasta.

Sa spunem ca V este un spatiu Hilbert Deci pe acest spatiu avem un produs scalar iar norma este definita prin x <x,x> Fie H V un subspatiu inchis si H ortogonalul sau. H este de asemenea un subspatiu inchis al lui V. Spatiile Hilbert au o proprietate cruciala numita « Teorema proiectiei ortogonale » : orice x I V se scrie in mod unic ca x = x_H+ x_H* unde x_H I H iar x_H*I H Aplicatia x a x_H se numeste proiectia ortogonala a lui x pe H. I se spune asa deoarece x - x_H x_H . Vom nota proiectia ortogonala Pr_H . Proiectia ortogonala are urmatoarele proprietati:

(i). este un operator liniar (adica Pr_H(ax+by) = aPr_H (x) + bPr_H (y) a,b I A, x,y I V)

(ii). care este proiector (adica Pr_H (Pr_H(x)) = Pr_H (x) x)

(iii). continuu (de fapt de norma 1)

(iv). Daca H K V atunci Pr_H o Pr_K = Pr_H .

(v). Daca H K atunci Pr_{H + K} = Pr_H + Pr_K (intr-adevar, scriem unic x = x_H+ x_K+y cu x_H I H, x_K I K si y I (H+K) = H K

(vi) Daca x H atunci Pr_H(x) = 0 (caci daca x = x_H + y cu x_H I H, y I H atunci 0 = <x,x_H> <x_H,x_H> <y,x_H> = ║x_H║² + 0 )

(vii). Daca x K si H K atunci Pr_{H + K} (x) = Pr_H(x) (se aplica (v). si (vi).)

Aici se subintelege ca H si K sunt subspatii inchise ale lui V.

Ceea ce este mai important pentru cazul nostru, proiectia ortogonala pe H coincide cu proiectia metrica pe H.

Proiectia metrica se defineste altfel (definitia are sens pentru o clasa mai larga de spatii Banach!) . Anume sa consideram functia f_x : H ) data prin f_x(u) = x - u . Aceasta functie este convexa si lim_tf_x(tu) = . Nu inseamna neaparat ca are un punct de minim (pentru cultura generala : daca spatiul Banach V are proprietatea ca functia f_x are cel putin un punct de minim pentru orice subspatiu inchis H V , atunci el este reflexiv - teorema Eberlein !) . Spatiile Hilbert sunt reflexive, deci in cazul nostru un asemenea punct de minim y exista. El se numeste element de cea mai buna aproximare a lui x in H. Uneori se intimpla ca acest element de cea mai buna aproximare sa fie si unic. (Pentru cultura generala : daca elementul de cea mai buna aproximare este unic, atunci spatiul V este reflexiv si strict convex . Reflexiv = V coincide cu bidualul sau V'' iar strict convex inseamna ca daca x,y I V sunt liniar independenti, atunci x + y < x y ). Spatiile Hilbert sunt strict convexe deoarece ( x y x + y x y <x,y> T x = ty , t I A, deci x si y sunt coliniari , dupa cum rezulta din inegalitatea Schwartz - Cauchy - Buniakowski.

Deci daca V este reflexiv si strict convex atunci oricarui x i se ataseaza un element din H unic care sa fie element de cea mai buna aproximare a lui. Acest element se numeste proiectia metrica a lui x pe H. Sa il notam , de exemplu, Pm_H(x).

Se stie ca in spatiile Hilbert cele doua proiectii coincid. Intr-adevar, nu este complicat. Daca x_H = Pr_H(x) si y I H, atunci x-y x - x_H) + (x_H- y) x - x_H x_H - y < x - x_H, x_H- y > . Dar x - x_H este ortogonal pe H iar x_H - y I H - deei produsul scalar este egal cu 0. Rezulta x-y x - x_H x_H - y x - x_H y I H deci proiectia ortogonala coincide cu proiectia metrica. Vom numi « proiectia pe H » proiectia ortogonala = metrica pe H..

Revenind la contextul din corolarul 1.5, lectia precedenta, , g(X) este proiectia lui X_t+₁ pe L²(X) iar estimatorul Buhlman h(X) este proiectia lui X_t₊₁ pe spatiul inchis generat de X in L². Sa notam acest spatiu cu sp(X). Fie H spatiul generat de 1 si X. Paragraful 2 din lectia precedenta ne spune ca h(X) = Pr_H(X_t+₁). Am vazut ca g(X) = = (Corolarul 1.5 din lectia precedenta). De aceea si h(X) = Pr_H(m Q)). Motivul este foarte general, si anume :

LEMA 3.3. Fie V un spatiu Hilbert si H K doua subspatii inchise. Fie x,y I V ca Pr_Kx = Pr_Ky. Atunci Pr_Hx = Pr_Hy.

Demonstratie. Evident: Pr_Hx = Pr_HPr_K (x) = Pr_HPr_K (y) = Pr_Hy.

Corolar. 3.4. Fie H un spatiu inchis din L² astfel ca sp(X) H L²(W s(X),P). Atunci

Pr_H (X_t+₁) = Pr_H (m Q

Demonstratie. Este Lema 1.3 aplicata in urmatorul context: K este L²(s(X)) , x este m Q) si y este X_t+₁.

Revenind la corolarul 1.2 (ii), stim ca E(X_j,t+₁ X) = E(m Q_j X_j) = E(X_j,t+₁ X_j). Atunci pentru orice subspatiu H din L²(W s(X),P) avem ca Pr_H (X_j,t+₁) = Pr_H (m Q_j)). In particular, daca H = sp(1,X) , atunci - proiectia metrica pe H a variabilei aleatoare Q_j - coincide si cu Pr_H (X_j,t+₁).

Fie H_j = sp(1,X_j) L²(s(X_j)) L²(s(X)) . Egalitatea E(m Q_j X_j) = E(X_j,t+₁ X_j) implica atunci

TEOREMA 3.5. In ipotezele a., b., c. de mai sus

= (1- z)m + zM_j

unde M_j = (X_j,₁ + X_j,₂ + . + X_j,t) / t

Demonstratie. Fie Y_i,r = X_i,r - EX_i,r = X_i,r - m. Fie Y_i = (Y_i,r)₁_r_t si Y = (Y_i)₁_i_k Sa observam ca spatiile H_i pot fi caracterizate si prin H_i = sp(1,Y_i), H = sp(1,Y) .

Atunci = Pr_H (X_j,t+₁) = Pr_H (Y_j,t+₁) + m (caci H contine constantele) = Pr_H(E(Y_j,t+₁ X)) + m

= Pr_H(E(Y_j,t+₁ Y_j)) + m . Fie Z_j = E(Y_j,t+₁ X_j) Dar Z_j este independenta de X_i daca i j. Avand media egala cu 0, Z_j Y_i,r pentru orice i j si 1 r t. Sa scriem H = H_j K_j unde K_j = sp(Y_i,r i k , i j, 1 r t). Cum Z_j K_j , proprietatea (vii) a proiectiei ortogonale implica Pr_H(Z_j) = (Z_j) . Deci in definitiv

= (E(Y_j,t+₁ Y_j)) + m = (E(Y_j,t+₁ + m X_j)) = (E(X_j,t+₁ X_j)) = (X_j,t+₁) (aplicam proprietatea (iv). a proiectiei ortogonale cu H_j in loc de H si L²(X_j) in loc de K ). Dar teorema Buhlman spune ca (X_j,t+₁) = (1- z)m + zM_j .

Dar daca schimbam spatiul de proiectie ?

In statistica apar si alte tipuri de estimatori, care nu mai corespund intotdeauna proiectiei pe un subspatiu. Spre exemplu, estimatorul = (X₁ + X₂ + .+ X_t)/t , notat de noi cu M , nu este un proiector pe un subspatiu al lui L² . Intr-adevar, daca presupunem ca variabilele X_j sunt din L² si EX_iX_j = a (daca i j) sau a + b (daca i = j) atunci <X_t+ - , X_j> = a - (ta+b)/t = b/t = 0 b = 0 EX₁² = EX₁X₂ = EX₂² T E(X₁-X₂)² = 0 T X_j = X₁ a.s. j . Deci, daca nu suntem in cazul trivial, nu poate fi proiector ortogonal pe nici un spatiu care contine variabilele (X_j)₁_j_t

Si totusi, este un proiector, dar nu pe un subspatiu al lui L², ci pe o varietate afina.

Definitie. Fie V un spatiu Hilbert si D V . Atunci D se numeste varietate afina daca x,y I D, a,b I A ca a+ b = 1 T ax + by I D.

LEMA 3.6.

(i). D este varietate afina D = u + H unde H V este un subspatiu. D este inchisa H este inchis.

(ii). Fie D o varietate afina, n 2 si (a_i)₁_i_n I Aⁿ astfel ca a₁ + a₂ + . + a_n = 1. (Numerele a_i formeaza o combinatie afina!). Fie x₁,x₂,.,x_n I D. Atunci a₁x₁ + . + a_nx_n I D.

(iii). H nu depinde de u I D. Deci H = D - D.

(iv). Daca D este o varietate afina atunci exista un unic u I D ca D = u + H cu H un subspatiu si u H. Sa numim acest vector u proiectia lui 0 pe D. El are proprietatea ca ║u║ = d(0,D) = inf . Numim scrierea D = u + H, u H reprezentarea normala a varietatii afine D.

(v). Fie D = u + H o varietate afina inchisa scrisa normal. Atunci definim

Pr_Dx := u + Pr_H x = Pr_D(0) + Pr_H x

si numim functia Pr_D: V D proiectia pe D. Atunci Pr_D este proiectia metrica pe D in sensul definit mai sus: ║x - Pr_D(x)║ = inf

Demonstratie.

(i). Sa presupunem ca D este varietate afina. Fie u I D oarecare si fie H = D - u = . Atunci H este un subspatiu vectorial. Intr-adevar, daca x I D si t I A atunci tx + (1-t)u = u + t(x - u ) I D. Altfel spus, u + tH D t I A tH H t I A. Deci x I H , t I A T tx I H. Pe de alta parte, daca x,y I H x', y' I D ca x = x' - u, y = y' - u T (x + y)/2 = ½ x'+ y' - u I H (caci ½ x'+ y' I D!) de unde x+y = 2 I H sau H + H H. Deci

tH H , H + H H

adica H este un subspatiu. Reciproc, daca H este un subspatiu , u I V atunci D = u + H este evident o varietate afina caci x,y I D x = u + x', y = u + y' cu x', y' I H T ax + by = (a+b)u + (ax' + by') = u + ax' + by' (daca a+b = 1) I D. A doua afirmatie rezulta din faptul ca translatia x a x + u este o izometrie in orice spatiu Banach.

(ii). Inductie. Presupunem afirmatia adevarata pentru n si o verificam pentru n+1. Fie (a_i)₁_i_n+1 ca a₁+.+a_n+₁ = 1. Exista o submultime de n numere a_i a caror suma sa fie nenula (caci a_i nu pot fi toti egali cu 1!). Sa presupunem ca a* := a₁ + .+ a_n 0. Deci a_n+₁ = 1 - a*. Atunci scriem a₁x₁ + . + a_nx_n + a_n+₁x_n+₁ = a* + (1-a*)x_n+₁ . Vectorul din paranteza aparttine lui D prin ipoteza de inductie iar combinatia totala este in D prin definitie.

(iii). Trebuie aratat ca daca u,v I D atunci D - u = D - v . Fie x I D. Atunci x - u = (x + v - u) - v I D - v deoarece x + v - u I D (aplicam punctul precedent cu n = 3, (a_i) = (1,1,-1) si (x_i) = (x,v,u)! ) deci D - u D - v. Analog si D - v D - u.

(iv). Fie v I D oarecare si H = D - v. Stim ca H este subspatiu si ca D = u + H u I D. Fie atunci u I D H . Insemna ca D = u + H , u I H. Unicitatea : v = u + (v-u) Din (iii) avem ca v - u I H . Cum u I H avem ca u (v-u). Analog si v (v-u) T (u-v) (u-v) T u = v. Fie acum x I D oarecare. Atunci x-u I H T u (x-u) T ║x║² = ║u║² + ║x-u║² (teorema lui Pitagora!) ║u║².

(v). Fie x I V, y = Pr_H x , z I D. Deci z = u + z', z' I H. Atunci x - z = (x - y - u ) - ( z' - y). Primul vector este in H (caci x - y I H din definitia proiectiei ortogonale iar u I H din reprezentarea canonica; iar H este un subspatiu inchis al lui V) iar al doilea este in H .

Din teorema lui Pitagora ║x - z║² = ║x - y - u ║² + ║z' - y ║² = ║x -Pr_D x║² + ║z - Pr_Dx ║² ║x -Pr_D x║² ceea ce incheie demonstratia.

Concluzia este ca proiectia pe o varietate afina inchisa este de fapt proiectia pe un subspatiu translatata cu un vector.

Sa notam cu aff(C) varieatea afina inchisa generata de C V. Este usor de vazut ca

aff(C) = cl

unde prin cl am notat inchiderea multimii.

COROLAR 3.7. Fie (X_j)_j un sir de variabile aleatoare din L² cu proprietatea ca EX_j = m j si Cov(X_i,X_j) = a + s²d_i,j. Fie t 2 si M = (X₁ + X₂ + .+ X_t)/t . Atunci

M = Pr_aff_(X)(X_t+₁) = Pr_aff_(X)(0)

Demonstratie. Se poate face in mai multe feluri. Noi vom aplica formula (3.9). Fie D = aff(X). Deci Z I D Z este de forma Z = c₁X₁ + c₂X₂ + . + c_tX_t unde c₁ + . + c_t = 1. Fie Y = Pr_aff_(X)(0). Inseamna ca 0 - Y H Y H . Ramane sa calculam H = D - D. Este usor de vazut ca

H = = sp

Ca atare Y H Y (X_i - X_j) i,j t sau

< c₁X₁ + c₂X₂ + . + c_tX_t, X_i-X_j > i,j t

Efectuind calculele vedem ca < X_r,X_i-X_j> = Cov(X_r,X_i) - Cov(X_r,X_j) poate lua trei valori: daca r este 0, daca r = i este s² iar daca r = j este - s². Deci (3.14) devine s²(c_i - c_j) = 0 T c_i = c_j i,j . (Cazul s² = 0 ar implica X_i = X_j i,j , deci nu ar fi interesant! ) Cum suma coeficientilor c_i este egala cu 1 rezulta ca c_i = 1/t i deci Y = (X₁ + .+ X_t)/t = M.

Pe de alta parte < X_t+₁,X_i - X_j> = a - a = 0 i j T X_t H T Pr_H(X_t+₁) = 0.

Ne punem acum problema proiectiei variabilei X_j,t+₁ pe aff(X) daca suntem in situatia celor k contracte independente care satisfac conditiile a,b,cde mai sus.

Atunci obtinem ceva care se numeste estimatorul liniar omogen al lui m Q_j) (sau al lui X_j,t+₁, dupa cum rezulta din Corolarul 3.2 combinat cu proprietatea (iv) a proiectiei ortogonale ).

PROPOZITIA 3.8.Fie D = aff(X) si H = D - D. Atunci

Pr_D(X_j,t+₁) = zM_j + (1-z)M₀ = Pr_D(m Q_j

unde M₀ este media generala : M₀ = (M₁ + M₂ + . + M_k)/k iar z = este coeficientul de credibilitate.

Mai mult, Pr_D(0) = M₀ si , Pr_H(X_j,t+₁) = z( M_j - M₀) .

Demonstratie. Sa observam ca

D = aff(X) =

H =sp

Din ipotezele a,b,c rezulta ca

< X_j,r , X_i,p > = m² + ad_j,i + s²d_j,id_r,p

Deci

< c_j,rX_j,r ,X_i,p-X_i',p' > = aS_i + s²c_i,p - (aS_i' + s²c_i',p') = a(S_i - S_i') + s²(c_i,p - c_i',p')

Am notat cu S_i suma c_i,₁ + c_i,₂ + . + c_i,t .

Fie Y = Pr_D(0). Deci Y I D si Y H . Din (3.16), conditia care trebuie indeplinita este ca

Y (X_i,p-X_i',p') 1 i,i' k, 1 p,p' t

Inlocuind in (3.18) rezulta conditiile

a(S_i - S_i') + s²(c_i,p - c_i',p') = 0 , 1 i,i' k, 1 p,p' t

Daca punem i = i' deducem ca c_i,₁ = c_i,₂ = . = c_i,t = S _i/t deci S_i = tc_i,₁; inlocuind in (3.20) pentru i i' deducem ca (ta + s²)(c_i,₁ - c_i',₁) = 0 i i' T c_1,1 = c_2,1 = . = c_k,₁ adica toti coeficientii c_j,r sunt egali. Din (3.15) urmeaza imediat ca c_j,r = deci Y = = - cu notatiile de la (3.8). Adica proiectia originii pe D este media aritmetica a tuturor observatiilor, notata cu M₀.

Calculam acum Z = Pr_H(X_j,t+₁). De data aceasta vom apela la metoda multiplicatorilor lui Lagrange, desi s-ar putea proceda analog, impunind conditia ca Z I H si Z (X_i,p-X_i',p') i,i',p,p'.

Avem de minimizat functia convexa f(c) = E[(X_m,t+₁ - c_j,rX_j,r)²] cu restrictia c_j,r = 0. Atasam functia

F(c,l) = E[(X_m,t+₁ - c_j,rX_j,r)²] - 2l(c_j,r)

Derivata partiala fata de c_i,p este (c,l) = - 2E[X_i,p(X_m,t+₁ - c_j,rX_j,r)] - 2l

Impunand conditia ca (c,l) = 0 gasim sistemul

c_j,r E(X_i,pX_j,r) = E[X_i,p(X_m,t+₁)] + l 1 i k , 1 p t

Folosind (3.17) sistemul devine

mc_j,r + ac_i,r + s²c_i,p = m² + ad_m,i l

sau, folosind conditia c_j,r = 0 si notatia S_i de mai sus

aS_i + s²c_i,p = m² + ad_m,i l , 1 i k , 1 p t

Daca i m este fixat , egalitatea de mai sus devine

aS_i + s²c_i,p = m² + l p t T c_i,₁ = c_i,₂ = . = c_i,t =

daca i = m atunci rezulta aS_i + s²c_i,p = m² + a + l p t T c_m,₁ = c_m,₂ = . = c_m,t =

Punem conditia ca c_j,r = 0 si determinam astfel pe l = - m² - de unde gasim

c_j,r = =

Deci Z = c_j,rX_j,r = = z(M_j - M₀).

Faptul ca m Q_j) are aceleasi proiectii rezulta imediat din faptul ca <X_i,p,X_j,t+> = <X_i,p,m Q_j > i,p.

Sa notam estimatorul liniar omogen al lui m Q_j) cu (Q_j). El depinde de doi parametri necunoscuti, de a si s² . Deci nici el nu este o statistica. Este un estimator bayesian nedeplasat aentru m.

4. Estimarea parametrilor m,a si s²

Ne punem acum problema de a estima pe baza datelor de observatie X cei trei parametri m, a si s². Acum este o problema de statistica obisnuita: cautam trei estimatori nedeplasati pentru aceste cantitati.

Unul din ei l-am gasit deja: M₀ este un estimator pentru m.

PROPOZITIA 4.1. In ipotezele a,b,c de la paragraful 3 statistica

= , = =

este un estimator nedeplasat pentru s². Varianta lui este

Var() =

Demonstratie. Conditionat de Q_j, variabilele aleatoare X_j,r sunt independente si identic repartizate. Inseamna ca E( Q_j) = Var(X_j,r Q_j) - caci stim ca pentru variabile aleatoare i.i.d. este intr-adevar un estimator nedeplasat pentru varianta.

In concluzie E() = E(Var(X_j,r Q_j)) = s² (din 3.4).

Pe de alta parte variabilele aleatoare sunt independente si identic repartizate , de unde rezulta imediat (4.2).

Este complicat de a calcula varianta estimatorului . Observam ca decisiv pentru minimizarea lui este cresterea numarului de contracte independente, k.

Totusi, putem calcula variantele estimatorilor M_j si M. Apare o evidenta deosebire fata de cazul i.i.d., cind aceste variante tind la 0 o data cu cresterea numarului de observatii, t :

PROPOZITIA 4.2. In ipotezele a,b,c de la paragraful 3 avem

Var(M_j) = a + , Var(M₀) =

Demonstratie. Fie S_j = X_j,₁ + X_j,₂ + . + X_j,t . Atunci Var(M_j) = iar Var(S_j) = Cov(X_j,p,X_j,q) = (a + d_p,qs) = t²a + ts² . A doua afirmatie rezulta imediat din faptul ca variabilele aleatoare M_j sunt independente.

PROPOZITIA 4.3. In ipotezele a,b,c de la paragraful 3 variabila aleatoare

= -

este un estimator nedeplasat pentru a.

Demonstratie. Se stie ca daca M_j sunt variabile aleatoare i.i.d. atunci este un estimator nedeplasat pentru Var(M_j). Din propozitia anterioara stim ca Var(M_j) = a + .

Inseamna ca E()= a + - E() iar din propozitia 4.1 stim ca este un estimator nedeplasat pentru s². Inseamna ca E() = deci E()= a.

Observatie. Precizia estimatorilor este data de varianta lor. Pentru ca sa aiba sens, ar trebui adaugata ipoteza ca in modelul nostru bayesian , variabilele aleatoare X_j,r au moment de ordin 4. De asemenea vedem ca nu conteaza asa de mult t (= istoricul ) cit conteaza k - numarul de contracte independente.

COROLAR 4.4. Variabila aleatoare

este un estimator pentru coeficientul de credibilitate z care este consistent in k : adica k T z .

Demonstratie. Din legea nunmerelor mari aplicata variabilelor aleatoare i.i.d. (M_j)_j stim ca limita aproape sigura a.s.lim_k = Var(M_j) = a + . Pe de alta parte variabilele aleatoare ()_j sunt si ele i.i.d. deci a.s.lim_k= E= s² . Deci daca k , atunci converge a.s. la s² si converge a.s. la a. Inseamna ca si z .

Observatie. In general estimatorul nu este nedeplasat, caci nu avem motive sa credem ca o formula de tipul E= ar putea fi adevarata, chiar in ipoteze restrictive. Daca X si Y sunt independente, de exemplu, atunci E se poate calcula, este diferit de . Ca amuzament, daca X si Y sunt i.i.d. atunci egalitatea este adevarata!

5. Conditii in care estimatorul Buhlman coincide cu media conditionata.

Revenim in contextul din capitolul II: avem observatiile X = (X₁,.,X_t) si modelul Bayesian

P(X₁ I B₁,..,X_t I B_t Q) = Q(Q,B₁)..Q(Q,B_t) B_r I B(A r t

Q q) = f_X_Q_q n

PoQ = u t

Reamintim ca m Q) = E(X_r Q). In aceste conditii media aposteriori este

g(X) = E(m Q X) = = E(X_t+₁ X

iar estimatorul Buhlman

h(X) = Pr_sp(1,X)(X_t+₁) = Mz + (1-z)m cu

m = EX_r, M = (X₁ + . + X_t)/t, z = , a = Var m Q), s² = E(Var(X₁ Q

Tot demersul de pina acum ar fi inutil daca nu ar exista cazuri intilnite in statistica care estimatorul Buhlman h(X) ar coincide cu g(X) . Un exemplu in care chiar asa se intimpla s-a dat in capitolul I.

Dam acum o generalizare a lui.

Definitie. Densitatea f_X_Q_q se numeste familie exponentiala daca este de forma

f_X_Q_q(x) = p(x)e^-^q^x/q q

unde se subintelege ca spatiul parametrilor E = [0, ). Se presupune ca functia q(q) este derivabila.

In acest caz densitatea vectorului X este

f_X_Q_q(x) = unde S = x₁ + . + x_t

Sa presupunem ca densitatea u a variabilei aleatoare Q este de forma

u(q) = unde a b I ) iar C(a b) este o constanta de normare.

In aceste conditii densitatea aposteriori este

f_Q_X_{= x} q)= = A(a b,x)e^-^q^a^+S) / q^t+^b q

adica este de acelasi tip ca si densitatea apriori. Spunem ca familia aceasta de densitati este o familie conjugata..

PROPOZITIA 5.1. Daca modelul bayesian este exponential, densitatea apriori este de forma (5.7) si u(0) = u( ) = 0 atunci g si h , definiti prin (5.4) si (5.5) coincid.

Demonstratie. Ideea este sa aratam ca g(X) este de forma c₀ + < c, x>. Stim ca estimatorul Buhlman este cel mai bun de acest tip. Fie f_q(x) = f_X_Q_q(x)

Din faptul ca f_q este o densitate deducem ca q(q) = dn(x) . Derivind (putem deriva sub integrala caci putem aplica teorema Lebesgue de convergenta dominata!) gasim q'(q - dn(x) = - q(q)dn(x) = - q(q)f_q(x)dn(x) = - q(q)E(X_r Q q) = - q(q m q) de unde

m q) = - (q

Pe de alta parte , derivand u(q) si folosind (5.9) gasim

u' q bm q a)u(q

Integrind si folosind conditiile u(0) = u( ) = 0 rezulta

0 = dq = u(q) dq bdq a . Deci =

Dar integrala din stinga este Em Q) = EX_r = m= .

Acum facem exact aceleasi calcule folosind densitatea aposteriori (5.8). Avem

g(X) = E(m Q X) = dq . Dar f_Q_X_=x q) este de acelasi tip ca u, numai ca s+au schimbat parametrii: in loc de a avem a + S iar in loc de b avem b + t.

Rezulta atunci ca g(X) = . Ori, aceasta este de forma c₀ + < c, x>., ceea ce incheie demonstratia.

Un caz particular este daca modelul este Poisson: repartitia Poisson este de forma (5.5). Aici masura n este masura cardinal pe multimea numerelor naturale..

Politica de confidentialitate

.com	Copyright © 2025 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational.

Modelul clasic de credibilitate al lui Bühlmann

Modelul clasic de credibilitate al lui Bühlmann

4. Estimarea parametrilor m,a si s2

5. Conditii in care estimatorul Buhlman coincide cu media conditionata.

Definitie. Densitatea fX Q q se numeste familie exponentiala daca este de forma

Comentarii literare

Personaje din literatura

Tehnica si mecanica

Economie

Geografie

4. Estimarea parametrilor m,a si s²

Definitie. Densitatea f_X_Q_q se numeste familie exponentiala daca este de forma