Creeaza.com - informatii profesionale despre


Cunostinta va deschide lumea intelepciunii - Referate profesionale unice
Acasa » referate » matematica » statistica

Studiul statistic al curelatiilor dintre fenomene - metode statistico-matematice de analiza a corelatiilor dintre fenomene


STUDIUL STATISTIC AL CURELATIILOR DINTRE FENOMENE - METODE STATISTICO-MATEMATICE DE ANALIZA A CORELATIILOR DINTRE FENOMENE


Fenomenele si procesele economice se gasesc in relatii de interdependenta, astfel incat unele se comporta ca fenomene cauza, determinante, independente sau factoriale, iar altele sunt fenomene efect, determinate, dependente sau rezultative.

Concluzii utile privind interdependenta dintre indicatorii statistici pot fi formulate numai in conditiile folosirii unui volum suficient de mare de date. Daca se studiaza corelatii intre serii dinamice de indicatori numarul minim de segmente de timp trebuie sa fie de 15, iar in cazul seriilor de indicatori obtinuti in urma unor experimentari, numarul minim de indicatori este apreciat la 40. In unele situatii concrete se remarca faptul ca o semnificatie crescuta a indicatorilor care exprima diverse aspecte ale corelatiilor dintre fenomene este mult imbunatatita atunci cand numarul determinarilor statistice depaseste 100.



Pentru a studia legaturile statistice care se formeaza intre fenomene pot fi utilizate mai multe modalitati de observatie si de calcul, grupate astfel:

- metode simple sau de observatie:

- metoda compararii seriilor paralele de date statistice interdependente

- metoda tabelului de corelatie

- metoda grafica

- metode analitice:

- metode parametrice (metode statistico-matematice de analiza a corelatiilor)

- metode neparametrice (metode de analiza a corelatiei rangurilor)


Metoda compararii seriilor paralele de date statistice interdependente consta in stabilirea legaturilor de interdependenta dintre fenomenele social-economice prin compararea a doua sau mai multe serii de indicatori.

In cazul seriilor de repartitie indicatorii care se refera la variabila determinanta sau independenta se aseaza in ordine crescatoare sau descrescatoare si in mod paralel se inscriu apoi valorile corespunzatoare variabilei (caracteristicii) dependente. Daca se compara serii cronologice de

indicatori acestia se pozitioneaza in mod paralel pe segmente de timp identice. Metoda compararii seriilor paralele de date statistice interdependente se poate utiliza, de asemenea, si atunci cand seriile respective de indicatori sunt inscrise in raport cu o caracteristica de spatiu (teritoriala).

Cu ajutorul acestei metode poate fi identificata, astfel, o anumita corespondenta a modificarilor inregistrate de indicatorii seriilor comparate, directia si intensitatea orientativa a modificarilor.


Metoda tabelului de corelatie. Tabelul de corelatie este un tabel statistic cu dubla intrare si cuprinde doua serii statistice de repartitie, o serie reprezinta seria de variante, sau intervalele de grupare, ale caracteristicii determinante, iar cealalta serie se refera la caracteristica dependenta (determinata). Tabelul de corelatie este o forma de grupare combinata efectuata dupa doua caracteristici considerate in sistem interdependent.

In functie de modul in care se distribuie frecventele aferente celor doua caracteristici se poate contura o apreciere cu privire la existenta sau inexistenta unei legaturi statistice, forma si directia legaturii. Concentrarea frecventelor in jurul uneia dintre diagonalele tabelului indica existenta unei anumite legaturi statistice, iar daca se remarca o imprastiere a frecventelor in tot spatiul tabelului se apreciaza ca cele doua caracteristici nu manifesta o stare de interdependenta.

Prin metoda tabelului de corelatie se identifica daca exista o legatura statistica intre fenomenele studiate, in profil static, la un anumit moment la care se refera datele, legatura care poate sa nu se mai manifeste la alte momente de existenta a unitatilor statistice.


Metoda grafica este una din cele mai utilizate metode pentru evidentierea legaturilor care se formeaza intre caracteristicile statistice. Aceasta metoda poate avea atat o utilizare independenta cat si in contextul aplicarii altor metode cu o structura de lucru mai complexa cum ar fi metodele statistico-matematice de analiza a corelatiilor.

Metoda graficului de corelatie (corelograma) consta in analiza unui grafic construit pe baza axelor rectangulare, valorile caracteristicii independente se inscriu pe abscisa, iar cele ale caracteristicii rezultative se inscriu pe axa ordonatelor. Reprezentarea punctelor de intersectie a valorilor celor doua caracteristici (“norul de puncte”) ofera o dispunere care permite, prin observatie, sa se concluzioneze asupra existentei corelatiei, precum si asupra directiei si formei analitice de manifestare a corelatiei.

Metode statistico-matematice de analiza
a corelatiilor dintre fenomene

Aceste metode fac parte din categoria metodelor de analiza factoriala, sunt metode cu caracter analitic si permit dimensionarea intensi-

tatii interdependentei dintre doua sau mai multe fenomene, viteza de modificare a fenomenelor efect prin modificarea fenomenelor cauza, precum si forma analitica a relatiei de interdependenta exprimata printr-o ecuatie de regresie.


Metodele statistico-matematice de analiza a corelatiilor dintre fenomene prezinta o larga aplicabilitate practica datorita consistentei informatiilor pe care le ofera.

Corelatiile care se manifesta intre fenomene sunt expresii ale asocierii unor dimensiuni cifrice date de indicatorii statistici cu continut economic sau de alta natura, si pot fi clasificate in functie de urmatoarele criterii:

1) Dupa numarul caracteristicilor care intervin intr-un sistem de interdependenta statistica, se disting:

-corelatii simple, cand sistemul considerat cuprinde o caracteristica  (fenomen) cauza si o caracteristica (fenomen) efect;

- corelatii multiple, cand se studiaza un sistem format din doua sau mai multe caracteristici determinante si o caracteristica rezultativa.

2) Dupa sensul sau directia corelatiei, pot exista:

- corelatii directe, cand modificarea intr-un anumit sens a fenomenului cauza determina modificarea in acelasi sens a fenomenului efect;

- corelatii inverse, cand modificarea intr-un anumit sens a fenomenului cauza determina modificarea in sens invers a fenomenului efect.


3) Dupa forma analitica, legaturile de interdependenta pot fi:

- corelatii liniare,

- simple, exprimate cu ajutorul ecuatiei:

- multiple, sintetizate prin ecuatia:

, daca variabilele independente (x) sunt in numar de trei

- corelatii de tip parabolic,

- simple:

- multiple: , daca variabilele independente (x) sunt in numar de doua

- corelatii de tip hiperbolic,

- simple:

- multiple:

- corelatii de tip exponential,

- simple:

- multiple:


4) Dupa tipul sincronizarii corelatiei in timp (in cazul corelatiilor dintre indicatori prezentati in serii dinamice):

- corelatii concomitente;

- corelatii cu decalaj.


In cadrul ecuatiilor de regresie fenomenul efect (rezultativ, determinat sau dependent) este notat cu y, fenomenul sau fenomenele cauza (determinante sau independente) cu x, iar parametrii a, b, c, d, asociati fenomenelor determinante sau independente se numesc coeficienti de regresie.

In cazul abordarii unei probleme de analiza a corelatiei dintre fenomene cu ajutorul metodelor statistico-matematice, se are in vedere parcurgerea urmatoarelor etape:

* constituirea sistemului de indicatori statistici sau de masurare propusi a fi studiati in sistem interdependent.

Se mentioneaza ca in aceasta etapa de lucru trebuie sa se tina seama de conditiile restrictive ce privesc volumul datelor. In cazul studierii corelatiei intre indicatori statistici prezentati sub forma seriilor dinamice, numarul minim acceptat este de 15 indicatori, iar in cazul datelor obtinute prin experimentari sau masurari ale unor unitati retinute prin sondaj, numarul minim de indicatori este apreciat la 40;

* analiza sistemului propus prin prisma cunostintelor de economie generala, precum si a experientei practice din domeniul concret al masuratorilor efectuate, in vederea stabilirii caracterului real sau absurd de existenta a interdependentei intre fenomenele sistemului.

Aceasta decizie este necesara deoarece prelucrarea indicatorilor initiali se realizeaza folosind o metodologie matematica care nu poate preciza caracterul real sau absurd al corelatiei.


* se apreciaza, tot pe baza de analiza, care este tipologia fenomenelor constituite in sistem interdependent, respectiv care este fenomenul dependent-efect (y) si care este fenomenul independent-cauza (x);


* se reprezinta grafic sisteme de corelatie constituite dintr-un fenomen efect si unul cauza, folosind axele rectangulare. Pe grafic va rezulta un nor de puncte care va sugera forma ecuatiei de regresie in functie de modul de dispunere a punctelor in plan;


* pe baza reprezentarii grafice, prin apreciere vizuala, se alege forma ecuatiei de regresie, considerata ca sintetizand in mod corespunzator modul de asezare a norului de puncte;


* se estimeaza valorile parametrilor din ecuatia de regresie aleasa, folosind metoda celor mai mici patrate, care consta in minimizarea sumei patratelor abaterilor nivelurilor reale ale fenomenului dependent-efect (y) de la nivelurile calculate pe baza ecuatiei de regresie ale aceluiasi fenomen notate cu ,



Minimum acestei sume se obtine prin egalarea cu zero a derivatelor partiale ale sumei in raport cu parametrii ecuatiei.

In cazul particular al unei ecuatii de regresie de forma: , sistemul de ecuatii obtinut prin metoda celor mai mici patrate care permite estimarea parametrilor ecuatiei de regresie, „a” si b”, este dedus astfel:

Minimum acestei sume se obtine prin egalarea cu zero a derivatelor partiale ale sumei calculate in raport cu parametrii ecuatiei de regresiei.

De unde rezulta:

*


Rezolvarea matriciala a sistemului se bazeaza pe relatia:

in care:

A -reprezinta matricea sistemului de ecuatii

A-1 -este matricea inversa a matricei A

B -reprezinta vectorul termenilor liberi

C -reprezinta vectorul coeficientilor (parametrilor) ecuatiei de regresie, a” si b


Estimarea valorii parametrilor care definesc o ecuatie de regresie poate fi efectuata si cu ajutorul unor metode considerate echivalente cum ar fi: metoda punctelor empirice alese sau metoda totalurilor partiale echidistante.


* se calculeaza estimatia erorii standard pentru fiecare parametru al ecuatiei de regresie si se verifica semnificatia parametrilor cu ajutorul Criteriului t

Confirmarea semnificatiei parametrilor ecuatiei de regresie este atestata cu ajutorul „Criteriului t” care consta in a compara variabila t-statistic cu variabila t-tabelara corespunzatoare unui anumit prag de semnificatie (de obicei se opteaza pentru o probabilitate P = 95%, respectiv un prag de semnificatie q = 5%, q = 1 - P si f = n - k grade de libertate, distribuita dupa functia de repartitie Student). Se precizeaza ca „n” reprezinta numarul variantelor, iar „k” reprezinta numarul parametrilor ecuatiei de regresie.

Variabila t-statistic se obtine raportand estimatia parametrului la estimatia erorii standard asociata fiecaruia dintre parametrii ecuatiei, astfel:

Daca ecuatia de regresie este de forma:

- pentru parametrul a, , in care sa este estimatia erorii standard a parametrului a,

- pentru parametrul b, , in care sb este estimatia erorii standard a parametrului b,

- pentru parametrul c, , in care sc este estimatia erorii standard a parametrului c,

- pentru parametrul d, , in care sd este estimatia erorii standard a parametrului d,


Nota: Estimatiile erorilor standard ale parametrilor ecuatiei de regresie (sa, sb, sc si sd) sunt determinate prin extragerea radacinii patrate din elementele situate pe diagonala principala a matricei rezultate din produsul estimatiei dispersiei erorii standard a ecuatiei de regresie sau patratului erorii standard a ecuatiei de regresie () cu matricea inversa a produsului matricei transpuse a variabilelor independente ( X' ) cu matricea initiala a acestor variabile ( X ) :


in care,

Testarea si interpretarea semnificatiei parametrilor ecuatiei de regresie conduce la urmatoarele concluzii:

-daca marimea cifrica a parametrul „a” este suficient de mare, se obtine informatia ca sistemul de corelatie studiat este format dintr-un numar redus de variante dar, in anumite conditii date ale analizei abordate aceasta concluzie poate fi ignorata. Importanta acestui parametru pentru analiza economica este relativ redusa iar procedura verificarii semnificatiei statistice a acestuia este aplicata, de regula, in scop demonstrativ.

-testarea semnificatiei parametrului „b”, „c”, si „d” este efectuata, de asemenea, prin compararea indicatorului t-statistic cu t-tabelar (;). Daca se constata o inegalitate in favoarea marimii tabelare a lui t” se accepta ipoteza nula si deci putem afirma cu suficienta incredere ca parametrul respectiv are o marime care nu difera semnificativ de zero. In aceste conditii caracteristica asociata acestui coeficient devine neinteresanta in sistemul de corelatie studiat si poate fi eliminata din sistem. In cazul existentei unei inegalitati in favoarea marimii statistice, calculate, se respinge ipoteza nula si prin urmare parametrul respectiv are o marime care difera semnificativ de zero iar variabile independenta asociata este semnificativa in cadrul sistemului interdependent studiat.

Decizia de a elimina o variabila independenta dintr-un sistem interdependent multiplu se poate lua si atunci cand marimea coeficientului de regresie asociat variabilei este foarte mica, situatie in care se apreciaza ca variabila dependenta este influentata intr-o masura nesemnificativa;


* se calculeaza nivelurile estimate (teoretice) ale fenomenului efect prin aplicarea ecuatiei de regresie, urmarindu-se realizarea urmatoarei egalitati:



Prin aceasta egalitate se confirma exactitatea calculelor efectuate pana la aceasta etapa de lucru.


* se procedeaza la testarea ipotezei privind existenta autocorelatiei intre valorile variabilei reziduale cu ajutorul criteriului statistic DURBIN-WATSON care se bazeaza pe calculul si interpretarea urmatorului indicator ( coeficientul de autocorelatie - DW):


;


Criteriului statistic DURBIN-WATSON atesta o buna eficacitate a parametrilor ecuatiei de regresie si respectiv a ecuatiei de regresie de a fi utilizata in calcule care vizeaza extrapolarea corelatiei studiate, daca marimea coeficientul de autocorelatie - DW este cuprinsa in intervalul 1,8 si 2,2.

Se precizeaza ca indicatorul statistic DW poate avea o marime situata in intervalul, 0 si 4:

- daca: 0,0 DW < 1,8, se confirma o corelatie pozitiva intre termenii de eroare sau reziduali (autocorelatie pozitiva);

- daca: 2,2 < DW 4,0, se confirma o corelatie negativa intre termenii de eroare sau reziduali (autocorelatie negativa);

- daca: 1,8 DW 2,2, se infirma existenta autocorelatiei intre termenii reziduali;

- valoarea ideala a indicatorului statistic DW, pentru a constata absenta autocorelatiei intre termenii reziduali, este 2.


In cazul ecuatiilor de regresie care nu au parametrul „a“, testarea existentei autocorelatiei intre variantele variabilei reziduale cu ajutorul indicatorului statistic DW nu este relevanta.



Politica de confidentialitate


creeaza logo.com Copyright © 2024 - Toate drepturile rezervate.
Toate documentele au caracter informativ cu scop educational.