Creeaza.com - informatii profesionale despre


Simplitatea lucrurilor complicate - Referate profesionale unice
Acasa » referate » matematica » statistica
GRUPAREA DATELOR STATISTICE

GRUPAREA DATELOR STATISTICE


GRUPAREA DATELOR STATISTICE

Informatiile statistice obtinute prin inregistrarea caracteristicilor unitatilor cercetate prezinta, in general, un numar mare de variante care nu permit formarea unei imagini corecte si complete asupra colectivitatii si de aceea este necesara ordonarea unitatilor in functie de nivelul de dezvoltare al caracteristicilor esentiale.

Impartirea colectivitatii statistice in grupe omogene de unitati , dupa variatia uneia sau a mai multor caracteristici esentiale, comune tuturor unitatilor colectivitatii, poarta denumirea de grupare statistica, stratificare sau clasificare , iar grupele se mai numesc straturi sau clase.

Gruparile au o importanta deosebita in statistica deoarece de modul in care sunt alcatuite grupele, depinde in buna masura cunoasterea tipurilor calitative care se contureaza in cazul colectivitatilor social-economice, structura colectivitatilor, continutul indicatorilor ce urmeaza a fi calculati si , pe baza acestora , chiar rezultatul cercetarii. De aceea , orice grupare a unitatilor unei colectivitati trebuie sa fie precedata de o analiza multilateral a esentei fenomenelor cercetate.



Pornind de la informatiile sistematizate prin grupare, se pot obtine indicatori generalizatori, diferentiati pe grupe, care sa permita o analiza stiintifica a fenomenelor si proceselor social-economice, a legaturilor esentiale dintre acestea.

Prezentarea datelor obtinute in urma observarii empirice se face, de regula, sub forma tabelului statistic.

Deoarece informatiile pot fi obtinute cu frecvente diferite, se poate realize reprezentarea lor in table, pe baza caruia se poate trece la reprezentarea grafica sub diferite forme, in functie de scopul urmarit.

In functie de tipul caracteristicii, putem avea urmatoarele tipuri de tabele statistice

Tabele cronologice (pentru o serie de timp)

Prezinta succesiunea in timp a valorilor unui indicator si au urmatoarea forma:

Timpul (t)

Caracteristica

xt

0

1

2

.

t

.

T

X0

X1

X2

xt

.

xT

X t - valoarea caracteristicii la momentul t

Tabele teritoriale - corespund unei serii teritoriale

Unitatea teritoriala

Valoarea caracteristicii corespunzatoare unitatii teritoriale respective (y)

A

B

.

Z

XA

XB

XZ

Tabelele caracteristicilor atributive - acestea pot fi grupate in functie de numarul caracteristicilor dupa care se face gruparea , de tipul caracteristicii (variabilei) supusa prelucrarii (variabile discrete si continue).

Dupa numarul caracteristicilor luate in calcul:

a)     Tabelul dupa o caracteristica - caz in care avem tabel indivizi - caracteristica.

Indivizii

Caracteristica (x)

1 → I1

2 → I2

3 → I3

m→ Im

X1

X2

X3

Xm

Observatie: Valorile caracteristicii x pot fi izolate , caz in care caracteristica (variabila) analizata este discreta, sau pot fi valori date prin intervale, situatie in care variabila x este continua.

Gruparile simple se efectueaza dupa o singura caracteristica de grupare. De exemplu : gruparea intreprinderilor din industrie dupa numarul salariatilor pe intervale de variatie mai mari, se poate obtine o imagine a tipurilor calitative care se diferentiaza in cadrul colectivitatii ( de exemplu intreprinderi mici, mijlocii, mari, foarte mari).

Gruparile simple sunt utile pentru caracterizarea structurii colectivitatii, pentru determinarea tendintei de concentrare a fenomenelor, pentru evidentierea tipurilor calitative care se contureaza in dezvoltarea fenomenelor si pentru rezolvarea altor probleme ale cercetarii statistice, dar nu permit studierea legaturilor existente intre fenomene.


Acest neajuns se inlatura cu ajutorul gruparilor combinate.

b)     Tabele dupa 2 caracteristici - exista 2 forme de prezentare a tabelului:

Fie se face o enumerare a indivizilor care alcatuiesc populatia P, evidentiindu-se pentru fiecare valorile corespunzatoare pentru cele 2 caracteristici studiate Xi si Yi unde i apartine lui I,I reprezentantand multimea indicilor pentru elementele componente ale populatiei supuse analizei.

In acest caz tabelul se prezinta sub forma a doua serii paralele de date

FIRMA

CA (mil lei)

xi

VAL.PROFITULUI (mil lei)

yi

F1

F2

F3

F4

F5

10.000

15.000

20.000

18.000

17.000

7.000

5.555

8.000

7.500

7.800

Fie se prezinta tabelul combinat al celor doua caracteristici,caz im care se numeste tabelul de corelatie:

Grupe dupa

caracteristica x

Subgrupe dupa caracteristica y

Y1 y2 . yi . yn

Total gr.i

X1

X2

.

xi

.

xm

N11 n12 . n1j . n1n

N21 n22 . n2j . n2n

Nil ni2 . nij . nin

Nm1 nm2 . nmj . nmn

N1*

N2*

.

Ni*

.

Nm*

Total grupa j

N*1 n*2 . N*j . n*n

n

De exemplu:gruparea salariatilor dupa vechime si salariu sau gruparea dupa salariu si cantitatea de produse realizate.

Tabelul de asociatie, este tabelul statistic care prezinta repartitia elementelor unei populatii dupa doua caracteristici corelate logic si care alterneaza intre 2 posibilitati.

Valorile

caracteristici x1

Valorile caracteristicii x2

X21 x22

TOTAL

X11

X12

N11

N21

n12

n22

N11+N12

N21+N22

TOTAL

N11+N21

N12+N22

Acest tabel serveste la calculul coeficientilor de asociatie.

Stabilirea intervalelor de gurpare

In practica,numarul de intervale de grupare,considerat pentru o anumita variabila continua,depinde de marimea preciziei masuritorilor, de natura si volumul colectivitatii studiate si de scopul cercetarii.

Stabilirea unui numar prea mare de intervale poate determina aparitia unor neregularitati accidentale,datorita numarului redus de unitati cuprinse in fiecare interval sau, dimpotriva considerarea unui numar foarte mic de intervale poate determina o pierdere de informatie.

Intre aceste doua situatii extreme de precizie iluzorie si costisitoare(data de un numar foarte mare de intervale mici ) si informatia insuficienta exista in mod logic un numar optim de inetrvale.Stabilirea numarului de grupe este rezultatul unui compromis care depinde mai ales de natura colectivitatii cercetate.In functie de natura colectivitatii cercetate,numarul optim de intervale se situeaza in general intre 10 si 15

Un interval de grupare (), i= 1,K este descris de 3 elemente:

Marimea sau amplitudinea intervalului de grupare:

a -

Central intervalului de grupare:

=

Densitatea intervalului de grupare:

In cazul intervalelor neegale , permite mai buna apreciere a greutatii specific (a ponderii relative) a unitatilor statistice care ii apartin fata de volumul total al colectivitatii:

In operatia de grupare se vor defini urmatoarele:

1)Stabilirea numarului de grupe - se realizeaza in general dupa anumite formule de calcul,existand si mai multe propuneri pentru determinarea numarului de grupe.

O prima propunere este aceea a lui D.V Huntsbergers(,,Elements of Statistical

Inferrence") si anume:

K=1+3,3 log n

unde: K - numarul de grupe;

n - numarul total de observatii;

log - logaritm zecimal.

O a doua propunere este cea facuta de Brooks si Carruthers (,,Handbook of Statistical Methods in Meteorology"):

K < 5 log n

O a treia propunere este avansata de Croxton si Cowden ,si anume aceea conform careia numarul de intervale sa fie cuprins intre 6 si 16 (,,Applied General Statistics").

2)Definirea grupelor

Fiecare grupa este complet definita prin precizarea a doua din elementele sale :

Limita inferioara : ,t =

Limita superioara: ,t =

Amplitudinea grupei : - ,iar daca grupele sunt egale,se considera amplitudinea egala cu h.

Folosind presupunerea ca gruparea se face pe intervale egale,marimea fiecarui interval va fi:

h =

3)Calcularea frecventelor fiecarei grupe prin alocarea valorilor individuale la una din grupele definite.Vom nota fecventa fiecarei grupe cu , t =, unde reprezinta numarul valorilor individuale pentru care Є (x) si t =

Evident,frecventele grupelor satisfac relatia de legatura =n.

Dar,pe langa gruparea in clase,bazata pe intervale egale,se poate realiza si gruparea datelor pe intervale neegale,caz in care este necesara o prelucrare in plus.Aceasta se utilizeaza pentru definirea grupelor tipice in diverse analize economice.

Observatie: Formulele de stabilire a marimii intervalelor de grupare au mai multa valoare orientativa si nu pot in nici un caz sa suplineasca analiza calitativa a fenomenului cercetat.Aplicarea in mod mecanic a acestei formule poate duce la rezultate nesatisfacatoare in practica.De regula,pentru fenomenele in curs de formare si dezvoltare,se recomanda a se utiliza intervale neegale de grupare,mai mici catre partea inferioara si mai mari spre partea superioara.

O alta problema a gruparilor pe intervale este stabilirea limitelor intervalelor de grupare.

Se disting 2 cazuri:

a)     cand limita superioara face parte din interval;

b)     cand se precizeaza in mod explicit limitele intervalelor de grupare





Politica de confidentialitate


creeaza logo.com Copyright © 2024 - Toate drepturile rezervate.
Toate documentele au caracter informativ cu scop educational.