Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
DemografieEcologie mediuGeologieHidrologieMeteorologie


INREGISTRAREA, SISTEMATIZAREA SI PREZENTAREA DATELOR STATISTICE

Demografie



+ Font mai mare | - Font mai mic



INREGISTRAREA, SISTEMATIZAREA SI PREZENTAREA DATELOR STATISTICE




Cuvinte-cheie

Observare statistica =

= inregistrare de date

Principii ale inregistrarii de date (autenticitatea, selectivitatea, obiectivitatea si confidentialitatea observarii)

Plan de observare statistica

Scopul observarii

Obiectul observarii

Unitatea de observare

Programul observarii

Modalitati de observare

Gruparea datelor

Grupare mecanica versus grupare tipologica

Grupare arborescenta (ierarhica)

Principii de grupare statistica

Serie statistica

Serie unicriteriala (unidimensionala)

Serie multicriteriala (multidimensionala)

Serie de repartitie = serie de distributie = serie de frecvente

Serie cronologica = serie de timp = serie dinamica

Serie teritoriala = serie de spatiu

Tabel statistic

Grafic statistic = diagrama statistica.

1.1. Observarea statistica

Datorita naturii sale preponderent inductive, analiza statistica porneste de la inregistrarea si colectarea informatiilor referitoare la fenomenul si/sau procesul supus cercetarii la nivelul manifestarilor sesizabile, care alcatuiesc realitatea mediului nostru economic, social, politic, natural. Astfel, prima etapa in procesul cercetarii este observarea statistica. Ea consta in culegerea anumitor date pe baza unor criterii/reguli unitare de la unitatile colectivitatii cercetate.

In procesul observarii statistice se respecta de anumite principii deontologice si de rationalitate:

datele culese sa fie autentice, sa reflecte realitatea;

datele sa se refere numai la caracteristici pertinente, esentiale, care raspund cel mai bine scopului cercetarii;

culegerea de date trebuie sa se realizeze in conditii obiective, fara preferinte din partea cercetatorilor;

datele obtinute de la fiecare unitate observata sa ramana confidentiale, pentru a nu prejudicia interesele persoanelor fizice sau juridice inregistrate.

Deoarece observarea statistica este, de obicei, efectuata concomitent de mai multe persoane sau de mai multe institutii, pentru organizarea ei rationala se cer a fi rezolvate o serie de probleme cu caracter metodologic si organizatoric cuprinse intr-un plan de observare statistica, care explica:

scopul observarii, subordonat scopului general pentru care s-a organizat cercetarea;

obiectul observarii il formeaza colectivitatea cercetata, respectiv, multimea unitatilor colectivitatii, cu o delimitare clara spatio-temporala si calitativa (pentru definitii, vezi caseta 1.1);

unitatea de observare este fiecare element component al colectivitatii. Pot exista unitati simple (persona fizica, studentul, angajatul, unitatea de marfa etc.) sau unitati complexe (familia/gospodaria, grupa/anul de studiu, echipa, sectia de productie, societatea comerciala etc.);

programul observarii consta in stabilirea caracteristicilor (variabilelor) care trebuie sa fie inregistrate, a modalitatilor concrete de culegere a datelor pentru fiecare caracteristica;

timpul observarii vizeaza doua aspecte: stabilirea timpului la care se refera datele ce urmeaza sa fie inregistrate (momentul critic sau perioada de inregistrare) si a duratei inregistrarii;

locul observarii coincide, in general, cu locul unde se produce fenomenul inregistrat;

masuri organizatorice urmaresc asigurarea unei logistici cat mai bune pentru desfasurarea observarii statistice: pregatirea formularelor de inregistrare si a instructiunilor de completare, instruirea personalului de inregistrare, obtinerea avizelor/aprobarilor pentru organizarea observarii si, daca este cazul, derularea unui program publicitar pentru a convinge populatia sa coopereze cu buna credinta la realizarea observarii, efectuarea unei observari-pilot etc.

CASETA 1.1. Concepte de baza utilizate in statistica

Colectivitatea statistica (populatia statistica) cuprinde totalitatea manifestarilor unui fenomen sau proces supus cercetarii statistice. Colectivitatea statistica este un ansamblu de elemente de aceeasi natura, cu o serie de trasaturi comune, generate de acelasi complex de cauze esentiale.

Colectivitatea statistica specifica vietii economico-sociale are un caracter obiectiv, concret, finit, avand o clara determinare in spatiu si timp, spre deosebire de colectivitatile teoretice, abstracte, infinite (numite si populatii sau statistici), cu care opereaza statistica matematica.

In functie de cuprinderea ei in observare, colectivitatea statistica poate fi:

Colectivitate generala, numita si populatie sau populatie originara. Ea cuprinde totalitatea elementelor supuse cercetarii.

Colectivitate de selectie numita si esantion, mostra, proba sau, simplu, selectie reprezinta o parte a populatiei, selectata pentru a reprezenta intreaga colectivitate statistica.

In functie de natura lor colectivitatile statistice se impart in:

Colectivitati statice, care exprima o stare, un stoc existent la un moment dat. Exemple: populatia Romaniei la 1 iulie 2007, numarul de IMM-uri la 1 ianuarie 2008; stocul de materii prime al fabricii "Fabrex" la 1 februarie 2008 etc.;

Colectivitati dinamice care evidentiaza un proces, un flux. Ele cuprind evenimente inregistrate de-a lungul unui interval de timp. Exemple: exporturile Romaniei de bunuri si servicii in lunile anului 2007, cifra de afaceri a societatii de asigurari "X" in lunile ultimului trimestru al anului precedent, produsul intern brut al unei tari in anii 2000-2007 etc.

 

Unitatea statistica reprezinta elementul, manifestarea sau concretizarea colectivitatii cercetate. Fiecare unitate se inregistreaza separat in timpul observarii statistice intrucat ea este purtatoare atat a trasaturilor comune ale colectivitatii statistice, cat si a unor particularitati care o fac sa se deosebeasca de alte unitati ale colectivitatii.

Functie de continutul unitatii, acestea pot fi:

unitati simple reprezentate de fiecare element constituent al colectivitatii. Exemple: persoana, angajatul, studentul etc.;

unitati complexe, care cuprind una sau mai multe unitati simple. Exemple: gospodaria/familia, echipa/sectia de productie, grupa/anul de studiu etc.

Unitatea de inregistrare (unitatea de raportare). In contextul organizarii unui sistem informational statistic la nivel national, fiecare entitate cu personalitate juridica si gestiune proprie poate contribui la alimentarea bazei de date, furnizand, ocazional sau in mod sistematic, date despre propria activitate. Exemple: intreprinderile publice sau private, institutiile, famiile etc.

Caracteristica statistica (variabila statistica) este trasatura, proprietatea sau insusirea comuna tuturor unitatilor unei colectivitati. Caracteristicile care fac obiectul cercetarii statistice trebuie sa serveasca obiectivului cunoasterii, in sensul ca ele definesc fie trasaturi cercetate, fie factori explicativi, cauze posibile ale variatiei acestor trasaturi de la un element al colectivitatii la altul. Caracteristicile statistice se pot clasifica dupa mai multe criterii, prezentate in caseta 1.2.

Varianta reprezinta nivelul observat al caracteristicii pentru fiecare unitate    statistica inregistrata.

Frecventa de aparitie a unei variante distincte sau a unui grup de variante, poate fi absoluta, ceea ce consta in numarul de inregistrari (aparitii) intr-o colectivitate sau relativa adica, ponderea, greutatea specifica sau cota parte in totalul elementelor unei colectivitati.

In urmatoarele capitole ale manualului sunt prezentate si alte concepte cu care opereaza statistica.

 


Modalitati si tehnici de observare statistica. Observarea statistica poate fi facuta indirect, prin observare documentara sau direct, prin observare pe teren.

Observarea documentara (indirecta) are loc atunci cand se preiau date inregistrate din documente, lucrari anterior elaborate, de obicei, cu alta finalitate sau din publicatiile disponibile pe suport de hartie sau electronic (carti, reviste, ziare, pagini web). Aceasta observare este rapida si necesita costuri relativ reduse. Exista, totusi, cel putin doua reguli, care trebuie respectate in cazul observarii documentare:

nu trebuie sa fie preluate informatiile in mod automat. Este necesar sa se verifice consistenta logica a continutului acestor informatii;

atunci cand se colecteaza date din mai multe surse, este absolut necesara verificarea compatibilitatii metodologiilor folosite de aceste surse la elaborarea datelor.

Observarea pe teren (directa) presupune contactul nemijlocit cu obiectul observarii si inregistrarea element cu element a tuturor caracteristicilor cuprinse in programul observarii.

In functie de volumul colectivitatii cercetate, observarea directa poate fi totala sau partiala.

Observarea totala (exhaustiva) presupune inregistrari la toate unitatile colectivitatii statistice analizate. Principalele tehnici de observare totala sunt:

Recensamantul, cea mai veche si, totodata, cea mai complexa forma a obsevarii totale in care, printr-o metodologie unitara, se culeg date asupra tuturor unitatilor colectivitatii cercetate.

Desfasurarea unui recensamant (al populatiei, al animalelor, al unitatilor comerciale, al pomilor fructiferi etc.) presupune rezolvarea prealabila a unor probleme organizatorice si metodologice, necesitand, prin sfera larga de cuprindere, importante resurse atat materiale, cat si umane si de timp. Ca urmare a acestui fapt, recensamintele se organizeaza la intervale mai mari de timp, periodicitatea fiind cauzata, mai ales, de volumul colectivitatii cercetate, de necesitatile de analiza si de resursele disponibile. De exemplu, recensamantul populatiei se desfasoara cu o periodicitate de circa 10 ani, in timp ce recensamintele din domeniul economic prezinta o periodicitate mai mica, de regula 3 5 ani.

Inventarierea stocurilor este si ea o tehnica a observarii totale, asemanatoare cu recensamantul. Deosebirea consta, intre altele, in faptul ca rezultatele unei inventarieri statistice se evalueaza apoi in preturile specifice evidentei contabile analitice si servesc, in ultima instanta, controlului de gestiune.

Rapoartele statistice au un caracter de observare permanenta si constau in evidentierea diferitelor aspecte ale activitatii agentilor economici. Aceste rapoarte trebuie comunicate lunar, trimestrial sau, dupa caz, semestrial serviciilor abilitate de statistica publica.

Monografia statistica presupune studierea aprofundata a unui fenomen/proces, a unei activitati sau unitati economice. Pe langa culegerea datelor, aceasta metoda implica si prelucrarea, analiza si interpretarea acestora.

Observarea partiala se face cu un efort mai redus: doar o parte din unitatile colectivitatii statistice sunt supuse inregistrarii. Principalele tipuri de observare partiala sunt:

Sondajul statistic (selectia statistica) presupune extragerea din populatia totala ce se doreste a fi cercetata, a unei parti, numita esantion sau mostra. Rezultatele si concluziile analizei esantionului se extind apoi la intreaga populatie. Pentru ca sondajul statistic sa fie eficient si corect, este necesar ca esantionul prelevat sa fie reprezentativ, adica, in pofida proportiei reduse, sa fie o reprezentare cat mai fidela a caracteristicilor si structurii populatiei totale.

Ancheta statistica este o tehnica a observarii partiale sistematice, bazata pe un esantion reprezentativ prestabilit (panel), astfel incat sa asigure prezenta tuturor tipurilor calitative din colectivitatea generala.

Observarea partii principale (observarea masivului de date) reprezinta o metoda ce se aplica colectivitatilor ce prezinta grupe de importanta diferita. Astfel, se renunta la inregistrarea datelor de la unitatile de mica importanta, considerand ca si acelea au un comportament, un continut sau un dinamism asemanator cu partea majora a colectivitatii, estimarea indicatorilor pe ansamblul colectivitatii facandu-se astfel - mai rapid - pe baza datelor inregistrate pentru grupele semnificative, importante ca pondere in colectivitatea generala.

Ancheta de opinie consta in culegerea de date de la o parte a populatiei si/sau completarea unor chestionare speciale pentru a se obtine unele informatii orientative despre fenomenul supus cercetarii, dar fara a se face demersuri speciale - ca in cazul sondajului statistic - pentru asigurarea reprezentativitatii esantionului.

Raspunsul la aceste chestionare este intotdeauna benevol (facultativ). Anchetele se pot realiza direct, formularele fiind completate de un personal instruit pentru efectuarea de interviuri, sau prin autoinregistrare, prin posta, telefon sau, mai nou, prin Internet, de exemplu, prin posta electronica (e-mail).

Metodele enumerate se pot folosi fie impreuna, fie separat, pentru a servi cat mai bine scopului cercetarii statistice.

Erorile de observare statistica. Erorile de observare statistica se concretizeaza in diferentele intre valoarea reala a fenomenului sau procesului cercetat si valoarea inregistrata in timpul observarii statistice.

Principalele tipuri de erori de observare statistica sunt:

Erori intamplatoare sunt greseli, ce pot surveni din neatentie. Ele nu au caracter premeditat (de exemplu, tastarea gresita, din neatentie, a unei/unor valori in procesul transferarii datelor de pe chestionar in baza electonica de date). In cazul colectivitatilor mari, acest tip de erori nu influenteaza semnificativ rezultatele finale ale cercetarii, intrucat abaterile intr-un sens de la valorile reale se compenseaza, in mare parte, cu abaterile in sens opus.

Erori sistematice sunt abateri semnificative, de regula intr-un singur sens, de la realitatea observata. Sunt generate de neintelegere sau din rea-credinta (vointa) si compromit cercetarea.

Depistarea si eliminarea erorilor de observare este o operatiune absolut necesara inainte de a trece la prelucrarea datelor cu ajutorul unor procedee, tehnici sau metode de calcul. In ultima instanta, calitatea rezultatelor intregului proces de cercetare statistica depinde, in buna masurå, de calitatea datelor inregistrate.

Pentru a depista si elimina erorile de observare se folosesc criterii cantitative si calitative de control, multe dintre acestea aplicandu-se astazi automat, cu ajutorul unor programe speciale de verificare in momentul introducerii datelor in baza electronica de date.

1.2. Sistematizarea datelor observarii

De multe ori, in analiza statistica dispunem de o masa de informatii diverse, greu de cuprins si asimilat. Pentru a deveni utile, informatiile culese necesita prelucrarea si aducerea lor intr-o forma cat mai concisa, dar care sa reflecte cat mai fidel realitatea.

Alegerea celei mai bune metode de analiza trebuie sa tina seama de tipul datelor culese, de felul in care au fost sistematizate acestea, precum si de adresantul studiului (mediul academic, mediul de afaceri, publicul larg consumator etc.) si de scopul final al cercetarii (la ce folosesc rezultatele). Astfel, pentru a putea observa tendinta de evolutie a fenomenului cercetat, legaturile dintre variabilele analizate etc., dupa culegerea informatiilor statistice, este necesara sistematizarea acestora sub forma de serii de date si, ulterior, prelucrarea acestora sub forma de indicatori.

Sistematizarea datelor statistice presupune urmatoarele etape:

centralizarea (colectarea) datelor observarii;

clasificarea datelor inregistrate;

gruparea datelor in functie de una sau mai multe caracteristici;

prezentarea rezultatelor sistematizarii sub forma de serii, tabele si/sau grafice statistice.

Centralizarea datelor observarii (colectarea) consta in strangerea la un centru de prelucrare a tuturor formularelor si, pentru caracteristicile aditive, insumarea valorilor inregistrate, in scopul obtinerii de indicatori totalizatori. Exemple: totalul populatiei Romaniei la terminarea recensamantului; totalul lunar al exporturilor de marfuri inregistrate la punctele vamale; totalul raspunsurilor primite la una dintre intrebarile unei anchete statistice etc.

Exista centralizari simple si centralizari pe grupe. Centralizarea pe grupe presupune stabilirea prealabila a grupelor specifice colectivitatii observate si are drept scop cunoasterea mai detaliata a fenomenului sau procesului, permitand analiza structurii colectivitatii. De exemplu: centralizarea datelor recensamantului in functie de mediul in care locuiesc subiectii: populatie urbana/populatie rurala; gruparea datelor in functie de numarul membrilor fiecarei gospodarii sau in functie de nivelul de instruire al capului familiei etc.

Clasificarea este operatia de separare a multimii datelor colectate pe subcolectivitati in functie de caracteristicile cuprinse in programul observarii. Astfel, daca au fost inregistrate valorile specifice a sapte caracteristici - unele numerice, cantitative, altele nominative/calitative - clasificarea presupune izolarea a sapte subcolectivitati de date, cate una pentru fiecare variabila observata.

Clasificarea datelor observarii se face, de regula, automat, prin atribuirea cate unui cod distinctiv valorilor ce apartin fiecarei caracteristici.

Rezultatul clasificarii este o lista care enumera in partea stanga (subiectul tabelului) elementele colectivitatii observate, iar in fiecare coloana se afla valorile specifice cate unei caracteristici, potrivit machetei prezentate in tabelul nr. 1.1.

Tabelul nr. 1.1

Elementul

Caracteristica

c1

c2

cj

cl

j

l

n

a1

a2

a3

an

b1

b2

b3

bn

j1

j2

j3

jn

l1

l2

l3

ln

Total*

*) Se totalizeaza doar valorile acelor caracteristici care permit insumarea directa, iar suma are o valoare cognitiva distincta.

In urma aplicarii clasificarii datelor observarii, se face ordine in masa amorfa de informatii inregistrate cu prilejul culegerii datelor, dar volumul de date este inca cel original: n x l date (n unitati inregistrate cu valorile specifice celor l caracteristici din programul observarii). Pentru a aduce volumul de informatii la o marime convenabila, care permite elaborarea de aprecieri, judecati, ipoteze etc. se combina clasificarea cu gruparea datelor.

Gruparea statistica este procedeul de comprimare (restrangere) a volumului datelor dupa o caracteristica numerica (cantitativa) sau nominativa (calitativa). Insusirea care sta la baza impartirii colectivitatii in grupe omogene poarta numele de caracteristica/variabila de grupare (vezi si Caseta 1.2).

Gruparea datelor trebuie sa porneasca de la o atenta analiza a fenomenului/procesului cercetat. Selectarea variabilei/variabilelor dupa care se va realiza gruparea depinde atat de natura lor, de relatia dintre caracteristicile observate, cat si de scopul cercetarii.

Dupa numarul caracteristicilor puse la baza gruparii se disting: grupari simple si grupari combinate, utilizand concomitent mai multe caracteristici.

Dupa continutul caracteristicilor, gruparile simple si combinate pot fi: teritoriale, cronologice sau atributive.


Caseta 1.2. Clasificarea variabilelor statistice

Dupa continut   

Dupa modul

de exprimare

Dupa natura

variatiei

Dupa modul

de manifestare

Dupa modul de

obtinere a datelor

Nota: Exemplele prezentate intre paranteze au menirea de a facilita intelegerea tipologiei variabilelor statistice. Oricare alte exemplificari adecvate sunt bine venite.

 


Gruparea in functie de o caracteristica numerica incepe, de regula, cu observarea numarului de valori (variante) distincte ale caracteristicii de grupare in cadrul colectivitatii cercetate. Daca valorile distincte nu sunt prea numeroase (cel mult 10-12 valori diferite), cercetatorul poate decide gruparea pe variante, adica separarea unitatilor colectivitatii pe subcolectivitati, in functie de varianta specifica.

De exemplu, gruparea studentilor dintr-un amfiteatru in functie de nota obtinuta la un test conduce la obtinerea a (cel mult) zece subcolectivitati deoarece, oficial, notele acordate sunt valori intregi de la 1 la 10. In realitatea empirica, unele note (variante) pot lipsi, intrucat nici un student din acel amfiteatru n-a obtinut, sa zicem, nota 1 sau 2. Deci, numarul real de grupe va fi 8, corespunzator notelor (variantelor) observate in colectivitate: de la 3 la 10.

Daca cercetatorul apreciaza ca numarul variantelor distincte este prea mare pentru a putea face aprecieri pertinente asupra colectivitatii cercetate, se trece la gruparea pe intervale omogene de variatie.

Intr-o grupa omogena, unitatile care o compun sunt de acelasi fel, apartin aceluiasi tip calitativ, prezentand variatii reduse, datorate de regula, factorilor intamplatori.

Intervalul de grupare, numit si interval de variatie este alcatuit dintr-un grup omogen de variante, despartit de restul colectivitatii prin limita inferioara si limita superioara a grupei. Intervalele de grupare pot fi:

intervale egale sau intervale neegale;

intervale deschise (cu una dintre limite nedefinita) sau intervale inchise (cu ambele limite clar precizate);

Gruparea datelor pe intervale egale dupa o singura variabila presupune parcurgerea urmatoarelor etape (vezi Problema 1.1, cerintele a si b):

Calculul amplitudinii variatiei, ca diferenta intre valoarea maxima (xmax) si, respectiv, valoarea minima (xmin) inregistrata de variabila analizata:

Ax = xmax xmin [1.1]

Stabilirea numarului de grupe/intervale (r). El trebuie sa fie, pe de o parte, suficient de mare, pentru a nu se pierde prea mult din diversitatea informatiilor culese si a nu se restrange astfel posibilitatile de analiza, iar pe de alta parte suficient de mic, pentru a permite o analiza rapida, dar coerenta, in care fiecare interval de grupare sa cuprinda un numar destul de mare de inregistrari. De regula, numarul de grupe/intervale folosit in analizele economice este cuprins intre 5 si 15 grupe.

Determinarea marimii (k) fiecarui interval de grupare:

[1.2]

unde: A amplitudinea absoluta a variatiei; r = numarul de grupe/intervale de variatie.

De obicei, in analizele economice se procedeaza la rotunjirea marimii intervalului, astfel incat sa permita o prezentare cat mai sugestiva a datelor, precum si o prelucrare numerica lesnicioasa.

Asa cum se va vedea in capitolul 3, in calculele statistice va fi utilizat centrul (mijlocul) intervalului. De aceea, se recomanda sa se stabileasca intervalele astfel incat centrele lor sa fie valori pe cat posibil intregi, sau avand un numar cat mai mic de zecimale, pentru a nu afecta calitatea determinarilor prin eventuale rotunjiri.

Marimea intervalului de grupare se mai poate determina si dupa formula lui H. A. Sturges:

[1.3]

Dupa ce se afla marimea si numarul intervalelor de grupare, se trece la stabilirea limitelor fiecarei grupe, pornind de la valoarea minima a caracteristicii inregistrate (xmin). La ea se adauga, pentru fiecare din cele (r) intervale in parte, marimea grupei/intervalului (k).

Trebuie avut in vedere faptul ca, in anumite situatii, exista limite inferioare/superioare obiectiv determinate ale variabilei analizate, ce nu trebuie ignorate. De exemplu, nota obtinuta de un student la un examen nu poate fi mai mare de 10. Depasirea acestei limite in procesul gruparii implica fie refacerea gruparii (eventual constituirea intervalelor de la valoarea maxim admisa si scazand din aceasta, in mod succesiv, marimea intervalului de grupare pana se ajunge la xmin), fie scrierea ultimului interval ca un interval deschis.

Dupa constituirea intervalelor de grupare, se determina numarul de valori ale caracteristicii analizate cuprins in fiecare din cele (r) intervale de grupare (frecventele absolute). Se recomanda ca fiecare interval de grupare sa cuprinda un numar de inregistrari omogene pentru a realiza o caracterizare cat mai corecta a fenomenului analizat.

Daca in urma gruparii, una sau mai multe grupe raman vide, este necesara refacerea gruparii pe un numar diferit de intervale, sau, eventual, pe acelasi numar de intervale, dar pornind de la o alta limita inferioara a primului interval de grupare, glisand cu cel mult ½ din marimea intervalului de grupare fie in sus, fie in jos, pana ce vidul de unitati dispare.

O alta solutie consta in gruparea pe intervale neegale (gruparea tipologica). Ea se poate realiza fie pornind de la intervalele egale stabilite anterior si regruparea acestora pentru a diminua fluctuatia excesiva a frecventelor de la o grupa la alta, sau pentru a acoperi una sau mai multe grupe vide (fara unitati), fie pe baza particularitatilor caracteristicii cercetate, a necesitatilor analizei (vezi problema 1.1 cerinta c).

Gruparea in functie de o caracteristica nominativa (calitativa sau nenumerica) seamana cu gruparea unitatilor colectivitatii cercetate dupa valorile (variantele) distincte ale unei caracteristici numerice. De asta data, se incepe cu listarea starilor calitative distincte ale caracteristicii de grupare, care pot fi identificate in colectivitatea cercetata. Aceste stari calitative distincte se mai numesc si atribute (variante calitative). De exemplu, reteaua comertului cu amanuntul dintr-un oras este alcatuita din cateva sute de magazine, a caror cercetare necesita, uneori, gruparea lor in functie de felul (natura) principalului grup de produse oferite spre vanzare. Rezulta o lista mai lunga sau mai scurta a specializarii magazinelor, in dreptul fiecarei variante nominative (a fiecarui atribut) inscriindu-se numarul de unitati inregistrate cu acel specific in orasul cercetat (vezi Problema 1.2, cerinta a).

In practica statistica, gruparea elementelor unei colectivitati in functie de stari, atribute comune ale acestora se realizeaza cu ajutorul unor nomenclatoare. Ele sunt sisteme standardizate de clasificare arborescenta a unitatilor ordonate pe clase, subclase, tipuri, sortimente etc. In acest fel, mai multe unitati care manifesta atribute similare sau apropiate alcatuiesc un sortiment, mai multe sortimente asemanatoare alcatuiesc un tip, mai multe tipuri sunt cuprinse intr-o subclasa, mai multe subclase apropiate din punct de vedere calitativ constituie o clasa, iar totalitatea claselor reprezinta multimea variata a starilor calitative din colectivitatea cercetata.

Cu titlu de exemplu, astfel de nomenclatoare oficiale utilizate in cercetarea economica sunt: CAEN - Clasificarea Activitatilor din Economia Nationala; CSCI - Clasificarea Standard a (marfurilor ce fac obiectul) Comertului International; N.C. - Nomenclatura Combinata care sta la baza tarifului vamal etc.

Gruparea combinata presupune separarea elementelor colectivitatii simultan dupa doua sau mai multe caracteristici (vezi Problema 1.2, cerinta c). Fata de o grupare unicriteriala, introducerea unei/unor caracteristici suplimentare de grupare presupune segmentarea grupelor initial constituite dupa o caracteristica, de obicei, complexa, rezultativa Y, in subgrupe dupa cea de-a doua (a treia etc.) variabila. Aceasta este (acestea sunt), de regula, factor (factori) explicativ(i) pentru variabila initiala de grupare sau se afla in interdependenta cu ea.

Prin urmare, este important ca intre variabilele combinate pentru obtinerea unei grupari multicriteriale sa existe o legatura/relatie logica.

Indiferent daca se opteaza pentru o grupare simpla sau combinata, daca in procesul gruparii se recurge la caracteristici numerice si/sau nenumerice, analistul economist trebuie sa respecte cateva reguli sau principii de grupare:

sa urmareasca omogenitatea elementelor cuprinse in fiecare grupa;

sa asigure completitudinea cuprinderii elementelor colectivitatii in grupele constituite;

sa verifice unicitatea incadrarii fiecarui element in cate o grupa;

sa genereze, daca este cazul, organizarea ierarhica a grupelor, astfel incat prin marirea gradului de generalitate a formelor de manifestare, sa se poata agrega clasele inferioare in grupe, grupele in capitole, capitolele in sectiuni ale unui nomenclator.

1.3. Serii statistice

In vederea aplicarii metodelor de calcul si interpretare statistica, rezultatele sistematizarii datelor se prezinta sub forma de serii statistice. Ele constituie materia prima in procesul de obtinere a indicatorilor statistici.

Seria statistica este alcatuita din siruri de date, aflate in corespondenta univoca, cu variantele sau intervalele de variatie unei (unor) caracteristici de grupare. Aceasta inseamna ca numarul de elemente dintr-o colectivitate sau valorile celorlalte caracteristici inregistrate sunt prezentate in raport de variantele sau intervalele de variatie ale caracteristicii/caracteristicilor de grupare.

Dintre caracteristicile inregistrate cu prilejul observarii, se alege aceea care serveste cel mai bine scopului cercetarii. Uneori este necesara combinarea si utilizarea concomitenta a mai multor caracteristici de grupare. In acest context distingem:

serii unicriteriale (unidimensionale);

serii multicriteriale (multidimensionale);

Seriile unicriteriale (unidimensionale) pot fi prezentate, in functie de natura caracteristicii de grupare, in trei tipuri distincte:

serii de repartitie (de distributie, de frecvente), cand caracteristica de grupare este un atribut cantitativ sau calitativ al colectivitatii cercetate;

serii cronologice (dinamice, de timp), cand caracterstica de grupare este o variabila de timp;

serii teritoriale (de spatiu), cand variabila de grupare este o caracteristica geografica sau administrativ teritoriala.

Seriile multicriteriale (multidimensionale) sunt alcatuite in functie de doua sau mai multe caracteristici de grupare, intre care exista o legatura logica (dependenta sau interdependenta). Se recomanda limitarea numarului de caracteristici combinate intr-o grupare multicriteriala pentru a nu imprastia elementele colectivitatii intr-un numar exagerat de grupe. Se poate pierde astfel din vedere esenta comuna a elementelor colectivitatii.

1.4. Prezentarea datelor statistice

Datele observarii, odata colectate, clasificate si grupate, se fac cunoscute cu ajutorul tabelelor si graficelor statistice.

Tabelul statistic este o forma de prezentare ordonata si completa a datelor unei colectivitati, cu scopul de a facilita formarea unei imagini globale despre obiectul de studiu.

Pentru ca un tabel sa-si indeplineasca misiunea de a facilita intelegerea (cuprinderea intr-un model mental) a realitatii cercetate, el are mai multe elemente constructive:

Titlul tabelului, trebuie sa precizeze in putine cuvinte natura datelor cuprinse in tabel, fixand, totodata, in spatiu si timp fenomenul/procesul analizat.

Macheta tabelului care cuprinde totalitatea liniilor orizontale si verticale a caror intersectie conduce la formarea de rubrici. Macheta devine tabel statistic cand se umple cu date. Prin urmare, continutul tabelului reprezinta totalitatea informatiilor trecute in rubrici.

Subiectul tabelului se inscrie in capetele randurilor si reprezinta colectivitatea si partile sale componente.

Predicatul tabelului se inscrie in capetele coloanelor si este format din totalitatea aspectelor cantitative si calitative referitoare la colectivitatea cercetata.

Sursa datelor se trece intr-o forma explicita imediat sub tabel.

Nota explicativa se pune fie imediat dupå sursa datelor, fie in subsolul paginii pe care se afla tabelul, daca in etapa de culegere sau prelucrare a datelor din tabel s-au folosit proceduri sau tehnici noi sau rar utilizate de catre posibilii utilizatori ai informatiilor cuprinse in tabel.

Un tabel statistic bine intocmit:

atrage atentia cititorului;

ii trezeste interesul pentru cunoasterea particularitatilor colectivitatii prezentate, dar si ofera:

a)      necesara sistematizare a informatiilor, prin claritatea structurarii;

b)      credibilitatea informatiilor, prin precizarea sursei datelor, si daca este cazul, mentionarea tehnicilor de observare - prelucrare.

Graficul statistic (diagrama) reprezinta acea modalitate de prezentare a datelor sub forma de imagini spatiale cu caracter conventional, care prin mijloace plastice reliefeaza unele caracteristici esentiale ale colectivitatii cercetate, in vederea facilitarii intelegerii fenomenului analizat .

Elementele unui grafic statistic sunt:

Titlul graficului are aceleasi caracteristici ca si titlul tabelului statistic.

Axa sau axele de referinta ale graficului

Scara graficului se foloseste pentru gradarea axei/axelor. Se recomanda ca figurile realizate in grafic sa nu fie nici prea aglomerate, nici prea dispersate, ci, prin scara graficului, sa se asigure proportionalitatea intre inaltimea si latimea graficului. In general, se considera justa o proportie de ¾ intre amplitudinea variatiei caracteristicii reprezentate pe axa ordonatelor si cea a variabilei inscrise pe axa absciselor.

Legenda graficului explica simbolurile, diferitele culori sau hasuri folosite in grafic.

Graficul propriu-zis este reprezentat de puncte, linii, figuri geometrice in plan sau spatiu, sau figuri natural-conventionale construite la scara.

Sursa datelor se plaseaza imediat sub grafic.

Nota explicativa are aceleasi caracteristici cu cele prezentate la tabelul statistic.

Principalele tipuri de grafice sunt inserate in prezentul volum la capitolele unde servesc ca instrument de percepere, apreciere si analiza a realitatii.

Misiunea unui grafic statistic bine alcatuit este aceea de a provoca interesul, curiozitatea celui ce il priveste. Prin combinatia de culori, hasuri, simboluri (uneori, chiar de scari de gradare a axelor), graficul trebuie sa rupa monotonia prezentarii, sa sugereze conexiuni si sa sustina, cu mijloace plastice, opiniile autorului.

O simpla succesiune de tabele si grafice statistice risca sa oboseasca pe beneficiarul cercetarii, sa-i estompeze atentia. De aceea, analistul trebuie sa faca alegeri rationale pentru o prezentare cat mai atractiva. Unele rezultate ale cercetarii se valorifica mai bine daca sunt prezentate tabelar, in schimb, altele devin evidente prin simpla proiectare a unui grafic atent elaborat.

1.5. Intrebari de control

Cum definiti observarea statistica in cadrul procesului inductiv de cunoastere?

Care sunt principiile deontologice si de rationalitate respectate in observarea statistica?

Care sunt principalele aspecte metodologice si organizatorice cuprinse intr-un plan de observare statistica? De ce este necesar un astfel de plan?

Care sunt regulile preluarii de informatii statistice prin observarea documentara?

In ce consta observarea statistica pe teren? Ce tehnici de observare totala si partiala cunoasteti?

Ce fel de erori de observare statistica puteti intalni la verificarea datelor inregistrarii?

Care sunt etapele sistematizarii datelor obtinute printr-o observare statistica?

Ce presupune clasificarea statistica a datelor culese?

Care sunt principiile gruparii datelor observarii?

Cum se face gruparea in functie de o caracteristica numerica?

La ce foloseste un nomenclator in procesul gruparii datelor unei observari statistice?

Ce este o serie statistica? Care sunt principalele tipuri de serii de date statistice?

Cum contribuie elementele constructive ale unui tabel statistic la indeplinirea misiunii acestuia intr-o lucrare/expunere?

Care este rolul unui grafic statistic? Cum poate fi accentuata functia cognitiva/analitica a unui grafic statistic?

1.6. Probleme rezolvate

Problema nr. 1.1

O ancheta intreprinsa in Bucuresti in randul a 60 de societati comerciale, permite urmatoarea inregistrare cu privire la numarul de salariati:

Caseta 1.1.1.

Se cere:

a)      Sa se identifice nivelul minim si maxim al numarului de salariati in cele 60 de societati comerciale observate;

b)      Sa se grupeze cele 60 de societati comerciale pe 6 intervale egale de variatie a numarului de salariati si sa se reprezinte grafic repartitia de frecvente obtinuta;

c)      Sa se propuna o grupare pe intervale neegale de variatie a numarului de angajati, pornind de la analiza tipologica a unitatilor inregistrate si sa se reprezinte grafic repartitia de frecvente obtinuta;

d)      Sa se precizeze care este cea mai fidela prezentare pe intervale de grupare a colectivitatii observate.

Rezolvare:

a) xmin = 165 persoane, xmax = 346 persoane

b) Varianta de rezolvare 1

Numarul de grupe este h = 6, iar marimea intervalului (k) este de aproximativ 30 persoane, potrivit relatiei:

In tabelul 1.1.1., primul interval de grupare are limita inferioara egala chiar cu xmin. In schimb, ultimul interval de grupare ramane deschis la limita superioara pentru a putea permite cuprinderea unitatii cu 346 persoane ocupate. In ultima coloana a tabelului sunt semnalate centrele intervalelor de grupare, care se obtin ca medie aritmetica simpla a limitelor inferioare si superioare ale fiecarei grupe.

Tabel 1.1.1.

Gruparea a 60 unitati comerciale din Bucuresti
dupa numarul de salariati

Intervale de variatie a numarului de salariati

Numar de societati comerciale

Centrul intervalului de grupare

315 si peste

Total

*Limita superioara nu este inclusa in interval

Reprezentarea grafica este o histograma sau un poligon de frecvente: pe axa absciselor se masoara cele sase intervale de grupare, iar pe axa ordonatelor frecventa specifica fiecarei grupe. Pentru o reprezentare grafica expresiva, se recomanda ca lungimea segmentului aferent frecventei maxime inregistrate (in exemplul nostru nmax = 17) sa fie aproximativ egala cu lungimea segmentului folosit pentru reprezentarea celor sase grupe pe axa absciselor (vezi Fig 1.1.1.).

b) Varianta de rezolvare 2

Prin aplicarea formulei lui H.D. Sturges pentru estimarea marimii (k) a intervalelor de grupare rezulta valoarea 26,2 pentru cele N = 60 unitati comerciale observate:

Avand in vedere ca variabila observata este numarul de salariati si ca aceasta variabila nu admite subdiviziuni, se va analiza posibilitatea gruparii societatilor comerciale pe intervale de cate 25 salariati, prima grupa urmand sa cuprinda toate unitatile cu personal de pana la 175 persoane.

Observatie: Formula lui H.D. Sturgers ofera o solutionare optimala a cerintei de grupare pe intervale egale numai in cazul unei distributii quasi-continue a unitatilor observate intre xmin si xmax. In acest exemplu, intervalul penultim (300 - 325) este vid.

Fig 1.1.1.

Numar de salariati

 

Totodata, coloana a doua a tabelului 1.1.2 reflecta fluctuatii ale numarului de unitati cuprinse in diferite grupe, ceea ce poate fi considerat ca semn al unei sistematizari deficitare a datelor observarii statistice (intre grupele cu 11 si, respectiv 14 societati comerciale apare una cu numai 6 unitati, intre grupele cu 14 si, respectiv 13 societati se inregistreaza o grupa cu o frecventa mai mica, de 11 societati comerciale).

Tabel 1.1.2.

Gruparea a 60 unitati comerciale din Bucuresti
dupa numarul de salariati

Intervale de variatie a numarului de salariati

Numar de societati comerciale

Sub 175*

325 si peste

Total

*Limita superioara nu este inclusa in interval

Pentru a elimina astfel de neajunsuri, exista doua alternative:

reluarea procesului de grupare a datelor observarii tot pe intervale de variatie a numarului de salariati de 25 de persoane, dar, se gliseaza fie in sus (de exemplu, primul interval sa cuprinda societatile cu pana la 180 salariati, al doilea interval sa fie de la 180 la 205 salariati etc), fie in jos (de exemplu, prima grupa sa fie pana la 170 salariati etc.).

se procedeaza la regrupare, unind doua cate doua intervalele de variatie a numarului de salariati ai societatilor comerciale.

Mai jos se prezinta doua variante de regrupare a societatilor comerciale observate, intervalele fiind de cate 50 salariati (vezi tabelele 1.1.3 si 1.1.4):

Tabel 1.1.3. Tabel 1.1.4

Intervale de variatie a numarului de salariati

Numar de societati comerciale

Intervale de variatie a numarului de salariati

Numar de societati comerciale

Sub 175*

325 si peste

Sub 200*

si peste

Total

Total

Din felul in care sunt definite intervalele marginale de grupare, rezulta ca limita inferioara este inclusa in fiecare interval.

*Limita superioara nu este inclusa in interval

c) Din variantele de grupare pe intervale egale deja prezentate, se remarca faptul ca majoritatea societatilor comerciale observate se incadreaza intre 200 si 300 salariati.

In acest context, se avanseaza urmatoarea grupare pe intervale neegale de variatie a numarului de salariati:

Tabelul 1.1.5.

Intervale de variatie a numarului de salariati

Numar de societati comerciale

Marimea intervalului de grupare

sub 180

Total

* Primul interval (deschis) se considera a avea aceeasi marime ca si intervalul vecin (20 de salariati)

Reprezentarea grafica se realizeaza tot sub forma de histograma. Tinand cont de faptul ca fiecare grupa este ilustrata sub forma unui dreptunghi care are o latura egala cu marimea intervalului de grupare (kj), iar cealalta cu numarul (nj) de elemente din grupa, trebuie respectata proportionalitatea dintre suprafetele dreptunghiurilor

Astfel, atunci cand grupa este de 2 sau 2,5 ori mai mare, frecventa observata se micsoreaza de acelasi numar de ori. Numai asa se realizeaza o reprezentare corecta a repartitiei de frecvente pe intervale neegale de grupare

d) Se porneste de la observarea numarului total de salariati in cele 60 de societati comerciale inregistrate: salariati.

Acea grupare care se abate cel mai putin (in plus sau minus) de la aceasta suma este considerata ca denatureaza cel mai putin specificul colectivitatii analizate.

Datele fiind grupate, frecventa (nj) specifica fiecarei grupe (j) se inmulteste cu centrul (xj) grupei pentru a calcula .

Rezultatul calculelor arata astfel:

Gruparea pe intervale de cate 30 persoane (Tabelul 1.1.1.) conduce la persoane (+0,9% fata de efectivul persoanelor salariate in cele 60 de societati comerciale);

Gruparea pe intervale de cate 25 persoane (Tabelul 1.1.2.) se caracterizeaza prin persoane (-0,2% fata de numarul efectiv al salariatilor), dar apare o grupa vida, ceea ce este inacceptabil;

Gruparea (b1) pe intervale de cate 50 salariati (Tabelul 1.1.3.) conduce la persoane (+1,5%), iar gruparea (b2), de aceeasi marime 50 a intervalelor (Tabelul 1.1.4.) prezinta persoane (-1,9%)

Gruparea pe intervale neegale (Tabelul 1.1.5.) se caracterizeaza prin persoane (-0,5%).

Prin urmare, cea mai fidela prezentare a numarului de salariati este cea realizata pe intervale neegale (cu o abatere de -0,5% fata de numarul de salariati inregistrati); prelucrarea ulterioara a datelor poate fi ingreunata insa de aceasta grupare pe intervale neegale.

Dintre gruparile pe intervale egale, cea mai cea mai apropiata redare a realitatii se realizeaza prin prima varianta de grupare (pe intervale de cate 30 de salariati) cu o abatere de +0,9% fata de numarul de salariati inregistrati.

Problema nr. 1.2.

In cursul lunii februarie, trei echipe (A, B si C) au realizat un numar de 220 de loturi de produse, fiecare lot fiind alcatuit din cate 500 de unitati.

Cu prilejul unui control total dispus de managementul fabricii, s-au inregistrat urmatoarele date (alaturi de insemnul echipei s-a notat numarul de produse defecte din fiecare lot):

Caseta 1.2.1.

Nr crt

Echi-

pa

Produse defecte

Nr crt

Echi-

pa

Produse defecte

Nr crt

Echi-

pa

Produse defecte

B

B

A

B

A

C

B

A

A

C

B

B

A

A

C

A

C

B

A

C

A

B

C

B

C

A

B

B

C

C

A

B

C

C

C

C

A

C

C

C

C

C

C

B

C

B

C

C

C

C

B

B

B

B

C

B

C

C

C

A

C

B

C

C

B

C

C

B

B

B

C

C

B

C

B

A

C

C

B

B

C

B

C

B

C

C

C

A

B

A

B

C

A

C

C

B

B

C

C

C

C

A

Caseta 1.2.1. (continuare)

Nr crt

Echi-

pa

Produse defecte

Nr crt

Echi-

pa

Produse defecte

Nr crt

Echi-

pa

Produse defecte

A

C

A

C

C

B

B

C

C

C

B

B

B

C

C

C

B

C

B

C

C

A

A

C

B

C

C

A

C

B

C

C

C

A

C

C

B

A

B

A

A

C

C

C

C

A

C

A

B

B

A

C

C

B

A

B

B

A

B

B

B

A

C

C

A

C

A

B

B

B

B

A

C

C

B

B

A

C

A

A

B

B

A

A

B

B

A

A

A

C

A

C

A

C

C

C

C

C

C

B

B

A

C

C

B

B

C

B

B

C

C

C

A

A

C

A

A

B

Se cere:

a)      Sa se grupeze loturile in raport cu echipa care a realizat fabricatia si sa se reprezinte grafic repartitia obtinuta;

b)      Sa se alcatuiasca repartitia loturilor fabricate in functie de numarul de produse defecte identificate si sa se realizeze reprezentarea grafica a seriei astfel obtinute;

c)      Sa se alcatuiasca repartitia bidimensionala a celor 220 de loturi, folosind gruparile unidimensionale anterioare ca instrumente de verificare a corectitudinii operatiei de grupare.

Rezolvare:

a) Gruparea in raport cu echipa lucratoare:

Tabel 1.2.1

Repartitia loturilor fabricate pe echipe

Echipa

Numar loturi

A

B

C

Total

Reprezentarea grafica se face printr-o diagrama prin benzi sau diagrama cu coloane, cum se prezinta in fig 1.2.1.:

Fig. 1.2.1.

b) Considerand ca variabila "numar de produse defecte pe lot" se distribuie aproape continuu intre xmin = 1 defect/lot si xmax = 15 defecte/lot, se poate recurge la gruparea pe trei intervale egale de marime cinci:

Tabelul 1.2.2.

Repartitia loturilor fabricate in functie de
numarul de produse defecte pe lot:

Numar de produse defecte/lot

Numar loturi

Total

Reprezentarea grafica este o histograma sau un poligon de frecvente.

c) Tabel 1.2.3.   

Repartitia loturilor fabricate in functie
de echipa de lucru si numarul de produse defecte pe lot:

Numar de produse

Echipa

Total

defecte/lot

A

B

C

Total

Observatie: Ultima linie a tabelului de mai sus reproduce prima grupare, iar ultima coloana cea de-a doua grupare a loturilor de produse.

1.7. Probleme propuse

Problema nr. 1.3

Sirul urmator de date reprezinta punctajele obtinute de 40 de candidati la admiterea in invatamantul superior la ASE Bucuresti in anul 2007: 44

Observatie: punctajul maxim obtenabil in 2007 a fost de 80.

Se cere:

a)      Sa se observe punctajele maxim si minim inregistrate in aceasta colectivitate.

b)      Sa se grupeze candidatii dupa rezultatele obtinute in cinci grupe egale.

c)      Sa se reprezinte grafic repartitia obtinuta.

d)      Sa se calculeze marimile relative prin care se caracterizeaza structura colectivitatii in functie de performanta inregistrata de candidati, precum si proportia intre grupele constituite.

Problema nr. 1.4

In cadrul unei universitati, un numar de 25 de profesori de toate gradele declara urmatoarele venituri salariale pe primele 6 luni ale anului 2007 (sute RON): 24; 38; 64; 20; 23; 24; 72; 50; 47; 21; 22; 47; 35; 58; 22; 24; 21; 61; 48; 20; 24; 56; 48; 67; 32.

Se cere:

a)   Sa se grupeze datele pe 4 intervale egale.

b)   Sa se reprezinte grafic gruparea obtinuta.

Problema nr. 1.5

Ratele dobanzii practicate de 15 banci comerciale intr-o luna a anului 2007 variaza astfel: 4,5%

Se cere:

a)      Sa se reprezinte grafic aceasta serie.

b)      Sa se grupeze bancile pe trei intervale de variatie a ratei dobanzii practicate si sa se faca o noua reprezentare grafica a repartitiei obtinute.



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 5274
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved