Scrigroup - Documente si articole

Username / Parola inexistente      

Home Documente Upload Resurse Alte limbi doc  

 
CATEGORII DOCUMENTE
DemografieEcologie mediuGeologieHidrologieMeteorologie


Populatie statistica - ESANTIONAREA - Tehnici de selectie a esantionului

Demografie

+ Font mai mare | - Font mai mic


DOCUMENTE SIMILARE

Trimite pe Messenger
ATITUDINI SOCIALE - Caracterul si atitudinile sociale Notiunea de atitudine sociala
Orasul - Dezvoltarea durabila
FENOMENE DEMOGRAFICE: NATALITATEA, MORTALITATEA SI MIGRATIA
Populatie statistica - ESANTIONAREA - Tehnici de selectie a esantionului
ROLUL POPULATIEI IN PLANIFICAREA URBANA SI AMENAJAREA TERITORIULUI
TRANZITIA DEMOGRAFICA
BOMBA DEMOGRAFICA - Evolutia si migratia populatiei
Islamul - o lume in expansiune - Prezenta musulmana
Cresterea populatiei - Schimbarile recente - Controlul natalitatii
Clasificarea oraselor dupa functii

TERMENI importanti pentru acest document

: esantionarea statistica : : selectie in statistica : :

Capitolul I. NOTIUNI  DE BAZA

1.      Populatie statistica

O populatie este definita ca un ansamblu de elemente care au una sau mai multe insusiri esentiale comune, proprii acestora. Exemple de populatii: gospodariile din Romania existente la sfarsitul lunii trecute, angajatii unei intreprinderi, ansamblul persoanelor unei tari, etc. Populatia constituie universul de referinta in studiul unei probleme statistice date. Se noteaza cu majuscule de la inceputul alfabetului.

Orice element component al populatiei se numeste unitate statistica. Aceasta  poate fi simpla sau complexa. Unitatile statistice simple sunt componente elementare ale unei populatii (membrul unei gospodarii, angajatul intreprinderii, persoana, etc.) iar unitatile statistice complexe, cum ar fi gospodaria de exemplu, constituie rezultatul  agregarii a doua sau mai multe unitati simple. Se noteaza cu minusculele corespunzatoare majusculei cu care s-a notat populatia.

Numarul unitatilor statistice care alcatuiesc o populatie constituie volumul acesteia. Se noteaza cu N. Daca populatia A de volum N este finita, atunci

A=

respectiv,

A=

daca este infinita.

2.      Variabila statistica

Variabila statistica reprezinta o insusire comuna unitatilor unei populatii care in general capata acceptii sau valori diferite de la o unitate sau grup de unitati la altul. Forma concreta de manifestare a unei variabile statistice la o unitate sau grup de unitati se numeste stare sau realizare. Variabilele statistice se noteaza cu litere majuscule de la sfarsitul alfabetului iar starile cu minusculele corespunzatoare. Exemple: numarul membrilor unei gospodarii, venitul realizat de gospodarie in ultima luna, domiciliul gospodariei, anul nasterii celui mai varstnic membru al gospodariei, etc.

In raport cu modul de exprimare a starilor variabilele statistice pot fi cantitative daca starile se exprima numeric sau calitative, daca starile se exprima prin cuvinte. O variabila este dihotomica daca ea nu poate avea decat 2 stari.

3.      Esantion – populatie univers

Esantionul este o submultime de unitati statistice dintr-o populatie asupra careia se efectueaza un studiu statistic. Populatia A din care se constituie esantionul se numeste populatie univers. Se mai foloseste si denumirea de populatie-mama sau populatie-tata. Esantionul se noteaza cu A daca populatia univers este A si avem AA.

4.      Esantionare (sondaj)

Esantionarea reprezinta ansamblul operatiilor destinate formarii unui esantion dintr-o populatie univers data.

Pentru ca informatia rezultata in esantion in raport cu o variabila X (de exemplu, media sa, valoarea mediana, modala, etc.) sa fie cat mai apropiata de cea din populatia univers este necesar ca structura esantionului in raport cu variabila X sa fie cat mai apropiata de cea din populatia univers. Diferenta dintre cele 2 structuri constituie o masura a gradului de reprezentativitate a esantionului.

In raport cu procedeul folosit, esantionarea poate fi aleatoare sau dirijata, in  ambele cazuri urmarindu-se realizarea unor esantioane reprezentative, care sa reproduca cat mai fidel posibil caracteristicile (parametri) din populatia univers.

Esantionarea aleatoare este tipul de esantionare prin care fiecarei unitati din populatia univers i se acorda aceeasi sansa de a face parte din esantion. Procedeul cel mai practic in acest scop este procedeul tabelelor cu numere intamplatoare. Dintr-o carte care contine astfel de numere, se citesc si se retin n numere cuprinse intre 1 si N, presupunand existenta numerotarii prealabile a unitatilor populatiei univers de la 1 la N, dupa un criteriu care nu are legatura cu variabilele studiate. Dupa n citiri rezulta astfel un esantion de n numere, care dupa identificarea unitatilor corespunzatoare din populatia univers, conduce la esantionul aleator al unitatilor.

Esantionarea dirijata este tipul de esantionare in care unitatile componente ale esantionului sunt prelevate in baza unor criterii prealabil stabilite.

In esantionarea unei populatii se poate aplica fie principiul cu schema bilei nerevenite fie cel al bilei revenite. Deosebim deci, esantionare fara revenire respectiv, esantionare cu revenire.

5.      Variabila  aleatoare

Definitie. Variabila pentru care realizarea unei stari este determinata in functie de rezultatul unei experiente aleatoare se numeste variabila aleatoare.

Intr-o experienta aleatoare, ansamblul tuturor rezultatelor posibile ale experientei  formeaza multimea fundamentala.

Ca si variabila statistica, este notata printr-o majuscula de la sfarsitul alfabetului. Aceasta este o functie cu valori reale definita pe multimea fundamentala. Altfel spus, o variabila aleatoare X este o aplicatie a lui Ω in R:

                             X: Ω R

Deosebim dupa modul de variatie:

·         Variabila aleatoare discreta, daca multimea valorilor luate de catre variabila aleatoare este o multime finita sau numarabila:

·         Variabila aleatoare continua, daca multimea valorilor luate este o multime infinita nenumarabila.

6.      Observarea statistica

Observarea statistica consta in identificarea unitatilor si inregistrarea starilor variabilelor in raport  cu care este studiata. Ansamblul  starilor variabilelor rezultate prin observare se  numesc statistici. Aceste statistici - materia prima a statisticii - in continuare sunt supuse unui proces complex de prelucrare in vederea obtinerii „produsului finit” concretizat printr-o anumita informatie la nivelul populatiei.

7.      Inferenta statistica

Prin inferenta statistica, se intelege un rationament prin inductie, care se efectueaza pe informatia rezultata prin prelucrare - cu ajutorul tehnicilor oferite de statistica descriptiva - a esantionului aleator al masuratorilor, in vederea extinderii acesteia la populatia univers din care s-a format esantionul.

8.      Statistica inferentiala

Statistica inferentiala sau deductiva este complementara statisticii descriptive, impreuna aplicate si intr-o succesiune logica - statistica descriptiva si apoi statistica inferentiala -conduc la realizarea scopului cercetarii unei populatii, in toate cazurile in care punctul de pornire il constituie un esantion aleator din populatia univers.

.

Capitolul II. ESANTIONAREA

Esantionarea reprezinta ansamblul operatiilor destinate formarii unui esantion dintr-o populatie univers data. O ancheta prin sondaj sau mai simplu, un sondaj este o ancheta efectuata pe o parte restransa dintr-o populatie. Acest subansamblu a populatiei este denumit esantion iar metodele care permit constituirea esantionului sunt denumite metode de esantionare sau metode de sondaj ( Dodge Y., 1993).

In “Mica Enciclopedie de statistica “ 1985, ancheta prin sondaj este definita ca o investigatie intreprinsa pe o fractiune reprezentativa a populatiei statistice numita esantion. In virtutea caracterului reprezentativ al esantionului si cu ajutorul inferentei statistice, informatiile obtinute prin sondaj sunt extinse la intreaga populatie.

Esantionarea permite cercetatorilor si practicienilor sa traga concluzii la nivelul populatiei univers, studiind doar o parte a acesteia, denumita esantion. Astfel se pot estima diferite carcteristici ale populatiei observand doar o parte a ansamblului populatiei.

II.1.  Avantajele si limitele esantionarii

Dintre avantajele esantionarii le remarcam pe urmatoarele:

• costul redus de obtinere a informatiilor primare, decat in cazul unei obsevari exhaustive. Astfel este posibil ca pe baza unui esantion relativ mic, sa obtinem rezultate ce caracterizeaza populatia univers, cu cheltuieli mult mai reduse;

• rapiditatea in obtinerea de informatii si in elaborarea de concluzii si strategii. Adesea, in studierea unui fenomen se dispune de putin timp intre momentul la care se stabilesc datele necesare cercetarii si acela in care sa se utilizeze rezultatele. Astfel daca se efectueaza un sondaj pentru aprecierea eficacitatii unei campanii publicitare, observatiile si culegerea datelor trebuie sa fie realizate cat mai aproape de debutul acestei campanii. Cum esantioanele au volume mici, timpul de culegere si prelucrare a datelor este mult redus ;

• permit obtinerea de informatii detaliate, care corespund si raspund cu precizie problemei studiate, ele fiind mai exacte. In general orice proces de observare este susceptibil de a fi afectat de erori, dar sondajul permite obtinerea de date mai exacte decat cele obtinute printr-o observare exhaustiva. Aceasta se datoreaza in principal participarii la culegerea datelor a unor persoane competente, organizarea riguroasa a controlului in teren etc.;

• permit studierea unor fenomene care printr-o observare totala ar fi distruse, ca de exemplu masurarea densitatii graului, degustarea unor produse, controlul calitatii produselor etc.;

• au un camp de aplicabilitate foarte vast.

In forma cea mai generala cercetarea prin sondaj are si anumite limite, cum ar fi:

• sunt destinate studierii populatiilor statistice de volum suficient de mare, bine delimitate in timp si spatiu;

• nu sunt suficient de rapide pentru rezolvarea problemelor pe termen scurt;

• sunt destul de costisitoare incat nu pot fi repetate intr-un ritm rapid;

• existenta erorilor de esantionare si de observare;

• dificultati in construirea esantionului.

Eroarea de esantionare denumita si eroare de estimare reprezinta diferenta dintre valoarea numerica inregistrata de parametrii calculati pe baza valorilor observate la nivelul unui esantion de unitati si valoarea numerica a parametrilor de la nivelul populatiei univers.

Ca atare eroarea de esantionare se datoreaza tocmai observarii numai a unei parti din populatie, in locul unei observari exhaustive.

Marimea acestei erori este data de o multitudine de factori. Se observa, de exemplu, ca eroarea de esantionare se diminueaza, in general in masura in care marimea esantionului creste. Aceasta intrucat sondajul se fundamenteaza pe legea numerelor mari, care impune asigurarea unei precizii acceptabile numai in masura in care esantioanele sunt suficient de mari.

Dar marimea esantionului nu este singurul element care influenteaza eroarea de esantionare, aceasta fiind determinata in egala masura si de gradul de variatie al  variabilelor de studiat, de metoda de sondaj folosita, de tipul de estimator folosit, de valorile inregistrate la nivelul unitatilor din esantion (componenta esantionului), de respectarea principiilor de formare a esantionului, de utilizarea unei baze de sondaj de buna calitate.

Erori de observare

Erorile, de observare sau de masurare, tin de faptul ca valoarea inregistrata intr-o ancheta poate fi o valoare diferita de cea adevarata. Aceste erori sunt prezente in egala masura atat in observarile partiale cat si in observarile exhaustive, din cele mai diverse cauze. Aceste erori pot fi datorate dificultatilor intalnite in constituirea si actualizarea bazei de sondaj sau a confuziilor ce se pot genera prin maniera de formare a intrebarilor in cadrul chestionarelor elaborate.

Pentru reducerea acestor erori este necesara o selectie riguroasa a anchetatorilor, o buna pregatire a acestora si o testare prealabila a chestionarelor. De asemenea se recomanda efectuarea de controale asupra operatorilor. Depistarea erorilor se poate realiza si in faza de prelucrare a datelor, iar in functie de natura lor se pot lua diferite masuri pentru eliminarea efectului acestora. 

 J. Desabie (1966) spunea “atunci cand o ancheta esueaza cel mai frecvent se datoreaza erorilor de observare decat erorii de esantionare”. De accea este irational sa consacri mari eforturi pentru reducerea erorii de esantionare atunci cand erorile de observare sunt consistente. Dar in general erorile de observare sunt mult mai mici in cazul anchetei prin sondaj decat in cazul observari exhaustive, datorita faptului ca operatorii au o pregatire mult mai buna.

II.2. Constituirea esantionului

Principala problema in desemnarea esantionului este dificultatea identificarii populatiei univers de referinta. Populatia de referinta poate fi definita simplu ca o lista de elemente, de unitati statistice sau utilizand diferite variabile auxiliare esentiale pentru cercetarea intreprinsa.

In teoria esantionarii, structurarea populatiei de referinta pe baza unor variabile auxiliare esentiale trebuie sa satisfaca proprietatile de complementaritate si completitudine. In virtutea acestor doua proprietati fiecare unitate din populatia de referinta, apartine uneia si numai uneia dintre clasele definite. Respectarea acestor proprietati asigura fiecarei unitati elementare aceeasi sansa de includere in esantion.

Pentru constituirea esantionului un rol important il are baza de sondaj, care in forma cea mai simpla se prezinta sub forma unei liste cuprinzand toate unitatile populatiei univers.

Baza de sondaj

• Ea trebuie sa permita identificarea unitatilor fara nici o ambiguitate.

 Astfel sunt necesare informatii cu privire la identificarea unitatilor. De exemplu daca unitatea statistica este gospodaria, atunci dupa ce aceasta primeste un numar curent din aceasta lista, ea trebuie sa fie insotita si de elemente de identificare, respectiv adresa. Daca unitatea o reprezinta intreprinderea, trebuie sa se dispuna de informatii privind denumirea si sediul acesteia.

Pentru ca o baza de sondaj sa fie corespunzatoare trebuie in primul rand sa contina informatii, de identificare a unitatilor, de bunahttp://luvbin.com  calitate. In caz contrar apare riscul ca o unitate sa fie confundata cu alta si astfel se introduc erori si se deformeaza probabilitatea de extragere a unitatilor in esantion.

 

• Ea trebuie sa fie exhaustiva, aceasta semnifica faptul ca fiecare unitate ce face parte din populatia studiata, trebuie sa fie prezenta in lista. Daca aceasta conditie nu se realizeaza, baza de sondaj este incompleta, sau cu defect de acoperire, ceea ce afecteaza precizia.

 

• Ea trebuie sa fie fara dubla inregistrare, adica nici o unitate nu trebuie sa fie prezenta de doua sau de mai multe ori in baza, si mai ales sub identificari diferite. In caz contrar se obtin estimatori de calitate mai slaba.

Lipsa bazei de sondaj

Daca dintr-un considerent oarecare nu se dispune de o baza de sondaj acceptabila, care sa permita realizarea de esantioane de calitate, atunci exista mai multe posibilitati:

• fie sa nu utilizam baza de sondaj, ci sa ne folosim numai de anumite informatii la nivelul populatiei, sa iesim din cadrul riguros al sondajelor probabiliste, si in consecinta sa se realizeze sondaje nealeatoare;

• fie cercetand baze de sondaj care nu se refera la toate unitatile unei populatii, ci doar la nivelul unor grupe de unitati. Ca exemplu sunt sondajele in mai multe trepte cand este nevoie de baza de sondaj la nivelul unitatilor primare extrase in prima treapta de sondaj sau sondajele de tip areal unde esantionul din prima treapta este format din zone geografice.

• fie recurgand la informatiile furnizate de o populatie intermediara pentru care se dispune de o baza de sondaj. In acest caz unitatea de esantionare si unitatea de observare difera in mod semnificativ, ca atare apar probleme de corespondenta intre aceste tipuri de unitati.

In concluzie orice ancheta prin sondaj trebuie sa fie precedata de o faza de cercetare in vederea constituirii bazei de sondaj si a culegerii de informatii care sa permita fie ameliorarea procedeelor de formare a esantionului, fie imbunatatirea calitatii estimatorilor.

Erori datorate non-raspunsurilor

Erori datorate non-raspunsurilor apar in urmatoarele situatii:

a)      non-raspunsuri totale cand avem de-a face cu urmatoarele situatii:

-   unitatile nu pot fi contactate, de exemplu, in cazul studierii populatiei, anumite persoane nu sunt gasibile, fiind plecate in toata perioada anchetei;

-    refuzul de furniza date;

-    incapacitatea unor persoane de a da raspunsuri;

- pierderea sau distrugerea unor documente necesare pentru completarea chestionarului;

-  in cazul anchetei prin corespondenta, pot aparea situatii cand chestionarele nu ajung la destinatar;

-   in cazul intreprinderilor, daca si-au incheiat activitatea in perioada anchetei (din acest motiv in construirea esantioanelor trebuie utilizate liste exhaustive si actualizate).

b)      non-raspunsuri partiale:

-  refuzul in fata anumitor intrebari sensibile;

-  neintelegerea unor intrebari;

-  prezenta unor date incorecte;

-  alte motive.

Pentru reducerea erorilor datorate non-raspunsurilor se recomanda  cresterea volumului  esantionului, cu un procent egal cu procentul estimat de non-raspunsuri (obtinut dintr-o ancheta anterioara avand acelasi obiectiv, aceeasi populatie de studiat), atunci cand bugetul permite acest lucru. Daca bugetul nu permite marirea volumului esantionului, atunci se vor utiliza diverse metode de ameliorare a estimatorilor si anume:

                  • in cazul non-raspunsurilor partiale se pot utiliza metodele imputatiei, de ex.: cea deductiva, 'colddeck', 'hot-deck' etc.

                  • in cazul non-raspunsurilor totale, se pot utiliza: metode de reponderare a esantionului de respondenti sau diverse metode de analiza a datelor: analiza corespondentelor, analiza discriminanta, analiza LOGIT etc.

II.3. Aplicatiile esantionarii

In toate actiunile sale intreprinderile trebuie sa se raporteze la piata, la schimbarile survenite in cerere, in preturi, in oferta, etc. De aceea studierea pietei nu este o operatiune ocazionala, periodica, ci un process continuu. Intreprinderea trebuie sa cunoasca in permanenta pulsul pietei, sa dispuna de suficiente informatii asupra tuturor caracteristicilor pietei.

Nevoia de informatii cat mai ample si cat mai recente, pentru orientarea activitatii economice, sporeste aria, frecventa si profunzimea cercetarilor de piata. Acestea devin mai complexe, datorita dinamismului pietei, a elasticitatii crescande a fenomenului de piata. Piata se largeste si se diferentiaza, structurile si formele de manifestare ale cererii devin tot mai instabile, oferta se diversifica foarte repede, aparatul de distributie isi modifica structurile, amplasarea, metodele de comercializare, preturile se schimba repede mai ales in conditii de instabilitate economica, etc.

Toate aceste conduc la o crestere a gradului de perisabilitate a informatiilor, de aici rezultand necesitatea reinnoirii lor continue si largirea tematicii cercetarilor de piata.

Cercetari de marketing bazate pe esantionare

Cele mai frecvente cercetari de marketing bazate pe esantionare sunt urmatoarele:

•cercetari statistice in domeniul social, agricol si industrial

•sondaje de opinie

•marketing politic

•obiceiuri si atitudini

•segmentare si pozitionare

•studii asupra consumatorului (profil, satisfactie, utilizare si comportament de achizitie)

•studii asupra satisfactiei consumatorilor

•evaluari de campanii publicitare

•imginea companiei

•cercetari asupra preturilor, elasticitatea pretului

•teste de produs si ambalaj . Experimente.

•mystery shopping

•cercetari asupra distributiei

Pe baza studiilor cantitative se pot realiza:

• scenarii si simulari de marketing;

• previziuni si predictii pentru fundamentarea strategiilor de marketing.

II.4. Tipuri de planuri de esantionare sau metode de esantionare

Dupa procedeul folosit in constituirea esantionului se disting doua categorii de sondaje: aleatoare sau probabiliste si nealeatoare sau cu ,,alegere rationala” neprobabiliste.

• In cadrul sondajelor aleatoare sunt incluse acele procedee bazate pe metodele de constituire a esantioanelor in care alegerea unitatilor din populatie se face in mod aleator, fiecare unitate avand o probabilitate cunoscuta si diferita de zero de a accede in cadrul esantionului. Se pot utiliza nenumarate metode probabiliste de esantionare. In cadru aceluiasi plan de esantionare se poate folosi una sau mai multe metode probabiliste sau neprobabiliste, din anumite considerente practice.

• Esantionarea nealeatoare se bazeaza pe ,,alegerea rationala’’ a unitatilor utilizand informatii cunoscute, asupra populatiei supusa analizei. Se utilizeaza intrucat sunt mai putin costisitoare si mult mai practice, dar in comparatie cu metodele de esantionare probabiliste sunt mai putin exacte.

Din cadrul metodelor de esantionare probabilista fac parte: esantionarea aleatoare simpla, esantionarea sistematica, esantionarea cu probabilitati inegale, esantionarea stratificata, esantionarea pe grupe, esantionarea in mai multe trepte, esantionarea in mai multe faze.

1. Metodele de esantionare aleatoare simpla au atat o importanta practica cat si teoretica in fundamentarea unui plan de sondaj. Constituirea esantioanelor se realizeaza prin includerea unitatilor elementare din populatia de referinta, de genul ca fiecare unitate are o anumita probabilitate nenula de a fi cuprinsa in cadrul esantionului. Astfel generarea esantionului se face prin alegerea unitatilor pe rand prin extrageri succesive, dupa schema bilei revenite si avem esantionare simpla cu revenire sau dupa schema bilei nerevenite si avem esantionare simpla fara revenire.

2. Esantionarea sistematica presupune alegerea unitatilor in esantion utilizand un pas de numarare determinat pe baza relatiei:

                                                              h=N/n

Constituirea esantionului prin metoda sistematica depinde de doua elemente :

•pasul de numarare sau de sondaj ( h )

•punctul de plecare ales ( a ) si care se gaseste intre 1 si h .

Astfel esantionul se prezinta sub forma :

                                               E =

3. Esantionarea stratificata presupune ca populatia univers sa fie impartita in k grupe, esantionul fiind obtinut prin constituirea de esantioane independente la nivelul fiecarei grupe .

Aceasta metoda de esantionare se aplica atunci cand populatia studiata este eterogena, variabilele inregistreaza  variatie mare, iar aplicarea sondajului simplu nu ar fi eficienta . Astfel popuatia studiata va fi impartita in grupe omogene, denumite si straturi, fiecare unitate apartinand unei singure grupe, neexistand nici o unitate comuna grupelor.

O mare importanta o reprezinta alegerea criteriilor de stratificare a populatiei si alegerea numarului de straturi.

4. Esantionarea cu probabilitati inegale presupune ca selectia unitatilor in esantion sa se realizeze cu probabilitati diferite. Respectiv, daca esantionarile precedente s-au fundamentat pe egalitatea probabilitatilor unitatilor de a accede in esantion in cazul analizat se vor folosi probabilitati diferite. Aceasta forma de esantionare se recomanda atunci cand unitatile populatiei in raport cu una sau mai multe variabile, au valori ce difera semnificativ, iar aplicarea esantionarii cu probabilitati egale ar duce la o eficienta scazuta a estimatiilor.

Acest tip de esantionare se recomanda in special a fi aplicata in cazul in care populatia de referinta este formata din multimea firmelor care au ordine de marime diferita.

5. Esantionarea pe grupe, presupune ca populatia de referinta sa fie impartita pe grupe sau pachete, grupele sa semene intre ele, dar unitatile din cadrul unei grupe sa fie eterogene.

Aceasta metoda consta in selectia unui anumit numar de grupe, la nivelul careia se va efectua o obsevare exhaustiva. Ca urmare esantionul este format din numarul de unitati ce compun grupele selectate.

6. Esantionarea in mai multe trepte

 este o metoda care se desfasoara in mai multe etape succesive si se aplica pentru o populatie care este organizata ierarhic, pe mai multe niveluri.

Se constituie astfel pentru fiecare nivel una sau mai multe baze de sondaj, cuprinzand unitatile elementare de pe nivelul imediat urmator. In prima etapa se aleg unitatile din primul nivel sau treapta. Unitatile alese se numesc unitati primare.

In a doua etapa pentru unitatile alese in prima etapa trebuie sa se dispuna de baza de sondaj din care vor fi alese unitatile din aceasta etapa. Astfel, avem o dispunere in cascada a bazelor de sondaj, incat unitatile alese intr-o etapa formeaza o baza pentru nivelul urmator de esantionare. Unitatile din al doilea nivel se numesc unitati secundare, cele din nivelul trei se numesc unitati tertiare etc.

II.5.  Tehnici de selectie a esantionului

Formarea esantionului

Formarea esantionului presupune extragerea celor n unitati din cadrul populatiei studiate. Extragerea unitatilor, in cazul in care se organizeaza sondaje probabiliste, este aleatoare.

  Dintre procedeele de formare a esantionului cele mai utilizate sunt:

• procedeul tragerii la sorti

• procedeul extragerilor sistematice.

Procedeul tragerii la sorti (aleatoare) presupune ca toate unitatile din cadrul populatiei studiate sa fie numerotate de la 1 la N. Extragerea a n unitati, n<N, se realizeaza utilizand o urna ce contine bile, fiecare bila avand un numar, cuprins intre 1 si N; prin extrageri successive se obtin cele n bile. Extragerile se pot realiza dupa schema bilei revenite, cand dupa fiecare bila extrasa se noteaza numarul inscris pe ea si se repune in urna, sau dupa schema bilei nerevenite, cand o bila odata extrasa dupa notarea numarului nu mai este pusa in urna.

De asemenea extragerea celor unitati se poate realiza utilizand tabelele cu numere intamplatoare. La ora actuala exista diferiti algoritmi de generare a numerelor aleatoare dupa o lege uniforma. In cadrul marilor programe de prelucrare statistica, cum ar fi S.A.S., exista posibilitatea generarii de numere aleatoare, respectiv de formare a esantionului de unitati utilizand calculatorul.

Tabelele cu numere aleatoare cuprind o multime de numere formate din mai multe cifre (exista tabele formate din 4, 5, 6, etc. cifre). Utilizarea lor presupune alegerea aleatoare a unui punct de pornire dupa care se vor extrage n numere care vor fi mai mici decat N.

De exemplu daca N = 5000 si n = 100 atunci, deoarece numarul este format din 4 cifre, vom folosi fie tabelele cu numere intamplatoare formate din 4 cifre sau pe cele formate din mai multe cifre, iar din numerele respective se vor folosi fie primele 4 cifre, fie ultimele 4 cifre ale numerelor. Astfel daca se foloseste tabelul din anexa 1 unde numerele sunt formate din 5 cifre, se pot urmari primele 4 cifre. Daca punctul de pornire este linia 10 coloana 5 (ales aleator), primul numar este 3347, fiind mai mic decat N se retine, urmatorul numar din acea coloana este 5560 fiind mai mare decat N nu se retine in esantion. Se continua cu urmatoarele numere pana se obtin 100 numere aleatoare, respectiv (3347, 2875, 3917, 1936, 2453, 2715, 2614, 1751, etc.).

In cazul in care se organizeaza un sondaj cu revenire, atunci acest procedeu este simplu de utilizat, dar daca este fara revenire, atunci trebuie verificate numerele extrase pentru ca anumite numere sa nu se repete. Daca numarul de unitati este mare aceasta operatie de verificare este complicata. In solutionarea acestei probleme au aparut diferiti algoritmi. Acestia presupun ca unitatile unei populatii sa constituie inregistrarile unui fisier si sa se dispuna de un generator de numere aleatoare dupa o lege uniforma pe intervalul  [0, 1).

Utilizarea tabelelor cu numere intamplatoare in formarea esantioanelor presupune respectarea urmatoarelor cerinte, care rezulta din expunerea de mai sus:

• stabilirea unui mod sistematic de citire a tabelului, adica alegerea aleatoare a unui punct de pornire si fixarea unei reguli de parcurgere a coloanelor si liniilor tabelului. Aceasta cerinta este foarte importanta, nerespectarea ei ar duce la introducerea unor erori involuntare, si nu ar permite efectuarea de controale in aceasta etapa;

• utilizarea unui singur tip de tabele, respectiv acela sa contina numere formate din acelasi numar de cifre, de exemplu tabele din 4 cifre, tabele din 5 cifre, tabele din 6 cifre, etc. Nerespectarea acestei cerinte ar produce erori legate de probabilitatile aferente fiecarei unitati din populatie care ar putea fi egale cu 0 pentru anumite unitati;

• tabelele cu numere aleatoare pot fi folosite in cazul organizarii unor sondaje cu probabilitati egale, deoarece ele sunt rezultatul generarii unor numere dupa o lege uniforma.

Procedeul extragerilor sistematice

In cazul utilizarii acestui procedeu esantionul va fi compus din n unitati ale caror ranguri sunt in progresie aritmetica, baza progresiei aritmetice fiind un numar aleator. Alegerea aleatoare a primului numar asigura caracterul aleator al procedeului.

Aplicarea practica a acestui procedeu presupune ca unitatile populatiei sa fie numerotate de la 1 la N. Cunoscand volumul esantionului n, se poate calcula raportul N / n denumit pas de numarare si este notat cu h, h = N /n.

Daca h este numar intreg, atunci folosind un anumit procedeu al extragerii la sorti sau al tabelelor cu numere intamplatoare, se va extrage un numar cuprins intre 1 si h. Notand cu a numarul extras, esantionul va fi compus din urmatoarele unitati: a; a+h; a+2h;….a+(n-1)h.

O astfel de extragere este denumita sistematica de ratie h . Extragerea primei unitati conditioneaza celelalte (n-1) unitati, de aceea pentru ca acest procedeu sa conduca la formarea de esantioane aleatoare trebuie ca prima unitate extrasa sa fie extrasa aleator.

Daca h nu este numar intreg, atunci conform lui J. M. Grosbras in ,,Methodes statistiques des sondages”, procedeul de extragere a unitatilor poate fi prezentat astfel: de exemplu se genereaza sau se alege aleator un numar u dupa o lege uniforma pe intervalul [0,1), esantionul va fi constituit din urmatoarele unitati:

                      [hu]+1; [h(u+1)]+1; [h(u+2)]+1; [h(u+n-1)]+1;

Numarul u fiind ales aleator ii confera intregului esantion de unitati un caracter aleator.

Avantajele extragerilor sistematice sunt costul de administrare foarte scazut si usurinta folosirii. Acest procedeu este eficient in cazul in care sondajul organizat este fara revenire, deoarece orice unitate poate sa apara in esantion doar o singura data.

Daca rangurile unitatilor sunt aleatoare si mai ales nu sunt corelate cu variabilele studiate, atunci extragerile sistematice sunt riguroase, estimatorii vor avea aceleasi calitati ca si in cazul sondajului fara revenire.

Un caz in care extragerile sistematice sunt eficiente este acela in care unitatile invecinate se aseamana intre ele, fiecare grup de unitati fiind reprezentat de cel putin o unitate. Astfel extragerile sistematice vor furniza esantioane reprezentative si din punct de vedere al structurii populatiei in raport cu variabilele studiate.

Daca exista corelatie intre rangurile unitatilor si variabilele studiate atunci extragerile sistematice sunt ineficiente, conducand la estimatori deplasati.

O alta situatie in care extragerile sistematice nu sunt eficiente este aceea in care variabilele studiate prezinta variatii periodice, iar numarul de subperioade este un submultiplu de h. In acest caz estimatorii sunt deplasati, esantionul fiind nereprezentativ pentru populatia studiata.

Cele doua procedee, ale tragerii la sorti si al extragerilor sistematice, se pot imbina mai ales in cazul in care se organizeaza sondaje in mai multe trepte. Astfel in prima sau in primele trepte de sondaj se recomanda formarea esantioanelor folosind procedeul tragerii la sorti, mai exact procedeul tabelelor cu numere intamplatoare, iar in ultima treapta de sondaj, esantionul de unitati statistice sa fie constituit folosind extragerile sistematice. De cele mai multe ori cand se organizeaza astfel de sondaje unitatile statistice de la care se culeg date, din ultima treapta de sondaj, se aseamana intre ele, iar utilizarea extragerilor sistematice devine mai eficienta decat daca s-ar utiliza alte procedee aleatoare.

In cazul in care sondajele ce se organizeaza sunt cu probabilitati inegale, cele doua procedee de formare a esantioanelor nu pot fi aplicate direct ca si in cazul sondajelor cu probabilitati egale, deoarece ele necesita efectuarea unor operatii prealabile.

Daca sondajele sunt cu revenire, formarea esantionului de n unitati se realizeaza astfel:

 

• se elaboreaza vectorul de probabilitati p> 0, = 1;

 •

 se elaboreaza vectorul probabilitatilor cumulate ( P),  respectiv:

Unitati

U

U

……

U

…….

U

Probabilit. cumulate

P = p

P= P + p

….

P = P + p

……

P = P + p= 1

• se extrage un numar aleator cuprins in intervalul [0,1), generat dupa o lege uniforma (putem sa folosim numerele aleatoare generate dupa o lege uniforma deoarece probabilitatile cumulate le putem considera ca valori ale functiei de repartitie, pe intervalul [0,1);

• daca acel numar este cuprins intre P si P atunci unitatea  u va fi selectionata in esantion;

• se reincepe aceasta operatie pana se obtin n unitati in esantion.

DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1655
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Distribuie URL

Adauga cod HTML in site

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2014. All rights reserved