Vzorčenje je ... Definicija, vrste, metode in rezultati vzorčenja

25. 2. 2019

Pogosto se zgodi, da je potrebno analizirati določen družbeni pojav in pridobiti informacije o njem. Takšne naloge se pogosto pojavljajo v statistiki in statističnih študijah. Preverjanje popolnoma opredeljenega družbenega pojava je pogosto nemogoče. Na primer, kako izvedeti mnenje prebivalstva ali vseh prebivalcev določenega mesta o kateri koli zadevi? Povprašati absolutno vsakogar je skoraj nemogoče in zelo naporno. V takih primerih potrebujemo vzorec. Prav to je koncept, na katerem temeljijo skoraj vse raziskave in analize.

Kaj je vzorčenje

Pri analizi določenega družbenega pojava je potrebno pridobiti informacije o njem. Če vzamete katero koli študijo, lahko vidite, da ni vsaka enota predmeta študija predmet raziskav in analiz. Upošteva se le določen del celotnega agregata. Ta postopek je vzorčenje: ko se pregledajo samo določene enote niza.

Seveda je veliko odvisno od vrste vzorca. Vendar obstajajo osnovna pravila. Najpomembnejši med njimi navajajo, da mora biti izbira iz agregata popolnoma naključna. Enote agregata, ki jih je treba uporabiti, se ne smejo izbrati zaradi kakršnih koli meril. V grobem, če je potrebno zbrati skupino prebivalstva določenega mesta in izbrati samo moške, bo v študiji prišlo do napake, ker izbira ni bila naključna, ampak izbrana na podlagi spola. Praktično vse metode vzorčenja temeljijo na tem pravilu.

vrste vzorcev

Izbirna pravila

Da bi izbrana populacija odražala osnovne lastnosti celotnega fenomena, mora biti zgrajena v skladu s posebnimi zakoni, kjer se je treba osredotočiti na naslednje kategorije:

  • vzorec (vzorec);
  • prebivalstvo;
  • reprezentativnost;
  • napaka reprezentativnosti;
  • enota agregata;
  • načine za izdelavo vzorca.

Značilnosti vzorčenja in vzorčenja so naslednje: t

  1. Vsi dobljeni rezultati temeljijo na matematičnih zakonih in pravilih, torej z ustreznimi raziskavami in z ustreznimi izračuni, rezultati ne bodo izkrivljeni na subjektivni osnovi.
  2. Omogoča pridobivanje rezultatov veliko hitreje in z manj časa in sredstev, preučevanjem ne celotnega niza dogodkov, temveč le del njih.
  3. Lahko se uporablja za preučevanje različnih predmetov: od specifičnih vprašanj, na primer starosti, spola interesne skupine do študija javnega mnenja ali ravni materialne podpore prebivalstva.

Naključno opazovanje

Selektivno - to je statistično opazovanje, pri katerem študija ni podvržena celotnemu nizu preučevanega, temveč le določen del izbranega dela, rezultati preučevanja tega dela pa veljajo za celoten sklop. Ta del se imenuje vzorec. To je edini način za preučevanje velikega obsega predmeta študija.

Toda selektivno opazovanje se lahko uporablja le v primerih, ko je treba raziskati le majhno skupino enot. Na primer, pri proučevanju razmerja med moškimi in ženskami na svetu bo uporabljeno selektivno opazovanje. Iz očitnih razlogov - je nemogoče upoštevati vsakega prebivalca našega planeta.

Toda z isto študijo, vendar ne vsi prebivalci Zemlje, ampak določen razred "A" v določeni šoli, lahko določeno mesto, določena država, brez selektivnega opazovanja. Konec koncev je povsem mogoče analizirati celotno paleto predmeta študija. Treba je šteti fantov in deklet tega razreda - to bo razmerje.

nabor vzorcev

Vzorec in populacija

Dejansko vse ni tako težko, kot se sliši. V vsakem predmetu študija obstajata dva sistema: splošni in selektivni agregat. Kaj je to? Vse enote pripadajo generalu. In za vzorec - tiste enote celotnega prebivalstva, ki so bile vzete za vzorec. Če je vse pravilno opravljeno, bo izbrani del zmanjšana razporeditev celotne (splošne) populacije.

Če govorimo o splošni populaciji, lahko ločimo le dve različici: definitivno in nedoločeno splošno prebivalstvo. Odvisno od tega, ali je skupno število enot tega sistema znano ali ne. Če je to specifična populacija, bo vzorec lažji, ker je znano, kolikšen odstotek skupnega števila enot bo vzorec.

Ta trenutek je zelo potreben v raziskavah. Na primer, če je treba raziskati odstotek slabe kakovosti slaščic v določeni tovarni. Predpostavimo, da je populacija že definirana. Znano je, da to podjetje proizvede 1000 slaščic na leto. Če naredite vzorec 100 naključnih slaščičarskih izdelkov iz teh tisoč in jih pošljete na pregled, bo napaka minimalna. Grobo rečeno, je bila študija predmet 10% vseh izdelkov in glede na rezultate lahko glede na napako reprezentativnosti govorimo o slabi kakovosti vseh izdelkov.

In če vzorčite 100 slaščičarskih izdelkov iz negotovega splošnega prebivalstva, kjer so bili, na primer, 1 milijon enot, bodo rezultati vzorca in same študije kritično neveljavni in netočni. Občutite razliko? Zato je varnost prebivalstva v večini primerov izjemno pomembna in močno vpliva na rezultat študije.

Splošno prebivalstvo

Reprezentativnost agregata

Torej, zdaj eno od najpomembnejših vprašanj - kakšen naj bi bil vzorec? To je glavna točka študije. Na tej stopnji je treba izračunati vzorec in izbrati enote od skupnega števila. Agregat je bil pravilno izbran, če v vzorcu ostanejo nekatere značilnosti in značilnosti splošne populacije. To se imenuje reprezentativnost.

Z drugimi besedami, če po izbiri del ohrani enake težnje in lastnosti kot celotna količina preučevanega, potem se takšen sklop imenuje reprezentativen. Vendar ne moremo izbrati vsakega posameznega vzorca iz reprezentativnega niza. Obstajajo tudi takšni predmeti raziskav, katerih vzorčenje preprosto ne more biti reprezentativno. Tu nastopi pojem napake reprezentativnosti. O tem pa se pogovorimo bolj podrobno.

Kako narediti izbor

Da bi povečali reprezentativnost, obstajajo tri osnovna pravila za vzorčenje:

  1. Najbolj edinstveni indikator števila vzorcev je 20%. Statistični vzorec v višini 20% bo skoraj vedno dal rezultat čim bližje realnosti. Hkrati ni treba prenašati na zbrano večino prebivalstva. 20% vzorca je kazalnik, ki so ga razvile številne študije. Dajemo malo več teorije. Večji kot je vzorec, manjša je napaka reprezentativnosti in natančnejši rezultat študije. Bolj kot je vzorec na splošno število enot, bolj natančni in pravilni bodo rezultati. Konec koncev, če boste raziskali celoten sistem, bo rezultat 100%. Toda ni vzorca. To so študije, v katerih se raziskuje celotno polje, vse enote, zato nas ne zanima.
  2. V primeru neustreznosti predelave 20% celotnega prebivalstva je dovoljeno preučiti enote agregata v količini, ki ni manjša od 1001. To je tudi eden od kazalnikov preučevanja matrike predmeta študija, ki se je razvil skozi čas. Seveda pa ne bo dala natančnih rezultatov z velikimi raziskavami, ampak ga bo čim bolj približala možni natančnosti vzorčenja.
  3. V statistiki je veliko formul in tabelaričnih tabel. Glede na predmet študije in merilo vzorca je smiselno izbrati eno ali drugo formulo. Toda ta postavka se uporablja v kompleksnih in večstopenjskih raziskavah.
    Set vzorcev

Napaka (napaka) reprezentativnosti

Glavna značilnost kakovosti izbranega vzorca je pojem »stopnja napake«. Kaj je to? To so določene razlike med kazalniki selektivnega in stalnega opazovanja. V smislu napake je reprezentativnost razdeljena na zanesljive, navadne in približne. Z drugimi besedami, dovoljena so odstopanja do 3%, od 3 do 10% oziroma od 10 do 20%. Čeprav je v statistiki zaželeno, da napaka ne presega 5-6%. V nasprotnem primeru lahko govorimo o pomanjkanju reprezentativnosti vzorca. Za izračun napake reprezentativnosti in načina vpliva na vzorec ali splošno populacijo se upoštevajo številni dejavniki:

  1. Verjetnost, s katero morate dobiti natančen rezultat.
  2. Število enot vzorca. Kot smo že omenili, manj enot bo vzorec, večja bo napaka reprezentativnosti in obratno.
  3. Homogenost obravnavane populacije. Bolj kot je agregat heterogen, večja bo napaka reprezentativnosti. Sposobnost reprezentativnega agregata je odvisna od homogenosti vseh njenih sestavnih enot.
  4. Metoda izbire enot v vzorcu.

V posebej določenih študijah raziskovalec sam izračuna odstotek napake povprečne vrednosti na podlagi programa opazovanja in podatkov iz prejšnjih študij. Praviloma se šteje, da je mejna napaka vzorčenja (napaka reprezentativnosti) znotraj 3-5%.

Izvajanje raziskav

Več ni vedno boljše

Pomembno je tudi, da se spomnimo, da je pri organiziranju selektivnega opazovanja glavna stvar, da se njen obseg doseže na sprejemljivem minimumu. V tem primeru ne bi smeli prizadevati za pretirano zmanjšanje omejitev vzorčne napake, saj bi to lahko povzročilo neupravičeno povečanje količine vzorčnih podatkov in posledično povečanje stroškov vzorčenja.

Hkrati pa ni mogoče pretirano povečati velikosti napake reprezentativnosti. Čeprav se bo v tem primeru obseg vzorca zmanjšal, bo to povzročilo poslabšanje zanesljivosti dobljenih rezultatov.

Kakšna vprašanja se običajno postavljajo raziskovalcu

Vsaka študija, če je izvedena, je za določen namen in za nekatere rezultate. Pri izvedbi selektivne študije se praviloma postavljajo začetna vprašanja:

  1. Določitev potrebnega števila enot vzorca, tj. Koliko enot se bo raziskalo. Poleg tega mora biti za natančno študijo celota reprezentativna.
  2. Izračun napake reprezentativnosti z ugotovljeno stopnjo verjetnosti. Takoj je treba omeniti, da se selektivne raziskave ne dogajajo s stopnjo verjetnosti 100%. Če organ, ki je opravil študijo določenega segmenta, trdi, da so njihovi rezultati točni z verjetnostjo 100%, potem je to napačno. Dolgoročna praksa je že določila odstotek verjetnosti pravilno izvedene selektivne študije. Ta številka je 95,4%.
    Kako vzorec

Metode za izbiro raziskovalnih enot v vzorcu

Ni vsak vzorec reprezentativen. Včasih je isti znak različno izražen kot celota in v svojem delu. Za doseganje zahtev po reprezentativnosti je priporočljivo uporabiti različne tehnike vzorčenja. Poleg tega je uporaba ene ali druge metode odvisna od posebnih okoliščin. Med takšnimi metodami ustvarjanja vzorca so:

  • naključni izbor;
  • mehanska izbira;
  • tipična izbira;
  • serijska izbira.

Naključno vzorčenje je sistem ukrepov, namenjenih naključnemu vzorčenju populacijskih enot, kadar je verjetnost za vstop v vzorec enaka za vse enote splošne populacije. Ta tehnika je primerna le za homogenost in majhno število značilnih lastnosti. V nasprotnem primeru obstaja tveganje, da se nekatere značilnosti ne bodo odražale v vzorcu. Znaki naključnega izbora so osnova vseh drugih metod vzorčenja.

Ko se mehanska izbira enot izvede v določenem intervalu. Če je potrebno oblikovati vzorec določenih kaznivih dejanj, se lahko vsaka peta, deseta ali petnajsta kartica odvzame iz vseh statističnih evidenc evidentiranih kaznivih dejanj, glede na njihovo skupno število in razpoložljive vzorce. Pomanjkljivost te metode je, da je treba pred vzorčenjem celovito prikazati agregatne enote, potem je treba opraviti razvrstitev in šele potem je mogoče izvesti vzorec v določenem intervalu. Ta metoda traja veliko časa, zato se pogosto ne uporablja.

Vzorčenje

Tipična (conska) izbira je vrsta vzorčenja, pri kateri se splošna populacija deli na homogene skupine po določenem atributu. Včasih raziskovalci namesto "skupin" uporabljajo druge izraze: "območja" in "območja". Nato se iz vsake skupine v naključnem vrstnem redu izbere določeno število enot, ki je sorazmerno s težo skupine v celotni populaciji. Tipična izbira se pogosto izvaja v več fazah.

Serijska izbira je metoda, pri kateri se izbor enot izvede v skupinah (serijah) in vse enote izbrane skupine (serije) so predmet pregleda. Prednost te metode je v tem, da je včasih težje izbrati posamezne enote kot serija, na primer pri proučevanju osebe, ki služi kazen. Na izbranih območjih, območjih se uporablja študija vseh enot brez izjeme, na primer študija vseh oseb, ki so v določeni instituciji prestajale kazen.