Korelacijska in regresijska analiza: uporaba, glavne faze

24. 3. 2019

Koncept korelacijsko-regresijske analize pomeni vrsto operacij, in sicer določitev bližine razmerja, njegovo smer in vzpostavitev enačbe, ki opisuje obliko razmerja. Ta vrsta analize vsebuje dve ločeni komponenti: korelacijsko in regresijsko analizo.

Vrednost in glavne faze procesa korelacijske in regresijske analize gospodarskih pojavov

Korelacijska in regresijska analiza je eden od načinov reševanja problemov in iskanja informacij. Omogoča vam določitev skupnega vpliva številnih med seboj povezanih in istočasno delujočih znakov ter ločenega vpliva vsakega atributa na ekonomski pojav (proces). Zahvaljujoč tej vrsti analize je mogoče oceniti stopnjo medsebojne povezanosti med več značilnostmi, karakteristikami in dobljenim rezultatom ter modelirati regresijsko enačbo, ki opisuje obliko medsebojne povezanosti. korelacijsko regresijsko analizo

Faze analize

Korelacijska in regresijska analiza ekonomskih procesov je razdeljena na več faz:

  1. Opredelitev argumentov in predhodna obdelava pogojnih informacij.
  2. Opredelitev bližine in oblike medsebojne povezanosti več znakov.
  3. Modeliranje predstavljenega ekonomskega procesa in analiza nastalega modela.
  4. Uporaba končnih rezultatov za izboljšanje načrtovanja in upravljanja modela.

Homogenost statističnih informacij je mogoče določiti z uporabo dveh tehnik. Za začetek je treba določiti in zavreči vrednost dejavnikov, ki se močno razlikujejo od vseh količin. Nato se izvede statistična študija homogenosti s preverjanjem neodvisnosti vzorca in njegove pripadnosti posameznemu nizu z normalno porazdelitvijo. primer korelacijske regresijske analize

Regresijski model je določen z metodo najmanjših kvadratov, ki zagotavlja najboljše približevanje ocene rezultatov, določene z regresijsko enačbo, njenim faktorjem.

Korelacijska in regresijska analiza: parametri ustvarjenega modela

Najpomembnejši dejavniki, ki določajo značilnosti modela, so:

  • Koeficienti parne korelacije (prikazujejo moč razmerja med dvema dejavnikoma).
  • Koeficient večkratne korelacije (določa razmerje med rezultatom in dejavniki).
  • Koeficienti zasebne določitve (prikaz učinka variacije argumenta na spremembo želene lastnosti).
  • Koeficient večkratnega določanja (prikazuje delež vseh argumentov o spremembi želene značilnosti).
  • Zasebno koeficienti elastičnosti (označite vpliv dejavnikov na rezultat, izražen v enem merilu v odstotkih).

Metoda korelacijske regresijske analize

Namen analize

Glavne naloge korelacijsko-regresijske analize so identifikacija dejavnikov, ki pomembno vplivajo na ekonomski izid pojava ali procesa, ter uporaba pridobljenih informacij za izboljšanje načrtovanja gospodarskega procesa ali fenomena.

Metode parametrične analize

Vsi proizvodni procesi so tesno povezani. Ta odnos je stohastičen (rezultat je odvisen od mnogih dejavnikov) in funkcionalen (rezultat se spremeni za enak znesek kot faktor). Stohastična odvisnost je pogosto korelativna v naravi, to pomeni, da vrednost faktorja istočasno ustreza več vrednostim rezultata, ki imajo popolnoma različne smeri.

problemska korelacijska regresijska analiza

Korelacijska mreža

Korelacijski odnos ima lahko eno ali več faktorskih znakov, ima pozitivno ali negativno usmerjenost, je ravna ali ukrivljena (odvisno od izraza). Možno je ugotoviti, katera vrsta razmerja je povezana z uporabo korelacijske mreže. Zgrajena je znotraj pravokotnih osi koordinat.

Frekvence, ki so postavljene blizu diagonal, kažejo na visoko korelacijo znakov. Frekvence, ki so postavljene blizu diagonale, ki poteka skozi spodnji levi in ​​desni zgornji kot, označujeta pozitivno smer, medtem ko tisti, ki gredo skozi zgornji levi in ​​desni spodnji vogal, kažejo nasprotno. Frekvence, ki se nahajajo v obliki loka, kažejo na krivocrtno razmerje in naključno razpršene - o odsotnosti razmerja.

Osnovna metoda korelacijske analize je linearna. koeficient korelacije. Lahko sprejme vrednosti od -1 do +1. Bližje kot je vrednost 1, močnejša je povezava med faktorjem in rezultatom. Pozitivne vrednosti kažejo na neposredno razmerje, negativne vrednosti pa na obratno. Koeficient prevzame vrednost "nič", če med znaki ni povezave.

korelacijsko regresijsko analizo v statistiki

Neparametrične metode analize

Številne metode omogočajo oceno razmerja pojavov brez kvantitativnega izražanja lastnosti in s tem tudi porazdelitvenih parametrov. Imenujejo se neparametrični. Med njimi so:

  • Kendallov koeficient korelacije (določa razmerje med kvantitativnimi in kvalitativnimi vrednostmi kazalnikov, če so predmet razvrstitve).
  • Spearmanov koeficient korelacije ranga (dodeli uvrstitve vsakemu argumentu in rezultatu, na podlagi katerega se določijo razlike in izračuna kazalnik).
  • Korelacijski koeficient Fechnerjevih znakov (določa število naključij in neskladij med odstopanji argumentov in rezultatom od njihove srednje vrednosti).
  • Druga pomembna metoda korelacijske in regresijske analize je metoda najmanjših kvadratov, ki omogoča določitev analitičnega izraza razmerja med nastalo lastnostjo in njenim faktorjem. Sestoji iz izgradnje sistema enačb in določanja parametrov teh enačb.

pojem korelacijsko regresijske analize

Korelacijska in regresijska analiza: primer

V statistiki in ekonomiji se uporabljajo številne vrste in predmeti analize. Statistične metode analize so usmerjene v preučevanje ponavljajočih se procesov, da bi dolgoročno napovedali obnašanje gospodarskih pojavov.

Na primer, za analizo družbeno-ekonomskega razvoja ozemlja je treba preučiti kazalnike življenjskega standarda prebivalstva. Korelacijska in regresijska analiza v statistiki vam omogoča ustvarjanje regresijska enačba in opredeliti korelacijske koeficiente, ki prikazujejo razmerje med življenjskim standardom in razvojem ozemlja. Življenjski standard je določen z dohodkom, glavni vir dohodka pa je plača. V tem primeru je faktor raven plač, rezultat pa je prebivalstvo z nizkimi dohodki.

Programska oprema za analizo

Za lažje izračune lahko izvedete korelacijsko analizo v Excelu. V tem programu so na voljo številna orodja za lažje izračune. Med njimi je funkcija "Korelacija", ki omogoča oblikovanje matrike koeficientov in različnih parametrov. Prikazana je v obliki tabele. Korelacijski koeficienti se uporabljajo kot stolpci in vrstice. Na podlagi podatkov iz tabele bo treba opraviti korelacijsko analizo. Primer zaporedja analize:

  1. V ukazu “Service” izberite “Data analysis”.
  2. Kot orodje za analizo izberite element "Korelacija".
  3. V oknu, ki se pojavi, v vrstici »Vhodni interval« določite obseg podatkov, ki se analizirajo, v vrstici »Izhodni parametri« izberite postavko »Združevanje«, vnesite izhodni obseg rezultatov in kliknite »V redu«.

Rezultat je korelacijska matrika, ki se nahaja v izhodnem območju. Znotraj bo prikazan linearni korelacijski koeficient, ki ocenjuje tesnost in obliko razmerja med kazalniki.

metoda korelacijske analize

Analiza v Excelu

V MS Excelu se funkcija »Korelacija« uporablja za korelacijsko in regresijsko analizo. Primer izračuna koeficientov bomo obravnavali pozneje. Ta funkcija tvori matriko s koeficienti bližine razmerja med različnimi parametri. Zato se oblikuje kvadratna tabela, ki vsebuje korelacijske koeficiente na presečišču vrstic in stolpcev.

Za analizo bo treba izvesti številne posebne ukrepe:

  1. Odprite ukaz "Service" in v njem postavko "Data Analysis".
  2. V oknu, ki se prikaže, v seznamu »Orodja za analizo« podajte postavko »Korelacija«.
  3. V oknu »Korelacija«, ki se odpre, podajte vhodni interval kot obseg celic, ki vsebujejo analizirane informacije (mora biti vsaj dva stolpca), označite možnost »Združevanje« in v polju Izhodni parametri izberite zgornjo levo celico, kjer je korelacijska matrika.
  4. Kliknite gumb V redu.

Kot rezultat izračunov bo prikazana kvadratna tabela s korelacijskimi koeficienti.

Regresijska analiza v MS Excelu

Za izračun linearna enačba Regresije, ki opisujejo razmerje med dejavniki in rezultatom, se v MS Excelu uporablja statistična funkcija „Linean“. Za njegovo uporabo morate:

  1. Izberite prazno območje, v katerem bodo prikazani rezultati analize.
  2. Odprite "Master of Functions", v njej najdete kategorijo "Statistical" in v njej funkcijo "Lineine" in kliknite OK.
  3. V polje "Znane vrednosti y " vnesite obseg analiziranih rezultatov v polje "Znane x vrednosti" - obseg analiziranih dejavnikov.
  4. Polje »Konstanta« označuje prisotnost prostega termina v enačbi (1 - da, 0 - ne), v polju »Statistika« pa je treba prikazati dodatne informacije (1 - prikažejo se dodatne informacije, prikaže se 0 - samo ocene parametrov). Privzeto lahko določite v obeh poljih 1.
  5. Kliknite V redu.

Na vrhu predhodno izbranega območja se bo pojavil začetni element tabele. Da bi razkrili vse podatke, morate pritisniti tipko F2 in hkrati kombinacijo tipk Ctrl + Shift + Enter.

Posledično bodo informacije o regresiji prikazane kot tabela dveh stolpcev in petih vrstic:

Stolpec 1

Stolpec 2

Vrstica 1

Koeficient b

Koeficient a

Vrstica 2

Standardni odklon b

Standardni odklon a

Vrstica 3

Koeficient določljivosti

Standardni odklon y

Vrstica 4

F-statistika

Število stopenj svobode

Vrstica 5

Znesek regresije kvadratov

Preostala vsota kvadratov

Rezultate je treba nadomestiti z linearno regresijsko enačbo, ki izgleda takole: y = a + bx. Vrednost iz celice na presečišču vrstice 1 in stolpca 2 se nadomesti s koeficientom a. Vrednost na presečišču vrstice 1 in stolpca 1 se uporabi kot koeficient b.

Koeficient določanja pokaže, kateri del rezultata je pojasnjen s pomočjo preučevanega faktorja. Preostali del rezultatov določajo faktorji, ki se v linearnem modelu ne upoštevajo.