Koncept korelacijsko-regresijske analize pomeni vrsto operacij, in sicer določitev bližine razmerja, njegovo smer in vzpostavitev enačbe, ki opisuje obliko razmerja. Ta vrsta analize vsebuje dve ločeni komponenti: korelacijsko in regresijsko analizo.
Korelacijska in regresijska analiza je eden od načinov reševanja problemov in iskanja informacij. Omogoča vam določitev skupnega vpliva številnih med seboj povezanih in istočasno delujočih znakov ter ločenega vpliva vsakega atributa na ekonomski pojav (proces). Zahvaljujoč tej vrsti analize je mogoče oceniti stopnjo medsebojne povezanosti med več značilnostmi, karakteristikami in dobljenim rezultatom ter modelirati regresijsko enačbo, ki opisuje obliko medsebojne povezanosti.
Korelacijska in regresijska analiza ekonomskih procesov je razdeljena na več faz:
Homogenost statističnih informacij je mogoče določiti z uporabo dveh tehnik. Za začetek je treba določiti in zavreči vrednost dejavnikov, ki se močno razlikujejo od vseh količin. Nato se izvede statistična študija homogenosti s preverjanjem neodvisnosti vzorca in njegove pripadnosti posameznemu nizu z normalno porazdelitvijo.
Regresijski model je določen z metodo najmanjših kvadratov, ki zagotavlja najboljše približevanje ocene rezultatov, določene z regresijsko enačbo, njenim faktorjem.
Najpomembnejši dejavniki, ki določajo značilnosti modela, so:
Glavne naloge korelacijsko-regresijske analize so identifikacija dejavnikov, ki pomembno vplivajo na ekonomski izid pojava ali procesa, ter uporaba pridobljenih informacij za izboljšanje načrtovanja gospodarskega procesa ali fenomena.
Vsi proizvodni procesi so tesno povezani. Ta odnos je stohastičen (rezultat je odvisen od mnogih dejavnikov) in funkcionalen (rezultat se spremeni za enak znesek kot faktor). Stohastična odvisnost je pogosto korelativna v naravi, to pomeni, da vrednost faktorja istočasno ustreza več vrednostim rezultata, ki imajo popolnoma različne smeri.
Korelacijski odnos ima lahko eno ali več faktorskih znakov, ima pozitivno ali negativno usmerjenost, je ravna ali ukrivljena (odvisno od izraza). Možno je ugotoviti, katera vrsta razmerja je povezana z uporabo korelacijske mreže. Zgrajena je znotraj pravokotnih osi koordinat.
Frekvence, ki so postavljene blizu diagonal, kažejo na visoko korelacijo znakov. Frekvence, ki so postavljene blizu diagonale, ki poteka skozi spodnji levi in desni zgornji kot, označujeta pozitivno smer, medtem ko tisti, ki gredo skozi zgornji levi in desni spodnji vogal, kažejo nasprotno. Frekvence, ki se nahajajo v obliki loka, kažejo na krivocrtno razmerje in naključno razpršene - o odsotnosti razmerja.
Osnovna metoda korelacijske analize je linearna. koeficient korelacije. Lahko sprejme vrednosti od -1 do +1. Bližje kot je vrednost 1, močnejša je povezava med faktorjem in rezultatom. Pozitivne vrednosti kažejo na neposredno razmerje, negativne vrednosti pa na obratno. Koeficient prevzame vrednost "nič", če med znaki ni povezave.
Številne metode omogočajo oceno razmerja pojavov brez kvantitativnega izražanja lastnosti in s tem tudi porazdelitvenih parametrov. Imenujejo se neparametrični. Med njimi so:
V statistiki in ekonomiji se uporabljajo številne vrste in predmeti analize. Statistične metode analize so usmerjene v preučevanje ponavljajočih se procesov, da bi dolgoročno napovedali obnašanje gospodarskih pojavov.
Na primer, za analizo družbeno-ekonomskega razvoja ozemlja je treba preučiti kazalnike življenjskega standarda prebivalstva. Korelacijska in regresijska analiza v statistiki vam omogoča ustvarjanje regresijska enačba in opredeliti korelacijske koeficiente, ki prikazujejo razmerje med življenjskim standardom in razvojem ozemlja. Življenjski standard je določen z dohodkom, glavni vir dohodka pa je plača. V tem primeru je faktor raven plač, rezultat pa je prebivalstvo z nizkimi dohodki.
Za lažje izračune lahko izvedete korelacijsko analizo v Excelu. V tem programu so na voljo številna orodja za lažje izračune. Med njimi je funkcija "Korelacija", ki omogoča oblikovanje matrike koeficientov in različnih parametrov. Prikazana je v obliki tabele. Korelacijski koeficienti se uporabljajo kot stolpci in vrstice. Na podlagi podatkov iz tabele bo treba opraviti korelacijsko analizo. Primer zaporedja analize:
Rezultat je korelacijska matrika, ki se nahaja v izhodnem območju. Znotraj bo prikazan linearni korelacijski koeficient, ki ocenjuje tesnost in obliko razmerja med kazalniki.
V MS Excelu se funkcija »Korelacija« uporablja za korelacijsko in regresijsko analizo. Primer izračuna koeficientov bomo obravnavali pozneje. Ta funkcija tvori matriko s koeficienti bližine razmerja med različnimi parametri. Zato se oblikuje kvadratna tabela, ki vsebuje korelacijske koeficiente na presečišču vrstic in stolpcev.
Za analizo bo treba izvesti številne posebne ukrepe:
Kot rezultat izračunov bo prikazana kvadratna tabela s korelacijskimi koeficienti.
Za izračun linearna enačba Regresije, ki opisujejo razmerje med dejavniki in rezultatom, se v MS Excelu uporablja statistična funkcija „Linean“. Za njegovo uporabo morate:
Na vrhu predhodno izbranega območja se bo pojavil začetni element tabele. Da bi razkrili vse podatke, morate pritisniti tipko F2 in hkrati kombinacijo tipk Ctrl + Shift + Enter.
Posledično bodo informacije o regresiji prikazane kot tabela dveh stolpcev in petih vrstic:
Stolpec 1 | Stolpec 2 | |
Vrstica 1 | Koeficient b | Koeficient a |
Vrstica 2 | Standardni odklon b | Standardni odklon a |
Vrstica 3 | Koeficient določljivosti | Standardni odklon y |
Vrstica 4 | F-statistika | Število stopenj svobode |
Vrstica 5 | Znesek regresije kvadratov | Preostala vsota kvadratov |
Rezultate je treba nadomestiti z linearno regresijsko enačbo, ki izgleda takole: y = a + bx. Vrednost iz celice na presečišču vrstice 1 in stolpca 2 se nadomesti s koeficientom a. Vrednost na presečišču vrstice 1 in stolpca 1 se uporabi kot koeficient b.
Koeficient določanja pokaže, kateri del rezultata je pojasnjen s pomočjo preučevanega faktorja. Preostali del rezultatov določajo faktorji, ki se v linearnem modelu ne upoštevajo.