Regresijska enačba Večkratna regresijska enačba

11. 6. 2019

Med študijem se učenci pogosto srečujejo z različnimi enačbami. Eden od njih - regresijska enačba - je upoštevan v tem članku. Ta vrsta enačbe se uporablja posebej za opis značilnosti razmerja med matematičnimi parametri. Ta vrsta enakosti se uporablja v statistiki in ekonometriji.

Opredelitev regresije

V matematiki se regresija nanaša na določeno vrednost, ki opisuje odvisnost povprečne vrednosti celote podatkov od vrednosti druge vrednosti. Regresijska enačba prikazuje povprečno vrednost drugega atributa kot funkcijo določenega atributa. Regresijska funkcija ima obliko preproste enačbe y = x, v kateri je y odvisna spremenljivka, x pa je neodvisna (sign-factor). V resnici je regresija izražena kot y = f (x).

Kakšne so vrste razmerij med spremenljivkami?

Na splošno izstopata dve nasprotni vrsti medsebojnih povezav: korelacija in regresija.

Za prvo je značilna enakost pogojnih spremenljivk. V tem primeru ni znano, katera spremenljivka je odvisna od druge.

regresijska enačba

Če med spremenljivkami ni enakosti in je v pogojih navedeno, katera spremenljivka pojasnjuje in je odvisna, lahko govorimo o prisotnosti druge vrste povezave. Da bi zgradili linearno regresijsko enačbo, bo treba ugotoviti, kakšno vrsto razmerja opazimo.

Vrste regresij

Do danes obstaja 7 različnih vrst regresije: hiperbolični, linearni, mnogostranski, nelinearni, parni, inverzni, logaritmično linearni.

linearna regresijska enačba

Hiperbolična, linearna in logaritemska

Linearna enačba Regresije se v statistiki uporabljajo za jasno razlago parametrov enačbe. Izgleda, da je y = c + t * x + e. Hiperbolična enačba ima obliko običajnega hiperbola: y = c + t / x + E. Logaritmično linearna enačba izraža razmerje z logaritmično funkcijo: V y = In c + t * In x + In E.

Množinski in nelinearni

Dva bolj kompleksna tipa regresije sta večkratna in nelinearna. Enačba večkratne regresije je izražena s funkcijo y = f (x 1 , x 2 ... x c ) + E. V tem primeru je y odvisna spremenljivka, x pa je pojasnjevalna spremenljivka. Spremenljivka E je stohastična, vključuje pa tudi vpliv drugih faktorjev v enačbi. Nelinearna regresijska enačba je nekoliko protislovna. Po eni strani glede na upoštevane kazalnike ni linearna, po drugi strani pa je v vlogi ocenjevanja kazalnikov linearna.

večkratna regresijska enačba

Povratne in parne vrste regresij

Inverzna je vrsta funkcije, ki jo je treba pretvoriti v linearno obliko. V najbolj tradicionalnih aplikacijskih programih ima obliko funkcije y = 1 / s + t * x + E. Parna regresijska enačba prikazuje razmerje med podatki kot funkcijo y = f (x) + E. Tako kot v drugih enačbah je y odvisno od x, E pa je stohastični parameter.

parna regresijska enačba

Koncept korelacije

To je kazalnik, ki dokazuje obstoj odnosa med dvema pojavoma ali procesoma. Moč odnosa je izražena kot koeficient korelacije. Njegova vrednost niha znotraj intervala [-1; +1]. Negativni kazalnik kaže na prisotnost povratnih informacij, pozitivna pa na neposredno. Če ima koeficient vrednost 0, potem ni nobene povezave. Bližje kot je vrednost 1, močnejša je povezava med parametri, bližje 0, šibkejša.

Metode

Korelacijske parametrske metode lahko ocenijo bližino razmerja. Uporabljajo se na podlagi ocene porazdelitve za proučevanje parametrov, ki spoštujejo zakon normalne porazdelitve.

Parametri linearne regresijske enačbe so potrebni za identifikacijo vrste odvisnosti, funkcije regresijske enačbe in vrednotenje kazalnikov izbrane formule za medsebojno povezavo. Korelacijsko polje se uporablja kot metoda identifikacije komunikacije. V ta namen morajo biti grafično prikazani vsi obstoječi podatki. V pravokotnem dvodimenzionalnem koordinatnem sistemu je treba uporabiti vse znane podatke. To oblikuje korelacijsko polje. Vrednost opisnega faktorja je označena vzdolž osi apscise, medtem ko so vrednosti odvisnega faktorja označene vzdolž osi ordinate. Če med parametri obstaja funkcionalno razmerje, so ti razvrščeni v obliki črte.

Če je korelacijski koeficient takšnih podatkov manjši od 30%, lahko govorimo o skoraj popolni odsotnosti komunikacije. Če je med 30% in 70%, potem to kaže na prisotnost srednje srednje tesnosti. 100% kazalnik - dokaz funkcionalne komunikacije.

Nelinearno regresijsko enačbo in linearno enačbo moramo dopolniti s korelacijskim indeksom (R).

Korelacija več regresije

Koeficient determinacije je kazalec kvadrata večkratne korelacije. Govori o bližini odnosa predstavljenega niza kazalnikov s testnim znakom. Lahko govori tudi o naravi vpliva parametrov na rezultat. Z uporabo tega kazalnika ocenjujemo enačbo za večkratno regresijo.

Za izračun indeksa večkratne korelacije je treba izračunati indeks.

enakovredna linearna regresijska enačba

Metoda najmanjših kvadratov

Ta metoda je metoda za ocenjevanje regresijskih faktorjev. Njegovo bistvo je v minimiziranju vsote odstopanj kvadrata, dobljenih zaradi odvisnosti faktorja od funkcije.

S to metodo lahko ocenimo enačbo za dvojno linearno regresijo. Ta vrsta enačb se uporablja v primeru zaznavanja med kazalniki linearnega razmerja v parih.

Parametri enačb

Vsak parameter funkcije linearne regresije ima poseben pomen. Parna linearna regresijska enačba vsebuje dva parametra: s in m. Parameter t prikazuje povprečno spremembo končnega indikatorja funkcije y, ob upoštevanju zmanjšanja (povečanja) spremenljivke x za eno konvencionalno enoto. Če je spremenljivka x nič, potem je funkcija enaka parametru c. Če spremenljivka x ni nič, potem faktor c nima ekonomskega smisla. Edini vpliv na funkcijo ima znak pred faktorjem c. Če je minus, potem lahko rečemo o počasni spremembi rezultata v primerjavi s faktorjem. Če je plus, potem to pomeni pospešeno spremembo rezultata.

parametri linearne regresijske enačbe

Vsak parameter, ki spremeni vrednost regresijske enačbe, se lahko izrazi z enačbo. Na primer, faktor c ima obliko c = y - mx.

Združeni podatki

Obstajajo taki pogoji problema, pri katerem so vse informacije razvrščene na podlagi x, hkrati pa so za določeno skupino prikazane ustrezne srednje vrednosti odvisnega indikatorja. V tem primeru povprečne vrednosti opisujejo, kako se indeks, odvisno od x, spremeni. Tako združene informacije pomagajo najti regresijsko enačbo. Uporablja se kot analiza razmerja. Vendar ima ta metoda svoje pomanjkljivosti. Na žalost so povprečni kazalci pogosto podvrženi zunanjim nihanjem. Ta nihanja niso odraz vzorca razmerja, temveč le prikrivajo njegov »hrup«. Povprečja kažejo, da so vzorci razmerij veliko slabši od linearne regresijske enačbe. Lahko pa jih uporabimo kot osnovo za iskanje enačbe. Če pomnožite moč posamezne populacije z ustreznim povprečjem, lahko dobite količino y znotraj skupine. Nato morate poravnati vse prejete zneske in poiskati končni kazalnik. Nekoliko težje je izračunati vsoto xy. V tem primeru, če so intervali majhni, lahko indikator x za vse enote (znotraj skupine) pogojno vzamemo enako. Potrebno ga je pomnožiti z vsoto y, da bi ugotovili vsoto produktov x po y. Poleg tega se vse količine seštejejo in dobimo skupno količino xy.

Večkratna paralna regresijska enačba: ocena pomembnosti komunikacije

Kot smo že omenili, ima multipla regresija funkcijo oblike y = f (x 1 , x 2 , ..., x m ) + E. Najpogosteje se taka enačba uporablja za reševanje problema ponudbe in povpraševanja po proizvodu, obrestnih prihodkov od odkupljenih delnic, preučevanja vzrokov in vrste funkcije proizvodnih stroškov. Prav tako se aktivno uporablja v najrazličnejših makroekonomskih študijah in izračunih, toda na mikroekonomski ravni se takšna enačba uporablja nekoliko manj.

Glavna naloga večkratne regresije je zgraditi podatkovni model, ki vsebuje ogromen informacije za določitev vpliva vsakega od dejavnikov posebej in na njihovo celotno skupnost na kazalnik, ki ga je treba modelirati, in njegove koeficiente. Regresijska enačba lahko prevzame veliko različnih vrednosti. Hkrati se za vrednotenje medsebojnih povezav pogosto uporabljata dve vrsti funkcij: linearno in nelinearno.

poiščite regresijsko enačbo

Linearna funkcija je prikazana v obliki naslednjega razmerja: y = a 0 + a 1 x 1 + a 2 x 2 , + ... + a m x m . Hkrati se šteje, da so a2, a m »čisti« regresijski koeficienti. Potrebne so za karakterizacijo povprečne spremembe parametra y s spremembo (zmanjšanjem ali povečanjem) vsakega ustreznega parametra x za eno enoto, s pogojem stabilne vrednosti drugih kazalnikov.

Nelinearne enačbe, na primer, imajo obliko močnostne funkcije y = ax 1 b1 x 2 b2 ... x m bm . V tem primeru se kličejo indikatorji b 1 , b 2 ..... b m koeficienti elastičnosti prikazujejo, kako se spremeni rezultat (v kolikšni meri%) s povečanjem (zmanjšanjem) ustreznega kazalnika x za 1% in s stabilnim kazalnikom preostalih dejavnikov.

Katere dejavnike je treba upoštevati pri gradnji večkratne regresije

Da bi lahko pravilno konstruirali večkratno regresijo, je treba ugotoviti, kateri dejavniki je treba posvetiti posebno pozornost.

Potrebno je imeti določeno razumevanje narave odnosa med ekonomskimi dejavniki in modeliranim. Dejavniki, ki jih je treba vključiti, morajo izpolnjevati naslednja merila:

  • Treba bi bilo količinsko opredeliti. Da bi lahko uporabili faktor, ki opisuje kakovost objekta, mora biti v vsakem primeru podan kvantitativna oblika.
  • Ne sme biti medsebojne povezanosti dejavnikov ali funkcionalnega odnosa. Takšna dejanja najpogosteje vodijo k nepopravljivim posledicam - sistem navadnih enačb postane brezpogojno, kar pomeni njegovo nezanesljivost in nejasnost ocen.
  • V primeru obstoja velikega korelacijskega kazalnika ni mogoče določiti izoliranega vpliva dejavnikov na končni rezultat kazalnika, zato koeficienti postanejo neinterpretirani.

Metode gradnje

Obstaja veliko metod in metod, ki pojasnjujejo, kako izbrati faktorje za enačbo. Vse te metode pa temeljijo na izbiri koeficientov z uporabo korelacijskega indeksa. Med njimi so:

  • Metoda odprave.
  • Metoda vključevanja.
  • Regresijska analiza po korakih.

Prva metoda vključuje odpravo vseh koeficientov iz kumulativnega niza. Druga metoda vključuje uvedbo številnih dodatnih dejavnikov. In tretji je izločitev dejavnikov, ki so bili prej uporabljeni za enačbo. Vsaka od teh metod ima pravico do obstoja. Imajo svoje prednosti in slabosti, vendar lahko rešijo vprašanje odpravljanja nepotrebnih kazalnikov na svoj način. Praviloma so rezultati vsake posamezne metode precej blizu.

Metode za multivariatno analizo

Takšne metode za določanje dejavnikov temeljijo na upoštevanju posameznih kombinacij medsebojno povezanih značilnosti. Vključujejo diskriminantno analizo, prepoznavanje obrazov, način glavnih komponent in analizo grozdov. Poleg tega obstaja tudi faktorsko analizo vendar se je pojavil zaradi razvoja komponente metode. Vsi se uporabljajo v določenih okoliščinah pod določenimi pogoji in dejavniki.