Dowiedz się, czym jest prosta liniowa regresja i jak to działa

Modele regresji liniowej są używane do pokazania lub przewidywania zależności między dwiema zmiennymi lub czynnikami. Czynnik, który jest przewidywany (czynnik, który równanie rozwiązuje dla ) nazywa się zmienna zależna. Czynniki, które są używane do przewidywania wartości zmiennej zależnej, są nazywane zmiennymi niezależnymi.

Dobre dane nie zawsze opowiadają całą historię. Analiza regresji jest powszechnie stosowana w badaniach, ponieważ stwierdza, że istnieje korelacja między zmiennymi. Ale korelacja nie jest taka sama jak przyczynowość. Nawet linia w prostej liniowej regresji, która dobrze pasuje do punktów danych, nie może powiedzieć czegoś ostatecznego o związku przyczynowo-skutkowym.

W prostej regresji liniowej każda obserwacja składa się z dwóch wartości. Jedna wartość odnosi się do zmiennej zależnej, a jedna do zmiennej niezależnej.

Prosta liniowa analiza regresji Najprostsza forma analizy regresji wykorzystuje zmienną zależną i jedną zmienną niezależną. W tym prostym modelu linia prosta przybliża związek między zmienną zależną i zmienną niezależną.
Analiza wielokrotnej regresji Gdy w analizie regresji stosuje się dwie lub więcej zmiennych niezależnych, model nie jest już prostym modelem liniowym.

Prosty liniowy model regresji

Prosty model regresji liniowej jest reprezentowany w następujący sposób: y = ( β 0 + β 1 + Ε

Według konwencji matematycznej wyznaczono dwa czynniki, które są zaangażowane w prostą liniową analizę regresji x i y . Równanie, które opisuje, w jaki sposób y odnosi się do x jest znany jako Model regresji. Model regresji liniowej zawiera również termin błędu, który jest reprezentowany przez Ε lub grecka litera epsilon. Termin błędu jest używany do uwzględnienia zmienności w y nie można tego wyjaśnić liniową zależnością między x i y . Są tam również parametry reprezentujące badaną populację.

Te parametry modelu, które są reprezentowane przez ( β 0+ β 1 x ).

Prosty liniowy model regresji

Proste równanie regresji liniowej jest przedstawione w następujący sposób: Ε ( y ) = ( β 0 + β 1 x ).

Proste równanie regresji liniowej wykreślono jako linię prostą.

( β 0 oznacza y przecięcie linii regresji.

β 1 to nachylenie.

Ε ( y ) jest średnią lub oczekiwaną wartością y dla danej wartości x .

Linia regresji może wykazywać dodatnią liniową zależność, ujemną liniową zależność lub brak związku. Jeśli wykreślona linia w prostej regresji liniowej jest płaska (bez nachylenia), nie ma związku między tymi dwiema zmiennymi. Jeśli linia regresji nachodzi w górę z dolnym końcem linii na y przecięcie (oś) wykresu i górny koniec linii rozciągający się w górę do pola wykresu, z dala od x przecięcie (oś) istnieje dodatnia liniowa zależność. Jeśli linia regresji opada w dół z górnym końcem linii na y punkt przecięcia (oś) wykresu, a dolny koniec linii przechodzi w dół do pola wykresu, w kierunku x przecięcie (oś) istnieje negatywny związek liniowy.

Estymowane równanie regresji liniowej

Jeżeli parametry populacji były znane, proste równanie regresji liniowej (pokazane poniżej) mogłyby zostać wykorzystane do obliczenia średniej wartości y dla znanej wartości x .

Ε ( y ) = ( β 0 + β 1 x ).

Jednak w praktyce wartości parametrów nie są znane, więc muszą zostać oszacowane przy użyciu danych z próby populacji. Parametry populacji są szacowane za pomocą statystyk próbek. Przykładowe statystyki są reprezentowane przez b 0 + b 1. Po zastąpieniu statystyk próby parametrami populacyjnymi powstaje estymowane równanie regresji.

Szacowane równanie regresji przedstawiono poniżej.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) jest wymawiane y kapelusz .

Wykres estymowanego prostego równania regresji nazywany jest szacowaną linią regresji.

The b 0 oznacza punkt przecięcia z osią y.

The b 1 to nachylenie.

The ŷ ) jest szacowaną wartością y dla danej wartości x .

Ważna uwaga: Analiza regresji nie służy do interpretacji zależności przyczynowo-skutkowych pomiędzy zmiennymi. Analiza regresji może jednak wskazywać, w jaki sposób zmienne są powiązane lub w jakim stopniu zmienne są ze sobą powiązane. Czyniąc tak, analiza regresji ma tendencję do tworzenia istotnych relacji, które gwarantują, że badacz przyjrzy się uważniej.

Znany również jako: regresja dwuwymiarowa, analiza regresji

Przykłady:The Metoda najmniejszych kwadratów to statystyczna procedura wykorzystywania danych przykładowych w celu znalezienia wartości szacowanego równania regresji. Metoda najmniejszych kwadratów została zaproponowana przez Carla Friedricha Gaussa, który urodził się w 1777 roku i zmarł w 1855 roku. Metoda Najmniejszych Kwadratów jest nadal szeroko stosowana.

Źródła:

Anderson, D. R., Sweeney, D. J. i Williams, T. A. (2003). Essentials of Statistics for Business and Economics (wyd. 3) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Objaśnienie: Analiza regresji. Wiadomości MIT.

McIntyre, L. (1994). Używanie danych papierosowych do wprowadzenia do wielokrotnej regresji. Journal of Statistics Education, 2 (1).

Mendenhall, W. i Sincich, T. (1992). Statystyka dla Engineering and the Sciences (3rd ed.), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statystyka zastosowań, jesień 2006, sekcja 14, Prosta regresja liniowa.(Massachusetts Institute of Technology: MIT OpenCourseWare)

Dowiedz się, czym jest prosta liniowa regresja i jak to działa

Prosty liniowy model regresji

Prosty liniowy model regresji

Estymowane równanie regresji liniowej

Dowiedz się, czym jest wariancja zagospodarowania przestrzennego i jak ją zdobyć

Dowiedz się, czym jest węgiel, jak się go tworzy i gdzie się znajduje

Dowiedz się, czym jest kapitał obrotowy i jaki jest jego wpływ na biznes

Dowiedz się, czym jest prosta liniowa regresja i jak to działa

Spisu treści:

Wideo: Chemia - Kinetyka reakcji chemicznych, energia aktywacji i kataliza 2024

Prosty liniowy model regresji

Prosty liniowy model regresji

Estymowane równanie regresji liniowej

Wybór redaktorów