Spisu treści:
Wideo: Chemia - Kinetyka reakcji chemicznych, energia aktywacji i kataliza 2024
Modele regresji liniowej są używane do pokazania lub przewidywania zależności między dwiema zmiennymi lub czynnikami. Czynnik, który jest przewidywany (czynnik, który równanie rozwiązuje dla ) nazywa się zmienna zależna. Czynniki, które są używane do przewidywania wartości zmiennej zależnej, są nazywane zmiennymi niezależnymi.
Dobre dane nie zawsze opowiadają całą historię. Analiza regresji jest powszechnie stosowana w badaniach, ponieważ stwierdza, że istnieje korelacja między zmiennymi. Ale korelacja nie jest taka sama jak przyczynowość. Nawet linia w prostej liniowej regresji, która dobrze pasuje do punktów danych, nie może powiedzieć czegoś ostatecznego o związku przyczynowo-skutkowym.
W prostej regresji liniowej każda obserwacja składa się z dwóch wartości. Jedna wartość odnosi się do zmiennej zależnej, a jedna do zmiennej niezależnej.
- Prosta liniowa analiza regresji Najprostsza forma analizy regresji wykorzystuje zmienną zależną i jedną zmienną niezależną. W tym prostym modelu linia prosta przybliża związek między zmienną zależną i zmienną niezależną.
- Analiza wielokrotnej regresji Gdy w analizie regresji stosuje się dwie lub więcej zmiennych niezależnych, model nie jest już prostym modelem liniowym.
Prosty liniowy model regresji
Prosty model regresji liniowej jest reprezentowany w następujący sposób: y = ( β 0 + β 1 + Ε
Według konwencji matematycznej wyznaczono dwa czynniki, które są zaangażowane w prostą liniową analizę regresji x i y . Równanie, które opisuje, w jaki sposób y odnosi się do x jest znany jako Model regresji. Model regresji liniowej zawiera również termin błędu, który jest reprezentowany przez Ε lub grecka litera epsilon. Termin błędu jest używany do uwzględnienia zmienności w y nie można tego wyjaśnić liniową zależnością między x i y . Są tam również parametry reprezentujące badaną populację.
Te parametry modelu, które są reprezentowane przez ( β 0+ β 1 x ).
Prosty liniowy model regresji
Proste równanie regresji liniowej jest przedstawione w następujący sposób: Ε ( y ) = ( β 0 + β 1 x ).
Proste równanie regresji liniowej wykreślono jako linię prostą.
( β 0 oznacza y przecięcie linii regresji.
β 1 to nachylenie.
Ε ( y ) jest średnią lub oczekiwaną wartością y dla danej wartości x .
Linia regresji może wykazywać dodatnią liniową zależność, ujemną liniową zależność lub brak związku. Jeśli wykreślona linia w prostej regresji liniowej jest płaska (bez nachylenia), nie ma związku między tymi dwiema zmiennymi. Jeśli linia regresji nachodzi w górę z dolnym końcem linii na y przecięcie (oś) wykresu i górny koniec linii rozciągający się w górę do pola wykresu, z dala od x przecięcie (oś) istnieje dodatnia liniowa zależność. Jeśli linia regresji opada w dół z górnym końcem linii na y punkt przecięcia (oś) wykresu, a dolny koniec linii przechodzi w dół do pola wykresu, w kierunku x przecięcie (oś) istnieje negatywny związek liniowy.
Estymowane równanie regresji liniowej
Jeżeli parametry populacji były znane, proste równanie regresji liniowej (pokazane poniżej) mogłyby zostać wykorzystane do obliczenia średniej wartości y dla znanej wartości x .
Ε ( y ) = ( β 0 + β 1 x ).
Jednak w praktyce wartości parametrów nie są znane, więc muszą zostać oszacowane przy użyciu danych z próby populacji. Parametry populacji są szacowane za pomocą statystyk próbek. Przykładowe statystyki są reprezentowane przez b 0 + b 1. Po zastąpieniu statystyk próby parametrami populacyjnymi powstaje estymowane równanie regresji.
Szacowane równanie regresji przedstawiono poniżej.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) jest wymawiane y kapelusz .
Wykres estymowanego prostego równania regresji nazywany jest szacowaną linią regresji.
The b 0 oznacza punkt przecięcia z osią y.
The b 1 to nachylenie.
The ŷ ) jest szacowaną wartością y dla danej wartości x .
Ważna uwaga: Analiza regresji nie służy do interpretacji zależności przyczynowo-skutkowych pomiędzy zmiennymi. Analiza regresji może jednak wskazywać, w jaki sposób zmienne są powiązane lub w jakim stopniu zmienne są ze sobą powiązane. Czyniąc tak, analiza regresji ma tendencję do tworzenia istotnych relacji, które gwarantują, że badacz przyjrzy się uważniej.
Znany również jako: regresja dwuwymiarowa, analiza regresji
Przykłady:The Metoda najmniejszych kwadratów to statystyczna procedura wykorzystywania danych przykładowych w celu znalezienia wartości szacowanego równania regresji. Metoda najmniejszych kwadratów została zaproponowana przez Carla Friedricha Gaussa, który urodził się w 1777 roku i zmarł w 1855 roku. Metoda Najmniejszych Kwadratów jest nadal szeroko stosowana.
Źródła:
Anderson, D. R., Sweeney, D. J. i Williams, T. A. (2003). Essentials of Statistics for Business and Economics (wyd. 3) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Objaśnienie: Analiza regresji. Wiadomości MIT.
McIntyre, L. (1994). Używanie danych papierosowych do wprowadzenia do wielokrotnej regresji. Journal of Statistics Education, 2 (1).
Mendenhall, W. i Sincich, T. (1992). Statystyka dla Engineering and the Sciences (3rd ed.), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Statystyka zastosowań, jesień 2006, sekcja 14, Prosta regresja liniowa.(Massachusetts Institute of Technology: MIT OpenCourseWare)
Dowiedz się, czym jest wariancja zagospodarowania przestrzennego i jak ją zdobyć
Dowiedz się, czym jest różnica w wyznaczaniu stref, dlaczego firma może jej potrzebować i jak ją zdobyć dla firmy prowadzącej działalność w domu.
Dowiedz się, czym jest węgiel, jak się go tworzy i gdzie się znajduje
Oto galeria obrazów, aby wyjaśnić, czym jest węgiel, jakie są różne typy i gdzie można je znaleźć i do czego jest używany.
Dowiedz się, czym jest kapitał obrotowy i jaki jest jego wpływ na biznes
Dowiedz się, czym jest kapitał obrotowy, aktywa płynne, jakie posiada firma, a także, w jaki sposób brak funduszy utrudnia przyciąganie inwestorów, uzyskiwanie pożyczek biznesowych lub kredytów.