Prosta regresji- dobry wynik?

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Dovv90
Użytkownik
Użytkownik
Posty: 243
Rejestracja: 12 mar 2011, o 15:39
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 153 razy

Prosta regresji- dobry wynik?

Post autor: Dovv90 »

Witam,
Mam w zadaniu podaną taką tabelkę:
\(\displaystyle{ \begin{tabular}{ 1 | 1 | 1 | 1 |1 | 1 | 1 | 1 |1 | 1 | 1 | 1 |1} nr&1&2&3&4&5&6&7&8&9&10&11&12\\ Y&96&98&104&112&117&123&127&128&130&133&135&141\\ X&27&20&54&38&57&69&55&63&78&89&72&93\\ \end{tabular}}\)

I mam do wyznaczenia prostą regresji. Ze wzorów:
\(\displaystyle{ y={\beta}_1x+\beta_0\\\\
\beta_1=\frac{\overline{xy}-\overline{x}\cdot\overline{y}}{\overline{x^2}-\overline{x}^2}\ \ \ \beta_0=\overline{y}-\beta_1\overline{x}}\)


Doszło do obliczeń:
\(\displaystyle{ \overline{y}=120,33 \\ \overline{x}=59,58 \\ \overline{xy}=7453,25\\ \overline{x^2}=4027,58\\ \\ \beta_{1}=\frac{7453,25-59,58 \cdot 120,33}{4027,58-59,58^2}=0,59\\ \beta_{0}=120,33-0,59 \cdot 59,58=85,1778\\\\
y=0,59 \cdot x+85,1778}\)



Pytania:
.1. Czy to jest dobrze wyznaczona prosta regresji?\(\displaystyle{ y=0,59 \cdot x+85,1778}\)

2. Mam w zadaniu użyć jej do obliczenia X dla Y równych:
113,140,131.

Jednak zrobiłem test czy ten wzór działa i użyłem go do obliczenia Y dla X równego 38:
\(\displaystyle{ y=0,59 \cdot 38+85,1778\\\\
y=22,42+85,1778
y=107,5978}\)

A patrząc na tabelke jasno mam, że wynik powinien wynosić 112. Czy to jest normalna granica błędu dla prostej regresji?

Z góry dziękuję
Pozdrawiam
Awatar użytkownika
mmoonniiaa
Użytkownik
Użytkownik
Posty: 5482
Rejestracja: 21 lis 2007, o 19:53
Płeć: Kobieta
Lokalizacja: Gdańsk
Podziękował: 21 razy
Pomógł: 1470 razy

Prosta regresji- dobry wynik?

Post autor: mmoonniiaa »

To kwestia zaokrągleń, ale gdybyś ich nie robił, to otrzymałbyś dokładniejsze oszacowania parametrów:
\(\displaystyle{ y=84,96485665+0,593596811x}\)

\(\displaystyle{ 113, 140, 131}\)
Skoro to są igreki i dla nich masz wyznaczyć iksy, to regresję powinieneś w ogóle zrobić odwrotnie: \(\displaystyle{ x=\beta_0+\beta_1y}\). A najlepiej po prostu inaczej przyjąć oznaczenia w tabelce - na odwrót. Miałeś oznaczone wiersze w tej tabelce, czy sam sobie je oznaczyłeś literkami?
Dovv90
Użytkownik
Użytkownik
Posty: 243
Rejestracja: 12 mar 2011, o 15:39
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 153 razy

Prosta regresji- dobry wynik?

Post autor: Dovv90 »

Argh.. no sam oznaczyłem, przyznam bez bicia, ale skoro tak to chyba mógłbym ten wzór wykorzystać prawda? \(\displaystyle{ x=\beta_0+\beta_1y}\)
I drugi raz już zdarza mi się, że ktoś mi podaje ten wzór:
\(\displaystyle{ y=84,96485665+0,593596811x}\)
Jakie zaokrąglenia ja dałem że mi tak inny wynik wyszedł?
Awatar użytkownika
mmoonniiaa
Użytkownik
Użytkownik
Posty: 5482
Rejestracja: 21 lis 2007, o 19:53
Płeć: Kobieta
Lokalizacja: Gdańsk
Podziękował: 21 razy
Pomógł: 1470 razy

Prosta regresji- dobry wynik?

Post autor: mmoonniiaa »

Najpierw musisz policzyć regresję \(\displaystyle{ x=\beta_0+\beta_1y}\). To będą zupełnie inne współczynniki. Dopiero wtedy, będziesz mógł podstawić za igreki \(\displaystyle{ 113, 140, 131}\), żeby wyliczyć iksy.

Zaokrąglenia robisz w momencie wyliczania tych wszystkich średnich - dwa miejsca po przecinku to trochę mało. Stąd biorą się te rozbieżności.
Dovv90
Użytkownik
Użytkownik
Posty: 243
Rejestracja: 12 mar 2011, o 15:39
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 153 razy

Prosta regresji- dobry wynik?

Post autor: Dovv90 »

Ok, to zmieniam ustawienia w tabelce:
\(\displaystyle{ \begin{tabular}{ 1 | 1 | 1 | 1 |1 | 1 | 1 | 1 |1 | 1 | 1 | 1 |1} nr&1&2&3&4&5&6&7&8&9&10&11&12\\ X&96&98&104&112&117&123&127&128&130&133&135&141\\ Y&27&20&54&38&57&69&55&63&78&89&72&93\\ \end{tabular}\\\\\\\\}\)
Wtedy:
\(\displaystyle{ \\\overline{y}=59,583333 \\ \overline{x}=120,333333 \\ \\ \overline{x^2}=14683,833333
\\ \\}\)


Dobra, to trzy pytania:
Czy sześć miejsc po przecinku wystarczy?
Czy \(\displaystyle{ \overline{x^2}= \frac{ (x_{1}^2+x_{2}^2+..+x_{n}^2)}{n}}\)?
I jak czyta sie \(\displaystyle{ \overline{xy}}\)? Przecież nie może to być \(\displaystyle{ \overline{x}\cdot\overline{y}}\) bo wtedy licznik byłby zawsze równy zeru. To co to w końcu za obliczenie?
Awatar użytkownika
mmoonniiaa
Użytkownik
Użytkownik
Posty: 5482
Rejestracja: 21 lis 2007, o 19:53
Płeć: Kobieta
Lokalizacja: Gdańsk
Podziękował: 21 razy
Pomógł: 1470 razy

Prosta regresji- dobry wynik?

Post autor: mmoonniiaa »

\(\displaystyle{ \overline{xy}}\) to średni iloczyn iksów i igreków. Czyli najpierw wyznaczasz dwanaście iloczynów, a następnie liczysz średnią z tych iloczynów.

6 miejsc po przecinku powinno wystarczyć, żeby dostać obliczenia takie, jak dostalibyśmy bez robienia jakichkolwiek zaokrągleń, np. zapisując poszczególne wyniki w pamięci kalkulatora, albo licząc w Excelu.
Dovv90
Użytkownik
Użytkownik
Posty: 243
Rejestracja: 12 mar 2011, o 15:39
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 153 razy

Prosta regresji- dobry wynik?

Post autor: Dovv90 »

Oki, czyli:
\(\displaystyle{ \\\overline{y}=59,583333 \\\\ \overline{x}=120,333333 \\ \\ \overline{x^2}=14683,833333 \\ \\\overline{xy}=7453,250000}\)
Dalej:
\(\displaystyle{ \\\\ \beta_1=\frac{7453,25-7169,861111}{14683,833333-14 480,111031}\\\\\\
\beta_1=\frac{283,388889}{203,722302}\\\\\\
\beta_1=1,391055}\)


I jeszcze dalej:

\(\displaystyle{ \ \ \ \beta_0=59,583333-1,391055\cdot120,333333\\\\
\beta_0=59,583333-167,390262\\\\
\beta_0=-107,81}\)


\(\displaystyle{ x=-107,81+1,391055\cdot y}\)

Prawidłowo to obliczyłem? :p
Awatar użytkownika
mmoonniiaa
Użytkownik
Użytkownik
Posty: 5482
Rejestracja: 21 lis 2007, o 19:53
Płeć: Kobieta
Lokalizacja: Gdańsk
Podziękował: 21 razy
Pomógł: 1470 razy

Prosta regresji- dobry wynik?

Post autor: mmoonniiaa »

Tak, ale czemu na koniec zmieniłeś literki? Skoro już w tabelce zmieniłeś oznaczenia, to oszacowałeś regresję:
\(\displaystyle{ y=-107,81+1,391055\cdot x}\)
Awatar użytkownika
mmoonniiaa
Użytkownik
Użytkownik
Posty: 5482
Rejestracja: 21 lis 2007, o 19:53
Płeć: Kobieta
Lokalizacja: Gdańsk
Podziękował: 21 razy
Pomógł: 1470 razy

Prosta regresji- dobry wynik?

Post autor: mmoonniiaa »

No tak ma być. Wartość rzeczywista \(\displaystyle{ y_{8}=63}\) różni się od wartości oszacowanej \(\displaystyle{ \hat{y}_{8}=70,24504}\). Stąd właśnie powstają reszty modelu: \(\displaystyle{ \epsilon_{8}=7,24504}\).
No i teraz liczysz igreki dla podanych iksów.
ODPOWIEDZ