?: Definicja wielowymiarowego rozkładu normalnego

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Zerro
Użytkownik
Użytkownik
Posty: 3
Rejestracja: 21 lis 2020, o 15:08
Płeć: Mężczyzna
wiek: 1

?: Definicja wielowymiarowego rozkładu normalnego

Post autor: Zerro »

Szanowni Koledzy i Koleżanki, (w kolejności alfabetycznej tytułów: "d" < "ż")

Mam pytanie jak najbardziej teoretyczne.

Otóż patrzę na stronę w wikipedii:

Kod: Zaznacz cały

https://pl.wikipedia.org/wiki/Wielowymiarowy_rozk%C5%82ad_normalny


Definicja tam umieszczona mówi:
"\(\displaystyle{ n}\)-wymiarowa zmienna losowa podlega \(\displaystyle{ n}\)-wymiarowemu rozkładowi normalnemu jeśli dowolna kombinacja liniowa jej składowych ma rozkład normalny".

Ale mam pytanie: co będzie, jeśli przyjmiemy, że \(\displaystyle{ x_1=x_2}\) ? (dla uproszczenia w dwuwymiarowym rozkładzie normalnym)
Poniżej we wspomnianym artykule na wiki w sekcji "Niezależność zmiennych" jest wzmianka: "nośnikiem wielowymiarowego rozkładu normalnego jest całą płaszczyzna \(\displaystyle{ \RR^2}\)".

Super. Rzeczywiście w moim przypadku (jeśli przyjmę, że chcę rozkład dwuwymiarowy) nośnik jest ograniczony do jednej prostej (nazwijmy to "lecącej na ukos"), a cała reszta płaszczyzny jest "pusta".

Tyle, że taki rozkład świetnie spełnia definicję - każda kombinacja liniowa składowych \(\displaystyle{ x_1}\) i \(\displaystyle{ x_2}\) będzie miała rozkład normalny!

(co wynika z własności rozkładu normalnego:

Kod: Zaznacz cały

https://pl.wikipedia.org/wiki/Rozk%C5%82ad_normalny#W%C5%82asno%C5%9Bci
)

W moim przypadku, przyjmując \(\displaystyle{ X=x_1, Y=x_2}\) będzie to \(\displaystyle{ X+Y = X+X = 2X}\), a przecież rozkład \(\displaystyle{ aX+b}\) ma rozkład normalny jeśli \(\displaystyle{ X}\) ma rozkład normalny.

Gdzie leży mój błąd?

Z wyrazami,
Zerro
Ostatnio zmieniony 21 lis 2020, o 17:00 przez Jan Kraszewski, łącznie zmieniany 1 raz.
Powód: Brak LaTeX-a. Proszę zapoznać się z instrukcją: http://matematyka.pl/latex.htm .
matmatmm
Użytkownik
Użytkownik
Posty: 2282
Rejestracja: 14 cze 2011, o 11:34
Płeć: Mężczyzna
Lokalizacja: Sosnowiec
Podziękował: 88 razy
Pomógł: 351 razy

Re: ?: Definicja wielowymiarowego rozkładu normalnego

Post autor: matmatmm »

Ja twojego pytania szczerze mówiąc nie rozumiem. Co to znaczy
Zerro pisze: 21 lis 2020, o 15:20 co będzie, jeśli przyjmiemy, że x1=x2 ? (dla uproszczenia w dwuwymiarowym rozkładzie normalnym)
Jeśli mamy dany wektor losowy \(\displaystyle{ X=[x_1,\ldots,x_n]}\) to zmienne losowe \(\displaystyle{ x_1,\ldots, x_n}\)dane.

Gdy sprawdzamy, czy wektor losowy \(\displaystyle{ X=[x_1,\ldots,x_n]}\) ma (wielowymiarowy) rozkład normalny według definicji z wikipedii, to możemy dowolnie dobrać współczynniki \(\displaystyle{ a_1,\ldots,a_n}\), ale nie możemy ni stąd ni zowąd założyć np. \(\displaystyle{ x_1=x_2}\).

Na wikipedii jest tak poza tym drobny błąd, bo powinno być "dowolna nietrywialna kombinacja liniowa". Nietrywialna znaczy tutaj "co najmniej jeden współczynnik \(\displaystyle{ a_i}\) jest niezerowy".

Dodano po 6 minutach 2 sekundach:
Ok. Chyba wiem o co pytasz. Jeśli mamy wektor losowy \(\displaystyle{ X=[x,x]}\), gdzie \(\displaystyle{ x}\) ma rozkład normalny, to \(\displaystyle{ X}\) nie spełnia definicji wielowymiarowego rozkładu normalnego, bo jeśli przyjmiemy \(\displaystyle{ a_1=1,a_2=-1}\), to \(\displaystyle{ Y=a_1x+a_2x=0}\) nie ma rozkładu normalnego.
Zerro
Użytkownik
Użytkownik
Posty: 3
Rejestracja: 21 lis 2020, o 15:08
Płeć: Mężczyzna
wiek: 1

Re: ?: Definicja wielowymiarowego rozkładu normalnego

Post autor: Zerro »

Co do nietrywialnej kombinacji liniowej - zgoda. Właśnie zresztą chciałem zwrócić na to uwagę.

Natomiast może niejasno się wyraziłem:

nie chodziło o to, że zakładamy, że dwie zmienne są równe, ale, że mamy dane dwie równe zmienne.
I ta równość wcale nie musi być "z definicji".

(Jakiś odległy przykład - z biologii: ze wszystkich znanych organizmów posiadających serce wszystkie posiadają również nerki. I odwrotnie.
Zatem zbiór "sercowców" jest równy zbiorowi "nerkowców", choć to przecież nie to samo).
(może specjalista biolog byłby w stanie wskazać jakieś organizmy, które nie spełniają tej zależności, ale podaję ją tylko jako przykład!)

Zatem: mamy dane dwie zmienne, co do których nie można powiedzieć, że "mają tę samą wartość semantyczną". Choć może po prostu nie wiemy, że akurat odnoszą się do tych samych obiektów, bo definicje niejako "ze swej natury" (nam jednak nieznanej) denotują dokładnie te same zbiory obiektów.

Badamy rozkład dwuwymiarowy zależności między tymi zmiennymi. Każda zmienna ma rozkład normalny.

I wracając do pierwotnego pytania:
Czy dwuwymiarowa zmienna, będąca wektorem tych zmiennych samodzielnych ma wielowymiarowy rozkład normalny czy nie?

Wrócę do cytatu z wikipedii: "nośnikiem jest cała płaszczyzna". Czy to zasadne stwierdzenie, jeśli chodzi o dwuwymiarowy rozkład normalny, czy nie?

---------------------
A odnosząc się do dopisku: \(\displaystyle{ a_{1} = 1}\) oraz \(\displaystyle{ a_2=-1}\) - to rzeczywiście inny kłopotliwy przypadek.... :(


Zorro
matmatmm
Użytkownik
Użytkownik
Posty: 2282
Rejestracja: 14 cze 2011, o 11:34
Płeć: Mężczyzna
Lokalizacja: Sosnowiec
Podziękował: 88 razy
Pomógł: 351 razy

Re: ?: Definicja wielowymiarowego rozkładu normalnego

Post autor: matmatmm »

Zerro pisze: 21 lis 2020, o 16:46 nie chodziło o to, że zakładamy, że dwie zmienne są równe, ale, że mamy dane dwie równe zmienne.
I ta równość wcale nie musi być "z definicji".
Nie no dla mnie "zakładamy, że mamy dwie równe zmienne" i "mamy dane dwie równe zmienne" to to samo. Być może mylisz równość zmiennych z równością rozkładów tych zmiennych.
Badamy rozkład dwuwymiarowy zależności między tymi zmiennymi. Każda zmienna ma rozkład normalny.

I wracając do pierwotnego pytania:
Czy dwuwymiarowa zmienna, będąca wektorem tych zmiennych samodzielnych ma wielowymiarowy rozkład normalny czy nie?
Jeśli są niezależne, to tak. Jeśli są równe, to w oczywisty sposób są zależne.
Wrócę do cytatu z wikipedii: "nośnikiem jest cała płaszczyzna". Czy to zasadne stwierdzenie, jeśli chodzi o dwuwymiarowy rozkład normalny, czy nie?
Zasadne. Można udowodnić, że rozkład normalny wielowymiarowy ma gęstość. Dalej trzeba odwołać się do wzoru na tę gęstość i definicji nośnika miary.
A odnosząc się do dopisku: \(\displaystyle{ a _{1} = 1}\) oraz \(\displaystyle{ a _{2}=-1}\) - to rzeczywiście drugi kłopotliwy przypadek.
Akurat tutaj to nie jest kłopotliwy przypadek, tylko dowód na to, że przyjmując \(\displaystyle{ x_1=x_2}\) nie otrzymamy wielowymiarowego rozkładu normalnego.
Zerro
Użytkownik
Użytkownik
Posty: 3
Rejestracja: 21 lis 2020, o 15:08
Płeć: Mężczyzna
wiek: 1

Re: ?: Definicja wielowymiarowego rozkładu normalnego

Post autor: Zerro »

matmatmm pisze: 21 lis 2020, o 17:02
Zerro pisze: 21 lis 2020, o 16:46 nie chodziło o to, że zakładamy, że dwie zmienne są równe, ale, że mamy dane dwie równe zmienne.
I ta równość wcale nie musi być "z definicji".
Nie no dla mnie "zakładamy, że mamy dwie równe zmienne" i "mamy dane dwie równe zmienne" to to samo. Być może mylisz równość zmiennych z równością rozkładów tych zmiennych.
Chodzi mi o równość zmiennych, nie rozkładów. Tzn.:
bierzemy egzemplarz (ryba_1) - serce: tak, nerki:tak
bierzemy egzemplarz (ryba_2) - serce: tak, nerki:tak
bierzemy egzemplarz (ukwiał_1) - serce: nie, nerki:nie
(tu akurat rozkład będzie dwupunktowy, ale to tylko przykład cechy - chodzi mi o cechę wyrażalną w zbiorze R)

I co najważniejsze: nie wiemy, czy te cechy są niezależne. Po prostu zbieramy dane, żeby sobie wyrobić na ten temat zdanie.

Przykład: u nas sercowce=nerkowce, ale pojedziemy na inny kontynent i tam będzie korelacja = -1, pojedziemy na trzeci, a tam będzie 100 razy tyle organizmów co na dwu pierwszych i nazbiera się mnóstwo przypadków, które pokażą, że zmienne są jednak niezależne

Ale może się okazać, że wszędzie jest tak, że sercowce=nerkowce - że zmienne są po prostu w 100% zależne, choć to nie wynika z ich definicji.

Zorro
matmatmm
Użytkownik
Użytkownik
Posty: 2282
Rejestracja: 14 cze 2011, o 11:34
Płeć: Mężczyzna
Lokalizacja: Sosnowiec
Podziękował: 88 razy
Pomógł: 351 razy

Re: ?: Definicja wielowymiarowego rozkładu normalnego

Post autor: matmatmm »

Załóżmy, że mamy dwie zmienne \(\displaystyle{ X,Y}\) o rozkładzie normalnym.
Jeśli nie wiemy, czy te zmienne są niezależne, to nie jesteśmy w stanie odpowiedzieć na pytanie, czy wektor \(\displaystyle{ [X,Y]}\) ma dwuwymiarowy rozkład normalny.
Zerro pisze: 21 lis 2020, o 17:22 Chodzi mi o równość zmiennych, nie rozkładów. Tzn.:
bierzemy egzemplarz (ryba_1) - serce: tak, nerki:tak
bierzemy egzemplarz (ryba_2) - serce: tak, nerki:tak
bierzemy egzemplarz (ukwiał_1) - serce: nie, nerki:nie
(tu akurat rozkład będzie dwupunktowy, ale to tylko przykład cechy - chodzi mi o cechę wyrażalną w zbiorze R)
Ja bym to interpretował tak:

Pierwsza zmienna zwraca tak (czyli np. \(\displaystyle{ 1}\)), gdy wylosowany egzemplarz ma serce, \(\displaystyle{ 0}\) w przeciwnym wypadku.
Druga zmienna zwraca \(\displaystyle{ 1}\), gdy wylosowany egzemplarz ma nerki, \(\displaystyle{ 0}\) w przeciwnym wypadku.

Przy założeniu, że każdy sercowiec jest nerkowcem i na odwrót, zmienne te rzeczywiście są równe. Zgadzam się, że równość tych zmiennych nie wynika wtedy bezpośrednio z ich definicji. Jednak dla rozważań matematycznych, można poczynić założenie, że zmienne są równe niezależnie od tego z czego miałoby to wynikać. "Założenie" nie oznacza tutaj, że te zmienne mają taką samą definicję. Jeśli piszesz "mamy dane dwie równe zmienne" to właśnie robisz w ten sposób takie założenie. Dlatego napisałem, że dla mnie oba sformułowania to to samo.
ODPOWIEDZ