ustalenie niezbędnej liczby respondentów
-
- Użytkownik
- Posty: 2
- Rejestracja: 21 wrz 2013, o 18:28
- Płeć: Mężczyzna
- Lokalizacja: Polska
ustalenie niezbędnej liczby respondentów
Mam problem.
Mam grupę badawczą (200 os.) i skalę 10 punktową (1 - 10). Jak wyznaczyć niezbędną liczbę osób aby uznać wyniki za reprezentatywne, z jakiego wzoru skorzystać i co przeliczyć kiedy na zadane pytanie:
Ile dni potrzebujesz na przygotowanie się do ważnego egzaminu uzyskane odpowiedzi przedstawiały się następująco:
4 dni - 22 osoby
5 dni - 21 osób
6 dni - 81 osób
7 dni - 27 osób
8 dni - 18 osób
9 dni - 15 osób
10 dni - 16 osób
Czy wzór byłby inny kiedy otrzymane odpowiedzi byłby jedynie 3 ?
8 dni - 2 osoby
9 dni - 8 osób
10 dni - 190 osób
Czy można też w jakiś sposób zbadać istotność wpływu poszczególnych odpowiedzi na szybkość nauki?
Jestem laikiem w tych sprawach więc proszę o wyrozumiałość
Mam grupę badawczą (200 os.) i skalę 10 punktową (1 - 10). Jak wyznaczyć niezbędną liczbę osób aby uznać wyniki za reprezentatywne, z jakiego wzoru skorzystać i co przeliczyć kiedy na zadane pytanie:
Ile dni potrzebujesz na przygotowanie się do ważnego egzaminu uzyskane odpowiedzi przedstawiały się następująco:
4 dni - 22 osoby
5 dni - 21 osób
6 dni - 81 osób
7 dni - 27 osób
8 dni - 18 osób
9 dni - 15 osób
10 dni - 16 osób
Czy wzór byłby inny kiedy otrzymane odpowiedzi byłby jedynie 3 ?
8 dni - 2 osoby
9 dni - 8 osób
10 dni - 190 osób
Czy można też w jakiś sposób zbadać istotność wpływu poszczególnych odpowiedzi na szybkość nauki?
Jestem laikiem w tych sprawach więc proszę o wyrozumiałość
ustalenie niezbędnej liczby respondentów
Kod: Zaznacz cały
> czas=rep(c(4,5,6,7,8,9,10),c(22,21,81,27,18,15,16))
> shapiro.test(czas)
Shapiro-Wilk normality test
data: czas
W = 0.9007, p-value = 2.77e-10
-
- Użytkownik
- Posty: 1567
- Rejestracja: 15 gru 2008, o 16:38
- Płeć: Mężczyzna
- Lokalizacja: Ostrzeszów/Wrocław
- Podziękował: 8 razy
- Pomógł: 398 razy
ustalenie niezbędnej liczby respondentów
szw1710, przecież na oko widać, że jedyny sensowny rozkład w tym przypadku to po prostu rozkład wielomianowy.
Ja bym to robił tak:
Mamy nasze zmienne losowe (odpowiedzi ankietowanych) \(\displaystyle{ X_i}\) o rozkładzie wielomianowym ( ) z parametrami \(\displaystyle{ 1}\) (pojedyncza odpowiedź) oraz (nieznane)\(\displaystyle{ p_1, ..., p_k}\) (prawdopodobieństwa poszczególnych odpowiedzi).
Najprostszym oszacowaniem na \(\displaystyle{ p_j}\) jest \(\displaystyle{ \widehat{p_j}= \frac{1}{n} \sum_{i=1}^{n}1{\hskip -2.5 pt}\hbox{l}_{\left\{ X_i = j \right\} }}\). Nietrudno zauważyć, że \(\displaystyle{ n\widehat{p_j}}\) ma rozkład \(\displaystyle{ B(n,p_j )}\).
Teraz jakoś na pałę możemy oszacować, np. z Markowa:
\(\displaystyle{ P( |\widehat{p_j} - p_j | >\varepsilon )=P( |n\widehat{p_j} - np_j | >n\varepsilon ) \le \frac{np_j (1-p_j )}{n^{2}\varepsilon^{2}} \le \frac{1}{4n\varepsilon ^{2}}}\)
Co do reprezentatywności:
Ja to rozumiem, że chcesz, by częstości pojawień się poszczególnych odpowiedzi były obarczone co najwyżej pewnym błędem. Ten błąd to u mnie \(\displaystyle{ \varepsilon}\). Teraz, jeśli chcesz, żeby to wszystko było z prawdopodobieństwem co najmniej \(\displaystyle{ 1-\alpha}\), to musisz znaleźć najmniejsze \(\displaystyle{ n}\), aby było \(\displaystyle{ \frac{1}{4n\varepsilon ^{2}}\le \alpha}\). To już będzie wystarczająca liczba ankietowanych dla Twojej precyzji
Przynajmniej ja bym tak to robił
Ja bym to robił tak:
Mamy nasze zmienne losowe (odpowiedzi ankietowanych) \(\displaystyle{ X_i}\) o rozkładzie wielomianowym ( ) z parametrami \(\displaystyle{ 1}\) (pojedyncza odpowiedź) oraz (nieznane)\(\displaystyle{ p_1, ..., p_k}\) (prawdopodobieństwa poszczególnych odpowiedzi).
Najprostszym oszacowaniem na \(\displaystyle{ p_j}\) jest \(\displaystyle{ \widehat{p_j}= \frac{1}{n} \sum_{i=1}^{n}1{\hskip -2.5 pt}\hbox{l}_{\left\{ X_i = j \right\} }}\). Nietrudno zauważyć, że \(\displaystyle{ n\widehat{p_j}}\) ma rozkład \(\displaystyle{ B(n,p_j )}\).
Teraz jakoś na pałę możemy oszacować, np. z Markowa:
\(\displaystyle{ P( |\widehat{p_j} - p_j | >\varepsilon )=P( |n\widehat{p_j} - np_j | >n\varepsilon ) \le \frac{np_j (1-p_j )}{n^{2}\varepsilon^{2}} \le \frac{1}{4n\varepsilon ^{2}}}\)
Co do reprezentatywności:
Ja to rozumiem, że chcesz, by częstości pojawień się poszczególnych odpowiedzi były obarczone co najwyżej pewnym błędem. Ten błąd to u mnie \(\displaystyle{ \varepsilon}\). Teraz, jeśli chcesz, żeby to wszystko było z prawdopodobieństwem co najmniej \(\displaystyle{ 1-\alpha}\), to musisz znaleźć najmniejsze \(\displaystyle{ n}\), aby było \(\displaystyle{ \frac{1}{4n\varepsilon ^{2}}\le \alpha}\). To już będzie wystarczająca liczba ankietowanych dla Twojej precyzji
Przynajmniej ja bym tak to robił
ustalenie niezbędnej liczby respondentów
Co widać na oko i co się stało z chłopem, można dyskutować Dla mnie za Poissonem przemawia szybkie maksimum i znaczne różnice poza nim. Ale pewnie się pofatyguję i zrobię to chi-kwadrat na Poissona. Do tablicy mnie wywołałeś.
-
- Użytkownik
- Posty: 1567
- Rejestracja: 15 gru 2008, o 16:38
- Płeć: Mężczyzna
- Lokalizacja: Ostrzeszów/Wrocław
- Podziękował: 8 razy
- Pomógł: 398 razy
ustalenie niezbędnej liczby respondentów
A dla mnie przeciw Poissonowi przemawia brak wielkości większych od 10, mimo, że już wcześniej gęstość się wypłaszcza (18,16,15 wobec max 81 )
ustalenie niezbędnej liczby respondentów
A mógłbyś zrobić to chi-kwadrat dla Poissona? Mam parę obowiązków domowych teraz, ale chętnie spojrzę na wyniki Dzięki z góry.
Ale chyba nie ma potrzeby. Średnia ok. \(\displaystyle{ 6.5}\), wariancja ok. \(\displaystyle{ 2.7}\). A w Poissonie są równe. Nadużyciem jest twierdzenie, że są tu sobie bliskie. Przyznaję Ci rację, że to nie Poisson
Ale chyba nie ma potrzeby. Średnia ok. \(\displaystyle{ 6.5}\), wariancja ok. \(\displaystyle{ 2.7}\). A w Poissonie są równe. Nadużyciem jest twierdzenie, że są tu sobie bliskie. Przyznaję Ci rację, że to nie Poisson
Ostatnio zmieniony 21 wrz 2013, o 22:36 przez szw1710, łącznie zmieniany 1 raz.
-
- Użytkownik
- Posty: 1567
- Rejestracja: 15 gru 2008, o 16:38
- Płeć: Mężczyzna
- Lokalizacja: Ostrzeszów/Wrocław
- Podziękował: 8 razy
- Pomógł: 398 razy
ustalenie niezbędnej liczby respondentów
Leniwa Statistica nie chce liczyć
Zdaje się, że na zajęciach wtedy odrzucaliśmy hipotezę (empirycznie wydumaliśmy, że p>0,15).
Kod: Zaznacz cały
Zmienna: Zmn2, Rozkład: Poissona, Lambda = 28,57143 (Arkusz1)
Chi-kwadrat: ------ ,df = 0 , p = ---
-
- Użytkownik
- Posty: 2
- Rejestracja: 21 wrz 2013, o 18:28
- Płeć: Mężczyzna
- Lokalizacja: Polska
ustalenie niezbędnej liczby respondentów
Analizuję wszystkie Wasze wypowiedzi ale dalej nie wiem jak wyznaczyć niezbędną liczbę pomiarów aby moje wyniki uznać za reprezentatywne. Domyślam się w każdym razie, że to jest o wiele bardziej zaawansowane niż jeden wzór. Czy ktoś z Was tym samym mógłby mi wypisać w punktach jakie kroki mam przeprowadzić aby ustalić niezbędną liczbę respondentów i tym samym uznać wyniki za reprezentatywne?
-
- Użytkownik
- Posty: 1567
- Rejestracja: 15 gru 2008, o 16:38
- Płeć: Mężczyzna
- Lokalizacja: Ostrzeszów/Wrocław
- Podziękował: 8 razy
- Pomógł: 398 razy
ustalenie niezbędnej liczby respondentów
Widzisz, bo to wcale nie jest trywialne zadanie. Przede wszystkim zdefiniuj co wg Ciebie znaczy "reprezentatywność". Moja metoda może wyznaczyć dostateczną liczbę obserwacji, jednak nie konieczną, tj. może się okazać, że mniejsza również jest wystarczająca.
Masz model
\(\displaystyle{ y_i =\alpha + \alpha_{ij}}\), gdzie \(\displaystyle{ \alpha _{ik}}\) jest wpływem \(\displaystyle{ i}\)-tej odpowiedzi na \(\displaystyle{ j}\)-tym poziomie (po ludzku: i to numer respondenta, a j numer odpowiedzi, którą wybrał).
Dodając całkiem rozsądne założenie, że \(\displaystyle{ \sum_{j=1}^{k}\alpha_{ij}=0}\) (tzn., że wszystkie efkty się znoszą) testujemy istotność wpływu, tj. badamy hipotezę \(\displaystyle{ H_0 : \ \alpha_{i1} = ... = \alpha_{ik}=0}\). Np. pakiet Satistica automatycznie bada tę hipotezę po wybraniu odpowiedniego modelu wielomianowego.
To akurat łatwo zbadać każdym pakietem statystycznym.Czy można też w jakiś sposób zbadać istotność wpływu poszczególnych odpowiedzi na szybkość nauki?
Masz model
\(\displaystyle{ y_i =\alpha + \alpha_{ij}}\), gdzie \(\displaystyle{ \alpha _{ik}}\) jest wpływem \(\displaystyle{ i}\)-tej odpowiedzi na \(\displaystyle{ j}\)-tym poziomie (po ludzku: i to numer respondenta, a j numer odpowiedzi, którą wybrał).
Dodając całkiem rozsądne założenie, że \(\displaystyle{ \sum_{j=1}^{k}\alpha_{ij}=0}\) (tzn., że wszystkie efkty się znoszą) testujemy istotność wpływu, tj. badamy hipotezę \(\displaystyle{ H_0 : \ \alpha_{i1} = ... = \alpha_{ik}=0}\). Np. pakiet Satistica automatycznie bada tę hipotezę po wybraniu odpowiedniego modelu wielomianowego.