Witam,
Mam kilka algorytmów, które robią tą samą rzecz w inny sposób (stosując inne struktury danych). Zakładam, że jeden z nich może mieć istotnie lepsze wyniki od innych. Chciałbym to sprawdzić i potwierdzić za pomocą testu statystycznego.
Mam zamiar stworzyć symulację. Jej wyniki będą zależeć od dwóch parametrów:
- Liczba operacji UPDATE
- Liczba operacji SEARCH
W obu przypadkach zdefiniuje interwał pomiędzy kolejnymi operacjami za pomocą generatora liczb losowych o rozkładzie normalnym.
Widzę tu jednak dwa podejścia:
1. Mogę uruchomić symulację X razy dla każdego algorytmu. W takim wypadku liczba operacji w symulacji algorytmu A może nieco różnić się od symulacji algorytmu B, bo interwały są losowe (mimo to bedą miały podobną średnią)
2. Mogę wygenerować konkretne czasy, w których powinny zostać wykonane operacje i na podstawie takiego testu uruchomić symulacje dla każdego algorytmu. W tym przypadku, w symulacjach algorytmów A i B będzie identyczna liczba operacji.
Moje pytania:
1. Czy w podejściu pierwszym próbki będą niezależne i zależne w drugim?
2. Które podejście jest lepsze?
3. Który test wydaje się najodpowiedniejszy? ANOVA?
Serdecznie dziękuję za pomoc