Testy statystyczne algorytmów na podstawie symulacji.

dexter007 · Post autor: **dexter007** » 22 paź 2016, o 14:22

Witam,

Mam kilka algorytmów, które robią tą samą rzecz w inny sposób (stosując inne struktury danych). Zakładam, że jeden z nich może mieć istotnie lepsze wyniki od innych. Chciałbym to sprawdzić i potwierdzić za pomocą testu statystycznego.

Mam zamiar stworzyć symulację. Jej wyniki będą zależeć od dwóch parametrów:
- Liczba operacji UPDATE
- Liczba operacji SEARCH
W obu przypadkach zdefiniuje interwał pomiędzy kolejnymi operacjami za pomocą generatora liczb losowych o rozkładzie normalnym.

Widzę tu jednak dwa podejścia:

1. Mogę uruchomić symulację X razy dla każdego algorytmu. W takim wypadku liczba operacji w symulacji algorytmu A może nieco różnić się od symulacji algorytmu B, bo interwały są losowe (mimo to bedą miały podobną średnią)
2. Mogę wygenerować konkretne czasy, w których powinny zostać wykonane operacje i na podstawie takiego testu uruchomić symulacje dla każdego algorytmu. W tym przypadku, w symulacjach algorytmów A i B będzie identyczna liczba operacji.

Moje pytania:

1. Czy w podejściu pierwszym próbki będą niezależne i zależne w drugim?
2. Które podejście jest lepsze?
3. Który test wydaje się najodpowiedniejszy? ANOVA?

Serdecznie dziękuję za pomoc