Prawdopodobieństwo powtórzenia się wzorca.

Dreamer1x6xX · Post autor: **Dreamer1x6xX** » 20 sty 2016, o 08:59

Poprawcie jeśli się mylę (a właściwie jeśli moje myślenie jest błędne).

Mam taki problem do rozwiązania, chcę napisać program zliczający liczbę RÓŻNYCH wyrazów w anglojęzycznej prasie (żeby pozliczać ile faktycznie wyrazów używa się na co dzień i rozwiać moje wątpliwości i mieć bazę słów do nauki).

Dlatego też jak wiecie lub nie muszę mieć jakiś "wzorzec/sumę kontrolną", którą będę zapisywał do pamięci, i potem każdy kolejny wyraz w niej szukał (czy już nie ma takiego samego tj. czy już po prostu nie wystąpił wcześniej). Jak wiecie lub nie w programowaniu operowanie na stringach, nie jest zbyt wygodne, ani ekonomiczne. Dlatego lepiej jest to robić najlepiej na liczbach stałoprzecinkowych.

Na początku myślałem, żeby po prostu ponumerować od a-z litery alfabetu i robić to w sposób taki, że każdą literę bym dodawał na końcu bym miał sumę po której bym rozpoznawał inne wyrazy, lecz np. taki sam wynik dałyby słowa odwrotne jak i z pewnością znalazłyby się i takie, które przy różne ilości liter dawałyby tą samą wartość.

Dlatego przechodząc do meritum czy dobrze myślę, że jeśli zamiast dodawania wezmę odejmowanie, czyli działanie nieprzemienne i ponadto, niektórych literom przypiszę dodatnie wartości, niektórym ujemne, i zwiększę rozrzut między nimi (np. jedne będą miały od 1-10, inne od 100-150 itd.) to wszystkie te działania zmniejszą prawdopodobieństwo tego, że otrzymam taką samą różnicę na wyjściu?