Poprawcie jeśli się mylę (a właściwie jeśli moje myślenie jest błędne).
Mam taki problem do rozwiązania, chcę napisać program zliczający liczbę RÓŻNYCH wyrazów w anglojęzycznej prasie (żeby pozliczać ile faktycznie wyrazów używa się na co dzień i rozwiać moje wątpliwości i mieć bazę słów do nauki).
Dlatego też jak wiecie lub nie muszę mieć jakiś "wzorzec/sumę kontrolną", którą będę zapisywał do pamięci, i potem każdy kolejny wyraz w niej szukał (czy już nie ma takiego samego tj. czy już po prostu nie wystąpił wcześniej). Jak wiecie lub nie w programowaniu operowanie na stringach, nie jest zbyt wygodne, ani ekonomiczne. Dlatego lepiej jest to robić najlepiej na liczbach stałoprzecinkowych.
Na początku myślałem, żeby po prostu ponumerować od a-z litery alfabetu i robić to w sposób taki, że każdą literę bym dodawał na końcu bym miał sumę po której bym rozpoznawał inne wyrazy, lecz np. taki sam wynik dałyby słowa odwrotne jak i z pewnością znalazłyby się i takie, które przy różne ilości liter dawałyby tą samą wartość.
Dlatego przechodząc do meritum czy dobrze myślę, że jeśli zamiast dodawania wezmę odejmowanie, czyli działanie nieprzemienne i ponadto, niektórych literom przypiszę dodatnie wartości, niektórym ujemne, i zwiększę rozrzut między nimi (np. jedne będą miały od 1-10, inne od 100-150 itd.) to wszystkie te działania zmniejszą prawdopodobieństwo tego, że otrzymam taką samą różnicę na wyjściu?
Prawdopodobieństwo powtórzenia się wzorca.
-
- Użytkownik
- Posty: 303
- Rejestracja: 17 sty 2014, o 02:51
- Płeć: Mężczyzna
- Lokalizacja: Gniezno
- Podziękował: 36 razy