Indeks zgodności

Podzielność. Reszty z dzielenia. Kongruencje. Systemy pozycyjne. Równania diofantyczne. Liczby pierwsze i względnie pierwsze. NWW i NWD.
qwerty355
Użytkownik
Użytkownik
Posty: 85
Rejestracja: 24 maja 2015, o 13:21
Płeć: Mężczyzna
Podziękował: 16 razy

Indeks zgodności

Post autor: qwerty355 »

Indeks zgodności dla szyfrogramu \(\displaystyle{ c}\) długości \(\displaystyle{ n}\), w którym litera \(\displaystyle{ A}\) występuje \(\displaystyle{ f_A}\) razy, \(\displaystyle{ Ą}\) występuje \(\displaystyle{ f_Ą}\) razy itd., jest dany wzorem
\(\displaystyle{ \frac{f_A(f_A−1)+f_Ą(f_Ą−1)+...+f_Ż(f_Ż−1)}{n(n−1)}}\)
Niech \(\displaystyle{ n}\) będzie liczbą naturalną. Wyznacz największą i najmniejszą możliwą wartość indeksu zgodności dla ciągu znaków długości \(\displaystyle{ n}\). Podaj przykład ciągu długości \(\displaystyle{ n}\), dla którego wartość indeksu zgodności jest najmniejsza/największa.

Łatwo zauważyć, że maksymalna wartość indeksu zgodności wynosi \(\displaystyle{ 1}\) - dla ciągu, w którym wszystkie litery są takie same (mamy wówczas \(\displaystyle{ \frac{n(n-1)}{n(n-1)} = 1}\)).
Analizując minimalną wartość, można zauważyć, że jeśli długość ciągu \(\displaystyle{ n\le35}\) (gdzie \(\displaystyle{ 35}\) to liczba liter w polskim alfabecie), to minimalna wartość indeksu zgodności wynosi \(\displaystyle{ 0}\) - dla ciągu, w którym każda litera występuje co najwyżej \(\displaystyle{ 1}\) raz.
Co jednak w przypadku, gdy \(\displaystyle{ n > 35}\)? Nie jest wówczas możliwe, aby każdy litera występowała maksymalnie raz. Jak można wyznaczyć minimalną wartość indeksu zgodności w takim przypadku?
a4karo
Użytkownik
Użytkownik
Posty: 22211
Rejestracja: 15 maja 2011, o 20:55
Płeć: Mężczyzna
Lokalizacja: Bydgoszcz
Podziękował: 38 razy
Pomógł: 3755 razy

Re: Indeks zgodności

Post autor: a4karo »

Wsk. Sprawdź jak wygląda indeks dla słów
abbbbbbbcc, aabbbbbbcc
aaabbbbbcc i aaaabbbbcc.

Wsk2. Poczytaj o funkcjach wypukłych
qwerty355
Użytkownik
Użytkownik
Posty: 85
Rejestracja: 24 maja 2015, o 13:21
Płeć: Mężczyzna
Podziękował: 16 razy

Re: Indeks zgodności

Post autor: qwerty355 »

dla abbbbbbbcc indeks wynosi \(\displaystyle{ \frac{44}{90}}\)
dla aabbbbbbcc indeks wynosi \(\displaystyle{ \frac{34}{90}}\)
dla aaabbbbbcc indeks wynosi \(\displaystyle{ \frac{28}{90}}\)
dla aaaabbbbcc indeks wynosi \(\displaystyle{ \frac{26}{90}}\)

Na podstawie tego przypuszczam, że indeks zgodności jest tym mniejszy, im rozkład liter jest bardziej równomierny. Czy takie stwierdzenie jest prawdziwe (można je udowodnić)? Pojęcie funkcji wypukłej znam, ale nie bardzo wiem, jak to ze sobą powiązać.
a4karo
Użytkownik
Użytkownik
Posty: 22211
Rejestracja: 15 maja 2011, o 20:55
Płeć: Mężczyzna
Lokalizacja: Bydgoszcz
Podziękował: 38 razy
Pomógł: 3755 razy

Re: Indeks zgodności

Post autor: a4karo »

T tak, to dobry wniosek. Zauważ, że `x(x-1)` jest wypukla
qwerty355
Użytkownik
Użytkownik
Posty: 85
Rejestracja: 24 maja 2015, o 13:21
Płeć: Mężczyzna
Podziękował: 16 razy

Re: Indeks zgodności

Post autor: qwerty355 »

Zgadza się. W liczniku mamy więc sumę funkcji wypukłych, która też jest funkcją wypukłą.
Nie mam jednak pomysłu, jak sformułować dowód stwierdzenia, że indeks zgodności jest najmniejszy przy najbardziej równomiernym rozkładzie liter.
a4karo
Użytkownik
Użytkownik
Posty: 22211
Rejestracja: 15 maja 2011, o 20:55
Płeć: Mężczyzna
Lokalizacja: Bydgoszcz
Podziękował: 38 razy
Pomógł: 3755 razy

Re: Indeks zgodności

Post autor: a4karo »

Nie masz sumy funkcji wypukłych, tylko sumę wartości tej samej funkcji wypukłej w kilku różnych punktach. Nierówność Jensena da Ci ograniczenie z dołu na taką sumę. Pomyśl kiedy to minimum da sie osiągnąć.
ODPOWIEDZ