Strona 1 z 1

Grupowanie danych

: 2 lis 2013, o 09:51
autor: jeth
Witam,

Mam problem, w którym potrzebuję grupować dane. Konkretnie jest to problem pogrupowania studentów według pewnych cech, jakimi są oni opisani i połączenia ich do pracy w grupie. Ma się to odbywać w taki sposób, że każdy student jest opisany za pomocą czterech atrybutów (jak w tabelce poniżej) i trzeba ich połączyć do pracy w grupie - to znaczy z tej tabelki "powyciągać" takich, którzy są opisani identycznymi wartościami - i oni utworzą grupę. Dla ułatwienia jest przyjęte, że nie trzeba tworzyć dużych grup, tylko pary.
Może od razu opiszę to na przykładzie:
mam kilkudziesięciu studentów uporządkowanych tak, jak w tej tabelce (oczywiście ta tabelka to tylko fragment):
\(\displaystyle{ \begin{tabular}{l|l}
Student (LP.) & Cechy\\ \hline
1 & aktywny, sensualny, wizualny, sekwencyjny \\ \hline
2 & aktywny, sensualny, wizualny, globalny \\ \hline
3 & refleksyjny, sensualny, wizualny, globalny \\ \hline
4 & refleksyjny, intuicyjny, wizualny, sekwencyjny \\ \hline
5 & aktywny, sensualny, wizualny, globalny \\ \hline
6 & aktywny, intuicyjny, wizualny, sekwencyjny \\ \hline
itd. & itd. ... \\
\end{tabular}}\)

Czyli bazując na tym, co napisałem powyżej, do pracy w grupie należałoby połączyć studentów 2 i 5, gdyż opisani są w taki sam sposób, itd.
Pytanie moje brzmi: jakiego algorytmu użyć do takiego grupowania? Myślałem o użyciu algorytmu apriori, jednak zostało mi to odradzone ze względu na to, że "wymaga on dużego zbioru danych". Myślałem też o naiwnym klasyfikatorze Bayesa, jednak nie do końca wiem, jak go tutaj użyć - ten klasyfikator wymaga zbioru uczącego (trenującego) i definiując jakiś własny zbiór testowy, klasyfikator odpowiada na pytanie, czy w zbiorze testowym wartości zostały poprawnie przydzielone - a mi bardziej chodzi o to, żeby uzyskać gotowe grupy.
Ze względu na charakter danych, algorytm k-średnich chyba tutaj odpada.

Czy ktoś mógłby coś poradzić?
Z góry dziękuję,
pozdrawiam.