Silhouette Coefficient – czy dobrze pogrupowałem obserwacje?

Inspekcja

Powróćmy na chwilę do uczenia nienadzorowanego. Dwa artykuły temu pisałem o jednym z prostszych i jednocześnie użytecznych algorytmów - k-średnich. Zapoznaliśmy się ze sposobem jego działania i z wynikami które dzięki niemu uzyskujemy (koncentrycznie pogrupowane obserwacje). Nie umknęła nam też największa wada tego algorytmu - ustalanie liczby grup, które chcemy uzyskać (tytułowe k). Czasem ustalenie … Czytaj dalej Silhouette Coefficient – czy dobrze pogrupowałem obserwacje?

Analiza skupień na przykładzie algorytmu k-średnich

Gargulec

Jednym z ciekawszych, a jednocześnie nie jednym z pierwszych zagadnień, na które można natrafić w uczeniu maszynowym, jest analiza skupień. Brzmi to trochę groźnie, ale tak naprawdę chodzi o sensowne grupowanie obserwacji w celu uzyskania jakiejś dodatkowej informacji. Analiza skupień to jedna z dziedzin uczenia nienadzorowanego. Dziedzina ta należy do uczenia nienadzorowanego, gdyż nie mamy … Czytaj dalej Analiza skupień na przykładzie algorytmu k-średnich