Silhouette Coefficient – czy dobrze pogrupowałem obserwacje?

Inspekcja

Powróćmy na chwilę do uczenia nienadzorowanego. Dwa artykuły temu pisałem o jednym z prostszych i jednocześnie użytecznych algorytmów - k-średnich. Zapoznaliśmy się ze sposobem jego działania i z wynikami które dzięki niemu uzyskujemy (koncentrycznie pogrupowane obserwacje). Nie umknęła nam też największa wada tego algorytmu - ustalanie liczby grup, które chcemy uzyskać (tytułowe k). Czasem ustalenie … Czytaj dalej Silhouette Coefficient – czy dobrze pogrupowałem obserwacje?

Ile tak naprawdę są warte nasze modele?

Ruiny zamku

Całkiem nieźle idzie nam przetwarzanie danych do postaci ramki danych. Sprawnie wykorzystujemy Pythona i różne moduły, które oferują funkcje modelujące. Dzielimy dane na zbiory treningowe i testowe. Uzyskujemy całkiem niezłe wyniki i zaczynamy odczuwać zadowolenie. Ale czy aby na pewno jest to już ten moment? Czy aby na pewno stworzyliśmy coś, co ma sens? Coś, … Czytaj dalej Ile tak naprawdę są warte nasze modele?