Ako nájsť centroid v zhlukovej analýze

Posted on
Autor: Judy Howell
Dátum Stvorenia: 1 V Júli 2021
Dátum Aktualizácie: 15 November 2024
Anonim
Ako nájsť centroid v zhlukovej analýze - Veda
Ako nájsť centroid v zhlukovej analýze - Veda

Obsah

Zhluková analýza je metóda usporiadania údajov do reprezentatívnych skupín na základe podobných charakteristík. Každý člen klastra má viac spoločných s ostatnými členmi toho istého klastra ako s členmi iných skupín. Najreprezentatívnejší bod v skupine sa nazýva ťažisko. Zvyčajne je to priemer hodnôt dátových bodov v klastri.

    Usporiadajte údaje. Ak údaje pozostávajú z jednej premennej, môže byť vhodný histogram. Ak sú zapojené dve premenné, zaznamenajte údaje na súradnicovej rovine. Napríklad, ak ste v triede sledovali výšku a hmotnosť školských detí, nakreslite body údajov pre každé dieťa do grafu, pričom váhou je vodorovná os a výška zvislou osou. Ak sú zapojené viac ako dve premenné, na zobrazenie údajov môže byť potrebná matica.

    Zoskupte údaje do zoskupení. Každý klaster by sa mal skladať z dát, ktoré sú najbližšie k nemu. V príklade výšky a hmotnosti zoskupte všetky body údajov, ktoré sa zdajú byť blízko seba. Počet klastrov a to, či každý údajový údaj musí byť v klastri, môže závisieť od účelu štúdie.

    Pre každý klaster pridajte hodnoty všetkých členov.Napríklad, ak súbor údajov pozostával z bodov (80, 56), (75, 53), (60, 50) a (68,54), súčet hodnôt by bol (283, 213).

    Vydeľte súčet počtom členov klastra. Vo vyššie uvedenom príklade je 283 delené štyrmi 70,75 a 213 delené štyrmi je 53,25, takže ťažisko klastra je (70,75, 53,25).

    Nakreslite ťažiská klastra a určte, či sú nejaké body bližšie k ťažisku iného klastra ako k ťažisku ich vlastného klastra. Ak sú niektoré body bližšie k inému ťažisku, rozdeľte ich do zoskupenia obsahujúceho bližšie ťažisko.

    Opakujte kroky 3, 4 a 5, až kým všetky body údajov nebudú v zoskupení obsahujúcom ťažisko, ku ktorému sú najbližšie.

    Tipy