Jedan od alata za rješavanje ekonomskih problema je klasterska analiza. Koristeći ga, klasteri i drugi objekti u nizu podataka klasificiraju se u skupine. Ova se metoda može koristiti u Excelu. Pogledajmo kako se to radi u praksi.
Korištenje klaster analize
Uz pomoć analize klastera, moguće je uzorkovati na temelju onoga što se istražuje. Njezin je glavni zadatak podijeliti multidimenzionalni niz u homogene skupine. Kao kriterij grupiranja primjenjuje se par korelacijskog koeficijenta ili Euklidska udaljenost između objekata prema određenom parametru. Najbliže međusobno vrijednosti grupiraju se zajedno.
Iako se ova vrsta analize najčešće koristi u gospodarstvu, ona se također može koristiti u biologiji (za klasifikaciju životinja), psihologije, medicine i na mnogim drugim područjima ljudske djelatnosti. Klaster analiza može se primijeniti pomoću standardnog Excel alata za tu svrhu.
Primjer korištenja
Imamo pet objekata koji su karakterizirani dvama parametrima - x i y .
- Primijenite na te vrijednosti formulu Euklidske udaljenosti koja se izračunava iz predloška:
=КОРЕНЬ((x2-x1)^2+(y2-y1)^2)
- Ova se vrijednost izračunava između svakog od pet objekata. Rezultati izračuna nalaze se u matrici udaljenosti.
- Izgledamo između onih vrijednosti koje je udaljenost najmanje. U našem primjeru to su objekti 1 i 2 . Udaljenost između njih je 4.123106, što je manje od bilo kojeg drugog elementa dane populacije.
- Kombiniramo te podatke u skupinu i oblikuju novu matricu, u kojoj su vrijednosti od 1,2 zasebni element. Prilikom sastavljanja matrice ostavljamo najmanju vrijednost iz prethodne tablice za kombinirani element. Opet gledamo, između kojih elemenata je udaljenost minimalna. Ovaj put je 4 i 5 , a također i objekt 5 i skupina objekata 1,2 . Udaljenost je 6,708204.
- Dodat ćemo navedene elemente općem klasteru. Mi formiramo novu matricu na isti princip kao u prethodnom vremenu. To jest, tražimo najniže vrijednosti. Tako vidimo da se naš skup podataka može podijeliti u dva klastera. U prvom skupu, najbliži elementi su 1 , 2 , 4 , 5 . U drugom klasteru, u našem slučaju, zastupa samo jedan element - 3 . Relativno je daleko od drugih objekata. Udaljenost između klastera iznosi 9,84.
Time se zaključuje postupak razdvajanja zbirke u skupine.
Kao što možete vidjeti, iako se općenito klaster analiza može činiti kompliciranim postupkom, nije tako teško razumjeti nijanse ove metode. Glavna stvar je razumjeti osnovni obrazac grupiranja.