Рӯйхати иерархӣ ва гурӯҳбандии қисман

Гурӯҳбандӣ ин як усули омӯзиши мошинии таҳлили додаҳо ва тақсим ба гурӯҳҳои ба он монанд мебошад. Ин гурӯҳҳо ё маҷмӯи додаҳои монандро ҳамчун кластерҳо мешиносанд. Таҳлили кластерӣ ба алгоритмҳои кластерӣ, ки кластерҳоро ба таври худкор муайян карда метавонанд, назар мекунад. Иерархикӣ ва қисман ду чунин синфҳои алгоритмҳои кластерӣ мебошанд. Алгоритмҳои кластерии иерархӣ маълумотро ба иерархияи кластерҳо тақсим мекунанд. Алгоритмҳои параллелӣ додаҳои ба қисмҳо ҷудошавандаро тақсим мекунанд.

Гурӯҳбандии иерархӣ чист?

Алгоритмҳои кластерии иерархӣ давраи ё муттаҳид кардани кластерҳои хурдтар ба калонтар ё таксим кардани кластерҳои калонтарро ба хурдтар такрор мекунанд. Дар ҳар сурат, он иерархияи кластерҳо ном дорад, ки онро дендограм меноманд. Стратегияи кластерии агломеративӣ равиши аз поён ба боло муттаҳид кардани кластерҳоро ба калонтар истифода мебарад, дар ҳоле ки стратегияи тақсимоти кластерӣ тақсим кардани усули аз боло ба поён ҷудошударо ба хурдтар истифода мекунад. Одатан, усули чашмгуруснагӣ ҳангоми муайян кардани он, ки кластерҳои калонтар ё хурдтар барои муттаҳид / тақсим кардан истифода мешаванд. Масофаи Евклид, масофаи Манҳеттан ва монандии косинусҳо баъзе аз ченакҳои маъмултарини монандии додаҳои ададӣ мебошанд. Барои маълумоти ғайримуқаррарӣ метрикҳо ба монанди масофаи Hamming истифода мешаванд. Қайд кардан муҳим аст, ки мушоҳидаҳои воқеӣ (ҳолатҳо) барои гурӯҳбандии иерархикӣ лозим нестанд, зеро танҳо матритсаи масофа кифоя аст. Dendogram як пешниҳоди визуалии кластерҳо мебошад, ки иерархияро ба таври возеҳ нишон медиҳад. Истифодабаранда метавонад вобаста аз сатҳи бурида шудани dendogram кластерҳои гуногун гирад.

Гурӯҳбандии қисмӣ чист?

Алгоритмҳои кластерии қисмкунӣ бахшҳои гуногунро эҷод мекунанд ва сипас онҳоро аз рӯи як меъёр баҳо медиҳанд. Онҳоро ҳамчун ғайрихарархӣ низ меноманд, зеро ҳар як намуна дар як кластерҳои мутақобилаи истисноӣ ҷойгир карда шудааст. Азбаски танҳо як маҷмӯи кластерҳо натиҷаи алгоритми муқаррарии кластерии қисман ҷудошуда аст, корбарро лозим аст, ки шумораи дилхоҳи кластерҳоро (одатан к) номида шавад. Яке аз маъмултарин алгоритмҳои қисман кластерии қисман истифодашаванда ин алгоритми кластерии к-маънои. Истифодабаранда вазифадор аст, ки пеш аз оғоз шумораи кластерҳоро (k) пешниҳод кунад ва алгоритм аввал марказҳоро (ё centroids) қисмҳои k-ро оғоз кунад. Хулоса, k-маънои алгоритми кластерӣ сипас аъзоёнро дар асоси марказҳои ҷорӣ ва марказҳои такрорӣ бар асоси аъзои кунунӣ тақсим мекунад. Ин ду қадам то он даме ки ягон вазифаи объективии шабеҳи ҳамбастагии дохили кластер ва хусусияти фарқияти фарқияти байни кластерҳо оптимизатсия карда мешаванд, такрор карда мешаванд. Аз ин рӯ, оғозкунии оқилонаи марказҳо омили муҳими гирифтани натиҷаҳои сифат аз алгоритмҳои қисман кластерӣ мебошад.

Тафовути гурӯҳбандии зинанизомӣ ва қисмӣ чӣ гуна аст?

Гурӯҳбандии иерархикӣ ва қисманӣ дар фарқияти калидӣ дар вақти кор, пиндоштҳо, параметрҳои вуруд ва кластерҳои натиҷавӣ фарқият доранд. Одатан, кластерсияи қисман назар ба кластератсияи иерархикӣ тезтар аст. Кластеризатсияи иерархӣ танҳо ченаки монандиро талаб мекунад, дар ҳоле ки кластерияи қисман пиндошти мустаҳкамро талаб мекунад, ба монанди шумораи кластерҳо ва марказҳои ибтидоӣ. Кластеризатсияи иерархӣ ягон параметрҳои воридшавиро талаб намекунад, дар ҳоле ки алгоритмҳои кластерии қисман шумораи кластерҳо барои оғози кор тақозо мекунанд. Кластеризатсияи иерархӣ тақсимоти бештар самарабахш ва субъективии кластерҳоро бармегардонад, аммо кластери қисман ба кластерҳои дақиқ оварда мерасонад. Алгоритмҳои кластерии иерархӣ барои маълумоти категориявӣ бештар мувофиқанд, ба шарте ки ченаки монандиро мутобиқи онҳо муайян кардан мумкин аст.