TY - JOUR AU - Н. С. Орленко AU - К. М. Мажуга AU - М. Б. Душар AU - В. В. Маслечкін PY - 2019/06/28 Y2 - 2024/03/29 TI - ПОРІВНЯЛЬНИЙ АНАЛІЗ ІЄРАРХІЧНИХ МЕТОДІВ КЛАСТЕРІЗАЦІЇ, ПРИДАТНИХ ДЛЯ ОБРОБЛЕННЯ ДАНИХ МОРФОЛОГІЧНИХ ОЗНАК СОРТІВ РОСЛИН JF - Вісник Полтавської державної аграрної академії JA - Scient.Prog.&Innov. VL - 0 IS - 2 SE - ТЕХНІЧНІ НАУКИ DO - 10.31210/visnyk2019.02.35 UR - https://journals.pdaa.edu.ua/visnyk/article/view/1180 AB - Незважаючи на те, що кластеризація є безконтрольною класифікацією багатовимірних даних увідповідні кластери, застосування кластерного аналізу під час дослідження морфологічних харак-теристик сортів рослин дозволяє зменшити розмірність вибірки даних, що сприяє більш точній іде-нтифікації нових сортів. Саме тому важливим питанням є порівняння результатів кластеризації іззастосуванням різних методів і метрик та виявлення найбільш придатних для аналізу морфологічниххарактеристик. Методи: аналітичний, математичний, статистичний, графічний. Під час виконан-ня досліджень використано широко відомий набір даних, що має назву Іриси Фішера. Результати.Досліджено вплив на результат кластерного аналізу різних ієрархічних агломеративних методівкласифікації (ближнього сусіда, дальнього сусіда, середнього зв'язку, середнього сусіда (центроїда)та метода Варда) із застосуванням евклідових та не евклідових метрик. Оцінено результати клас-терізації з використанням засобів описової статистики (методу перехресних таблиць). Встановле-но, що найбільш придатними для проведення кластеризації за морфологічними характеристикамидля наборів даних, які описуються метричними шкалами є методи: середнього зв'язку (між групами)із застосуванням кореляції Пірсона, середнього зв'язку (всередині групи) із застосуванням метрикКосінус та кореляції Пірсона, а також методу Варда із застосуванням метрики Косінус. Запропо-новано використовувати апарат частотної статистики (перехресні таблиці) для оцінювання якос-ті результатів класифікації. Висновки. Проведене тестування довело, що не існує жодного універса-льного алгоритму, який би ідеально розподілив набір Ірисів Фішера на кластери. Не зважаючи на те,що встановлено методи й метрики, які є найбільш вдалими для класифікації протестованого наборуданих, ці методи не можна рекомендувати для використання під час тестування морфологічних оз-нак усіх ботанічних таксонів. Кластеризацію сортів рослин потрібно проводити ітераційно, послі-довно застосовуючи найбільш поширені алгоритми кластеризації та ретельно оцінювати результа-ти кластеризації з метою вибору метода та метрики, які найбільш оптимально класифікують сор-ти рослин та дозволять правильно інтерпретувати результати класифікації. Результати такоїкластеризації рекомендовано оцінювати з використанням методу перехресних таблиць та обиратикращий за якістю кластерів. ER -