АГЛОМЕРАЦИОННАЯ СТРУКТУРНАЯ И БЕССТРУКТУРНАЯ КЛАСТЕРИЗАЦИЯ

20 мая 3:32

Определяется два последствия навязывания связи:

  1. кластеризация;
  2. матрица связности.

 

Второй тип более быстрый. Помимо этого, при использовании матрицы связности одиночная, средняя и полная связь нестабильны и имеют тенденцию создавать несколько кластеров, которые растут с высокой скоростью. Объяснимо это типом кластера, в результате чего средняя и полная связь избегают такого явления (высокий рост) перколяционным поведением, рассматривая все расстояния между двумя кластерами при их объединении (в то время как одиночная связь преувеличивает поведение, рассматривая только самое короткое расстояние между кластерами).

На рисунках 1 – 2 находятся графики, на которых последовательно (слева направо) изображаются: среднее, полное, камерное и одиночное представление трёх кластеров для отсутствующей связи структуры и с ней.

http://meridian-journal.ru/uploads/2020/04/3916-1.PNG

 

Рисунок 1. Бесструктурный кластер из трех.

Рисунок 2. Объединение трёх кластеров с добавлением структурной связи.

 

Средняя связь структурного кластера при появлении связи смешивает классы и превозносит преобладание одного класса. Такой же эффект наблюдается и у полной кластеризации, но на одиночную и камерную сильного эффекта не наблюдается; увеличение числа кластеров повысит этот эффект – он станет заметным даже при первичном анализе (рисунок 3, 4)

 

Рисунок 3. Объединение тридцати кластеров без структурной свзяи

 

Рисунок 4. Объединение тридцати кластеров в общую структурную связь.

 

Граф связности нарушает этот механизм для средней и полной связи, делая их похожими на более хрупкую единственную связь. Этот эффект более выражен для полносвязных и очень разреженных графов (уменьшение числа соседей в алгоритме ближайших соседей). В частности, имея очень небольшое количество соседей в графе, прослеживается геометрия, близкая к геометрии одиночной связи, которая обладает такой же перколяционной неустойчивостью.

 Список литературы: 

  1. Geron. Hands-on Machine learning with Scikit-Learn, Keras, and TensorFlow, OREILLY Sebastopol, California – USA, 2019
  2. Bruce, A. Bruce. Practical statistics for data scientists, OREILLY Sebastopol, California – USA, 2017
  3. Theodoridis, A. Pikrakis. Introduction to Pattern Recognition: A MATLAB Approach, Elsevier press, 2010
  4. Narasimha Murty, V. Susheela Devy. Introduction to pattern recognition and machine learning, IISc press, New Jersey – London, 2015
  5. Christopher Bishop. Pattern Recognition and Machine Learning, Plenum press, New York – London, 1971