Разница между кластеризацией и классификацией

Оглавление:

Разница между кластеризацией и классификацией
Разница между кластеризацией и классификацией

Видео: Разница между кластеризацией и классификацией

Видео: Разница между кластеризацией и классификацией
Видео: ML: Что такое Кластеризация/clustering, где применяется, как работает, виды алгоритмов 2024, Ноябрь
Anonim

Ключевое различие между кластеризацией и классификацией заключается в том, что кластеризация - это метод обучения без учителя, который группирует похожие экземпляры на основе признаков, тогда как классификация - это метод обучения с учителем, который присваивает предопределенные теги экземплярам на основе признаков.

Хотя кластеризация и классификация кажутся похожими процессами, между ними есть разница, основанная на их значении. В мире интеллектуального анализа данных кластеризация и классификация - это два типа методов обучения. Оба эти метода характеризуют объекты в группы по одному или нескольким признакам.

Что такое кластеризация?

Кластеризация - это метод группировки объектов таким образом, что объекты с похожими характеристиками объединяются, а объекты с разными характеристиками разъединяются. Это распространенный метод статистического анализа данных для машинного обучения и интеллектуального анализа данных. Исследовательский анализ и обобщение данных также является областью, в которой используется кластеризация.

Разница между кластеризацией и классификацией
Разница между кластеризацией и классификацией
Разница между кластеризацией и классификацией
Разница между кластеризацией и классификацией

Рисунок 01: Кластеризация

Кластеризация относится к неконтролируемому анализу данных. Это не какой-то конкретный алгоритм, а общий метод решения задачи. Поэтому можно добиться кластеризации с помощью различных алгоритмов. Соответствующий кластерный алгоритм и настройки параметров зависят от отдельных наборов данных. Это не автоматическая задача, а итеративный процесс обнаружения. Следовательно, необходимо модифицировать обработку данных и моделирование параметров до тех пор, пока результат не достигнет желаемых свойств. Кластеризация K-средних и иерархическая кластеризация - это два распространенных алгоритма кластеризации в интеллектуальном анализе данных.

Что такое классификация?

Классификация - это процесс категоризации, в котором используется обучающий набор данных для распознавания, дифференциации и понимания объектов. Классификация - это метод обучения под наблюдением, в котором доступны обучающая выборка и правильно определенные наблюдения.

Ключевая разница - кластеризация и классификация
Ключевая разница - кластеризация и классификация
Ключевая разница - кластеризация и классификация
Ключевая разница - кластеризация и классификация

Рисунок 02: Классификация

Алгоритм, который реализует классификацию, является классификатором, тогда как наблюдения являются экземплярами. Алгоритм K-ближайших соседей и алгоритмы дерева решений являются наиболее известными алгоритмами классификации в интеллектуальном анализе данных.

В чем разница между кластеризацией и классификацией?

Кластеризация - это обучение без учителя, а классификация - метод обучения с учителем. Он группирует похожие экземпляры на основе функций, тогда как классификация присваивает экземплярам предопределенные теги на основе функций. Кластеризация разделила набор данных на подмножества, чтобы сгруппировать экземпляры со схожими функциями. Он не использует размеченные данные или обучающий набор. С другой стороны, классифицируйте новые данные в соответствии с наблюдениями обучающей выборки. Тренировочный набор помечен.

Цель кластеризации состоит в том, чтобы сгруппировать набор объектов, чтобы выяснить, есть ли какая-либо связь между ними, тогда как классификация направлена на то, чтобы найти, к какому классу принадлежит новый объект из набора предопределенных классов.

Изображение
Изображение
Изображение
Изображение

Резюме – Кластеризация и классификация

Кластеризация и классификация могут показаться похожими, потому что оба алгоритма интеллектуального анализа данных делят набор данных на подмножества, но это два разных метода обучения интеллектуальному анализу данных для получения надежной информации из набора необработанных данных. Разница между кластеризацией и классификацией заключается в том, что кластеризация - это метод обучения без учителя, который группирует похожие экземпляры на основе признаков, тогда как классификация - это метод обучения с учителем, который присваивает предопределенные теги экземплярам на основе признаков.

Изображение предоставлено:

1. «Cluster-2» от Cluster-2.gif: производная работа hellisp: (общественное достояние) через Wikimedia Commons 2. «Магнетизм» Джона Аплесседа - собственная работа. (Общественное достояние) через Wikimedia Commons

Рекомендуемые: