Ключевая разница - контролируемое и неконтролируемое машинное обучение
Обучение с учителем и обучение без учителя - две основные концепции машинного обучения. Обучение с учителем - это задача машинного обучения для изучения функции, которая сопоставляет ввод с выводом на основе примеров пар ввода-вывода. Неконтролируемое обучение - это задача машинного обучения, заключающаяся в выводе функции для описания скрытой структуры из немаркированных данных. Ключевое различие между машинным обучением с учителем и без учителя заключается в том, что обучение с учителем использует помеченные данные, а обучение без учителя использует немаркированные данные.
Машинное обучение - это область компьютерных наук, которая дает компьютерной системе возможность учиться на данных без явного программирования. Это позволяет анализировать данные и прогнозировать закономерности в них. Существует множество приложений машинного обучения. Некоторые из них - распознавание лиц, распознавание жестов и распознавание речи. Существуют различные алгоритмы, связанные с машинным обучением. Некоторыми из них являются регрессия, классификация и кластеризация. Наиболее распространенными языками программирования для разработки приложений на основе машинного обучения являются R и Python. Также можно использовать другие языки, такие как Java, C++ и Matlab.
Что такое контролируемое обучение?
В системах на основе машинного обучения модель работает по алгоритму. При обучении с учителем модель находится под наблюдением. Во-первых, необходимо обучить модель. С полученными знаниями он может предсказать ответы для будущих инстанций. Модель обучается с использованием помеченного набора данных. Когда в систему передаются данные вне выборки, она может предсказать результат. Ниже приведен небольшой отрывок из популярного набора данных IRIS.
Согласно приведенной выше таблице, длина чашелистика, ширина чашелистика, длина пателя, ширина пателя и виды называются атрибутами. Столбцы известны как функции. Одна строка содержит данные для всех атрибутов. Поэтому одна строка называется наблюдением. Данные могут быть числовыми или категориальными. На вход модели подаются наблюдения с соответствующим названием вида. Когда дается новое наблюдение, модель должна предсказать тип вида, к которому оно принадлежит.
В обучении с учителем существуют алгоритмы классификации и регрессии. Классификация - это процесс классификации помеченных данных. Модель создала границы, разделяющие категории данных. Когда в модель поступают новые данные, она может классифицироваться в зависимости от того, где находится точка. K-ближайшие соседи (KNN) - это классификационная модель. В зависимости от значения k определяется категория. Например, когда k равно 5, если конкретная точка данных находится рядом с восемью точками данных в категории A и шестью точками данных в категории B, то точка данных будет классифицирована как A.
Регрессия - это процесс прогнозирования тенденции предыдущих данных для прогнозирования результата новых данных. В регрессии выходные данные могут состоять из одной или нескольких непрерывных переменных. Прогноз делается с использованием линии, которая покрывает большинство точек данных. Самая простая регрессионная модель - это линейная регрессия. Это быстро и не требует настройки параметров, как в KNN. Если данные показывают параболический тренд, то модель линейной регрессии не подходит.
Это несколько примеров алгоритмов обучения с учителем. Как правило, результаты, полученные с помощью контролируемых методов обучения, являются более точными и надежными, поскольку входные данные хорошо известны и помечены. Поэтому машине приходится анализировать только скрытые паттерны.
Что такое обучение без учителя?
При неконтролируемом обучении модель не контролируется. Модель работает сама по себе, предсказывая результаты. Он использует алгоритмы машинного обучения, чтобы делать выводы на основе неразмеченных данных. Как правило, алгоритмы обучения без учителя сложнее, чем алгоритмы обучения с учителем, потому что информации мало. Кластеризация - это тип обучения без учителя. Его можно использовать для группировки неизвестных данных с помощью алгоритмов. Кластеризация на основе k-mean и плотности - это два алгоритма кластеризации.
Алгоритм k-mean случайным образом размещает центр тяжести k для каждого кластера. Затем каждая точка данных присваивается ближайшему центроиду. Евклидово расстояние используется для расчета расстояния от точки данных до центроида. Точки данных разбиты на группы. Позиции для k центроидов вычисляются снова. Новое положение центроида определяется средним значением всех точек в группе. Снова каждая точка данных назначается ближайшему центроиду. Этот процесс повторяется до тех пор, пока центроиды больше не меняются. k-mean - это быстрый алгоритм кластеризации, но не указана инициализация точек кластеризации. Кроме того, существует большое разнообразие моделей кластеризации, основанных на инициализации точек кластеризации.
Другим алгоритмом кластеризации является кластеризация на основе плотности. Он также известен как приложения пространственной кластеризации на основе плотности с шумом. Он работает, определяя кластер как максимальный набор связанных точек плотности. Это два параметра, используемые для кластеризации на основе плотности. Это Ɛ (эпсилон) и минимальные точки. Ɛ - максимальный радиус окрестности. Минимальные точки - это минимальное количество точек в окрестности Ɛ для определения кластера. Это несколько примеров кластеризации, которая относится к неконтролируемому обучению.
Как правило, результаты, полученные с помощью алгоритмов обучения без учителя, не очень точны и надежны, потому что машина должна определить и пометить входные данные, прежде чем определить скрытые шаблоны и функции.
В чем сходство между контролируемым и неконтролируемым машинным обучением?
Обучение с учителем и обучение без учителя являются типами машинного обучения
В чем разница между контролируемым и неконтролируемым машинным обучением?
Контролируемое и неконтролируемое машинное обучение |
|
Обучение с учителем - это задача машинного обучения, заключающаяся в изучении функции, которая сопоставляет ввод с выводом на основе примеров пар ввода-вывода. | Обучение без учителя - это задача машинного обучения, заключающаяся в выводе функции для описания скрытой структуры из немаркированных данных. |
Основной функционал | |
В обучении с учителем модель предсказывает результат на основе размеченных входных данных. | В неконтролируемом обучении модель предсказывает результат без размеченных данных, самостоятельно определяя закономерности. |
Точность результатов | |
Результаты, полученные с помощью контролируемых методов обучения, более точны и надежны. | Результаты, полученные с помощью методов обучения без учителя, не очень точны и надежны. |
Основные алгоритмы | |
Существуют алгоритмы регрессии и классификации в обучении с учителем. | Существуют алгоритмы кластеризации в неконтролируемом обучении. |
Резюме – Контролируемое и неконтролируемое машинное обучение
Обучение с учителем и обучение без учителя - это два типа машинного обучения. Обучение с учителем - это задача машинного обучения для изучения функции, которая сопоставляет ввод с выводом на основе примеров пар ввода-вывода. Неконтролируемое обучение - это задача машинного обучения, заключающаяся в выводе функции для описания скрытой структуры из немаркированных данных. Разница между машинным обучением с учителем и без учителя заключается в том, что обучение с учителем использует помеченные данные, а обучение без учителя использует немаркированные данные.