Ключевое различие между классификацией и деревом регрессии заключается в том, что в классификации зависимые переменные являются категориальными и неупорядоченными, тогда как в регрессии зависимые переменные являются непрерывными или упорядоченными целыми значениями.
Классификация и регрессия - это методы обучения для создания моделей прогнозирования на основе собранных данных. Обе методики графически представлены в виде деревьев классификации и регрессии, а точнее блок-схем с делениями данных после каждого шага, а точнее «ветви» в дереве. Этот процесс называется рекурсивным разбиением. В таких областях, как горное дело, используются эти методы классификации и регрессионного обучения. В этой статье основное внимание уделяется дереву классификации и дереву регрессии.
Что такое классификация?
Классификация - это метод, используемый для получения схемы, которая показывает организацию данных, начиная с переменной-предшественника. Зависимые переменные - это то, что классифицирует данные.
Рисунок 01. Интеллектуальный анализ данных
Дерево классификации начинается с независимой переменной, которая разветвляется на две группы, определяемые существующими зависимыми переменными. Он предназначен для разъяснения ответов в форме категоризации, вызванной зависимыми переменными.
Что такое регрессия
Регрессия - это метод прогнозирования, основанный на предполагаемом или известном числовом выходном значении. Это выходное значение является результатом серии рекурсивных разбиений, при этом каждый шаг имеет одно числовое значение и другую группу зависимых переменных, которые разветвляются на другую пару, такую как эта.
Дерево регрессии начинается с одной или нескольких переменных-предшественников и заканчивается одной конечной выходной переменной. Зависимые переменные являются либо непрерывными, либо дискретными числовыми переменными.
В чем разница между классификацией и регрессией?
Классификация и регрессия |
|
Модель дерева, в которой целевая переменная может принимать дискретный набор значений. | Модель дерева, в которой целевая переменная может принимать непрерывные значения, обычно действительные числа. |
Зависимая переменная | |
Для дерева классификации зависимые переменные являются категориальными. | Для дерева регрессии зависимые переменные являются числовыми. |
Ценности | |
Имеет заданное количество неупорядоченных значений. | Имеет либо дискретные, но упорядоченные значения, либо недискретные значения. |
Цель конструкции | |
Цель построения дерева регрессии состоит в том, чтобы подогнать регрессионную систему к каждой ветви определителя таким образом, чтобы получить ожидаемое выходное значение. | Дерево классификации разветвляется, как определено зависимой переменной, полученной из предыдущего узла. |
Резюме – Классификация и регрессия
Регрессионное и классификационное деревья являются полезными методами для отображения процесса, который указывает на изучаемый результат, будь то классификация или отдельное числовое значение. Различие между деревом классификации и деревом регрессии заключается в их зависимой переменной. Деревья классификации имеют зависимые переменные, которые являются категориальными и неупорядоченными. Деревья регрессии имеют зависимые переменные, которые являются непрерывными значениями или упорядоченными целыми значениями.