Линейная и логистическая регрессия
В статистическом анализе важно определить отношения между переменными, рассматриваемыми в исследовании. Иногда это может быть единственной целью самого анализа. Одним из сильных инструментов, используемых для установления существования взаимосвязи и выявления связи, является регрессионный анализ..
Простейшей формой регрессионного анализа является линейная регрессия, где связь между переменными представляет собой линейную зависимость. В статистических терминах он выявляет взаимосвязь между объясняющей переменной и переменной отклика. Например, с помощью регрессии мы можем установить связь между ценой товара и потреблением на основе данных, собранных из случайной выборки. Регрессионный анализ создаст регрессионную функцию набора данных, которая представляет собой математическую модель, которая наилучшим образом соответствует имеющимся данным. Это может быть легко представлено графиком рассеяния. Графически регрессия эквивалентна поиску наиболее подходящей кривой для заданного набора данных. Функция кривой - это функция регрессии. Используя математическую модель, можно предсказать использование товара по заданной цене.
Поэтому регрессионный анализ широко используется в прогнозировании и прогнозировании. Он также используется для установления взаимосвязей в экспериментальных данных в областях физики, химии и во многих естественных и технических дисциплинах. Если отношение или функция регрессии является линейной функцией, то процесс известен как линейная регрессия. На точечной диаграмме его можно представить в виде прямой линии. Если функция не является линейной комбинацией параметров, то регрессия нелинейна.
Логистическую регрессию можно сравнить с многомерной регрессией, и она создает модель, объясняющую влияние нескольких предикторов на переменную отклика. Однако в логистической регрессии переменная конечного результата должна быть категориальной (обычно разделенной, т. Е. Пара достижимых результатов, таких как смерть или выживание, хотя специальные методы позволяют моделировать более категоризированную информацию). Непрерывная переменная результата может быть преобразована в категориальную переменную для использования в логистической регрессии; однако сворачивание непрерывных переменных таким образом в основном не рекомендуется, поскольку это снижает точность.
В отличие от линейной регрессии, к среднему, переменные-предикторы в логистической регрессии не обязательно должны быть линейно связаны, обычно распределены или иметь одинаковую дисперсию внутри каждого кластера. В результате связь между предиктором и переменными результата вряд ли будет линейной функцией.
В чем разница между логистической и линейной регрессией?
• В линейной регрессии предполагается линейная связь между независимой переменной и переменной отклика, и параметры, удовлетворяющие модели, находятся с помощью анализа, чтобы получить точное соотношение.
• Линейная регрессия выполняется для количественных переменных, и результирующая функция является количественной.
• В логистической регрессии используемые данные могут быть либо категориальными, либо количественными, но результат всегда категоричен.