Регрессия против корреляции
В статистике важно определить связь между двумя случайными величинами. Это дает возможность делать прогнозы относительно одной переменной относительно других. Регрессионный анализ и корреляция применяются в прогнозах погоды, поведении финансового рынка, установлении физических взаимосвязей с помощью экспериментов и в гораздо более реальных сценариях.
Что такое регрессия?
Регрессия - это статистический метод, используемый для построения связи между двумя переменными. Часто при сборе данных могут быть переменные, которые зависят от других. Точная связь между этими переменными может быть установлена только методами регрессии. Определение этой взаимосвязи помогает понять и предсказать поведение одной переменной по отношению к другой.
Наиболее распространенное применение регрессионного анализа заключается в оценке значения зависимой переменной для заданного значения или диапазона значений независимых переменных. Например, с помощью регрессии мы можем установить связь между ценой товара и потреблением на основе данных, собранных из случайной выборки. Регрессионный анализ создает функцию регрессии набора данных, которая представляет собой математическую модель, которая лучше всего соответствует доступным данным. Это может быть легко представлено графиком рассеяния. Графически регрессия эквивалентна поиску наиболее подходящей кривой для данного набора данных. Функция кривой - это функция регрессии. Используя математическую модель, можно предсказать спрос на товар по заданной цене.
Поэтому регрессионный анализ широко используется в прогнозировании и прогнозировании. Он также используется для установления взаимосвязей в экспериментальных данных в областях физики, химии и многих естественных наук и инженерных дисциплин. Если отношение или функция регрессии является линейной функцией, то процесс известен как линейная регрессия. На точечной диаграмме его можно представить в виде прямой линии. Если функция не является линейной комбинацией параметров, то регрессия нелинейна.
Что такое корреляция?
Корреляция - это мера силы взаимосвязи между двумя переменными. Коэффициент корреляции количественно определяет степень изменения одной переменной на основе изменения другой переменной. В статистике корреляция связана с концепцией зависимости, которая представляет собой статистическую взаимосвязь между двумя переменными.
Коэффициент корреляции Пирсона или просто коэффициент корреляции r представляет собой значение от -1 до 1 (-1≤r≤+1). Это наиболее часто используемый коэффициент корреляции, и он действителен только для линейной зависимости между переменными. Если r=0, связи нет, а если r≥0, связь прямо пропорциональна; т. е. значение одной переменной увеличивается с увеличением другой. Если r≤0, связь обратно пропорциональна; т. е. одна переменная уменьшается по мере увеличения другой.
Из-за условия линейности коэффициент корреляции r также может использоваться для установления наличия линейной зависимости между переменными.
В чем разница между регрессией и корреляцией?
Регрессия дает форму отношения между двумя случайными величинами, а корреляция дает степень силы отношения.
Регрессионный анализ создает функцию регрессии, которая помогает экстраполировать и прогнозировать результаты, в то время как корреляция может предоставить информацию только о том, в каком направлении она может измениться.
Более точные модели линейной регрессии дает анализ, если коэффициент корреляции выше. (|r|≥0,8)