Разница между дисперсией и ковариацией

Разница между дисперсией и ковариацией
Разница между дисперсией и ковариацией

Видео: Разница между дисперсией и ковариацией

Видео: Разница между дисперсией и ковариацией
Видео: Теория вероятностей #19: ковариация, корреляция, зависимость двух случайных величин 2024, Июль
Anonim

Дисперсия против ковариации

Дисперсия и ковариация - две меры, используемые в статистике. Дисперсия является мерой разброса данных, а ковариация указывает на степень изменения двух случайных величин вместе. Дисперсия - это скорее интуитивное понятие, но ковариация определяется математически, а не интуитивно поначалу.

Подробнее о дисперсии

Дисперсия - это мера отклонения данных от среднего значения распределения. Он сообщает, насколько далеко точки данных лежат от среднего значения распределения. Это один из основных дескрипторов распределения вероятностей и один из моментов распределения. Кроме того, дисперсия является параметром совокупности, а дисперсия выборки из совокупности действует как оценка дисперсии совокупности. С одной точки зрения, это определяется как квадрат стандартного отклонения.

Простым языком это можно описать как среднее квадратов расстояния между каждой точкой данных и средним значением распределения. Для расчета дисперсии используется следующая формула.

Var(X)=E[(X-µ)2] для совокупности и

Var(X)=E[(X-‾x)2] для выборки

Его можно еще упростить, чтобы получить Var(X)=E[X2]-(E[X])2.

Variance имеет некоторые свойства подписи и часто используется в статистике для упрощения использования. Дисперсия неотрицательна, потому что это квадрат расстояний. Однако диапазон дисперсии не ограничен и зависит от конкретного распределения. Дисперсия постоянной случайной величины равна нулю, и дисперсия не меняется в зависимости от параметра местоположения.

Подробнее о ковариации

В статистической теории ковариация - это мера того, насколько сильно изменяются вместе две случайные величины. Другими словами, ковариация - это мера силы корреляции между двумя случайными величинами. Также его можно рассматривать как обобщение концепции дисперсии двух случайных величин.

Ковариация двух случайных величин X и Y, которые совместно распределены с конечным секундным импульсом, известна как σXY=E[(X-E[X])(Y-E[Я])]. Исходя из этого, дисперсию можно рассматривать как частный случай ковариации, когда две переменные одинаковы. Cov(X, X)=Var(X)

Путем нормализации ковариации можно получить коэффициент линейной корреляции или коэффициент корреляции Пирсона, который определяется как ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Графически ковариацию между парой точек данных можно рассматривать как площадь прямоугольника с точками данных в противоположных вершинах. Его можно интерпретировать как меру величины разделения между двумя точками данных. Рассматривая прямоугольники для всей совокупности, перекрытие прямоугольников, соответствующих всем точкам данных, можно рассматривать как силу разделения; дисперсия двух переменных. Ковариация существует в двух измерениях из-за двух переменных, но упрощение ее до одной переменной дает дисперсию одного как разделение в одном измерении.

В чем разница между дисперсией и ковариацией?

• Дисперсия - это мера разброса/дисперсии в популяции, в то время как ковариация рассматривается как мера вариации двух случайных величин или силы корреляции.

• Дисперсия может рассматриваться как частный случай ковариации.

• Дисперсия и ковариация зависят от величины значений данных и не могут сравниваться; следовательно, они нормированы. Ковариация нормализуется в коэффициент корреляции (делится на произведение стандартных отклонений двух случайных величин), а дисперсия нормализуется в стандартное отклонение (путем извлечения квадратного корня)

Рекомендуемые: