Дисперсия против ковариации
Дисперсия и ковариация - две меры, используемые в статистике. Дисперсия является мерой разброса данных, а ковариация указывает на степень изменения двух случайных величин вместе. Дисперсия - это скорее интуитивное понятие, но ковариация определяется математически, а не интуитивно поначалу.
Подробнее о дисперсии
Дисперсия - это мера отклонения данных от среднего значения распределения. Он сообщает, насколько далеко точки данных лежат от среднего значения распределения. Это один из основных дескрипторов распределения вероятностей и один из моментов распределения. Кроме того, дисперсия является параметром совокупности, а дисперсия выборки из совокупности действует как оценка дисперсии совокупности. С одной точки зрения, это определяется как квадрат стандартного отклонения.
Простым языком это можно описать как среднее квадратов расстояния между каждой точкой данных и средним значением распределения. Для расчета дисперсии используется следующая формула.
Var(X)=E[(X-µ)2] для совокупности и
Var(X)=E[(X-‾x)2] для выборки
Его можно еще упростить, чтобы получить Var(X)=E[X2]-(E[X])2.
Variance имеет некоторые свойства подписи и часто используется в статистике для упрощения использования. Дисперсия неотрицательна, потому что это квадрат расстояний. Однако диапазон дисперсии не ограничен и зависит от конкретного распределения. Дисперсия постоянной случайной величины равна нулю, и дисперсия не меняется в зависимости от параметра местоположения.
Подробнее о ковариации
В статистической теории ковариация - это мера того, насколько сильно изменяются вместе две случайные величины. Другими словами, ковариация - это мера силы корреляции между двумя случайными величинами. Также его можно рассматривать как обобщение концепции дисперсии двух случайных величин.
Ковариация двух случайных величин X и Y, которые совместно распределены с конечным секундным импульсом, известна как σXY=E[(X-E[X])(Y-E[Я])]. Исходя из этого, дисперсию можно рассматривать как частный случай ковариации, когда две переменные одинаковы. Cov(X, X)=Var(X)
Путем нормализации ковариации можно получить коэффициент линейной корреляции или коэффициент корреляции Пирсона, который определяется как ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Графически ковариацию между парой точек данных можно рассматривать как площадь прямоугольника с точками данных в противоположных вершинах. Его можно интерпретировать как меру величины разделения между двумя точками данных. Рассматривая прямоугольники для всей совокупности, перекрытие прямоугольников, соответствующих всем точкам данных, можно рассматривать как силу разделения; дисперсия двух переменных. Ковариация существует в двух измерениях из-за двух переменных, но упрощение ее до одной переменной дает дисперсию одного как разделение в одном измерении.
В чем разница между дисперсией и ковариацией?
• Дисперсия - это мера разброса/дисперсии в популяции, в то время как ковариация рассматривается как мера вариации двух случайных величин или силы корреляции.
• Дисперсия может рассматриваться как частный случай ковариации.
• Дисперсия и ковариация зависят от величины значений данных и не могут сравниваться; следовательно, они нормированы. Ковариация нормализуется в коэффициент корреляции (делится на произведение стандартных отклонений двух случайных величин), а дисперсия нормализуется в стандартное отклонение (путем извлечения квадратного корня)