Разница между средним значением, медианой и модой

Разница между средним значением, медианой и модой
Разница между средним значением, медианой и модой

Видео: Разница между средним значением, медианой и модой

Видео: Разница между средним значением, медианой и модой
Видео: Мода, размах, среднее арифметическое, медиана 2024, Ноябрь
Anonim

Среднее значение по сравнению с медианой по сравнению с модой

Среднее значение, медиана и мода являются основными показателями центральной тенденции, используемыми в описательной статистике. Они полностью отличаются друг от друга, и случаи, в которых они используются для обобщения данных, также различны.

Среднее

Среднее арифметическое представляет собой сумму значений данных, деленную на количество значений данных, т.е.

[латекс]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]

Если данные взяты из выборочного пространства, они называются выборочным средним ([latex]\bar{x} [/latex]), которое представляет собой описательную статистику выборки. Хотя это наиболее часто используемый описательный показатель для выборки, он не является надежной статистикой. Он очень чувствителен к выбросам и колебаниям.

Для примера рассмотрим средний доход жителей конкретного города. Поскольку все значения данных суммируются, а затем делятся, доход очень богатого человека значительно влияет на среднее значение. Поэтому средние значения не всегда являются хорошим представлением данных.

Также, в случае переменного сигнала, ток, проходящий через элемент, периодически меняется с положительного направления на отрицательное и наоборот. Если мы возьмем средний ток, проходящий через элемент за один период, он даст 0, что означает, что ток через элемент не проходил, что, очевидно, неверно. Следовательно, и в этом случае среднее арифметическое не является хорошей мерой.

Среднее арифметическое является хорошим индикатором, когда данные распределены равномерно. Для нормального распределения среднее значение равно моде и медиане. Он также имеет самые низкие невязки при рассмотрении среднеквадратичной ошибки; следовательно, это лучшая описательная мера, когда требуется представить набор данных одним числом.

Медиана

Значения средней точки данных после упорядочивания всех значений данных в порядке возрастания определяются как медиана набора данных. Медиана - это 2-й квартиль, 5-й дециль и 50-й процентиль.

• Если количество наблюдений (точек данных) нечетное, то медианой является наблюдение точно в середине упорядоченного списка.

• Если количество наблюдений (точек данных) четное, то медиана является средним значением двух средних наблюдений в упорядоченном списке.

Median делит наблюдение на две группы; т.е. группа (50%) значений выше и группа (50%) значений ниже медианы. Медианы специально используются в асимметричных распределениях и представляют данные гораздо лучше, чем среднее арифметическое.

Режим

Mode - наиболее часто встречающееся число в наборе наблюдений. Режим набора данных рассчитывается путем нахождения частоты каждого элемента в наборе.

• Если ни одно значение не встречается более одного раза, то набор данных не имеет режима.

• В противном случае любое значение, встречающееся с наибольшей частотой, является модой набора данных.

В наборе может существовать более 1 режима; поэтому мода не является уникальной статистикой набора данных. В равномерном распределении есть одна мода. Мода дискретного распределения вероятностей - это точка, в которой функция массы вероятности достигает своего наивысшего значения. Воспроизводя приведенные выше интерпретации, мы можем сказать, что глобальные максимумы являются модами.

Рассмотрите применение всех трех показателей к следующему набору данных.

ДАННЫЕ: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Среднее=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12

Медиана=9 (13-й элемент)

Mode=9 (частота 9=5)

В чем разница между средним значением, медианой и модой?

• Среднее арифметическое – это сумма значений (наблюдений), деленная на количество наблюдений. Это ненадежная статистика, и она сильно зависит от характера нормального распределения в рассматриваемом распределении. Единственный выброс может привести к значительному сдвигу среднего значения, что приведет к вводящим в заблуждение значениям. Эту концепцию можно расширить до среднего геометрического, среднего гармонического, среднего взвешенного и т. д.

• Медиана - это средние значения набора наблюдений, и на нее относительно меньше влияют выбросы. Это может дать хорошую оценку в качестве сводной статистики в сильно искаженных случаях.

• Мода - это наиболее распространенные значения наблюдения в наборе данных. Если распределение скошено положительно, мода лежит слева от медианы, а если скошено отрицательно, мода лежит справа от медианы.

• При положительной асимметрии среднее соответствует медиане; если отрицательно асимметричное среднее находится слева от медианы.

• В нормальном распределении все три, среднее, мода и медиана равны.

Рекомендуемые: