Население и стандартное отклонение выборки
В статистике для описания набора данных используется несколько индексов, соответствующих его центральной тенденции, дисперсии и асимметрии. Стандартное отклонение - одна из наиболее распространенных мер разброса данных относительно центра набора данных.
Из-за практических трудностей будет невозможно использовать данные всего населения при проверке гипотезы. Поэтому мы используем значения данных из выборок, чтобы делать выводы о населении. В такой ситуации они называются оценщиками, поскольку они оценивают значения параметров совокупности.
Чрезвычайно важно использовать в выводах несмещенные оценки. Говорят, что оценщик несмещен, если ожидаемое значение этого оценщика равно параметру генеральной совокупности. Например, мы используем выборочное среднее в качестве несмещенной оценки среднего значения генеральной совокупности. (Математически можно показать, что ожидаемое значение выборочного среднего равно среднему по совокупности). В случае оценки стандартного отклонения совокупности стандартное отклонение выборки также является несмещенной оценкой.
Что такое стандартное отклонение населения?
Когда для учета могут быть приняты данные всего населения (например, в случае переписи), можно рассчитать стандартное отклонение населения. Чтобы рассчитать стандартное отклонение совокупности, сначала рассчитываются отклонения значений данных от среднего значения совокупности. Среднеквадратичное (квадратичное среднее) отклонений называется стандартным отклонением генеральной совокупности.
В классе из 10 учеников можно легко собрать данные об учениках. Если гипотеза проверяется на этой совокупности студентов, то нет необходимости использовать выборочные значения. Например, вес 10 студентов (в килограммах) равен 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тогда средний вес десяти человек (в килограммах) равен (70+62+65+72+80+70+63+72+77+79)/10, что равно 71 (в килограммах). Это среднее значение населения.
Теперь, чтобы рассчитать стандартное отклонение населения, мы вычисляем отклонения от среднего. Соответствующие отклонения от среднего составляют (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 и (79 – 71)=8. Сумма квадратов отклонения равна (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Стандартное отклонение генеральной совокупности составляет √(366/10)=6,05 (в килограммах). 71 - это точный средний вес учеников класса, а 6.05 - точное стандартное отклонение веса от 71.
Что такое стандартное отклонение выборки?
Когда данные из выборки (размером n) используются для оценки параметров генеральной совокупности, рассчитывается стандартное отклонение выборки. Сначала рассчитываются отклонения значений данных от выборочного среднего. Поскольку среднее значение выборки используется вместо среднего значения генеральной совокупности (которое неизвестно), использование среднего квадратичного значения нецелесообразно. Чтобы компенсировать использование выборочного среднего, сумма квадратов отклонений делится на (n-1) вместо n. Стандартное отклонение выборки равно квадратному корню из этого. В математических символах S=√{∑(xi-ẍ)2 / (n-1)}, где S - выборочное стандартное отклонение, ẍ - выборочное среднее, а xi’s - точки данных.
Теперь предположим, что в предыдущем примере население – это учащиеся всей школы. Тогда класс будет только образцом. Если эта выборка используется в оценке, стандартное отклонение выборки будет √(366/9)=6.38 (в килограммах), поскольку 366 было разделено на 9 вместо 10 (объем выборки). Следует отметить, что это не гарантируется точное значение стандартного отклонения населения. Это всего лишь его оценка.
В чем разница между стандартным отклонением популяции и стандартным отклонением выборки?
• Стандартное отклонение генеральной совокупности - это точное значение параметра, используемое для измерения отклонения от центра, тогда как стандартное отклонение выборки является его объективной оценкой.
• Стандартное отклонение популяции рассчитывается, когда известны все данные о каждом индивидууме популяции. В противном случае рассчитывается стандартное отклонение выборки.
• Стандартное отклонение популяции определяется как σ=√{ ∑(xi-µ)2/ n}, где µ - среднее значение популяции, а n - размер популяции, но Стандартное отклонение выборки определяется как S=√{ ∑(xi-ẍ)2 / (n-1)}, где ẍ - среднее значение выборки, а n - размер выборки.