Категорические данные против числовых данных
Данные - это факты или информация, собранные для ссылок или анализа. Часто эти данные собираются как атрибут соответствующего субъекта. Этот атрибут может варьироваться от одного к другому, поэтому этот изменяющийся атрибут можно рассматривать как переменную. Переменные могут принимать различные формы значений, и они присущи собранным данным.
Переменные могут быть как качественными, так и количественными; т. е. если переменная является количественной, ответы представляют собой числа, и величина измеряемого признака может быть указана с определенной степенью точности. Другой тип, качественные переменные, измеряют качественные атрибуты, и значения, принимаемые переменными, не могут быть даны с точки зрения размера или величины. Сами переменные известны как категориальные переменные, а данные, собранные с помощью категориальной переменной, являются категориальными данными.
Подробнее о числовых данных
Числовые данные - это в основном количественные данные, полученные из переменной, и значение имеет смысл размера/величины. Полученные числовые данные далее делятся еще на три категории на основе теории, разработанной Стэнли Смитом Стивенсом. Числовые данные могут быть порядковыми, интервальными или относительными. Тип данных определяется методом измерения значений, а типы известны как уровни измерения.
Вес человека, расстояние между двумя точками, температура и цена акции являются примерами числовых данных.
В статистике большинство методов используется для анализа числовых данных. Базовая описательная статистика, регрессия и другие методы вывода в основном используются для анализа числовых данных.
Подробнее о Категориальных данных
Категориальные данные - это значения качественной переменной, часто числа, слова или символа. Они выявляют тот факт, что переменная в рассматриваемом случае принадлежит к одному из нескольких доступных вариантов. Следовательно, они относятся к одной из категорий; отсюда и название категориальное.
Политическая принадлежность человека, национальность человека, любимый цвет человека, группа крови пациента являются качественными признаками. Иногда число может быть получено как категориальное значение, но само число не представляет величину измеряемого атрибута. Почтовый индекс является одним из примеров.
Кроме того, любые категориальные значения относятся к номинальному типу данных, который является другим типом, основанным на уровнях измерений. Методы, используемые для анализа категориальных данных, отличаются от методов анализа числовых данных, но основной принцип может быть тем же самым.
В чем разница между категориальными и числовыми данными?
• Числовые данные - это значения, полученные для количественной переменной, и они несут значение величины, связанное с контекстом переменной (следовательно, они всегда представляют собой числа или символы, несущие числовое значение). Категориальные данные - это значения, полученные для качественной переменной; числа категориальных данных не несут смысла величины.
• Числовые данные всегда относятся к порядковому, относительному или интервальному типу, тогда как категориальные данные относятся к номинальному типу.
• Методы, используемые для анализа количественных данных, отличаются от методов, используемых для категорийных данных, даже если принципы те же, по крайней мере, приложение имеет существенные различия.
• Числовые данные анализируются с использованием статистических методов в описательной статистике, регрессии, временных рядах и многом другом.
• Для категорийных данных обычно используются описательные методы и графические методы. Также используются некоторые непараметрические тесты.