Интеллектуальный анализ данных против OLAP
И интеллектуальный анализ данных, и OLAP являются двумя распространенными технологиями бизнес-аналитики (BI). Бизнес-аналитика относится к компьютерным методам идентификации и извлечения полезной информации из бизнес-данных. Интеллектуальный анализ данных - это область информатики, которая занимается извлечением интересных закономерностей из больших наборов данных. Он сочетает в себе множество методов искусственного интеллекта, статистики и управления базами данных. OLAP (онлайн-аналитическая обработка), как следует из названия, представляет собой набор способов запросов к многомерным базам данных.
Интеллектуальный анализ данных также известен как обнаружение знаний в данных (KDD). Как упоминалось выше, это область информатики, которая занимается извлечением ранее неизвестной и интересной информации из необработанных данных. Из-за экспоненциального роста данных, особенно в таких областях, как бизнес, интеллектуальный анализ данных стал очень важным инструментом для преобразования этого большого количества данных в бизнес-аналитику, поскольку ручное извлечение шаблонов стало, по-видимому, невозможным в последние несколько десятилетий. Например, в настоящее время он используется для различных приложений, таких как анализ социальных сетей, обнаружение мошенничества и маркетинг. Интеллектуальный анализ данных обычно имеет дело со следующими четырьмя задачами: кластеризация, классификация, регрессия и ассоциация. Кластеризация - это выявление похожих групп из неструктурированных данных. Классификация - это правила обучения, которые можно применять к новым данным и обычно включают следующие этапы: предварительная обработка данных, проектирование моделирования, обучение/выбор признаков и оценка/проверка. Регрессия - это поиск функций с минимальной ошибкой для моделирования данных. А ассоциация ищет связи между переменными. Интеллектуальный анализ данных обычно используется для ответа на такие вопросы, как, например, какие основные продукты могут помочь в получении высокой прибыли в следующем году в Wal-Mart.
OLAP - это класс систем, дающих ответы на многомерные запросы. Обычно OLAP используется для маркетинга, составления бюджета, прогнозирования и подобных приложений. Само собой разумеется, что базы данных, используемые для OLAP, настроены для сложных и специальных запросов с учетом высокой производительности. Обычно матрица используется для отображения результатов OLAP. Строки и столбцы формируются размерами запроса. Они часто используют методы агрегирования по нескольким таблицам для получения сводок. Например, с его помощью можно узнать о продажах этого года в Wal-Mart по сравнению с прошлым годом? Каков прогноз по продажам в следующем квартале? Что можно сказать о тренде, глядя на процентное изменение?
Хотя очевидно, что интеллектуальный анализ данных и OLAP похожи, поскольку они работают с данными для получения интеллектуальных данных, основное различие заключается в том, как они работают с данными. Инструменты OLAP обеспечивают многомерный анализ данных и предоставляют сводку данных, но, напротив, интеллектуальный анализ данных фокусируется на соотношениях, закономерностях и влияниях в наборе данных. Это OLAP-сделка с агрегацией, которая сводится к работе с данными через «сложение», но интеллектуальный анализ данных соответствует «делению». Другим заметным отличием является то, что в то время как инструменты интеллектуального анализа данных моделируют данные и возвращают действенные правила, OLAP будет проводить сравнение и противопоставление методов по бизнес-измерениям в режиме реального времени.