СУБД и интеллектуальный анализ данных
A СУБД (система управления базами данных) - это полная система, используемая для управления цифровыми базами данных, которая позволяет хранить содержимое базы данных, создавать/обслуживать данные, осуществлять поиск и выполнять другие функции. С другой стороны, интеллектуальный анализ данных - это область компьютерных наук, которая занимается извлечением ранее неизвестной и интересной информации из необработанных данных. Обычно данные, используемые в качестве входных данных для процесса интеллектуального анализа данных, хранятся в базах данных. Пользователи, склонные к статистике, используют Data Mining. Они используют статистические модели для поиска скрытых закономерностей в данных. Майнеры данных заинтересованы в поиске полезных взаимосвязей между различными элементами данных, что в конечном итоге выгодно для бизнеса.
СУБД
СУБД, иногда называемая просто менеджером баз данных, представляет собой набор компьютерных программ, предназначенных для управления (т. е. организации, хранения и поиска) всеми базами данных, установленными в системе (т. е. на жестком диске или в сети). В мире существуют различные типы систем управления базами данных, и некоторые из них предназначены для надлежащего управления базами данных, сконфигурированными для определенных целей. Наиболее популярными коммерческими системами управления базами данных являются Oracle, DB2 и Microsoft Access. Все эти продукты предоставляют средства распределения различных уровней привилегий для разных пользователей, что позволяет централизованно управлять СУБД одним администратором или распределять ее между несколькими людьми. В любой системе управления базами данных есть четыре важных элемента. Это язык моделирования, структуры данных, язык запросов и механизм транзакций. Язык моделирования определяет язык каждой базы данных, размещенной в СУБД. В настоящее время на практике используются несколько популярных подходов, таких как иерархический, сетевой, реляционный и объектный. Структуры данных помогают организовать такие данные, как отдельные записи, файлы, поля и их определения, а также такие объекты, как визуальные носители. Язык запросов данных поддерживает безопасность базы данных, отслеживая данные для входа, права доступа для разных пользователей и протоколы для добавления данных в систему. SQL - это популярный язык запросов, который используется в системах управления реляционными базами данных. Наконец, механизм, который позволяет транзакциям, способствует параллелизму и множественности. Этот механизм гарантирует, что одна и та же запись не будет изменена несколькими пользователями одновременно, тем самым сохраняя целостность данных. Кроме того, СУБД также обеспечивает резервное копирование и другие возможности.
Интеллектуальный анализ данных
Интеллектуальный анализ данных также известен как обнаружение знаний в данных (KDD). Как упоминалось выше, это одно из направлений информатики, которое занимается извлечением ранее неизвестной и интересной информации из необработанных данных. Из-за экспоненциального роста данных, особенно в таких областях, как бизнес, интеллектуальный анализ данных стал очень важным инструментом для преобразования этого большого количества данных в бизнес-аналитику, поскольку ручное извлечение шаблонов стало, по-видимому, невозможным в последние несколько десятилетий. Например, в настоящее время он используется для различных приложений, таких как анализ социальных сетей, обнаружение мошенничества и маркетинг. Интеллектуальный анализ данных обычно имеет дело со следующими четырьмя задачами: кластеризация, классификация, регрессия и ассоциация. Кластеризация - это выявление похожих групп из неструктурированных данных. Классификация - это правила обучения, которые можно применять к новым данным и обычно включают следующие этапы: предварительная обработка данных, проектирование моделирования, изучение/выбор признаков и оценка/проверка. Регрессия - это поиск функций с минимальной ошибкой для моделирования данных. А ассоциация ищет связи между переменными. Интеллектуальный анализ данных обычно используется для ответа на такие вопросы, как, например, какие основные продукты могут помочь Wal-Mart получить высокую прибыль в следующем году?
В чем разница между СУБД и интеллектуальным анализом данных?
СУБД - это полноценная система для размещения и управления набором цифровых баз данных. Однако интеллектуальный анализ данных - это метод или концепция компьютерных наук, которая занимается извлечением полезной и ранее неизвестной информации из необработанных данных. В большинстве случаев эти необработанные данные хранятся в очень больших базах данных. Поэтому майнеры данных используют существующие функции СУБД для обработки, управления и даже предварительной обработки необработанных данных до и во время процесса интеллектуального анализа данных. Однако СУБД сама по себе не может быть использована для анализа данных. Но некоторые СУБД в настоящее время имеют встроенные инструменты или возможности для анализа данных.