Разница между СУБД и Hadoop

Оглавление:

Разница между СУБД и Hadoop
Разница между СУБД и Hadoop

Видео: Разница между СУБД и Hadoop

Видео: Разница между СУБД и Hadoop
Видео: Очень кратко про Hadoop и Spark 2024, Июль
Anonim

Основное различие между СУБД и Hadoop заключается в том, что СУБД хранит структурированные данные, а Hadoop хранит структурированные, полуструктурированные и неструктурированные данные.

РСУБД - это система управления базами данных, основанная на реляционной модели. Hadoop - это программное обеспечение для хранения данных и запуска приложений на кластерах стандартного оборудования.

Изображение
Изображение

Что такое СУБД?

RDBMS означает систему управления реляционными базами данных, основанную на реляционной модели. В СУБД таблицы используются для хранения данных, а ключи и индексы помогают связать таблицы. Таблица - это набор элементов данных, и они являются сущностями. Он содержит строки и столбцы. Строки представляют одну запись в таблице. Столбцы представляют атрибуты.

Например, в базе данных продаж могут быть объекты клиентов и продуктов. Клиент может иметь такие атрибуты, как customer_id, имя, адрес, phone_no. Элемент может иметь такие атрибуты, как product_id, имя и т. д. Первичный ключ таблицы клиентов - это customer_id, а первичный ключ таблицы продуктов - product_id. Размещение product_id в таблице клиентов в качестве внешнего ключа связывает эти два объекта. Точно так же таблицы также связаны друг с другом. Они обеспечивают целостность данных, нормализацию и многое другое. Немногие из распространенных СУБД - это MySQL, MSSQL и Oracle. Они используют SQL для запросов.

Что такое Hadoop?

Hadoop - это среда Apache с открытым исходным кодом, написанная на Java. Это помогает хранить и обрабатывать большое количество данных в кластерах компьютеров, используя простые модели программирования. Основная цель Hadoop - хранить и обрабатывать большие данные, которые относятся к большому количеству сложных данных. Пропускная способность Hadoop, то есть способность обрабатывать объем данных за определенный период времени, высока.

Разница между РСУБД и Hadoop
Разница между РСУБД и Hadoop

В архитектуре Hadoop четыре модуля. Это общие файлы Hadoop, YARN, распределенная файловая система Hadoop (HDFS) и Hadoop MapReduce. Общий модуль содержит библиотеки и утилиты Java. В нем также есть файлы для запуска Hadoop. Hadoop YARN выполняет планирование заданий и управление ресурсами кластера.

Кроме того, распределенная файловая система Hadoop (HDFS) является системой хранения данных Hadoop. Он использует архитектуру master-slave. Главный узел - это NameNode, он управляет метаданными файловой системы. Другие компьютеры являются подчиненными узлами или узлами данных. Они хранят фактические данные. С другой стороны, Hadoop MapReduce выполняет распределенные вычисления. У него есть алгоритмы для обработки данных. В HDFS главный узел имеет средство отслеживания заданий. Он запускает задания по уменьшению карты на подчиненных узлах. Для каждого ведомого узла существует средство отслеживания задач для завершения обработки данных и отправки результата обратно на главный узел. В целом, Hadoop обеспечивает массивное хранилище данных с высокой вычислительной мощностью.

В чем разница между СУБД и Hadoop?

РСУБД против Hadoop

RDBMS - это системное программное обеспечение для создания и управления базами данных, основанное на реляционной модели. Hadoop - это набор программного обеспечения с открытым исходным кодом, которое объединяет множество компьютеров для решения задач, связанных с большим объемом данных и вычислений.
Разнообразие данных
СУБД хранит структурированные данные. Hadoop хранит структурированные, полуструктурированные и неструктурированные данные.
Хранение данных
СУБД хранит средний объем данных. Hadoop хранит больше данных, чем СУБД.
Скорость
В СУБД чтение выполняется быстро. В Hadoop чтение и запись выполняются быстро.
Масштабируемость
СУБД имеет вертикальную масштабируемость. Hadoop обладает горизонтальной масштабируемостью.
Оборудование
РСУБД используют высокопроизводительные серверы. Hadoop использует общедоступное оборудование.
Пропускная способность
Пропускная способность РСУБД выше. Пропускная способность Hadoop ниже.

Резюме – РСУБД против Hadoop

В этой статье обсуждалась разница между СУБД и Hadoop. Основное различие между СУБД и Hadoop заключается в том, что СУБД хранит структурированные данные, а Hadoop хранит структурированные, полуструктурированные и неструктурированные данные.

Рекомендуемые: