Распределенная база данных против централизованной базы данных
Централизованная база данных - это база данных, в которой данные хранятся и поддерживаются в одном месте. Это традиционный подход к хранению данных на крупных предприятиях. Распределенная база данных - это база данных, в которой данные хранятся на устройствах хранения, которые не расположены в одном физическом месте, но база данных управляется с помощью центральной системы управления базами данных (СУБД).
Что такое централизованная база данных?
В централизованной базе данных все данные организации хранятся в одном месте, например, на мэйнфрейме или сервере. Пользователи в удаленных местах получают доступ к данным через глобальную сеть (WAN) с помощью прикладных программ, предоставленных для доступа к данным. Централизованная база данных (мейнфрейм или сервер) должна быть в состоянии удовлетворить все запросы, поступающие в систему, поэтому легко может стать узким местом. Но поскольку все данные находятся в одном месте, их легче поддерживать и создавать резервные копии. Кроме того, легче поддерживать целостность данных, потому что после того, как данные будут сохранены в централизованной базе данных, устаревшие данные больше не будут доступны в других местах.
Что такое распределенная база данных?
В распределенной базе данных данные хранятся на устройствах хранения, расположенных в разных физических местах. Они не привязаны к общему процессору, но база данных управляется центральной СУБД. Пользователи получают доступ к данным в распределенной базе данных через глобальную сеть. Для поддержания актуальности распределенной базы данных в ней используются процессы репликации и дублирования. Процесс репликации идентифицирует изменения в распределенной базе данных и применяет эти изменения, чтобы убедиться, что все распределенные базы данных выглядят одинаково. В зависимости от количества распределенных баз данных этот процесс может стать очень сложным и трудоемким. Процесс дублирования идентифицирует одну базу данных как главную базу данных и дублирует эту базу данных. Этот процесс не такой сложный, как процесс репликации, но гарантирует, что все распределенные базы данных будут иметь одни и те же данные.
В чем разница между распределенной базой данных и централизованной базой данных?
В то время как централизованная база данных хранит свои данные на устройствах хранения, которые находятся в одном месте, подключенном к одному ЦП, система распределенной базы данных хранит свои данные на устройствах хранения, которые могут быть расположены в разных географических точках и управляются с помощью центрального СУБД. Централизованную базу данных легче поддерживать и обновлять, поскольку все данные хранятся в одном месте. Кроме того, легче поддерживать целостность данных и избегать дублирования данных. Но все запросы, поступающие на доступ к данным, обрабатываются одним объектом, например одним мейнфреймом, и поэтому он легко может стать узким местом. Но с распределенными базами данных этого узкого места можно избежать, поскольку базы данных распараллелены, что обеспечивает балансировку нагрузки между несколькими серверами. Но поддержание данных в актуальном состоянии в системе распределенной базы данных требует дополнительной работы, поэтому увеличивает стоимость обслуживания и сложность, а также требует для этой цели дополнительного программного обеспечения. Кроме того, проектирование баз данных для распределенной базы данных является более сложным, чем для централизованной базы данных.