Применение Дедупликации Данных или Нет? Серия «Стратегия Управления Данными» – II

Apply-Data-Reduction-or-Not-Data-Management-Strategy-Series---Part-2

Оглавление

В связи с тем, что ресурсы ограничены, независимо от бюджетных или физических возможностей, поставщики СХД стремятся повысить эффективность хранения данных. С другой стороны, программно-определяемые политики сокращения объема данных также являются ключом к решению данной задачи.

Сокращение данных – это общее описание технологии уменьшения практической емкости необработанных данных. Дедупликация и компрессия – самые распространенные методы, помогающие организациям справиться с растущим объемом данных. Итак, мы рассмотрим обе функции и выясним их преимущества и возможные недостатки.

Компрессия

Компрессия (сжатие) представляет собой технологию хранения данных, предназначенную для уменьшения размера файлов или групп данных. Путем более эффективного кодирования информации сжатие позволяет минимизировать объем пространства, необходимого для хранения данных, не теряя при этом их основного содержания.

В корпоративных средах сжатие является ключевым инструментом для оптимизации хранения, ускорения передачи данных и повышения общей эффективности. Оно особенно эффективно в процессах резервного копирования и архивирования. Кроме того, сжатие хорошо подходит для данных с редким доступом, таких как общие файлы или управление файлами журналов, где экономия и эффективность хранения имеют ключевое значение.

Сжатие широко используется на предприятиях для различных приложений, но его эффективность может быть ограничена несколькими факторами. В первую очередь, эффективность сжатия в значительной степени зависит от алгоритмов и механизмов, используемых поставщиком системы хранения данных.

Дедупликация

Дедупликация выполняется с помощью технологии сжатия, которая позволяет оптимизировать хранение данных и устранить их избыточность. Дедупликация обнаруживает дубликаты и сохраняет только одну копию, а не множество экземпляров идентичных данных. Такой подход позволяет значительно сократить объем занимаемого пространства, а также сохранить целостность данных.

Дедупликация обычно применяется в случаях, когда ваши данные содержат большое количество избыточных данных, которые регулярно повторяются. Например, в виртуализированной среде многократно создаются виртуальные машины. В большинстве случаев сотрудники ИТ-службы формируют одинаковые виртуальные машины, а различия в данных заключаются только в информации о пользователе. В этом случае дедупликация может стать идеальным решением.

Помимо преимуществ технологии дедупликации, данная технология имеет и некоторые ограничения. Одним из существенных недостатков является ее влияние на пропускную способность, которая может снижаться при включении дедупликации. Это связано с тем, что доступ к дедуплицированным данным требует поиска и восстановления данных, а для эффективного выполнения этого процесса необходимо высокопроизводительное устройство хранения. Кроме того, дедупликация наиболее эффективна, когда значительная часть данных идентична. Если в массивах данных отсутствует достаточная избыточность, преимущества дедупликации значительно снижаются.

Рекомендации по Определению Применения Дедупликации Данных

Несмотря на ограниченность применений сокращения объема данных, в большинстве случаев они все же оказываются более экономически эффективными. Согласно отчету SNIA, процентное соотношение TCO (совокупной стоимости владения) на ТБ по сравнению с HDD: NVMe SSD составляет примерно 45,37 %. Когда коэффициент сокращения данных достигает 54,63 % или выше, стратегия дедупликации обеспечивает более высокую совокупную стоимость владения, чем развертывание нового устройства хранения, как показано на рисунке ниже. Поскольку применение стратегии дедупликации более подходящее, можно добиться более высокой совокупной стоимости владения. Кроме того, в результате применения сокращения данных может снизиться производительность, но эффект от использования SSD-накопителей в среде хранения данных все же будет более ощутимым.

TCO-per-TB-vs-Data-Reduction-Rate

Заключение

Сжатие данных представляет собой универсальную технологию хранения, которая позволяет минимизировать пространство, необходимое для хранения данных, без изменений их основного содержания. Она широко используется в различных корпоративных приложениях для оптимизации использования хранилищ, повышения скорости передачи данных, а также для резервного копирования и архивирования. Однако ее эффективность зависит от алгоритма поставщика системы хранения и определенные типы данных, такие как зашифрованные или часто используемые, могут создавать сложности для оптимальной производительности сжатия. Дедупликация в качестве технологии, позволяющей устранять избыточные копии данных, является ценной политикой в сценариях, где часто повторяются данные, например в виртуализированных средах. При значительной экономии емкости хранилища и эффективности затрат на него, существует еще и компромисс с производительностью. Таким образом, при проектировании среды хранения данных организации должны соизмерять экономию средств с возможными перегрузками по производительности.

Блог

Последние Тенденции и Перспективы в Управлении Хранением Данных