quinta-feira, 2 de junho de 2016

Storage: Deduplicação Funciona?

Deduplicação (ou Desduplicação) é uma técnica que visa economizar espaço em disco através da eliminação de redundância de dados.
A otimização promete ganhos de até 90%, mas será que é verdade? Vamos ver...

Tipos de Deduplicação

Há dois tipos básicos de deduplicação:
1) Baseado em Arquivos: Caso exista cópias de um mesmo arquivo no volume, apenas o tamanho de um arquivo será ocupado no disco.

2) Baseado em Blocos: Caso exista arquivos com "pedaços" (blocos) idênticos no volume, apenas uma instância do pedaço será ocupada no disco.

Para a maioria dos casos, a Deduplicação Baseada em Blocos é mais eficiente. Apenas storages de alto nível possuem baseado em Bloco, por exemplo os da marca NetApp.
Storages simples (Exemplo: QNAP) utilizam deduplicação baseada em arquivos.

Dedup na prática com Storage NetApp

Segundo a NetApp os ganhos com Deduplicação são gigantescos. Veja a tabela abaixo:


Mas, e na prática? É o que vamos testar. Será utilizado um storage de NetApp modelo FAS-2554.

Teste 01: Ambiente de Backup

O ambiente de backup utilizado no teste possui dados gerais: servidores, banco de dados, dados de usuários, etc. O sistema de backup faz compactação de arquivos (ZIP).
Segue tela após o agendamento da execução da desduplicação no:

No ambiente testado conseguimos apenas 25% de economia. Segundo a propaganda da NetApp deveria ser 90%. Pode ser que no ambiente testado pela fabricante não utilizou compactação de arquivos.
Em todo caso, o resultado foi interessante, uma vez que os arquivos estavam compactados. E, a ativação da funcionalidade não implicou em perda de performance, pois funciona em período pré-agendado.

Teste 02: Ambiente de Virtualização

O ambiente de virtualização utilizado no teste possui 20 maquinas virtuais de Windows Server e de Linux Debian.
Todas as máquinas virtuais utilizam alocação dinâmica de disco, ou seja se uma maquina virtual possui um disco de 1TB, mas está utilizado 100GB, então o espaço em disco no storage será de 100GB. É neste ambiente que veremos qual é a eficiência do Dedup.
Segue tela após o agendamento da execução da desduplicação:

Deduplicação ambiente de Virtualização - Netapp
No ambiente testado conseguimos a incrível marca dos 44% de economia. Segundo a propaganda da NetApp deveria ser 70%. Pode ser que no ambiente testado pela fabricante não foi utilizado a alocação dinâmica de dados das máquinas virtuais.
Em todo caso, o resultado foi impressionante e a ativação da funcionalidade não implicou em perda de performance.

Conclusão

Deduplicação em storage (da NetApp) pode trazer grandes economia, mas o resultado obtido na prática é menor do que o anunciado.

Nenhum comentário:

Postar um comentário