La influencia del big data y la necesidad de disponer de datos en real time en los centros de datos, junto con los avances de las tecnologías de almacenamiento, han dado lugar a la aparición de sistemas pensados para incrementar la eficiencia a la hora de guardar la información en soportes flash, teniendo en cuenta las ventajas que ofrecen en cuanto a velocidad.
La memoria flash ha tomado el mundo del almacenamiento por asalto. Los smartphones y demás dispositivos móviles la emplean, los discos SSD están sustituyendo a los discos duros y, cómo no, la misma ola ha llegado a los centros de procesamiento de datos. Teniendo en cuenta que no se trata de dispositivos mecánicos, estamos ante una tecnología que garantiza un incremento significativo de la velocidad y que, al mismo tiempo, reduce de forma considerable el nivel de ruido, el consumo eléctrico y el calor generado. De este modo, no solo se trata de una mejora evidente en el rendimiento, sino de la incidencia que tiene esta tecnología en la factura eléctrica, no solo porque consume menos, sino porque requiere de una menor refrigeración. Pero, como en todo, hay también una serie de retos que hay que salvar.
Procesos de escritura
Por un lado, hay que tener en cuenta que la tecnología flash fue desarrollada pensando en los dispositivos móviles y, por ello, se diseñó de manera asimétrica. En estos dispositivos son mucho mas frecuentes las operaciones de lectura que las de escritura. El problema es que, en un centro de datos, son igual de probables tanto las lecturas como las escrituras y, en la tecnología flash, para cambiar un simple bit en un dato es necesario borrar un bloque entero y reescribirlo.
Esto solo impacta a la velocidad de escritura y paralelizando estas operaciones se solventa el asunto del rendimiento. Lo que no se puede evitar es que la durabilidad de las celdas flash se resienta, ya que el número de operaciones de escritura que son capaces de soportar es limitado. Por este motivo, reducir los procesos de escritura en un centro de datos no solo aumenta la velocidad, sino también la duración de los discos y, con ello, disminuye el coste que supondría sustituirlos.
De este modo, las tecnologías que reducen el número de escrituras están cobrando cada vez más importancia, ya que impactan directamente en el coste del CPD. El sistema Adaptive Data Reduction de HPE, que se incluye con los sistemas HPE 3PAR StoreServ, tiene como misión no solo reducir el número de operaciones de escritura, sino también el volumen de los datos almacenados, para optimizar aún más la eficiencia de los sistemas.
Adaptive Data Reduction disminuye el número de operaciones de escritura y el volumen de datos para optimizar la eficiencia de los sistemas
Adaptive Data Reduction
Bajo este paraguas se aglutinan una serie de tecnologías incluidas de serie en HPE StoreServ Storage. Se pueden utilizar de forma individual o combinadas entre sí y, en todos los casos, incrementan la eficiencia del sistema de una forma u otra.
- Zero Detect. Este sistema se encarga de reducir la cantidad de datos que realmente se acaban por escribir en el medio de almacenamiento. Esta característica está integrada directamente en el hardware, por lo que funciona en tiempo real y no afecta al rendimiento del sistema. Básicamente, se trata de eliminar las series de ceros consecutivos que los sistemas envían con frecuencia al almacenamiento. De esa forma, toda esa información innecesaria ni siquiera acaba por escribirse en el disco y no consume un espacio valioso. Al funcionar de forma independiente de otras tecnologías de reducción de datos, puede aplicarse a toda la información y combinarlo con otros métodos.
- Deduplication. De forma similar a Zero Detect, se trata de eliminar información duplicada, pero, en lugar de buscar filas de ceros, se fija en repeticiones de estructuras más complejas. Para ello crea una especie de “huella dactilar” de las peticiones de escritura y la guarda para el futuro. Si se vuelve a encontrar la misma huella, es que el conjunto de datos es idéntico y el sistema descarta la información. En su lugar, graba solo un puntero que apunta al lugar en el que se guardó esa información la primera vez, produciendo así un ahorro de espacio y tiempo. Esta función también se realiza en el hardware, por lo que no impacta en el rendimiento. De hecho, los sistemas HPE 3PAR ASIC tienen tres motores de deduplicación concurrentes.
- Compresión. Los dos métodos anteriores se encargan de reducir el volumen de datos almacenado. Tras ellos, se aplica la compresión, que es uno de los sistemas más antiguos y eficientes para reducir la cantidad efectiva de información que se almacena. Al igual que los anteriores, la compresión se realiza inline, a velocidad de memoria, sin impactar en el rendimiento. Los HPE 3PAR ASIC distribuyen la compresión en distintos núcleos y, además, aplican primero un sistema llamado Express Scan, que identifica streams de datos incompresibles y así evita pérdidas de tiempo innecesarias, al pasarlos directamente al almacenamiento.
- Data Packing. Aunque el conjunto de técnicas anteriores mejora la eficiencia de los datos individuales, mantenerla en todo un centro de datos es un reto muy distinto. La solución que aplican los HPE 3PAR StoreServ Storage se llama Data Packing.
A grandes rasgos, esta tecnología soluciona los posibles inconvenientes derivados de la aplicación de los métodos anteriores. Una vez deduplicados y comprimidos los datos entrantes, el resultado son una serie de bloques de datos de diversos tamaños, que no sería nada eficiente escribir en flash. Por este motivo, Data Packing reúne estos bloques —heterogéneos y de tamaños aleatorios— y los “empaqueta” en bloques de tamaño fijo, lo cual incrementa la eficiencia del conjunto.
Pero no solo eso, sino que el tamaño de esos bloques se adapta exactamente al de página nativa del almacenamiento flash, lo que redunda en una mejora del rendimiento al no haber datos que cruzan páginas.
Otro parámetro importante que tiene en cuenta el sistema de Data Packing es la localidad de los datos, que se agrupan de manera que no se crean residuos en el disco, residuos que procesos posteriores (los conocidos como garbage
collectors) tengan que limpiar. Esto no solo ahorra recursos de procesamiento y operaciones en el disco, sino que asegura que la reducción de datos de los HPE 3PAR sea 100% inline y no requiera ningún tipo de procesamiento posterior.
Esta característica presenta una ventaja sustancial para los sistemas 24×7 que carezcan de valles de utilización para realizar las tareas de mantenimiento y limpieza de los datos y discos.
Resumen
En el actual escenario de almacenamiento, en el que la tecnología flash desempeña un papel protagonista, los sistemas de reducción de datos resultan imprescindibles para salvar los retos que plantea. La flexibilidad que ofrecen las tecnologías Adaptive Data Reduction de HPE permite utilizar uno o más de los sistemas disponibles, en función de la naturaleza de los datos, lo cual hace posible configurar una cadena de reducción personalizada para cada aplicación. El objetivo es aumentar la durabilidad y eficiencia de los sistemas flash.