El problema de la densidad en almacenamiento flash empresarial

A lo largo de las últimas décadas las tecnologías de cómputo y comunicaciones han parecido evolucionar de manera proporcional. Sin embargo, en la industria del almacenamiento empresarial, la tecnología de disco rotacional se quedó estancada no habiendo muchos cambios prácticamente desde la última década (los discos eran cada vez más grandes pero seguían rotando a 10K-15Krpm y no daban mas de 200MB/s de ancho de banda con un tiempo de respuesta de unos 5ms en el mejor y más favorable de los casos). Por ello, los que nos dedicamos a esto, tratábamos de poner a trabajar en paralelo cuantos más discos rotacionales (ejes) nos fuese posible hasta que estrangulásemos el canal de comunicación hacia el cómputo. Esto, creaba complejidad y elevaba los costes ya que había que tener unos conocimientos muy específicos para poder afrontar un dimensionamiento con garantías, o llevar a cabo las tareas de puesta a punto, mantenimiento y operación de la solución; en fin no creo que aquí cuente nada nuevo.
Hasta que llegó la tecnología de almacenamiento en estado sólido con sus SSDs y pensamos que ya habíamos solucionado el problema…en parte.

En realidad, lo que está a punto de pasar con los SSDs es lo mismo que nos pasó ya con los HDDs, pero esta vez el problema no ha venido por una limitación mecánica sino por una limitación del interface de conexión y el protocolo.
A día de hoy las capacidades y densidades de los SSDs han superado incluso hasta el disco SATA mas grande: hace tiempo que Seagate anunció un SSD de 60TB y otros fabricantes ya tienen desde hace tiempo modelos de 15TB de capacidad.


La realidad de esto es que todo el potencial en rendimiento que ofrece el medio flash de mayor densidad sigue estando “encorsetado” por el uso de interfaces y mecanismos pensados para el disco rotacional, es decir, por el interface SATA/SAS. Y esto nos conducirá irremediablemente a un dejavú:
  • La fiabilidad de la solución de almacenamiento se ve reducida. Ejemplo muy simple: con 9 SSDs de 16TB consigo unos 100TB netos en RAID-5, si un SSD falla eso significa que un 10% de mi capacidad se ha perdido y tengo que reconstruirla; dada la ingente cantidad de datos que acabo de perder, teniendo en cuenta el ancho de banda del que dispone el SSD es limitado y que el sistema de almacenamiento tiene una carga en IO que procesar simultáneamente, esta operación me puede llevar casi un día (tiempo durante el cual mis datos están comprometidos). Por poner una analogía, lo que ocurre aquí es como si en una cabina de 300 discos me fallan 30 simultáneamente (de grupos raid distintos).
  • El ratio rendimiento/densidad se reduce dramáticamente: el rendimiento de un SSD pequeño es similar al de uno grande, de nuevo porque el límite no está ya en el medio flash sino en el interface. Volviendo al mismo ejemplo del punto anterior y haciendo unos cálculos simples, si asumimos que cada SSD nos puede ofrecer 5.000 IOPs mi backend podría dar 40.000 IOPS…como tengo 100TB de datos, mi ratio rendimiento/densidad es de 400 IOPS/TB lo cual es algo que está a la par de cualquier solución de disco híbrida tradicional.
A continuación un gráfico que muestra una imagen aún mas realista e interesante:
En este otro, sacado del Storage Developer Conference de la SNIA en el 2015, se muestra la curva de escalabilidad del rendimiento de un SSD en relación con el paralelismo limitado por el uso de un interface pensado y diseñado para disco rotacional (comandos AHCI en SATA o comandos SCSI en SAS):

Y si hacemos una rápida comparativa de los distintos interfaces actuales de comunicación de disco, memoria y CPU se nos hará evidente que es necesario empezar a pensar en algo específicamente para el medio flash que solucione el problema:


La nueva realidad, donde los sistemas de cómputo están alcanzando y explotando unos niveles de paralelismo sin precedentes, está haciendo que la industria del almacenamiento esté comenzando una nueva transición que permita explotar todo el potencial de la tecnología flash e incluso dar los siguientes pasos en la evolución del medio (SCM o Storage-class Memory). El primer paso ya se ha dado mediante el desarrollo de iniciativas y estándares NVM (Non-Volatile Memory) y protocolos específicos (NVMe), que abordaré en un siguiente post.

Lo que queda patente es que, hasta que no se utilice un protocolo e interface adecuado al medio, no tiene mucho sentido diseñar e implantar soluciones de almacenamiento All-Flash basadas en estas nuevas capacidades y densidades. Siguiendo con el ejemplo básico que había puesto anteriormente, es preferible elegir un sistema de almacenamiento flash con unos 56 SSDs de 2TB en RAID-5 para obtener 100TB netos en lugar de uno con solo 9 SSDs de 16TB…en un sistema de almacenamiento con una arquitectura correcta no debería de haber mucha diferencia en huella ni en coste. Es más, dada la casuística del medio flash, utilizar un RAID-5 especialmente en SSDs de elevada densidad es arriesgar la disponibilidad e integridad del dato. Al menos deberíamos de contar con doble protección, o paridad doble…por lo que un mecanismo de protección de paridad simple como el RAID-5 es algo que debería de quedar descartado en este tipo de densidades.

Por último, y no menos importante, es igual de cierto que la aceleración de la obsolescencia de las soluciones y tecnologías en el mundo de la IT tiene una evolución exponencial con los años; hace una década un sistema de almacenamiento quedaba obsoleto a los 6 años, la realidad actual es que a los 3 años los componentes que lo conforman a nivel de procesamiento están bastante obsoletos en relación con el resto de componentes del datacenter y la llegada de la tecnología flash no ha hecho mas que pisar el acelerador más fuerte aún. Por tanto, a la hora de elegir una nueva solución de almacenamiento All-Flash hay que considerar si ésta estará ya preparada para esta nueva transición permitiendo adoptar estas nuevas iniciativas y estándares sin compromiso e impacto en coste y operación, haciendo frente así al efecto acelerador en la obsolescencia.

Comentarios

Entradas populares de este blog

Apache Spark 2.4: hacia la analítica de datos unificada

¿Qué es NVMe y porqué es clave?