Volver

NUEVA METRICA PARA DATA CENTERS: EL INDICADOR DE DESEMPEÑO

En Junio de 2016, The Green Grid (TGG) publicó el Whitepaper #68 titulado El Indicador de Desempeño: Evaluando y Visualizando el Desempeño del Enfriamiento del Data Center[1].

La métrica más común que utilizamos es el PUE (Power Usage Effectiveness) que nos mide la eficiencia energética de la infraestructura del data center. Sin embargo, otras métricas que se han desarrollado no han tenido acogida dentro de la industria. La intención de TGG es que se adopte una métrica más holística que involucre varios criterios.

El Indicador de Desempeño toma tres unidades del rendimiento del sistema de enfriamiento, las cuales se definen para conformar esta métrica: 1. Razón PUE, que define la banda de operación como representación del índice de eficiencia energética. 2. La conformidad térmica TI, que toma La operación de los equipos de TI a temperatura adecuada en condiciones de operación normal. Y 3. La resiliencia térmica TI, que tiene en cuenta la operación de los equipos de TI a temperatura adecuada durante una falla de los equipos de acondicionamiento ambiental o durante un mantenimiento (Aires Acondicionados).

El cálculo del indicador, necesita la recolección de datos y dependiendo de la cantidad y exactitud de estos (temperatura, potencia versus tiempo) se pueden tener cuatro niveles de evaluación, que también implica la predicción del desempeño futuro según los planes de operación de sitio y la calibración del modelo 3D utilizado.

El nivel 1 sólo evalúa el estado operacional del sitio. No hay predicción, por lo que no es necesario utilizar un modelo 3D. Utiliza un monitoreo básico de temperatura con sensores en la entrada de aire del rack (se sugieren tres para racks llenos: Uno en la parte inferior, otro en el medio y otro en la parte superior del rack; según la recomendación de 2015 de ASHRAE). Si se desea entender de mejor manera el desempeño del enfriamiento, se pueden instalar más sensores ya sea en el piso falso, entre los pasillos fríos/calientes, o en el retorno de las unidades de aire acondicionado. Se necesitan monitores de energía a nivel de PDU (Power Distribución Unit) para el PUE. Sin embargo, para el cálculo de la conformidad térmica y la resiliencia térmica de los equipos de TI, se puede simplificar la obtención de datos tomando el número de equipos que operan por fuera de las condiciones de temperatura requeridas (número de equipos por fuera versus total de equipos y porcentaje de carga con respecto a los datos de placa del equipo de TI).

El nivel 2 es una extensión del nivel 1, pero tomando datos más exactos. Para esto se toman las temperaturas de entrada a los equipos a nivel de chasis, al igual que la potencia se mide a nivel de equipo de TI. Sin embargo, se pueden tomar datos de potencia a nivel de rack para llevarlos hasta el equipo de TI. La implementación de una herramienta de administración de la infraestructura del data center DCIM (Data Center Infrastructure Management) puede ayudar, pero no es necesaria.

El Nivel 3 incorpora la investigación del comportamiento del sitio en estadios futuros, así como del actual. La simulación del data center a plena carga y en el estado operacional planeado implica el uso de modelos 3D que no necesariamente deben estar calibrados. La exactitud de los cálculos puede estar limitada, pero nos da una idea del impacto en los planes operacionales. No es necesario tener medición a nivel de equipo de TI, es suficiente la medición del nivel 1 y no se necesitan las inversiones en monitoreo del nivel 2.

El nivel 4 es el más avanzado y es más preciso en medición y simulación que el nivel 3. Este requiere que la temperatura de entrada de todos los equipo de TI se registre y el modelo 3D debe estar calibrado  (Modelo CFD Computational Fluid Dynamics). Es deseable que las medidas de potencia se hagan a nivel de equipo de TI, pero se aceptan a nivel de rack. Se deben hacer simulaciones para varios escenarios, incluido plena carga, estados de falla y el operacional.

La razón PUE se establece de acuerdo al objetivo de eficiencia que se defina para el sitio. El Whitepaper presenta rangos del A al G similares a los del etiquetado de productos domésticos o el de edificios bEQ de ASHRAE. Se toma el mínimo valor del rango objetivo y se divide por el Actual.

Para la conformidad se sugiere tomar el rango de operación permitido por las guías ASHRAE de 18 a 27?C[2] y hacer la relación entre el número de equipos que operan en este rango con respecto al total de equipos TI.

Con respecto a la resiliencia se pretende que mediante niveles de redundancia  se evite el riesgo de sobrecalentamiento de los equipos de TI, previniendo posibles fallas. El operador o el dueño del data center seleccionan esta temperatura. Por ejemplo 32?C puede ser un punto que el negocio tolere y tomamos la relación entre el número de equipos que operan por debajo de esta temperatura y el total de equipos de TI.

Estas tres variables se dibujan en un gráfico triangular que nos muestra el indicador de desempeño del enfriamiento de nuestro data center. Aquí, podemos observar nuestro estado de operación a nivel de energía (razón PUE), ¿Cómo estamos en cumplimiento de temperatura? (conformidad) y ¿Cuál es nuestra situación ante una falla? (resiliencia).

Para la implementación de los niveles avanzados recuerde asesorarse adecuadamente. La configuración y personalización de un DCIM y la calibración de un CFD requieren conocimiento de expertos, por lo que la clave es el equipo profesional que Usted seleccione. Los sensores y el software mal implementados le pueden llevar a un proyecto fallido.

Con este indicador Usted podrá mejorar la eficiencia de su data center y aumentar la disponibilidad del mismo.

Para mayor información no dude en contactarme en gerardo.alfonso@ingeal.com.

 

Gerardo Alfonso, es Ingeniero Eléctrico de la Universidad de los Andes en Colombia. Se ha dedicado durante los últimos 30 años a trabajar en la mejora de la eficiencia energética de los Data Center participando activamente en ASHRAE. Es miembro de IEEE, BICSI, TGG, ACIEM, ACAIRE. Actualmente es Consultor Sénior en Ingeal.

 

[1] The Performance Indicator: Assessing and Visualizing Data Center Cooling Performance. The Green Grid. http://www.thegreengrid.org/

[2] Thermal Guidelines for Data Processing Environments, 4th Edition, 2015. ASHRAE.

Resultado de imagen para performance indicator tgg

Volver