sábado, 7 de septiembre de 2013

Métricas en el Data Center

En este artículo comparto un resumen de las métricas más importantes para medir la eficiencia dentro del Data Center para luego poder tomar acciones correctivas ya que como dijo el célebre autor especialista en managment Peter Drucker, “Lo que no se puede medir, no se puede gestionar”.

PUE: Es uno de los parámetros más comunes para evaluar el desempeño eléctrico de un Data Center, (Power Usage Effectiveness): métrica que mide el valor de la eficiencia eléctrica en relación al consumo eléctrico total. Fue establecido por la organización The Green Grid, en particular por uno de sus directores, Christian Belady, y su fin es establecer un parámetro para identificar qué tan eficiente es el consumo actual de los equipos.

\[PUE=\frac{Consumo Eléctrico Total}{Consumo Eléctrico IT}\]

Ejemplo:
\[\frac{200 kW (Consumo Eléctrico Total)}{100 kW (Consumo Eléctrico IT)} = 2.0 PUE\]

Mientras menor sea el valor PUE, mejor será el aprovechamiento eléctrico, lo que se traduce en menores costos y menores emisiones de CO2, permitiendo reducir la llamada “huella de carbono”.El valor perfecto sería un PUE = 1.0. Este número resulta prácticamente imposible de alcanzar, ya que quiere decir que toda la energía consumida por los equipos es igual a la ingresada en el Data Center para que funcione completamente, y donde la refrigeración, UPS, etcétera, no tuvieron consumo eléctrico. Adicionalmente esta métrica puede subdividirse en 4, para obtener diferentes valores que permitan hacer un análisis más detallado, como se enumeran a continuación:
PUE0: se calcula igual que el PUE, pero se toma el pico del consumo eléctrico sobre el consumo eléctrico de los equipos de IT a la salida de la UPS (ambos en el último año).
PUE1: se calcula igual que el PUE, pero se toma el consumo eléctrico total acumulado sobre el consumo eléctrico de los equipos de IT acumulados a la salida de la UPS, ambos valores medidos en el último año.
PUE2: similar al anterior, pero la carga de los equipos de IT se toma a la salida de la PDU (Power Distribution Unit).
PUE3: similar al anterior, pero la carga de los equipos de IT se mide en la entrada a ellos.

DCiE: Parámetro utilizado en la evaluación de la eficiencia,  derivado del anterior, que mide el porcentaje de eficiencia llamado DCiE (Data Centre infrastructure Efficiency), la cuantificación de DCiE fue creada para entender más fácilmente la eficiencia del Data Center. Por ejemplo, un valor DCiE de 28% equivale a un PUE de 2,8. Por ejemplo, si tenemos una factura por consumo eléctrico de 1.000 dólares, sabremos que 280 dólares fueron los realmente consumidos por los equipos de IT.

\[DCiE=\frac{Consumo Eléctrico IT}{Consumo Eléctrico Total} * 100 =\frac {1}{PUE} * 100\]

WUE: se utiliza para evaluar la eficiencia del consumo de agua en los equipos de refrigeración en relación a la cantidad de kW/h, conocida como por sus siglas WUE (Water Usage Effectiveness), y se define como el uso anual del agua dividido por la cantidad de energía utilizada por el equipamiento TI. Las unidades de WUE son litros por kW consumidos por hora (calculados anualmente)

\[WUE=\frac{Consumo Anual De Agua (Litros)}{Consumo Eléctrico IT (kW/h)}\]

Para más información, pueden consultar el link completo del artículo completo en PDF aquí.

CCF: es una métrica creada por la empresa Upsite, que se utiliza para gestionar la eficiencia de refrigeración en el Data Center, por las siglas de Cooling Capacity Factor. Se calcula mediante el cociente entre la capacidad total de refrigeración sobre la carga de consumo de los dispositivos de IT (a la salida de la UPS) aumentada en un 10% (ese 10% adicional está atribuido otros factores que interfieren en el cálculo, como ser: iluminación, personas, estructura, etc)

\[CCF=\frac{Capacidad Total Refrigeración}{Consumo Eléctrico IT (Salida UPS) *1,1} =\frac {215 kW}{150 kW * 1,1} = 1,3\]

El valor de CCF recomendado es 1,2 or 120%. Lo que significa que la capacidad de refrigeración está funcionando al 120% de la carga TI. Un CCF que oscila entre 1,0 y 1,1 significa que la capacidad de refrigeración redundante es prácticamente nula. Si los valores van de 1,2 a 1,5 es posible que se puedan realizar modificaciones en los sistemas de enfriamiento que permitan ahorrar dinero. Si el valor es superior a 1,5 estamos sin dudas frente a un ambiente donde se pueden hacer muchas mejoras para reducir los costos en enfriamiento. Generalmente la mayoría de los Data Centers entran en esta última categoría.
Articulo original en PDF disponible aquí, Link a la calculadora de CCF online aquí

ERE: es otra métrica importante creada por The Green Grid utilizada para calcular la eficiencia de la reutilización de la energía (Energy Reuse Effectiveness), como por ejemplo podría ser la reutilización del calor generado por los equipos para aclimatar las instalaciones edilicias. Es una fórmula similar al PUE, pero al consumo eléctrico del Data Center (en el numerador) se le resta el ahorro de energía eléctrica generado por la reutilización.

\[ERE=\frac{(Consumo Eléctrico Equipos Data Center) - (Energía Reutilizada)}{Consumo Eléctrico IT }\]

Link articulo original en PDF aquí.
Para un nivel de detalle mayor y orientado con un enfoque puramente ecologista, existe otra métrica relacionada a esta llamada CUE (Carbon Usage Effectiveness), en donde se analiza la cantidad total de emisiones de CO2  causada por los equipos del Data Center sobre el consumo eléctrico de los equipos de IT.      

UUR: la métrica UUR (Utilización Unitaria de Rack) consiste en evaluar el porcentaje de utilización de cada Rack medido en "U" o unidades de Rack. Esta información es útil para comprender la utilización total y poder asociar esa utilización con el consumo o la generación de calor que provoca cada Rack analizando si el flujo de refrigeración es el correcto, ya que lo no es lo mismo un Rack de comunicaciones que solo tiene patchears que otro donde hay cinco cajones de servidores blade.
Por cada uno de los Racks del Data Center se debe hacer este simple cálculo:

\[UUR=\frac{"U"Disponibles-"U" Utilizadas}{"U" Disponibles} * 100 \]

Aquí les dejo una planilla de cálculos con la fórmula, donde solo tienen que completar la cantidad de U utilizadas y el consumo eléctrico por cada Rack. Archivo aquí.
Para aquellas personas que desean tener un detalle más completo de la utilización del espacio, existen otras métricas más complejas que permiten analizar la disponibilidad física dentro del Data Center, como ser: DCSE (Data Center Space Efficiency Metric) es un conjunto de métricas complejas desarrolladas por David Cappuccio (Gartner) que tienen por finalidad establecer la utilización real de los espacios dentro del Data Center.

Conclusión final: todas las métrica previamente enumeradas carecen de poco valor práctico de aplicación si al momento de hacer los cálculos no se tiene preestablecido cuales son los objetivos buscados, ya sea desde una visión ecológica orientada a la sustentabilidad o la intención de reducir costo. La métrica no es un objetivo en si mismo, sino que debe ser una herramienta para la toma de decisiones, basado en la información obtenida históricamente en el transcurso del tiempo.