Back

Salesforce sufre una caída en su data center de Washington

Los problemas derivados de este incidente se han prolongado durante una semana

 

Disponibilidad

 

 

 

La pasada semana la compañía especializada en soluciones CRM Salesforce experimentó una caída superior a las 20 horas en su instancia NA14, en la región de Norteamérica. Por una acumulación de problemas, el servicio no estuvo completamente restaurado hasta una semana después. 
 
Durante el 9 de mayo, después de observar una disrupción en el servicio que impedía a los clientes acceder a las soluciones de Salesforce en la instancia NA14, el equipo técnico determinó que el problema se debía a un fallo eléctrico en su data center de Washington (WAS), según indican desde la compañía. 
 
Al parecer, el fallo se encontraba en un interruptor responsable de controlar la corriente en el data center. Mientras que el proveedor se encargaba de sustituir el interruptor, se produjeron fallos eléctricos a nivel del sistema de computación, puesto que varios sistemas de energía redundante no funcionaron. 
 
Para restaurar el servicio lo antes posible, el equipo decidió cambiar la instancia desde su data center primario (WAS) hasta un centro de datos secundario en Chicago (CHI). Previsiblemente, el mismo día 9 de mayo se restauró la instancia NA14 desde este CPD. 
 
Sin embargo, durante el día 10 de mayo se registró una degradación del rendimiento de dicha instancia, que llevó a una interrupción del servicio como resultado de un fallo en la base de datos. Esto impidió a los clientes de la NA14 acceder al servicio de Salesforce. 
 
Al parecer, se produjeron discrepancias de archivo en la base de datos en el data center WAS, mientras que el backup en el data center CHI no se había completado aún. Esto significaba que el servicio no podía ser restaurado. 
 
Después de diversos intentos de restaurar el servicio en el centro de datos de Chicago, se decidió restaurar un backup local de la instancia en el CPD de Washington. Esta copia de seguridad, no obstante, no contenía los nuevos datos generados después de que se produjeran los problemas eléctricos, una situación que hubo que solucionar. 
 
Con toda la problemática añadida, no fue hasta el 15 de mayo, una semana después, cuando todas las funcionalidades fueron finalmente restauradas.

Back