Seleccionar página

Éxito de Big Data 2012

Como os decía en la entrada anterior, un problema de agenda me obligó a cambiar la hora de mi charla, y sólo pude estar en el evento por la tarde. Pero en un tiempo como este, en el que la crisis está sacudiendo fuerte, he visto muchos congresos y eventos con baja asistencia porque en muchas organizaciones ya no hay presupuesto ni para ir a la esquina.

Por eso me ha sorprendido la cantidad (y la calidad) de los asistentes a Big Data 2012, siendo un evento de pago. Eso significa dos cosas: que iiR (la empresa que organizaba el evento) tiene un buen poder de convocatoria y que hay una inquietud creciente sobre el concepto Big Data y sus consecuencias. Enhorabuena a iiR por tener la visión para organizarlo.

Como es habitual, mi charla se centró en infraestructuras y sistemas. Conté cómo es mi visión de los sistemas para almacenamiento de Big Data, y lo que implican desde el punto de vista del datacenter. Para ello hice un análisis de cómo son las arquitecturas de los sistemas de almacenamiento actuales y por qué no son válidos para Big Data.

Y para abrir boca puse algún ejemplo sobre el «Data Big Bang», contando algún ejemplo de instrumentos que van a «escupir datos» a ritmo de 1TB/seg. Ya he hablado de ello en el blog en alguna ocasión anterior.

Os dejo las transparencias en el área de descargas, aunque los que habéis estado en presentaciones mías sabéis que son muy simples (soy vago), así que quizá sin la charla no se entienda.

Por cierto, que esta mañana he tenido una reunión para un proyecto bastante interesante. Requiere un almacenamiento de 2,4PetaBytes. Un USB cualquiera.

Y ahora, Big Data

El próximo martes 19 de Junio se celebra, organizado por iiR España, el evento «Big Data 2012». En el blog hemos hablado mucho de Eficiencia Energética y Cloud Computing, las dos grandes modas TIC. Y Big Data es la tendencia emergente. El concepto es muy sencillo: el volumen de información está literalmente explotando, y tenemos que desarrollar tecnologías para adaptarnos a esta demanda.

La gente de iiR, atentos siempre a las tendencias del sector, han organizado el evento y una vez más han tenido la amabilidad de invitarme a dar una charla: «Big Data & Data Center: Infraestructuras para almacenamiento y proceso de Big Data». En ella veremos algunas cifras sobre la magnitud de la explosión de datos, y haremos un análisis sobre cómo serán las infraestructuras para almacenamiento y proceso. Y, sobre todo, las razones de por qué van a ser así.

Tenéis más información del evento en su web. Espero veros allí, y que la charla sea de vuestro interés. Por cierto, que ha habido un cambio de horario en el programa, la charla será a las 17:15.

Tutorial Eficiencia Energética en los Grupos de Trabajo de RedIris

Como habéis notado, hace mucho tiempo que no actualizo el blog: el último mes ha sido muy intenso en trabajo, viajes, etc, etc. El agobio ha sido considerable, y ni siquiera he podido anunciaros  los Grupos de Trabajo de RedIris que se han celebrado en Cáceres. Cualquier excusa es buena para visitar Cáceres y su maravilloso casco antiguo, pero sobre todo si una de las sesiones lleva por título «Tutorial de Eficiencia Energética», y en la que RedIris me ha invitado a dar dos charlas «Impacto económico de la Eficiencia Energética» y «Gestión de un Datacenter Eficiente».

A simple vista me ha parecido que este año la asistencia a los Grupos de Trabajo ha sido algo más escasa: se nota que la crisis hace estragos y mucha gente ya no tiene ni presupuesto para un modesto viaje a Cáceres. Pero a pesar de ello, la asistencia a la sesión fue más que notable, con la sala llena (a pesar de ser la primera sesión de la tarde). Se notaba a la perfección que es un tema que despierta gran interés e inquietud.

En la primera puse ejemplos básicos -muy básicos- del impacto en términos económicos de la eficiencia energética. Y fue significativa la sorpresa de algunos de los asistentes ante la magnitud del problema y asimilar lo que supone ahorrar un sólo kW de carga IT, bajar el PUE, etc, etc.

En la segunda charla, aparte de algunos consejos básicos sobre gestión de datacenters (hay quien todavía se sorprende cuando le dices que suba el termostato, que no tiene por qué hacer frío en el CPD), mostré los resultados preliminares del proyecto MONICA, que en algunos aspectos son bastante sorprendentes. Pero esto serán objeto de una entrada nueva.

Si queréis ver las transparencias, tenéis las presentaciones en la sección de descargas.

Monitorización y Control Inteligente del PUE

Control del PUELa próxima semana tiene lugar el ASLAN (días 27, 28 y 29) y el congreso de enerTIC (días 28 y 29 de Marzo). Así que es un momento ideal para hablar de PUE, por lo que haré la presentación «Monitorización y Control Inteligente del PUE» en el Foro Tecnológico (será el día 28 de Marzo a las 11:45).

En la presentación os contaré qué es el PUE y el DCIE, cuales son sus componentes y cómo se comportan. Pero más importante aún, os introduciré al concepto EIT (Eficiencia IT) y desmitificaremos algunas cuestiones alrededor del PUE. Para hablar del PUE es necesario conocerlo, monitorizarlo y controlarlo. Para eso os presentaré MONICA.

El proyecto MONICA es un desarrollo liderado por Catón en el que participan la FCSCL (Fundación Centro de Supercomputación de Castilla y León) y el grupo HPCA (High Performance Computing Architectures) de la UJI (Universidad Jaume I).

El proyecto tiene dos objetivos principales:

  • Monitorizar el PUE. Es decir, monitorizar en tiempo real todos los dispositivos necesarios en el CPD para poder tener datos del PUE con precisión.
  • Controlar de forma inteligente y automática el CPD para mejorar la eficiencia. Por ejemplo: encendiendo o apagando servidores, desplazando máquinas virtuales de servidor, cambiando consignas en equipos de climatización, etc.

Es más, este aspecto puede realizarse conforme a unas reglas de negocio predefinidas, y puede usarse para diferentes propósitos. Mejorar la eficiencia energética es uno de ellos, pero puede ser también la minimización del riesgo.

El proyecto nos ha permitido aprender mucho sobre PUE y eficiencia en una gran instalación real. Por ejemplo, el hecho de que el PUE, tal y como está definido por The Green Grid, es una integración de un año. Y la optimización del PUE requiere trabajar con la derivada… Os presentaré algunos resultados y conclusiones sobre PUE y eficiencia que probablemente sorprendan a más de uno.

… Y hasta aquí puedo leer. Os recomiendo (a los que podáis) que vengáis el miércoles a la charla. No obstante, después de la charla colgaré aquí las transparencias, y me tenéis a vuestra disposición para consultas y dudas.

Datacenters, Garcerán y Forges

Ayer tuve la suerte de asistir -una vez más gracias a mi amigo Garcerán Rojas por la invitación- a la presentación del libro que PQC ha editado con motivo de su decimoquinto aniversario: El Centro de Proceso de Datos. El libro está ilustrado por Forges y es una verdadera joya. Un compendio de conocimiento sobre CPD’s escrito e ilustrado en clave de humor. El subtítulo (To bit or not to bit; data is the question) lo dice todo.

Recomiendo muy vivamente su lectura. No sólo porque hacerlo supone pasar un rato divertido, sino por las píldoras de conocimiento que contiene. A todos nos servirá para darnos cuentas de las muchas cosas que no sabemos y las muchas cosas que hacemos mal en el CPD.

Las ilustraciones de Forges, como corresponden al autor: sencillamente geniales. Personalmente, la que más me ha gustado es la del Centro de Respaldo. Por fin he podido averiguar cómo es. Pero, sobre todo, invito a todos los responsables de CPD’s a seguir los recomendamientos: sin duda mejorarán su instalación si lo hacen.

Garcerán, mi más sincera enhorabuena por la obra. Por favor, transmite también mi enhorabuena y admiración a Forges.