Seleccionar página

Data Center, Infrastructure & Operations Management Summit (I)

Este mes tenía la agenda repleta de eventos, el último en el que he estado es el Data Center, Infrastructure & Operations Management Summit. Londres siempre merece la pena, y el evento, también. En otro post os hablaré en más detalle del evento, ahora sólo quiero dejar dos detalles.

El primero, una frase que me ha gustado mucho. En la profesión hay un viejo chascarrillo: Legacy is all that works. Pero en la keynote de apertura, a cargo de Neil Rickard y Milind Govekar, dijeron una frase que me encantó y con la que no puedo estar de acuerdo: Don’t be a Custodian of Legacy Technologies. Llevo años diciendo eso mismo: si no provocas tú el cambio, te pasará por encima, así que espabilad.

Un evento con más de mil personas en el que sólo estábamos media docena de asistentes españoles: tenemos que hacérnoslo mirar. Y hay otra cosa que nos tenemos que hacer mirar: en dos días he estado en 19 charlas, y todos los ponentes terminaban a la hora en punto sin necesidad que que un moderador les interrumpiera. Y más significativo aún: no sonó ni un puñetero móvil. Salas con 300 personas y no sonaba ni un móvil. Para terminar de descentrar, no había ningún runrun de gente charloteando. Hombre ¿cómo se va a concentrar uno en lo que te están contando si no suenan móviles, la gente no hace ruido y encima el ponente termina a la hora?

Casi igual que el evento en el que estuve el viernes en Madrid, en el que los ponentes que nos ajustamos a nuestro tiempo fuimos excepción y en el que sonaba un móvil cada dos por tres.

Por lo demás, Boris Becker muy simpático y el O2 Arena muy bonito, unas vistas impresionantes y te hace recordar la peli de Pierce Brosnan, pero excesivamente apartado.

Éxito de Big Data 2012

Como os decía en la entrada anterior, un problema de agenda me obligó a cambiar la hora de mi charla, y sólo pude estar en el evento por la tarde. Pero en un tiempo como este, en el que la crisis está sacudiendo fuerte, he visto muchos congresos y eventos con baja asistencia porque en muchas organizaciones ya no hay presupuesto ni para ir a la esquina.

Por eso me ha sorprendido la cantidad (y la calidad) de los asistentes a Big Data 2012, siendo un evento de pago. Eso significa dos cosas: que iiR (la empresa que organizaba el evento) tiene un buen poder de convocatoria y que hay una inquietud creciente sobre el concepto Big Data y sus consecuencias. Enhorabuena a iiR por tener la visión para organizarlo.

Como es habitual, mi charla se centró en infraestructuras y sistemas. Conté cómo es mi visión de los sistemas para almacenamiento de Big Data, y lo que implican desde el punto de vista del datacenter. Para ello hice un análisis de cómo son las arquitecturas de los sistemas de almacenamiento actuales y por qué no son válidos para Big Data.

Y para abrir boca puse algún ejemplo sobre el «Data Big Bang», contando algún ejemplo de instrumentos que van a «escupir datos» a ritmo de 1TB/seg. Ya he hablado de ello en el blog en alguna ocasión anterior.

Os dejo las transparencias en el área de descargas, aunque los que habéis estado en presentaciones mías sabéis que son muy simples (soy vago), así que quizá sin la charla no se entienda.

Por cierto, que esta mañana he tenido una reunión para un proyecto bastante interesante. Requiere un almacenamiento de 2,4PetaBytes. Un USB cualquiera.

Y ahora, Big Data

El próximo martes 19 de Junio se celebra, organizado por iiR España, el evento «Big Data 2012». En el blog hemos hablado mucho de Eficiencia Energética y Cloud Computing, las dos grandes modas TIC. Y Big Data es la tendencia emergente. El concepto es muy sencillo: el volumen de información está literalmente explotando, y tenemos que desarrollar tecnologías para adaptarnos a esta demanda.

La gente de iiR, atentos siempre a las tendencias del sector, han organizado el evento y una vez más han tenido la amabilidad de invitarme a dar una charla: «Big Data & Data Center: Infraestructuras para almacenamiento y proceso de Big Data». En ella veremos algunas cifras sobre la magnitud de la explosión de datos, y haremos un análisis sobre cómo serán las infraestructuras para almacenamiento y proceso. Y, sobre todo, las razones de por qué van a ser así.

Tenéis más información del evento en su web. Espero veros allí, y que la charla sea de vuestro interés. Por cierto, que ha habido un cambio de horario en el programa, la charla será a las 17:15.

Lo que se nos viene encima…

Esta semana hemos tenido la reunión de arranque de un interesante proyecto de investigación: Amiga4Gas. En la reunión estábamos los equipos de los tres miembros del proyecto: IAA (CSIC), BSC y FCSCL. Es decir, un centro de investigación en astrofísica y dos centros de supercomputación.

Nuestro rol como centro de supercomputación es doble: además de desarrollar los componentes de software necesarios, tenemos que poner nuestro músculo computacional a disposición del proyecto para realizar los cálculos necesarios.

Las imágenes a procesar proceden de radiointerferómetros. Y en estos momentos está en proyecto el que será el mayor radiointerferómetro del mundo: SKA (siglas de Square Kilometer Array). No voy a aburriros ahora con lo que significa SKA desde el punto de vista de la ingeniería, tenéis la información básica en el artículo de la wikipedia. Lo relevante desde el punto de vista TI es el flujo de datos que dará SKA cuanto esté completamente operativo en 2024. Ni más ni menos que 1TB de datos por segundo.

Es decir, este pequeño instrumento nos dará un exabyte de datos por día. Tenemos doce años para diseñar cómo serán los sistemas capaces de procesar, transmitir y almacenar semejantes flujos de información. Si me permitís un chiste malo, esto ya no es un problema de Big Data, sino más bien de Huge Data. Y necesita tecnología que todavía no tenemos.

Mientras tanto, nosotros diseñaremos los sistemas para tratar los cubos actuales de datos (comienzan en 100MB) de forma completamente automática, utilizando para ello una federación de infraestructuras heterogéneas.