Del dia, Destacado, Noticias, Principal

Fortalece EMC su plataforma Greenplum

[widget id="text-31"]

La subsidiaria de EMC, Greenplum, anunció una nueva capacidad en su Hadoop Data Computing Appliance (DCA), la cual permite a los usuarios mezclar y unir plataformas de analítica de datos estructurados y no estructurados.

 
EMC también anunció su Greenplum Analytics Workbench, un bed test de más de mil nodos para tests de integración de software de Apache Hadoop.
 
La test bed proporciona a la comunidad de código abierto Hadoop los recursos de testing para identificar bugs, estabilizar los nuevos releases, y optimizar las configuraciones de hardware en un esfuerzo por acelerar la innovación de Hadoop. Todos los testings y resultados serán devueltos a la Apache Software Foundation y a la comunidad de código abierto. El testing de EMC será planeado en coordinación con el proyecto Apache Hadoop. Hadoop es una plataforma de software de código abierto, originalmente desarrollada por Google, para analizar grandes cantidades de datos.
 
En el frente de los appliances de Greenplum, EMC presentó el Modular Data Computing Appliance, que permite a los usuarios combinar bases de datos relaciones masivas de procesamiento paralelo con la Apache Hadoop, de clase empresarial, en un solo appliance unificado para lograr el procesamiento de datos estructurados y no estructurados.
 
Greenplum presentó el Data Computing Appliance en octubre del 2010. El pasado mayo se presentó una versión actualizada del DCA que incluía un appliance Hadoop.
 
El Greenplum HD (Hadoop) DCA está construido en base a servidores Intel x86 y utiliza una base de datos estructurada de Greenplum -que EMC adquirió el año pasado-, y la versión de código abierto Apache de Hadoop. La versión anterior del appliance se basaba en servidores Sun Fire x64.
 
De acuerdo a Scott Yara, uno de los fundadores de Greenplum y vicepresidente de productos de la División de Computación de Datos de EMC, los administradores pueden leer y escribir archivos en paralelo de Greenplum a HDFS (Hadoop File System), lo cual permite que se compartan los datos de manera rápida. Se puede realizar análisis interplataforma usando el Greenplum SQL y las funciones avanzadas de analítica que acceden a los datos en HDFS.
 
El nuevo Modular DCA añade módulos de computación de alto desempeño en la forma del software In-Memory Analytics del SAS Institute, lo cual le permite trabajar con datos estructurados, como las bases de datos, y con datos no estructurados, de acuerdo a Yara.
 
El cambio principal es que puede realizar procesamiento paralelo usando memoria de procesador a través del uso de software de analítica empresarial [de SAS], sostuvo Yara. Queríamos ofrecer una arquitectura tipo bloques de Lego.
 
A través del uso del software SAS, los datos estructurados y no estructurados pueden existir en múltiples hosts x86, lo cual tiene como propósito permitir a los usuarios realizar cómputos en memoria en cada nodo de servidor en una configuración en cluster.
 
El poder del appliance es que puede resolver todos estos complejos problemas en paralelo, sostuvo Yara.
 
El nuevo Modular DCA se encuentra en fase de prueba y se espera que esté disponible para finales de este año, señaló el ejecutivo.
 
Lucas Mearian, Computerworld (US)

Deja un comentario