Etiqueta: analísis de información

16 puntos del Big Data que todo profesional de TI debe saber

Comstor ofrece 16 claves a tener en cuenta sobre Big Data que todo profesional de TI debe saber, donde aprender a usarlo es inmensamente más relevante.

Saber qué es lo que significa cada término relacionado al Big Data es fundamental para aplicar en el día a día de los negocios. Sin embargo, muchos de los términos que existen hoy no poseen una definición exacta, pues se transforman en la medida que son usados.

A continuación, dejamos algunas palabras esenciales para los que trabajan con esta tecnología:

1-    Algoritmo: Secuencia lógica, finita y con instrucciones que forman una fórmula matemática o estadística para realizar el análisis de datos.

2-    Analytics: Es la forma de capturar informaciones, procesarlas y analizarlas para que se conviertan en insights.

3-   BI (Business Inteligence): Es el método que transforma informaciones almacenadas y analizadas en datos que son estratégicos para una empresa y que se convierten en ganancia para el negocio.

4-    Data Scientist: Es el analista de datos. La persona que capturará los insights, las principales informaciones dentro de un gran volumen de información.

5-    Small Data: Mucho más pequeño que el Big Data, se refiere al análisis que se hace con pocas fuentes de datos.

6-    Datos estructurados y no estructurados: Los estructurados tienen una organización lógica, pero con posibilidades pequeñas de extracción de informaciones para el Big Data. Por otro lado, los no estructurados son desorganizados, como los mensajes en emails y redes sociales, pero permiten una gran posibilidad de extracción de insights comerciales.

7-    Dark Data: Se refiere a datos desconocidos que pueden perderse o almacenarse, sin la posibilidad de accederse o analizarse en caso de que el sistema no esté configurado para eso.

8-    Data Cleansing: Es el método que mantiene los bancos de datos libres de informaciones inconsistentes o irrelevantes.

9-    Data Lake: Es un lago de datos en el cual se almacenan informaciones en su estado natural y en gran volumen, es allí donde el Data Scientist debe sumergirse para encontrar sus principales insights.

10- Data Mining: Es el proceso previo al Analytics, es la minería de los datos, la forma de descubrir informaciones relevantes.

11- Dirty Data: Son los registros que no se han limpiado. Datos que se capturaron, almacenaron y que se usarán, pero que precisan ser primeramente trabajados.

12- Fast Data: Los datos rápidos son los que pierden valor a lo largo del tiempo y que, por eso, necesitan ser analizados prácticamente en tiempo real para que generen respuestas estratégicas para las empresas que necesitan dar respuestas y tomar decisiones de forma instantánea.

13-Slow Data: Es lo opuesto de Fast Data y hace referencia a las informaciones que se pueden capturar en el Data Lake para un análisis posterior. Esos datos no necesitan un análisis en tiempo real, con tiempo de respuesta menor.

14- Medium Data: Término que define una cantidad intermediaria de datos que son necesarios para que se generen análisis e insights. Es un tamaño menor de información que el generado por el Big Data.

15- Predictive Analytics: El análisis predictivo es la utilización de datos para predecir tendencias o eventos futuros.

16- Sentiment Analysis: El análisis de sentimiento son técnicas usadas para identificar el sentimiento de un individuo sobre determinada cuestión. Hay muchos términos que surgen a cada momento, muchas veces creados por proveedores de herramientas y analistas de consultorías para intentar ofrecer un nuevo servicio. Generalmente son funciones que ya existen y que quien trabaja con Big Data ya está acostumbrado, pero con un nuevo nombre o definición.

Finalmente, hay que destacar que el dominar estos términos es importante para el área de TI, pero es aún más importante que se enfoque en la forma en la que se puede usar el Big Data para que se generen resultados que puedan transformar una empresa.

N. de P. Comstor

Las redes sociales son la puerta de entrada del malware

Los ecosistemas de social media se han convertido en una amenaza para las organizaciones, que no las suelen tener en cuenta. Son de fácil acceso y su uso es masivo. Además, la gente suele compartir información inocua perfecta para el phishing.

Las redes sociales se han convertido en una mina de oro para los actores maliciosos. El informe NopSec 2016 ha detectado que las organizaciones utilizan mal los sistemas de evaluación de riesgo; y pone el ejemplo de las redes sociales, que normalmente no entran dentro de estos rangos de puntuación, y que conforman una plataforma superior y esencial para la ciberseguridad. Pero, ¿cuál es la correlación entre las redes sociales y el incremento del malware?

El director de Information Security Forum, Steve Durbin, asegura que una vez alguien entra en sitios como Linkedin, Twitter o Facebook, se crea una conciencia colectiva de que la interacción con los demás se encuentra bajo una capa de protección inexpugnable. “Psicológicamente, nuestra guardia baja”, explica. Como resultado, los sitios web de este tipo se han convertido en un medio muy útil para aquellos que quieran desplegar malware”.

Según el documento NopSec, Twitter es en la actualidad una de las plataformas más utilizadas tanto por investigadores de seguridad como por atacantes que buscan difundir sus hazañas y poner a prueba varios tipos de exploits. Las vulnerabilidades asociadas al malware activo se tuitean nueve veces más que las debilidades que tienen que ver con solo un exploit públicos y 18 veces más que otro tipo de inseguridades.

Es por ello que las redes sociales se han convertido en una puerta de entrada de malware. Según una encuesta anual realizada por Smarsh, el 48% de los preguntados percibieron estos sitios como los número uno en cuanto al riesgo que generan. “Incluso cuando una empresa restringe el acceso a estas plataformas, el riesgo permanece si los empleados no se adhieren a esta restricción. De hecho, el porcentaje de los encuestados que aseguran no tener ninguna confianza en este tipo de políticas de prohibición se mueve en rangos del 30% para Linkedin, 41% en Facebook y 45% en Twitter.

El mayor problema para los equipos de ciberseguridad en las organizaciones es que las redes sociales existen fuera de su perímetro de red. Sin embargo, tal y como asegura Mike Ragoo, cofundador de ZeroFOX, “muchas empresas están empezando a entender el problema y a buscar soluciones a este problema”.

“El primer paso para minimizar el riesgo es entender cuáles son y de dónde provienen las amenazas. Una empresa puede gastar millones y millones en obtener mejores herramientas y no avanzar en nada”, asegura.

Kacy Zurkus

 

Big Data como protagonista de los premios Oscar

Todo está listo para que este próximo fin de semana se lleve a cabo la entrega de los premios Oscar, en su edición número 88, durante la transmisión del evento sin duda alguna generará un gran tráfico en internet. Datos arrojan que el año pasado se obtuvieron más de 937 mil impresiones con el hashtag #Oscars2015.

Basados en esto ¿se podría predecir a los próximos ganadores del Oscar a través de la información generada en redes sociales y plataformas como quinielas online, motores de búsqueda, entre otros? De acuerdo con Amobee, empresa de marketing digital, en las tres semanas siguientes al anuncio de las nominaciones a los Oscar el 14 de enero, “The Revenant” generó 26% más contenido digital que “Spotlight”, su competidor más cercano en la carrera hacia mejor película.

Entonces ¿las empresas pueden capitalizar el gran volumen de datos no estructurados que se generan en eventos futuros y agregar valor a la estrategia de negocio? Ante la explosión de información, datos de la consultora Gartner destacan que 70% de proyectos de Big Data en las empresas nunca se ponen en funcionamiento, siendo limitadas por sus plataformas analíticas, que no están adaptadas a la escala, complejidad y variedad que representan estos datos.

Para sacar provecho de estos eventos debe contar con una visión más clara de los retos concretos que plantea el Big Data, hay cinco elementos en particular que debe tener en cuenta antes de seguir adelante:

  1. Prepárese para un gran volumen de información: En todas las dimensiones, clasifique los datos por su valor (por ejemplo, transacciones de clientes), su uso (frecuencia de acceso), su tamaño (gigabytes, terabytes), su complejidad (datos de máquinas, datos relacionales, vídeos…) y las personas con acceso a ellos (sólo los especialistas en datos o cualquier usuario de negocio). Un inventario minucioso y organizado de los datos facilita la decisión de cómo gestionarlos. Evalúe la capacidad actual de almacenamiento y procesamiento y busque los métodos más rentables y eficientes para hacerla escalable.
  2. Tenga en cuenta la diversidad: El aspecto más complicado del Big Data radica en la multitud de formatos y estructuras que debe conciliar en sus análisis. Tiene que integrar varias fuentes si desea incluir estructuras y tipos de datos nuevos (sociales, de sensores o de vídeos) con las fuentes a las que están acostumbrados (relacionales o mainframes heredados). Optar por codificación precisa puede consumir todo el tiempo y todos los recursos de que dispone. Aproveche al máximo las herramientas disponibles de integración y calidad de datos para agilizar el proceso y dedicarse a tareas más útiles.
  3. Controle la velocidad: Es importante combinar la transmisión de datos en tiempo real con los datos históricos, aumenta el potencial predictivo de los análisis. Por ello, algunos de los datos que le interesan sólo tienen valor si fluyen de manera constante hacia sus sistemas. En efecto, casi todos los análisis en tiempo real se tienen que basar en transmisiones de datos que, a menudo, proceden de fuentes diferentes y tienen distintos formatos. Integre en el proyecto alguna tecnología de análisis de transmisiones y una infraestructura lógica que le permitan gestionar todos los datos.
  4. Compruebe la veracidad: Debe analizar si las fuentes son confiables, cuantos más datos analice, más importante es que mantenga la máxima calidad de datos. Para que los datos sirvan a un fin determinado, tiene que conocer dicho fin. Si un especialista en datos busca patrones en datos agregados de clientes, la preparación necesaria es mínima. Sin embargo, los datos de los informes financieros y de la cadena de suministro exigen un elevado grado de conservación, limpieza y certificación de precisión y cumplimiento. Cree categorías basadas en la preparación indispensable que vayan desde datos sin procesar hasta almacenes conservados y controlados de datos limpios, fiables y fidedignos.
  5. Tenga en consideración el cumplimiento: Los distintos conjuntos de datos que va a manejar tienen diferentes requisitos y condiciones de seguridad. En cada conjunto de datos, se debe plantear qué hace falta para mantener el anonimato de los datos conforme a las políticas de seguridad. Entérese de dónde residen los datos sensibles, protéjalos en la fuente mediante cifrado y, a continuación, controle quiénes tienen acceso a ellos. Además de archivar de forma segura e inteligente los datos sensibles.

Aplique estas cinco consideraciones a todos los conjuntos de datos que maneje y no tendrá problemas para superar de forma más realista los retos que plantea el Big Data en eventos como el del fin de semana que generan gran volumen.

-N. de P. Informatica LLC.

El impacto de Big Data en las PyMEs

En la actualidad es muy común que recibamos varios correos electrónicos el día de nuestro cumpleaños; y lo más natural sería esperarlos de destinatarios que sean nuestros amigos, conocidos o familiares. Sin embargo, quienes lo hacen de manera más regular son las compañías de seguros, tiendas en línea, restaurantes e inclusive agencias de autos donde alguna vez solicitaste una cotización. Enviar felicitaciones por correo ya no es una realidad que nuestros amigos y familiares utilicen, en su lugar prefieren utilizar alguna red social como Facebook.

Esto nos da un panorama de cómo ha cambiado nuestra forma de vida, los cambios exponenciales en cómo nos comunicamos, compramos cosas, cómo interactuamos con quienes nos ofrecen servicios, e inclusive como nos relacionamos con nuestros seres queridos. La vida “online” se ha vuelto una forma de vida y por ende, se ve un aumento en la cantidad de datos que se encuentran en línea.  Este fenómeno nos lleva a reflexionar sobre cómo la adopción de la tecnología impulsa este crecimiento de datos.

A donde sea que uno voltee, los datos crecen exponencialmente y el uso de éstos, hace posible lo que hasta hace 5 años parecía imposible en temas de interconectividad a nivel global. Estudios demuestran que el uso de la información hace más competitivas a las empresas sin importar su tamaño. Asimismo, actualmente estamos siendo testigos de la evolución de la inteligencia de negocios o Business Intelligence – con el crecimiento explosivo de los datos y todo el uso que se puede dar a estos con el correcto análisis de los mismos.

El uso de la información permite tener una ventaja competitiva ya que el uso de la ésta permitirá ofrecer productos y servicios acorde a las necesidades específicas de cada uno de nuestros clientes, así como lanzar campañas de productos y servicios de acuerdo a cada uno de los segmentos de nuestros clientes. Compañías como eBay han capitalizado beneficios a través de la soluciones de Big Data permitiéndoles identificar nuevas oportunidades de negocio a través de señales es decir comportamientos específicos de un cliente que entra al portal y en ese momento ofrecerle un producto en tiempo real que sabemos comprará porque es acorde a su comportamiento como cliente.

Si bien el acceso a tanta información trae consigo beneficios para las empresas, también les genera retos como  la discriminación adecuada de cuál es la información relevante, definir los costos de la infraestructura  tecnológica, el reclutamiento de personal calificado para el correcto manejo de esta información, análisis de datos de manera adecuada, y la elección de tecnología adecuada para almacenar los datos obtenidos.

Es bien sabido que la tecnología puede ser un gran aliado para las compañías, siempre y cuando se elija de manera adecuada. La adopción de herramientas que apoyen en el análisis de lo que llamamos “Big Data” se pueden tener resultados muy positivos como: mayor eficiencia en las operaciones del negocio, reducción de costos de TI, agilización en los tiempos de respuesta y el aumento en la atracción y retención de clientes, entre otros.

En conclusión, el acceso a la información y el crecimiento de la misma pueden llegar a ser abrumadores, sin embargo, si se utilizan las herramientas adecuadas, estos datos se pueden volver en un fuerte aliado para las empresas, obteniendo resultados que impactarán directamente en las cifras de manera positiva.

 

Por: Ángel Morfín, Director de Innovación para SAP México