Etiqueta: algoritmo

16 puntos del Big Data que todo profesional de TI debe saber

Comstor ofrece 16 claves a tener en cuenta sobre Big Data que todo profesional de TI debe saber, donde aprender a usarlo es inmensamente más relevante.

Saber qué es lo que significa cada término relacionado al Big Data es fundamental para aplicar en el día a día de los negocios. Sin embargo, muchos de los términos que existen hoy no poseen una definición exacta, pues se transforman en la medida que son usados.

A continuación, dejamos algunas palabras esenciales para los que trabajan con esta tecnología:

1-    Algoritmo: Secuencia lógica, finita y con instrucciones que forman una fórmula matemática o estadística para realizar el análisis de datos.

2-    Analytics: Es la forma de capturar informaciones, procesarlas y analizarlas para que se conviertan en insights.

3-   BI (Business Inteligence): Es el método que transforma informaciones almacenadas y analizadas en datos que son estratégicos para una empresa y que se convierten en ganancia para el negocio.

4-    Data Scientist: Es el analista de datos. La persona que capturará los insights, las principales informaciones dentro de un gran volumen de información.

5-    Small Data: Mucho más pequeño que el Big Data, se refiere al análisis que se hace con pocas fuentes de datos.

6-    Datos estructurados y no estructurados: Los estructurados tienen una organización lógica, pero con posibilidades pequeñas de extracción de informaciones para el Big Data. Por otro lado, los no estructurados son desorganizados, como los mensajes en emails y redes sociales, pero permiten una gran posibilidad de extracción de insights comerciales.

7-    Dark Data: Se refiere a datos desconocidos que pueden perderse o almacenarse, sin la posibilidad de accederse o analizarse en caso de que el sistema no esté configurado para eso.

8-    Data Cleansing: Es el método que mantiene los bancos de datos libres de informaciones inconsistentes o irrelevantes.

9-    Data Lake: Es un lago de datos en el cual se almacenan informaciones en su estado natural y en gran volumen, es allí donde el Data Scientist debe sumergirse para encontrar sus principales insights.

10- Data Mining: Es el proceso previo al Analytics, es la minería de los datos, la forma de descubrir informaciones relevantes.

11- Dirty Data: Son los registros que no se han limpiado. Datos que se capturaron, almacenaron y que se usarán, pero que precisan ser primeramente trabajados.

12- Fast Data: Los datos rápidos son los que pierden valor a lo largo del tiempo y que, por eso, necesitan ser analizados prácticamente en tiempo real para que generen respuestas estratégicas para las empresas que necesitan dar respuestas y tomar decisiones de forma instantánea.

13-Slow Data: Es lo opuesto de Fast Data y hace referencia a las informaciones que se pueden capturar en el Data Lake para un análisis posterior. Esos datos no necesitan un análisis en tiempo real, con tiempo de respuesta menor.

14- Medium Data: Término que define una cantidad intermediaria de datos que son necesarios para que se generen análisis e insights. Es un tamaño menor de información que el generado por el Big Data.

15- Predictive Analytics: El análisis predictivo es la utilización de datos para predecir tendencias o eventos futuros.

16- Sentiment Analysis: El análisis de sentimiento son técnicas usadas para identificar el sentimiento de un individuo sobre determinada cuestión. Hay muchos términos que surgen a cada momento, muchas veces creados por proveedores de herramientas y analistas de consultorías para intentar ofrecer un nuevo servicio. Generalmente son funciones que ya existen y que quien trabaja con Big Data ya está acostumbrado, pero con un nuevo nombre o definición.

Finalmente, hay que destacar que el dominar estos términos es importante para el área de TI, pero es aún más importante que se enfoque en la forma en la que se puede usar el Big Data para que se generen resultados que puedan transformar una empresa.

N. de P. Comstor

Un nuevo sistema de imagen puede leer libros cerrados

La ayuda de diferentes algoritmos y a la radiación de terahertz, es posible que este sistema sea capaz de leer letras de las primeras nueve páginas de una pila de papeles.

Ahora podemos juzgar un libro por su carátula según Laura Waller, profesora de ingeniería eléctrica e informática en la Universidad de California de Berkeley. Es por ello que, el nuevo sistema desarrollado por investigadores del MIT y de Georgia Tech permite leer un libro cerrado a través de su tapa. Esto es posible principalmente gracias a la radiación de terahertz, una banda de radiación electromagnética entre microondas y luz infrarroja.

Las ventajas que ofrece sobre otros tipos de ondas que pueden penetrar superficies, como rayos X u ondas sonoras. La radiación de terahertz distingue entre la tinta y los espacios en blanco del papel. Usa una cámara de terahertz estándar que emite explosiones ultracortas de radiación para que el sensor incrustado en la cámara detecte sus reflexiones. Y, así, un algoritmo calibra la distancia de cada una de las páginas individuales del libro.

El sistema usa dos medidas diferentes de la energía de la reflexión de la luz para extraer la información sobre las propiedades químicas de las superficies, haciendo todo lo posible por eliminar “el ruido” irrelevante producido a lo largo del camino. De esta manera es como se distingue la tinta del papel de los espacios en blanco, usando otro algoritmo para interpretar las imágenes que a menudo llegan deformadas o incompletas como letras individuales.

La descripción de esta nueva metodología fue publicada el viernes pasado en la revista científica Nature Communications. Los investigadores probaron este sistema sobre un montón de papeles con una letra en cada folio y descubrieron que con este método podían leer las letras de las primeras nueve hojas.

El investigador de MIT, Barmak Hesmat, señala que el Museo Metropolitano en Nueva York ha expresado su interés por el sistema como un modo de examinar libros antiguos sin tocarlos. Además añadió que esta tecnología podría ser usada para analizar cualquier material organizado en capas finas, así como las capas que hay en partes de una maquina o productos farmacéuticos.

Claudia Ortiz-Tallo

 

Cómo impacta en las empresas el nuevo timeline de Twitter

La nueva función que ha a puesto en marcha la red social de los 140 caracteres, da prioridad al seguimiento de cuentas, beneficiará en especial a las empresas a hacer un seguimiento más breve de las cuentas que les afectan.

Twitter es un canal de comunicación que sigue creciendo; en un principio se utilizaba entre amigos, después llegaron los personajes públicos, las empresas, los medios, más adelante llegó la avalancha de tuits que ocultan los más importantes, convirtiendo en una tarea difícil y larga la filtración de qué es más importante.

La red social es consciente del exceso de información que a veces hay en el timeline, por lo que ha introducido una nueva función que da prioridad a los tweets de las cuentas que sean más importantes para el usuario mediante un algoritmo; gracias a esta nueva opción las compañías podrán manejar más fácilmente la red social, además de monitorear de manera sencilla los influencers que les repercuten directamente, las noticias más relevantes o los cambios en la competencia.

Ponerlo en práctica

Con anterioridad la función estaba a modo de prueba para todos los usuarios en la sección “mientras tu no estabas”, ahora se activa la función en los ajustes de configuración; cuando el usuario entra en Twitter, los Tweets que más interesan aparecen en la parte superior de la cronología, empezando por el más reciente y en orden cronológico inverso. A continuación, el resto de los Tweets se mostrarán inmediatamente debajo, también en orden cronológico inverso, como siempre.

La red social ya ha comparado los resultados: la gente que ha usado esta nueva función tiende a retwittear y twittear más, generando más comentarios en tiempo real y conversación, lo que es un gran beneficio para las empresas.

En las próximas semanas se activará la nueva función para todos los usuarios (lo notificarán en la cronología cuando se implemente). Si el usuario desea desactivarlo, se puede modificar fácilmente en los ajustes de configuración.

Cómo funciona

El algoritmo que emplea Twitter se parece mucho al que ya ha utilizado anteriormente Facebook para dar prioridad a contenido en su timeliene: detecta los usuarios en los que más interesado aparece el dueño de la cuenta, por lo que sí hay un constatado interés en tuits de restaurantes o comida, este contenido recibirá mayor atención en el timeline. Esto se aplica a las cuentas de políticos, deportistas, famosos; en especial con los tuits que hayan obtenido mucha atención de otros usuarios.

Twitter ha estado bajo presión en los últimos meses para conseguir mayor participación por parte de los usuarios, además de mejorar los beneficios de la empresa. Según mantiene Patrick Moorhead, analista de Moor Insights & Strategy, muchos usuarios se sintieron sobrepasados con tantos tuits y dejaron la red; “con este cambio muchos de ellos volverán a Twitter”, señala Moorhead.

-Computerworld