Microsoft acelera el proceso de adopción de Machine Reading

Microsoft se enfoca en el soporte para crear máquinas que puedan tener conversaciones mediante la liberación gratuita de una nueva serie de datos.

Los datos, llamados Microsoft Machine Reading Comprehension (MS MARCO), se junta un paquete de más de 100,000 consultas en inglés junto con las respuestas correspondientes. Éste, se supone que debe ayudar a la construcción de sistemas de inteligencia artificial que puedan entender el lenguaje escrito humano.

La tecnológica de Redmond está abriendo su conjunto de datos “con la esperanza de poder trabajar con otras máquinas en la comprensión de la lectura”, ha explicado Rangan Majumder, director de programa del Microsoft Partner Group, en un blog publicado el viernes.

Las consultas en MS MARCO se basan en preguntas anónimas que se enviaron a la herramienta de búsqueda Bing y al asistente virtual Cortana. Y, las respuestas se basan en la información encontrada en línea, escrita por humanos y verificadas con exactitud. Éstas se crean para el uso con modelos de deep learning.

Por el momento, esta base de datos es gratis para todos aquellos que planean su uso sin ánimo de lucro. Así, Microsoft lo comparte de la misma manera en que también abre otros conjuntos de datos para entrenar programas de inteligencia artificial. Uno de ellos es ImageNet, una base de datos de imágenes etiquetadas que se utiliza para entrenar algoritmos de reconocimiento. La compañía ya utilizó esa base de datos en el desarrollo de la tecnología de reconocimiento de imágenes que ahora sustenta productos como el Microsoft Computer Vision API.

Las personas que quieran saber más acerca de MS MARCO pueden descargar un documento de investigación escrito por el equipo de Microsoft que lo construyó. A su vez, el equipo también está preparando un reto que evaluará modelos entrenados usando los datos MS MARCO.

Blair Hanley Frank