Científicos de Xerox comparten innovaciones para hacer la computación más intuitiva

0
49
IEEE Computer Vision/Pattern Recognition
IEEE Computer Vision/Pattern Recognition
IEEE Computer Vision/Pattern Recognition
IEEE Computer Vision/Pattern Recognition

Durante la conferencia anual IEEE Computer Vision/Pattern Recognition, la compañía presentó tecnologías que permiten, entre otras cosas, convertir un smartphone en un profesor virtual o que pueden detectar si un conductor está utilizando un dispositivo móvil mientras conduce.

Veinte científicos de Xerox especializados en visión artificial y procesamiento de imágenes se unieron a finales de junio a profesionales de Google, Facebook, Microsoft Research, Amazon y a algunas de las principales instituciones académicas del mundo para compartir sus investigaciones. El objetivo de esta comisión es hacer que las computadoras se comporten cada vez más como si fueran “seres humanos”, imitando la forma en la que el cerebro ve y piensa.

“Xerox tiene un amplio conocimiento de procesos de negocio en muchos sectores y es pionero en investigaciones que permiten a los computadores extraer análisis significativos y procesables de imágenes y vídeos”, mencionó Raja Bala, científico del Centro de Investigación de Xerox en Webster, Nueva York. “Aunque hubo un progreso significativo en los últimos años, todavía hay retos científicos que debemos resolver”, agregó.

Entre las investigaciones que Xerox presentó durante la conferencia de destacan aquellas que permiten detectar si los conductores utilizan dispositivos móviles cuando están conduciendo por la autopista. Los científicos de la firma están trabajando en un sistema de cámaras para las autopistas que emplea tecnología de reconocimiento de patrones y detecta si un conductor está usando el teléfono móvil.

Asimismo, aquellas que permiten convertir los smartphone en asistentes personales de conducción. Los investigadores de Webster también están trabajando en un proyecto de visión artificial que convertiría los teléfonos móviles en asistentes para la conducción. Al utilizar una tecnología de detección de rasgos faciales, el teléfono identificaría la dirección de la mirada del conductor y detectaría si está distraído o está prestando atención a la carretera.

Por otra parte, otro de los objetivos de las investigaciones es hacer imágenes que llamen más la atención. Los investigadores tanto de Xerox en Europa como de la Universidad de Harvard están estudiando qué es lo que más atrae la atención de la gente cuando ven una fotografía por primera vez. De esta forma se podrán desarrollar imágenes que tengan un mayor efecto para predecir dónde mirará la gente cuando visualice una escena, una foto o un juego.

Dar sentido a la información de la visión artificial: las firmas visuales, es otro tema investigado. Imágenes y vídeo suponen el 90% del tráfico actual de Internet. Por eso es necesario contar con una tecnología que pueda analizar automáticamente una imagen y crear una única firma visual que la distinga de otras. El Centro Europeo de Investigación de Xerox (XRCE) ha inventado una metodología patentada y de primera línea que crea esas firmas de forma extremadamente compacta y sólida, superando los actuales métodos de aprendizaje, para afrontar problemas de clasificación de imágenes.

Finalmente, también se está buscando diseñar “preguntas clave” en tareas complejas de crowdsourcing, que se emplea habitualmente como un foro para encontrar individuos que etiqueten imágenes. Pero esto tiene sus retos cuando se requieren expertos para temas específicos, ya que rara vez están disponibles en las plataformas de crowdsourcing. Para ayudar a los intérpretes no especializados, los Centros de Investigación de Xerox en Europa e India han diseñado un sistema que puede hacer un filtro inicial para proponer un número muy limitado de categorías para elegir. El sistema incluye automáticamente preguntas clave, para identificar que los expertos que se seleccionen son fiables y proporcionan una cierta calidad en el trabajo.

El IEEE Computer Vision/Pattern Recognition, que se celebró entre el 23 y 28 de junio en Columbus, Ohio (Estados Unidos), reúne todos los años a importantes científicos de todo el mundo para que trabajen en mejorar la visión artificial, una disciplina que permite que las computadoras mejoren su funcionamiento, aumentando e incluso superando -en algunas ocasiones- las capacidades humanas.

Autor