udla

Docente de la UDLA participó en investigación de algoritmo para el reconocimiento de gestos

Jorge Luis Pérez Medina es docente-investigador de la Ingeniería de Software de la UDLA, y junto a Jean Vanderdonckt y Paolo Roselli, investigadores de la Universidad Católica de Louvain-Bélgica, presentaron en octubre pasado un algoritmo para el reconocimiento de gestos que se apoya en el álgebra vectorial.

El nombre de este algoritmo es Faster Than Light (!FTL), un algoritmo de reconocimiento de vectores entre vectores, para reconocer gestos.

¿Cómo funciona FTL?

FTL es un reconocedor de trazo 2D basado en una nueva distancia a los cuales los investigadores han llamado la Distancia de Forma Local (LSD). Esta distancia permite calcular la similitud entre dos gestos a partir de vectores consecutivos presentes en un gesto.

“Para FTL, un gesto se define mediante un vector basado en álgebra geométrica y realiza el reconocimiento al calcular una Distancia de Forma Local Novedosa entre vectores”, mencionó Jorge Luis.

Según Jorge Luis, FTL es insensible a la rotación, escala, orientación y la dinámica de un gesto. Por consecuencia, FTL no necesita de un preprocesamiento previo para realizar el reconocimiento, lográndose de esta manera un mayor rendimiento y tiempo de respuesta. FTL fue producto de varias comparaciones entre algoritmos similares entre los que se destaca $P (Dólar P). Las comparaciones entre FTL y $P arrojaron sorpresivamente una tasa de reconocimiento similar, no obstante, FTL tomó menos tiempo en efectuar su labor.

¿Cómo lo hicieron?

Los investigadores utilizaron un conjunto de datos de referencia denominado NicIcon: Esta base de gestos contiene 14 tipos de gestos. Se recogieron 55.440 muestras de 33 participantes para realizar las comparaciones. FTL fue codificado en Javascript. y fue comparado con los algoritmos $1 (Dólar 1), $P, siendo más efectivo que los otros dos reconocedores de gestos.

Luego de analizar los resultados de los experimentos los investigadores llegaron a las siguientes conclusiones:

  • FTL fue el más rápido en comparación a los otros dos algoritmos.
  • FTL fue sorpresivamente similar a su contraparte $P en relación al conjunto de gestos de referencia NicIcon.
  • Para FTL, la posición, la escala y las invariancias de rotación están garantizadas debido al enfoque basado en vectores.
  • Este algoritmo propone un nuevo enfoque vectorial.

Esta investigación tuvo una duración de alrededor de dos años y fue presentada en la 20ava edición del congreso internacional en interacción multimodal auspiciado por la ACM realizada en octubre del 2018.

Actualmente los investigadores colaboran en optimizar el algoritmo de FTL, así como también efectuar las comparaciones con un nuevo algoritmo recientemente publicado en el congreso MobileHCI realizado en septiembre del 2018.