Estudiantes de ingeniería del Tec campus Cuernavaca publicaron un artículo científico en la revista "Research in Computing Science" del Instituto Politécnico Nacional.
El artículo es producto de los resultados de su investigación sobre el desarrollo de algoritmos de inteligencia artificial para la creación de un eventual sistema de traducción de la lengua de señas americana (ASL).
Emiliano Vivas, estudiante de 6to semestre de la Ingeniería en Tecnologías Computacionales y Regina Alexia Blas, ahora egresada de la Ingeniería en Mecatrónica, colaboraron en la investigación con el profesor de la Escuela de Ingeniería y Ciencias, Atoany Nazareth Fierro Radilla.
El estudio se titula: "Aprendizaje de similitud semántica para el reconocimiento del alfabeto de lengua de señas" y propone una arquitectura de red neuronal siamesa para reconocer mejor el alfabeto del ASL.
Tiene como objetivo desarrollar un sistema de reconocimiento para el alfabeto ASL, haciendo que la computadora aprenda a partir de las similitudes de cada alfabeto de ASL, buscando mejorar la comunicación y las relaciones interpersonales con las personas que viven con discapacidad auditiva.
La base de la investigación
La lengua de señas es el principal método de comunicación para las personas sordas en Estados Unidos, sin embargo existen problemas de comunicación con las personas oyentes ya que no lo comprenden.
Es por ello que, la investigación se centra en que si se pudiera traducir automáticamente en texto o voz la lengua de señas, sería más fácil para las personas sordas sentirse incluidas y mejorar la comunicación.
“Este proyecto da apertura en un futuro a la inclusión”.- Emiliano Vivas.
“Este proyecto da apertura a que en un futuro haya más aplicaciones que involucren nuevos sistemas de accesibilidad para todas las personas y dar un paso más a la inclusión”, contó Emiliano Vivas.
La arquitectura de red neuronal
El proyecto enseña a la computadora a reconocer similitudes entre imágenes de diferentes alfabetos de la lengua de señas.
Una red neuronal siamesa consta de dos redes neuronales idénticas. Cada red neuronal recibe una imagen y genera un código, las dos salidas se comparan para determinar si las entradas son similares o no.
Si las imágenes son de la misma clase, las dos redes neuronales deben generar códigos similares.
"Es un programa, también se le conoce como modelo, que puede reconocer el alfabeto de lengua de señas. Este programa teóricamente se lo puedes poner a cualquier computadora con cámara y puede detectar la letra y traducir el alfabeto", explicó Atoany Fierro.
Proceso de publicación del artículo
En enero de 2023 el Congreso Mexicano de Inteligencia Artificial (COMIA) lanzó una convocatoria para la presentación de artículos, donde se estableció que los trabajos aceptados serían publicados en la revista del IPN.
El equipo llevó a cabo experimentos para validar la hipótesis de que existe un algoritmo capaz de poder representar a cada imagen de cada letra con un código. Una vez obtenidos resultados positivos, redactaron el artículo conforme a los requisitos del congreso.
Este documento fue enviado y evaluado por expertos en el tema que determinaron que la investigación aporta al conocimiento científico en el campo del reconocimiento de la lengua de señas.
El 1 de mayo de 2023, Regina Blas presentó el artículo de forma virtual en el COMIA. El artículo fue uno de los elegidos para su publicación en la revista "Research in Computing Science".
“El proyecto ha tenido un impacto significativo en mi vida y ha demostrado su potencial de tener un impacto positivo en el futuro, beneficiando a muchas personas”, comentó Regina Blas.
SEGURO QUERRÁS LEER: