Grupo de Ingeniería Lingüística: unión en beneficio del conocimiento
Por Ameyalli Villafán
México, DF. 2 de septiembre de 2015 (Agencia Informativa Conacyt).- Con el objetivo de crear un diccionario onomasiológico —el cual consiste en buscar un término a partir de la descripción de un concepto— el doctor Gerardo Sierra Martínez comenzó a conjugar sus conocimientos de ingeniería y lingüística para fundar el Grupo de Ingeniería Lingüística (GIL).
La página de internet del GIL menciona que se trata de “un grupo de investigación en el que dos áreas, al parecer alejadas, retoman el sentido de la unidad e interdependencia para formar un solo núcleo. Estas áreas son la lingüística y la ingeniería.”
El GIL se ubica en el sótano del Instituto de Ingeniería (II) de la Universidad Nacional Autónoma de México (UNAM). Es el lugar donde el doctor Sierra Martínez —líder del proyecto— explica, en entrevista para la Agencia Informativa Conacyt, la importancia de este grupo que a sus más de 16 años ha logrado varios reconocimientos en su área.
Agencia Informativa Conacyt (AIC): ¿Qué es la ingeniería lingüística?
Doctor Gerardo Sierra Martínez (GSM): Es investigación aplicada que se relaciona con el lenguaje natural y la computación y está orientada al desarrollo y aplicación de sistemas informáticos que procesan, analizan y sintetizan el lenguaje natural. Es un área interdisciplinaria porque no somos ingenieros ni lingüistas solamente, pues sabemos ambas cosas.
Podemos encontrar ingeniería lingüística en todos lados. Por ejemplo, en transcriptores de voz, sistemas que reconocen errores ortográficos, diccionarios electrónicos, buscadores tradicionales, entre otros.
AIC: ¿Cómo inicia el Grupo de Ingeniería Lingüística?
GSM: Cuando acabé la licenciatura estaba trabajando en el Instituto de Ingeniería en otra área e iba a empezar una licenciatura en Letras y me recomendaron que tomara la maestría en lingüística. Comencé a trabajar el diccionario onomasiológico para ayudar a mi jefe, que era ruso y quería saber las palabras en español.
Sin embargo, este programa lo hice a mano subrayando textos, cortando y pegando e hice el programa informático para tener una base de datos y recuperar los términos. Posteriormente, mis tutores Luis Fernando Lara y Felipe Lara Rosano me sugirieron hacer el doctorado en Lingüística Computacional en UMIST (Inglaterra) para que el proceso de elaboración del diccionario ahora fuera automático.
A mi regreso a México, en el Instituto de Ingeniería me abrieron las puertas para desarrollar el área y formar a ingenieros.
AIC: ¿Qué papel jugó el diccionario onomasiológico para el desarrollo del estudio de la ingeniería lingüística?
GSM: Este proyecto ha sido estratégico, es el eje central del cual han nacido todas aquellas líneas que hemos desarrollado. Este diccionario permite buscar un término a partir de la descripción del concepto.
Para hacer un diccionario de esta naturaleza primero se construye una base de datos de conocimiento léxico. Necesitamos corpus lingüísticos, textos de especialidad, terminología especializada y automática.
Tenemos 16 años trabajando en él, pero ya no nos interesa lograr el fin, nos interesan los medios y desarrollar las distintas líneas de investigación para llegar a esto. El producto final lo hemos dejado en un segundo término porque cada una de estas líneas son muy interesantes y ofrecen muchos retos, y nos hemos dedicado a ellas.
AIC: ¿Qué líneas de investigación abarca el GIL?
GSM: Terminótica, lexicografía computacional, terminología, análisis morfológico, sintáctico y semántico, bancos terminológicos, lingüística de corpus, lexicología y lexicografía, lingüística forense, resumen automático de textos, minería de textos.
AIC: ¿Qué disciplinas pueden tener participación en el desarrollo de proyectos del GIL?
GSM: Ingenierías, lingüística y sus distintas áreas. Ciencias, matemáticas, estadística, computación e informática. Ya para el desarrollo de las interfaces depende del área, hemos tenido filósofos, enfermeros, odontólogos.
En cuanto a la aplicación, la ingeniería lingüística puede usarse en cualquier ciencia, pues esta necesita información y genera conocimiento. Es un grupo interdisciplinario, está abierto a todos.
AIC: ¿Qué plataformas han desarrollado en el grupo?
GSM: Hemos desarrollado varias herramientas, como los corpus lingüísticos que están en línea. Otra sobre atribución de autoría, sistemas de extractores terminológicos, entre otros. El objetivo del GIL es llegar a este tipo de desarrollos porque, de lo contrario, se quedaría en lingüística computacional.
AIC: ¿Cuál considera que es el aporte del Grupo de Ingeniería Lingüística al conocimiento que se genera dentro de la universidad en beneficio del país?
GSM: Es la interdisciplina. Es el hecho de que podemos trabajar en dos áreas aparentemente alejadas y realmente construir cosas uniendo distintas líneas. Yo creo que ese es un gran aporte del cual los alumnos están convencidos y están contentos de que ya no son lo que eran cuando llegaron.
Otro es la formación de recursos humanos y aquí hemos tenido todo el apoyo de Conacyt con los proyectos, pero también con los programas de posgrado y hemos logrado incidir en la docencia y en los planes de estudio.
AIC: ¿Cuáles son los retos actuales del GIL?
GSM: Buscamos reconocimiento de que lo que se hace en México está bien hecho; que lo que se hace es mejor a lo que se trae de otros lados, y queremos convencer que realmente aquí pueden encontrar más de lo que esperaban.
Otro reto es tener vinculación con todas las áreas científicas y todos los grupos para que conozcan lo que nosotros podemos aportar a sus investigaciones, y el área se consolide en México y sea tan reconocida como otras.
AIC: ¿Cuál ha sido el apoyo del Consejo Nacional de Ciencia y Tecnología para el desarrollo de este proyecto?
Actualmente tenemos con Conacyt cuatro proyectos: de ciencia básica, de problemas nacionales, PEI y fondos sectoriales con la Secretaría de Gobernación.
Gerardo Sierra MartínezEs doctor en Lingüística Computacional por el Instituto de Ciencia y Tecnología de la Universidad de Mánchester (UMIST, por sus siglas en inglés).Actualmente es investigador titular B del Instituto de Ingeniería de la UNAM, miembro del Sistema Nacional de Investigadores (SNI) nivel II y evaluador de proyectos Conacyt.Es fundador de la Asociación Mexicana para el Procesamiento del Lenguaje Natural. |
Esta obra cuyo autor es Agencia Informativa Conacyt está bajo una licencia de Reconocimiento 4.0 Internacional de Creative Commons.