El pasado fin de semana en Madrid, la Casa del Lector fue el mejor escenario posible para celebrar Lenguando: el primer encuentro nacional sobre lengua y tecnología. La innovadora iniciativa, materializada con éxito por nuestros colegas de Molino de Ideas, Cálamo &Cran y Xosé Castro, fue impulsada, entre otros patrocinadores, por Stilus de Daedalus.
El espíritu de las jornadas fue el de reunir en un mismo espacio a traductores, correctores, filólogos y otros profesionales de la comunicación y el lenguaje para hacer hincapié, entre otros temas, en el contexto que plantea la revolución tecnológica en el sector.
Las ponencias sobre los avances en tecnología del lenguaje y los talleres simultáneos sobre su aplicación práctica fueron los más esperados. En concreto, el taller impartido en el auditorio principal por quien escribe (Concepción Polo) en representación del equipo Stilus, fue uno de los más solicitados por los asistentes.
Lingüística de Corpus aplicada a la corrección
Con la intención de presentar contenidos novedosos y sobre todo prácticos, en el taller reflexionamos sobre las posibles aplicaciones de la Lingüística de Corpus (LC) en el ámbito concreto de la corrección automática y profesional. El primero de los puntos que despertó interés fue la revelación para muchos de las nuevas funcionalidades de búsqueda lematizada y morfológica que los corpus académicos del Nuevo Diccionario Histórico (CDH) y el Corpus del Español del Siglo XXI (CORPES XXI) por fin ofrecen. Otro de los contenidos clave fue la exposición de una breve comparativa entre las capacidades de estos nuevos corpus RAE y las del menos conocido, aunque veterano y brillante, Corpus del Español de Mark Davies.
La última parte del taller se destinó a explicar cómo un corrector automático inteligente es capaz de atender cuestiones contextuales validadas sobre corpus que quedan fuera del alcance del usuario autónomo. Era el momento de «abrirle las tripas a Stilus» y entender el pseudocódigo en C++ en que se basan sus reglas lingüísticas. La sorpresa entre los asistentes sin experiencia en Tratamiento de Lenguaje Natural radicó tanto en el potencial de esta tecnología como en el mero hecho de verse capaces de interpretar unas reglas en C que manejaban elementos formales, morfológicos, sintagmáticos e incluso semánticos.
Presentación de Stilus Macro
Efectivamente, la existencia de corpus etiquetados ha permitido a los fenómenos sintácticos y léxicos de una lengua abrirse a la investigación empírica en una escala inimaginable, y su aplicación es en alto grado viable desde el punto de vista computacional. Pero la observación sobre corpus demuestra, a su vez, que existen miles de secuencias erróneas acotables sin necesidad de apoyo morfosintáctico y esta es precisamente la finalidad de Stilus Macro: un complemento, aún en desarrollo, que presentamos para cerrar el taller y que es capaz de ejecutar, activando el control de cambios y con gran velocidad, más de 230 000 patrones independientes del contexto para corrección ortotipográfica y de estilo sobre Word; una tarea en su esencia sencilla, pero inviable desde el punto de vista humano.
Vídeo-demo
Para más información, accede a la presentación completa.