El grupo de investigación en Análisis del Discurso Académico y Profesional (EDAP) organiza el 7 de mayo la Jornada de lingüística de corpus: enfoques avanzados para el análisis del discurso (tributario) con Corpus Sense en la Universitat de Barcelona. La jornada se centró en explorar las posibilidades metodológicas de esta aplicación para la investigación empírica basada en corpus.

La actividad, que reunió a 27 participantes, contó con la participación de Antonio Moreno-Ortiz y Giovanni Garofalo, ambos expertos en linguística de corpus. Estos especialistas abordaron las estrategias de gestión, organización y explotación de corpus, con especial atención a la creación de subcorpus a partir de criterios lingüísticos, textuales y contextuales. Asimismo, pusieron de relieve la importancia de una adecuada preparación de los datos como base de cualquier investigación empírica sólida.
Uno de los bloques centrales de la jornada, impartida por Moreno-Ortiz, se centró en las funcionalidades de búsqueda avanzada y análisis cuantitativo que ofrece Corpus Sense —aplicación de la que es el creador—. Este profesor e investigador de la Universidad de Málaga presentó las posibilidades de la herramientas, como la búsqueda léxica y lematizada, la identificación de patrones lingüísticos mediante etiquetas, la búsqueda semántica y la obtención de colocaciones y combinaciones de palabras. También, dedicó un espacio específico a las funcionalidades avanzadas basadas en procesamiento del lenguaje natural e inteligencia artificial integradas en Corpus Sense; entre ellas, ejemplificó la extracción de palabras clave, el reconocimiento de entidades, el modelado de temas y la generación de insights asistidos por modelos de lenguaje.
El catedrático de la Universidad de Bérgamo, Giovanni Garofalo, centró su intervención en la aplicación práctica de estas herramientas al corpus COMTCLAR, que recoge materiales de comunicación tributaria desarrollados en el marco de los proyectos del grupo EDAP. A través de ejemplos concretos, reveló las posibilidades analíticas de la inteligencia artificial generativa y algunas de las limitaciones relacionadas con el tratamiento de datos.
La jornada combinó la exposición teórica con el análisis de casos, y favoreció una aproximación progresiva desde los fundamentos del análisis de corpus hasta el uso de herramientas avanzadas.
Con esta iniciativa, el grupo EDAP continúa consolidando su compromiso con la innovación metodológica en el análisis del discurso, apostando por la interdisciplinariedad y la integración crítica de herramientas digitales y enfoques computacionales en la investigación lingüística contemporánea.