ESLORA - Corpus para el estudio de la lengua oral

El corpus para el estudio del español oral ESLORA contiene 60 horas de entrevistas semidirigidas y 20 horas de conversaciones de hablantes de Galicia grabadas entre los años 2007 y 2015. Los registros sonoros se transcribieron ortográficamente con alineación texto-voz para facilitar el acceso inmediato al audio desde la transcripción. En el proceso de enriquecimiento del corpus se han desarrollado recursos para la lematización y el etiquetado morfosintáctico de los textos que permiten realizar diversos tipos de búsquedas.

A día de hoy es posible obtener datos de una parte de los materiales mediante un sistema de consultas simples y combinadas que incluye variables sociales (grupo de edad, nivel de estudios y sexo) junto a categorías lingüísticas (lemas, clases de palabras y categorías morfológicas). La aplicación de consulta tiene además la ventaja de que permite recuperar los fragmentos sonoros correspondientes a las consultas realizadas. En la Guía de consulta se describen los detalles de las múltiples posibilidades que ofrece el sistema de búsqueda y en la sección Descargas puede obtenerse directamente el corpus en formato textual o bien solicitarse en formato etiquetado, junto con los audios y la información sociolingüística de los hablantes.

El corpus ESLORA ha sido elaborado por el Grupo de Gramática del Español de la Universidad de Santiago de Compostela a través de los proyectos ESLORA, ESLORA2 y ESLORA+ financiados por el Ministerio de Economía y Competitividad (FFI2010-17417, FFI2014-52287-P y PFFI2017-86379-P).

Deja un comentario

Debes indicar tu nombre en el mensaje para que se publique tu comentario.

Plain text

  • Allowed HTML tags: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd> <div> <br> <p><img> <u>
  • Lines and paragraphs break automatically.
  • Web page addresses and e-mail addresses turn into links automatically.