Centre for Language and Speech Technology

FoLiA Formato para Anotación Lingüística

“Un formato práctico basado en XML para anotación de dados lingüísticos„

Sobre FoLiA

FoLiA es un formato basado en XML para la representación de recursos annotados língüísticalmente. FoLiA se usa como formato para almacenar y intercambiar recursos lingüísticos, corpora incluso. El objetivo es de ofrecer un solo formato muy rico que puede representar una grande variedad de anotación lingüística, basado en un paradigma común. FoLiA no se obliga al uso de ningún conjunto de etiquetas lingúísticas, idioma, ni teoría lingüística. Este lo deja siempre a los usuários o desarrolladores, y así FoLiA ofrece una máxima flexibilidad.

XML es un formato jerárquico. FoLiA utiliza esa structura jerárquica maximalmente con su modelo de anotación in-line

El objetivo de FoLiA no es de ofrecer solo un formato, sino de crear una infastructura rica y práctica de software y librarías usando el formato.

Características

Las características principales de FoLiA son:

FoLiA combina el uso de anotación in-line y stand-off. anotación inline se usa para anotaciones perteneciendo a palabras sueltas, o a otras construcciónes sueltas. Stand-off anotación se usa para esas anotaciones que abarcan varias palabras.

Esquema del paradigma

FoLiA paradigm

Recursos

La documentación, el esquema de validación y otros recursos para la última versión de FoLiA se puede encontrar aquí debajo. Se puede también consultar el FoLiA github repository para verlo todo.

Hay dos bibliotecas para trabajar con el formato FoLiA en tu proprio software:

Hay también una herramienta de anotación para FoLiA:

Para más suporte puedes siempre mandar un mensaje a lamasoftware@science.ru.nl.

Publicaciones y Utilización

FoLiA se utiliza en varios proyectos en la comunidad de lingüística computacional en los Paísos Bajos y Flandes, también se lo utiliza en algunos proyectos CLARIN. Soporte para FoLiA está integrado en varias aplicaciones, como ucto, Frog, y Valkuil.net.

FoLiA es creado por Maarten van Gompel, con apoyo de Antal van den Bosch, Ko van der Sloot, Martin Reynaert y otras personas en la comunidad académica. En estudios que usan FoLiA, se puede citarnos como:

Hay también algunas presentaciónes:

FoLiA es software libre y todos los recursos son bajo GNU Licencia Pública v3.

badge