Corpus-based language comparison: From morphology to dependencies and beyond
DOI:
https://doi.org/10.21165/el.v54i1.4032Resumo
We provide an overview of the Universal Dependencies multilingual corpus collection, its current status and numerous extensions, such as the UNER annotation of named entities or the CorefUD annotation of coreference and anaphora. We discuss the utility of the data in several areas of Digital Humanities, with a particular focus on comparative linguistics and typology.
Keywords: annotated corpus; treebank; morphology; syntax; typology.
Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Estudos Linguísticos (São Paulo. 1978)

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
A aprovação dos artigos para publicação implica na cessão imediata e sem ônus dos direitos de publicação nesta revista. O(s) autor(es) autoriza(m) o Grupo de Estudos Lingüísticos do Estado de São Paulo (GEL) a reproduzi-lo e publicá-lo na revista Estudos Linguísticos (São Paulo. 1978), entendendo-se os termos "reprodução" e "publicação" conforme definição respectivamente dos incisos VI e I do artigo 5° da Lei 9610/98. O(s) autor(es) continuará(rão) a ter os direitos autorais para publicações posteriores. O artigo poderá ser acessado pela rede mundial de computadores (www.gel.org.br/estudoslinguisticos), sendo permitidas, a título gratuito, a consulta e a reprodução de exemplar do artigo para uso próprio de quem o consulta. Essa autorização de publicação não tem limitação de tempo, ficando o GEL responsável pela manutenção da identificação do autor do artigo. Casos de plágio ou quaisquer ilegalidades nos textos apresentados são de inteira responsabilidade de seus autores.
