Transcrição automática de entrevistas e anotação Universal Dependencies no Corpus Roda Viva
DOI:
https://doi.org/10.21165/el.v54i1.3851Abstract
This article presents the research about the automatic transcription of four interviews extracted from the Roda Viva Corpus, formed by 713 interviews from the Roda Viva Program, on TV Cultura. The original interviews were transcribed by journalists, thus acquiring the status of written text, and also presents interventions, such as encyclopedic information about facts and people mentioned. In order to work with oral text, this research carried out a pilot work of automatic transcription of four of these interviews, using the Whisper tool. Subsequently, the interviews were automatically annotated with the formalization of Universal Dependencies and manually reviewed by the Arborator Grew ElizIA tool. Through this work, it was possible to note the syntactic differences present in the original corpus and in the transcribed interviews.
Downloads
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Estudos Linguísticos (São Paulo. 1978)

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
A aprovação dos artigos para publicação implica na cessão imediata e sem ônus dos direitos de publicação nesta revista. O(s) autor(es) autoriza(m) o Grupo de Estudos Lingüísticos do Estado de São Paulo (GEL) a reproduzi-lo e publicá-lo na revista Estudos Linguísticos (São Paulo. 1978), entendendo-se os termos "reprodução" e "publicação" conforme definição respectivamente dos incisos VI e I do artigo 5° da Lei 9610/98. O(s) autor(es) continuará(rão) a ter os direitos autorais para publicações posteriores. O artigo poderá ser acessado pela rede mundial de computadores (www.gel.org.br/estudoslinguisticos), sendo permitidas, a título gratuito, a consulta e a reprodução de exemplar do artigo para uso próprio de quem o consulta. Essa autorização de publicação não tem limitação de tempo, ficando o GEL responsável pela manutenção da identificação do autor do artigo. Casos de plágio ou quaisquer ilegalidades nos textos apresentados são de inteira responsabilidade de seus autores.
