The Orthographic Agreement applied to Unitex graphs and dictionaries
Keywords:
Orthographic Agreement, Orthography, Computational LinguisticsAbstract
The Orthographic Agreement of 1990 proposes unifying the orthography of Portuguese, the language of the CPLP members (Community of Portuguese Language Countrie), namely, Brazil, Portugal, Angola, Cape Verde, São Tomé and Príncipe, East Timor, Guinea-Bissau, and Mozambique. Since part of the Portuguese lexicon was modifi ed, its dictionaries need revising and adapting to the new rules. Our work contributes to the development of NLP (Natural Language Processing) enhanced tools, like Unitex. Unitex is a software developed by the Linguistics and Computing team of the Université Paris-Est Marne-la-Vallée (PAUMIER, 2002), which allows the research of regular expressions within large corpora, besides other functionalities. This software is characterized by its embedded large coverage electronic dictionaries that need constant revision for maintenance of such lexicons.
Downloads
References
ALMEIDA, G. M. B.; FERREIRA, J. P.; CORREIA, M.; OLIVEIRA, G. M. Vocabulário Ortográfico Comum (VOC): constituição de uma base lexical para a língua portuguesa. Estudos Linguísticos, São Paulo, n. 42, v. 1, p. 204-215, 2013.
BRASIL. Decreto n. 12.605, de 3 de abril de 2012. Determina o emprego obrigatório da flexão de gênero para nomear profi ssão ou grau em diplomas. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2012/lei/l12605.htm> Acesso em: 20 ago. 2013.
CALCIA, N. P.; CARNEIRO, A. S.; RUFO, A. Revisão dos modelos de fl exão do unitex: passos iniciais. In: SEMINÁRIO DO GEL, 59, 2011, Programação... Bauru (SP): GEL, 2011.
Disponível em: <http://gel.org.br/detalheResumo.php?trabalho=7637> Acesso em: 4 abr. 2013.
DIAS-DA-SILVA, B. C.; MONTILHA, G.; RINO, L. H. M.; SPECIA, L.; NUNES, M. G. V.; OLIVEIRA JR., O. N.; MARTINS, R. T.; PARDO, T. A. S. Introdução ao Processamento das Línguas Naturais e Algumas Aplicações. Série de Relatórios Técnicos do NILC, NILC-TR-07-10. São Carlos-SP, Agosto, 2006. 121p
JESUS, M.A.C.; NUNES, M.G.V. Representação de léxicos através de autômatos finitos. Relatórios Técnicos do ICMC-USP, 110 (NILC-TR-00-5). 2000.
KUCINSKAS, A. B.; VALE, O. A. Revisão dos modelos de fl exão verbal do Unitex-PB. Relatório Técnico, 2014 (no prelo).
MUNIZ, M. C. M. A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto de Unitex-PB. 72f. 2004. Dissertação (Mestrado) – Instituto de Ciências Matemáticas de São Carlos, USP, 2004
PAUMIER, S. Unitex 3.0 User Manual. Université Paris-Est Marne-La-Vallée, 2002. Disponível em: < http://www-igm.univ-mlv.fr/~unitex/UnitexManual3.0.pdf> Acesso em: 4 mar. 2013.
SILBERZTEIN, M. Le dictionnaire électronique des mots composés, langue française. Dictionnaires électroniques du français, n. 87, p. 71-83, 1990.
VALE, O. V. Dictionnaire électronique des conjugaisons des verbes du portugais du Brésil. Rapport Technique du LADL n 27, Paris: Université Paris 7, 1990.