O Acordo Ortográfico aplicado aos grafos e aos dicionários do Unitex
Palavras-chave:
Acordo Ortográfi co, Ortografia, Linguística ComputacionalResumo
O Acordo Ortográfico de 1990 propõe unificar a ortografica das línguas dos países membros da CPLP (Comunidade dos Países de Língua Portuguesa), ou seja, Brasil, Portugal, Angola, Cabo Verde, São Tomé e Príncipe, Timor-Leste, Guiné Bissau e Moçambique. Devido a isso, uma parte do léxico do português sofreu modifi cações e por isso necessita de uma revisão e adequação às novas regras. O presente trabalho se inscreve nos esforços para a constituição de ferramentas de PLN (Processamento de Linguagem Natural) mais aprimoradas, como o Unitex, um software desenvolvido pela equipe de Linguística e Informática da Université Paris-Est Marne-la-Vallée (PAUMIER, 2002), que permite, entre outras funcionalidades, a busca por expressões regulares em grandes corpora. Esse software se caracteriza por possuir dicionários eletrônicos de grande cobertura incorporados, que quando construídos, precisam ser constantemente revisados.
Downloads
Referências
ALMEIDA, G. M. B.; FERREIRA, J. P.; CORREIA, M.; OLIVEIRA, G. M. Vocabulário Ortográfico Comum (VOC): constituição de uma base lexical para a língua portuguesa. Estudos Linguísticos, São Paulo, n. 42, v. 1, p. 204-215, 2013.
BRASIL. Decreto n. 12.605, de 3 de abril de 2012. Determina o emprego obrigatório da flexão de gênero para nomear profi ssão ou grau em diplomas. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2012/lei/l12605.htm> Acesso em: 20 ago. 2013.
CALCIA, N. P.; CARNEIRO, A. S.; RUFO, A. Revisão dos modelos de fl exão do unitex: passos iniciais. In: SEMINÁRIO DO GEL, 59, 2011, Programação... Bauru (SP): GEL, 2011.
Disponível em: <http://gel.org.br/detalheResumo.php?trabalho=7637> Acesso em: 4 abr. 2013.
DIAS-DA-SILVA, B. C.; MONTILHA, G.; RINO, L. H. M.; SPECIA, L.; NUNES, M. G. V.; OLIVEIRA JR., O. N.; MARTINS, R. T.; PARDO, T. A. S. Introdução ao Processamento das Línguas Naturais e Algumas Aplicações. Série de Relatórios Técnicos do NILC, NILC-TR-07-10. São Carlos-SP, Agosto, 2006. 121p
JESUS, M.A.C.; NUNES, M.G.V. Representação de léxicos através de autômatos finitos. Relatórios Técnicos do ICMC-USP, 110 (NILC-TR-00-5). 2000.
KUCINSKAS, A. B.; VALE, O. A. Revisão dos modelos de fl exão verbal do Unitex-PB. Relatório Técnico, 2014 (no prelo).
MUNIZ, M. C. M. A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto de Unitex-PB. 72f. 2004. Dissertação (Mestrado) – Instituto de Ciências Matemáticas de São Carlos, USP, 2004
PAUMIER, S. Unitex 3.0 User Manual. Université Paris-Est Marne-La-Vallée, 2002. Disponível em: < http://www-igm.univ-mlv.fr/~unitex/UnitexManual3.0.pdf> Acesso em: 4 mar. 2013.
SILBERZTEIN, M. Le dictionnaire électronique des mots composés, langue française. Dictionnaires électroniques du français, n. 87, p. 71-83, 1990.
VALE, O. V. Dictionnaire électronique des conjugaisons des verbes du portugais du Brésil. Rapport Technique du LADL n 27, Paris: Université Paris 7, 1990.