Starting Time: 2002
Status: Concluded in 2004
Goals
To investigate, implement and evaluate some algorithms of
word alignment of bilingual texts - Portuguese and English - including
empirical and linguistic based methods.
Project's Features
Use of a corpus of authentic abstracts of
Brazilian Portuguese and English scientific texts in the computing domain, CorpusPE.
Results
- A word aligner for Brazilian Portuguese and English bitexts.
- Some support linguistic resources, such as glossary of technical terms in computer.
- A corpus of word aligned Portuguese and English texts for supporting research
in machine translation and other resources.
Team (2002-2004)
Aline Maria da Paz Silva (MSc Student)
Maria das Graças Volpe Nunes (supervisor)
Finantial Support
CAPES: 2002-2004
Contact
Maria das Graças Volpe Nunes: email gracan@icmc.usp.br
Related Project
Potuguese-English Sentence Alignment (PESA)
Tools
Sentence and Word Aligners
Related Publications
2005
Caseli, H. M.; Nunes, M. G. V. Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática. Estudos Lingüísticos, v. 34, São Paulo, p.356-361, 2005. ISSN 1413 0939. PDF
2004
Caseli, H.M.; Silva, A.M.P.; Nunes, M.G.V. Evaluation of Methods for Sentence and Lexical Alignment of Brazilian Portuguese and English Parallel Texts. In A.L.C. Bazzan and S. Labidi (eds.) Proceedings of the Seventeenth Brazilian Symposium on Artificial Intelligence (SBIA 2004), LNAI 3171, p.184-193. São Luis, Maranhão, Brazil, September 2004. PDF
Silva, A.M.P.; Nunes, M.G.V. Using Multiword Lists for Lexically Aligning Brazilian Portuguese and English Texts.Série de Relatórios do NILC. NILC-TR-04-02, March 2004. 8 p. PDF
Caseli, H.M; Nunes, M.G.V. Corpus paralelo e corpus paralelo alinhado: propriedades e aplicações. Estudos Lingüísticos, v. 33, Taubaté, p.581-586, 2004. ISSN 1413 0939. PDF
2003
Silva, A.M.P.; Nunes, M.G.V. Extração Automática de Multipalavras. Série de Relatórios do NILC. NILC-TR-03-11, Novembro 2003. 23 p. PDF
2002
Caseli, H.M.; Feltrim, V.D.; Nunes, M.G.V. TagAlign: Uma ferramenta de pré-processamento de textos. Série de Relatórios do NILC. NILC-TR-02-09, Junho 2002. ZIP
Caseli, H.M.; Nunes, M.G.V. A construção dos recursos lingüísticos do projeto PESA. Série de Relatórios do NILC. NILC-TR-02-07, Junho 2002. ZIP
2001
Martins, M.S; Caseli, H.M.; Nunes, M.G.V. A construção de um corpus de textos paralelos inglês-português. Série de Relatórios do NILC. NILC-TR-01-05, Setembro 2001. ZIP
