El Corpus Tycho Brahe: un Corpus sintácticamente anotado del português histórico
DOI:
https://doi.org/10.22481/rbba.v8i1.5585Palavras-chave:
Corpus Tycho Brahe. Anotação sintática. História do português. Português brasileiro.Resumo
Resumen
Este artículo presenta la metodología de trabajo de construcción y uso del Corpus Sintácticamente Anotado del Português Histórico Tycho Brahe. Describe la herramienta de edición electrónica eDictor, así como el sistema de etiquetado de palabras y anotación sintáctica aplicada a los textos. Ejemplifica el funcionamiento y el uso del lenguaje de búsqueda Corpus Search, que busca construcciones en archivos sintácticamente anotados, a partir de preguntas de investigación. Muestra los avances de la investigación sobre la historia del portugués europeo permitidos por la gran cantidad de datos anotados disponibles en el Corpus Tycho Brahe para el período comprendido entre los siglos XVI y XIX. En la conclusión, se evoca la extensión del trabajo al portugués brasileño, a favor de la convergencia entre la metodología propuesta y el intenso trabajo de edición de documentos históricos de diversas procedencias socioculturales y geográficas.
Palabras clave: Corpus Tycho Brahe. Anotación sintáctica. Historia del portugués. Portugués brasileño.
Downloads
Referências
ANTONELLI, A. Sintaxe de posição do verbo e mudança gramatical na história do português europeu. 2011. Tese (Doutorado em Linguística), Instituto de Estudos da Linguagem, Universidade de Campinas, Campinas
BELLETTI, A. Aspects of the low IP area. In: RIZZI, L. (org.) The Structure of CP and IP, Oxford: Oxford University Press, 2004. p. 16-51.
CAVALCANTE, S.; GALVES, C.; PAIXÃO DE SOUSA, M.C. Topics, subjects and grammatical change: from Classical to Modern European Portuguese, In: Subjects in diachrony: Grammatical change and the expression of subjects Conference, University of Regensburg, Alemanha, 4-5/11/2010.http://rhssl1.uni-‐regensburg.de/SlavKo/conferences/gces/abstracts/Galves_Paix2206o%20de%20Sousa_de%20Oliveira%20Cavalcante.pdf
FARIA, P.; GALVES, C. Criando “bancos de árvores”: o sistema de anotação e o processamento automático. Cadernos de Estudos Linguísticos, Campinas, v. 58, n.2, p. 299-315, 2016.
GALVES, C. Syntax and Style: clitic-placement in Padre Antonio Vieira. Santa Barbara Portuguese Studies, Santa Barbara, vol.6, p. 387-403, 2002.
GALVES, C. Relaxed Verb Second in Portuguese. In: WOLFE, S.; WOODS, R. (orgs.) Rethinking Verb Second, Oxford: Oxford University Press. No prelo.
GALVES, C.; PAIXÃO DE SOUSA, M. C. The position of the verb in the history of Portuguese: Subject position, Clitic placement and Prosody, Language, vol, 93, n.3, p.152-180, 2017.
LUCCHESI, D. A periodização da história sociolinguística do Brasil. DELTA-Documentação em Linguística Teórica e Aplicada, v. 33, n.2, 2017.
MAGRO, C. ParsPort. Revision queries for parsing Portuguese. Centro de Linguística da Universidade de Lisboa, 2017. URL: http://parsport.sourceforge.net
MARTINS, A. M. A história dos clíticos em português. 1994. Tese (Doutorado em Linguística), Faculdade de Letras, Universidade de Lisboa, Lisboa.
MATTOS E SILVA, R.V. Para uma caracterização do período arcaico do português, D.E.L.T.A - Documentação em Linguística Teórica e Aplicada, São Paulo, vol.10 n. especial, p.247-276, 1994.
MEDEIROS, C. A sintaxe da ordem no português medieval. 2018. Tese (Doutorado em Linguística), Instituto de Estudos da Linguagem, Universidade de Campinas, Campinas.
OLIVEIRA, K. Negros e escrita no Brasil do século XIX: sócio-história, edição filológica de documentos e estudo linguístico. 2006. Tese (Doutorado), Universidade Federal da Bahia, Salvador.
PAIXÃO DE SOUSA, M. C. O Corpus Tycho Brahe: contribuições para as humanidades digitais no Brasil, Filologia e Linguística Portuguesa, v. 16 n. esp, p. 53-93, 2014.
PAIXÃO DE SOUSA, M.C.; KEPLER, F.; FARIA, P.E-Dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: Shepherd, T.; Berber Sardinha, T.; Veirano Pinto, M. (Orgs.). Caminhos da linguística de corpus,Campinas: Mercado de Letras, 2010.