O Corpus Tycho Brahe: um corpus sintaticamente anotado do português histórico

Autores/as

  • Charlotte Galves Universidade Estadual de Campinas – UNICAMP/CNPq - Brasil

DOI:

https://doi.org/10.22481/rbba.v8i1.5585

Palabras clave:

Corpus Tycho Brahe. Anotação sintática. História do português. Português brasileiro.

Resumen

Este artigo apresenta a metodologia de trabalho de construção e uso do Corpus Sintaticamente Anotado do Português Histórico Tycho Brahe. Descreve a ferramenta de edição eletrônica eDictor, bem como o sistema de etiquetagem de palavras e de anotação sintática aplicado aos textos. Exemplifica o funcionamento e uso da linguagem de busca Corpus Search, que procura construções em arquivos sintaticamente anotados, a partir de perguntas de pesquisa. Mostra os avanços da pesquisa sobre a história do português europeu permitidos pela grande quantidade de dados anotados disponíveis no Corpus Tycho Brahe para o período dos séculos 16 a 19. Na conclusão, evoca-se a extensão do trabalho ao português brasileiro, a favor da convergência entre a metodologia proposta e o trabalho intensivo de edição de documentos históricos de diversas procedências socio-culturais e geográficas.

Palavras-chave: Corpus Tycho Brahe. Anotação sintática. História do português. Português brasileiro.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Charlotte Galves, Universidade Estadual de Campinas – UNICAMP/CNPq - Brasil

Charlotte Galves. Doutora em Língua Portuguesa pelo Université Paris-Sorbonne, França (1980), Professor titular da Universidade Estadual de Campinas, Bolsista de Produtividade em Pesquisa CNPq – Nível 1, tem experiência na área de Linguística, com ênfase em Descrição e Análise do Português, atuando principalmente nos seguintes temas: descrição comparativa do português europeu, português brasileiro e português clássico no quadro teórico da gramática gerativa; história gramatical da língua portuguesa nas suas diversas vertentes; interface fonologia-sintaxe e seu papel na mudança linguística; elaboração e uso de grandes corpora eletrônicos anotados de língua; além de modelagem probabilística em linguística. Charlotte foi pioneira em investir na formação de grandes corpora anotados em Língua Portuguesa, precursora do primeiro corpus sintaticamente anotado do Português: O Corpus Histórico do Português Tycho Brahe.

Citas

ANTONELLI, A. Sintaxe de posição do verbo e mudança gramatical na história do português europeu. 2011. Tese (Doutorado em Linguística), Instituto de Estudos da Linguagem, Universidade de Campinas, Campinas

BELLETTI, A. Aspects of the low IP area. In: RIZZI, L. (org.) The Structure of CP and IP, Oxford: Oxford University Press, 2004. p. 16-51.

CAVALCANTE, S.; GALVES, C.; PAIXÃO DE SOUSA, M.C. Topics, subjects and grammatical change: from Classical to Modern European Portuguese, In: Subjects in diachrony: Grammatical change and the expression of subjects Conference, University of Regensburg, Alemanha, 4-5/11/2010.http://rhssl1.uni-­‐regensburg.de/SlavKo/conferences/gces/abstracts/Galves_Paix2206o%20de%20Sousa_de%20Oliveira%20Cavalcante.pdf

FARIA, P.; GALVES, C. Criando “bancos de árvores”: o sistema de anotação e o processamento automático. Cadernos de Estudos Linguísticos, Campinas, v. 58, n.2, p. 299-315, 2016.

GALVES, C. Syntax and Style: clitic-placement in Padre Antonio Vieira. Santa Barbara Portuguese Studies, Santa Barbara, vol.6, p. 387-403, 2002.

GALVES, C. Relaxed Verb Second in Portuguese. In: WOLFE, S.; WOODS, R. (orgs.) Rethinking Verb Second, Oxford: Oxford University Press. No prelo.

GALVES, C.; PAIXÃO DE SOUSA, M. C. The position of the verb in the history of Portuguese: Subject position, Clitic placement and Prosody, Language, vol, 93, n.3, p.152-180, 2017.

LUCCHESI, D. A periodização da história sociolinguística do Brasil. DELTA-Documentação em Linguística Teórica e Aplicada, v. 33, n.2, 2017.

MAGRO, C. ParsPort. Revision queries for parsing Portuguese. Centro de Linguística da Universidade de Lisboa, 2017. URL: http://parsport.sourceforge.net

MARTINS, A. M. A história dos clíticos em português. 1994. Tese (Doutorado em Linguística), Faculdade de Letras, Universidade de Lisboa, Lisboa.

MATTOS E SILVA, R.V. Para uma caracterização do período arcaico do português, D.E.L.T.A - Documentação em Linguística Teórica e Aplicada, São Paulo, vol.10 n. especial, p.247-276, 1994.

MEDEIROS, C. A sintaxe da ordem no português medieval. 2018. Tese (Doutorado em Linguística), Instituto de Estudos da Linguagem, Universidade de Campinas, Campinas.

OLIVEIRA, K. Negros e escrita no Brasil do século XIX: sócio-história, edição filológica de documentos e estudo linguístico. 2006. Tese (Doutorado), Universidade Federal da Bahia, Salvador.

PAIXÃO DE SOUSA, M. C. O Corpus Tycho Brahe: contribuições para as humanidades digitais no Brasil, Filologia e Linguística Portuguesa, v. 16 n. esp, p. 53-93, 2014.

PAIXÃO DE SOUSA, M.C.; KEPLER, F.; FARIA, P.E-Dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: Shepherd, T.; Berber Sardinha, T.; Veirano Pinto, M. (Orgs.). Caminhos da linguística de corpus,Campinas: Mercado de Letras, 2010.

Publicado

2019-07-31

Cómo citar

Galves, C. (2019). O Corpus Tycho Brahe: um corpus sintaticamente anotado do português histórico. Revista Binacional Brasil-Argentina: Diálogo Entre Las Ciencias, 8(1), 181-204. https://doi.org/10.22481/rbba.v8i1.5585