O Corpus Tycho Brahe: um corpus sintaticamente anotado do português histórico

  • Charlotte Galves Universidade Estadual de Campinas – UNICAMP/CNPq - Brasil

Resumo

Este artigo apresenta a metodologia de trabalho de construção e uso do Corpus Sintaticamente Anotado do Português Histórico Tycho Brahe. Descreve a ferramenta de edição eletrônica eDictor, bem como o sistema de etiquetagem de palavras e de anotação sintática aplicado aos textos. Exemplifica o funcionamento e uso da linguagem de busca Corpus Search, que procura construções em arquivos sintaticamente anotados, a partir de perguntas de pesquisa. Mostra os avanços da pesquisa sobre a história do português europeu permitidos pela grande quantidade de dados anotados disponíveis no Corpus Tycho Brahe para o período dos séculos 16 a 19. Na conclusão, evoca-se a extensão do trabalho ao português brasileiro, a favor da convergência entre a metodologia proposta e o trabalho intensivo de edição de documentos históricos de diversas procedências socio-culturais e geográficas.


Palavras-chave: Corpus Tycho Brahe. Anotação sintática. História do português. Português brasileiro.


 


Resumen


Este artículo presenta la metodología de trabajo de construcción y uso del Corpus Sintácticamente Anotado del Português Histórico Tycho Brahe. Describe la herramienta de edición electrónica eDictor, así como el sistema de etiquetado de palabras y anotación sintáctica aplicada a los textos. Ejemplifica el funcionamiento y el uso del lenguaje de búsqueda Corpus Search, que busca construcciones en archivos sintácticamente anotados, a partir de preguntas de investigación. Muestra los avances de la investigación sobre la historia del portugués europeo permitidos por la gran cantidad de datos anotados disponibles en el Corpus Tycho Brahe para el período comprendido entre los siglos XVI y XIX. En la conclusión, se evoca la extensión del trabajo al portugués brasileño, a favor de la convergencia entre la metodología propuesta y el intenso trabajo de edición de documentos históricos de diversas procedencias socioculturales y geográficas.


Palabras clave: Corpus Tycho Brahe. Anotación sintáctica. Historia del portugués. Portugués brasileño.

DOWNLOADS

Não há dados estatísticos.

Biografia do Autor

##submission.authorWithAffiliation##

Charlotte Galves. Doutora em Língua Portuguesa pelo Université Paris-Sorbonne, França (1980), Professor titular da Universidade Estadual de Campinas, Bolsista de Produtividade em Pesquisa CNPq – Nível 1, tem experiência na área de Linguística, com ênfase em Descrição e Análise do Português, atuando principalmente nos seguintes temas: descrição comparativa do português europeu, português brasileiro e português clássico no quadro teórico da gramática gerativa; história gramatical da língua portuguesa nas suas diversas vertentes; interface fonologia-sintaxe e seu papel na mudança linguística; elaboração e uso de grandes corpora eletrônicos anotados de língua; além de modelagem probabilística em linguística. Charlotte foi pioneira em investir na formação de grandes corpora anotados em Língua Portuguesa, precursora do primeiro corpus sintaticamente anotado do Português: O Corpus Histórico do Português Tycho Brahe.

Publicado
2019-07-31
Como Citar
GALVES, Charlotte. O Corpus Tycho Brahe: um corpus sintaticamente anotado do português histórico. Revista Binacional Brasil-Argentina: Diálogo entre as ciências, [S.l.], v. 8, n. 1, p. 181-204, jul. 2019. ISSN 2316-1205. Disponível em: <http://periodicos2.uesb.br/index.php/rbba/article/view/5585>. Acesso em: 15 nov. 2019. doi: https://doi.org/10.22481/rbba.v8i1.5585.
Seção
Dossiê Temático