Corpus eletrônico de Documentos Históricos do Sertão
etapa 1 (1750-2000)
DOI:
https://doi.org/10.22481/rbba.v8i1.5588Palavras-chave:
Português Brasileiro. Banco de Dados. Edições Eletrônicas.Resumo
Resumo
Este trabalho apresenta o Banco CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão, na sua primeira etapa, que abrange o período que vai de 1750 a 2000, caracterizado pelo multilinguismo localizado. O CE-DOHS é a versão eletrônica – com textos editados em linguagem xml – do banco DOHS, do projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro, com textos em edição semidiplomática, além de amostras orais. A edição eletrônica é feita, no âmbito do CE-DOHS, usando o eDictor, desenvolvido por Paixão de Sousa, Kepler e Faria (2010); trata-se de um editor de textos especialmente voltado ao trabalho filológico e à análise linguística automática. Finalizada a primeira etapa, no ano de 2018, o banco CE-DOHS tem mais de um milhão de palavras, colaborando, de maneira muito significativa, com o Projeto Nacional para a História do Português Brasileiro (PHPB), do qual é parceiro.
Palavras-chave: Português Brasileiro. Banco de Dados. Edições Eletrônicas.
Resumen
Este documento presenta el Banco EC-DOHS - Corpus de Documentación Electrónica de Sertão, en su primera etapa, que abarca el período de 1750 a 2000, caracterizado por el multilingüismo localizado. CE-DOHS es la versión electrónica, con textos editados en lenguaje XML, del banco DOHS, del proyecto Vozes do Sertão en Datos: historia, pueblos y formación del portugués brasileño, con textos en edición semidiplomática y muestras orales. La edición electrónica se realiza, en el marco de CE-DOHS, utilizando eDictor, desarrollado por Paixão de Sousa, Kepler y Faria (2010); Es un editor de texto enfocado especialmente en el trabajo filológico y el análisis lingüístico automático. Después de la primera fase, en 2018, el banco CE-DOHS tiene más de un millón de palabras, colaborando de manera muy significativa con el Proyecto Nacional de Historia del Portugués Brasileño (PHPB), del cual es socio.
Palabras clave: Portugués brasileño. Banco de datos. Ediciones electrónicas.
Downloads
Referências
BACELAR DO NASCIMENTO, M. F. O lugar do corpus na investigação linguística. Disponível em:<http://www.clul.ul.pt/equipa/berlim-2000-nascimento.pdf.>. Acesso em: 20abr.2004.
BARBOSA, A. G. A plataforma de corpora do PHPB: uma apresentação ad infinitum. In: CARNEIRO, Z. de O. N. (Org.). Cartas brasileiras (1809-2000): coletânea de fontes para o estudo do português. Feira de Santana: UEFS,2011.
BRITO, G. S. Do texto ao documento digital: transposição fotográfica de documentos manuscritos históricos para formação de corpora linguísticos eletrônicos. Dissertação (Mestrado em Linguística) – Programa de Pós Graduação Linguística da Universidade Estadual do Sudoeste da Bahia, Vitória da Conquista, 2015.
CARNEIRO, Z. O. N. Cartas Brasileiras: um estudo linguístico-filológico. Tese (Doutorado em Estudos Linguísticos) – Programa de Pós-Graduação em Linguística, Universidade Estadual de Campinas, Campinas, 2005.
CARNEIRO, Z. de O. N., OLIVEIRAM. F. de. Publica-se em Feira de Santana: das cartas de leitores e redatores e dos anúncios em O Progresso e Na Folha do Norte (1901-2006). Feira de Santana: UEFS,2012.
CE-DOHS: Corpus eletrônico de documentos históricos do sertão. Disponível em: [www.uefs.br/cedohs]. 2011.
CHOMSKY, N. Knowledge of Language: its nature origin, and use. New York: Praeger, 1986.
CORPUS Histórico do Português Tycho Brahe. Disponível em: http://www.tycho.iel.unicamp.br/~tycho/corpus/
CRANE, G. (et al.). e Philology: when the boock stalk to their readers. Blackwell Campanion to Digital Literary Studies. Oxford: Blackwell,2008.
GONÇALVES, M. F.; BANZA, A. P. Fontes de metalinguísticas para a história do português clássico. In: GONÇALVES, M. F.; BANZA, A. P. Património Textual e Humanidades Digitais: da antiga à nova filologia. Évora: CIDEHUS, 2013. p.73-112.
LABOV, W. Principles of Linguistic Change: internal factors. Oxford: Blackwell, 1994.
LACERDA, M. F. O; CARNEIRO, Z. O. N. Edição filológica e edição digital do Livro do Gado e do Livro de Razão do Arquivo do Sobrado do Brejo (Bahia setecentista e oitocentista). In: Revista Labor Histórico. 2016, n. 2, p. 151-163. Disponível em: <https://revistas.ufrj.br/index.php/lh/article/download/4814/3522>.Acesso em: 3 mai 2019.
LOBO, T.; CARNEIRO, Z. N. Reflexões sobre a constituição e análise de corporalinguísticos históricos e sobre a identificação de perfis sociais de redatores do passado. In: CASTILHO, A. T. de. (Coord.). História do português brasileiro: corpus diacrônico do português brasileiro. São Paulo: Contexto, 2019.
LUCCHESI, D. Língua e sociedade partidas: a polarização sociolinguística do Brasil. São Paulo: Contexto, 2015.
LUCCHESI, D. A periodização da história sociolinguística do Brasil. In: Revista DELTA. 2017, vol.33, n.2, p.347-382. Disponível em: <http://dx.doi.org/10.1590/0102-445067529349614964>. Acesso em 4 mai 2019.
MATTOS E SILVA, R. V. Ensaios para uma sócio-história do português brasileiro. São Paulo: Parábola Editorial, 2004.M
ATTOS E SILVA, R. V. Caminhos da Linguística Histórica: ouvir o inaudível. São Paulo: Parábola Editorial, 2008. p.7-26.
PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. F. E-Dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: SHEPHERD T.; SARDINHAT. B.; PINTOM. V. (Org.). Caminhos da linguística de corpus. Campinas: Mercado de Letras,2010.
Penn Helsinki Parsed Corpus of Middle English. Disponível em: http://www.ling.upenn.edu/historpora/
PETRUCCI, A. La ciência de la escritura: primera lección de paleografía. Buenos Aires: Fondo de Cultura Económica de Argentina,2003.
Plataforma de Corpora do PHPB. Disponível em: https://sites.google.com/site/corporaphpb
Post Scriptum: archivo digital de escritura cotidiana em Portugal e Espanha na Época Moderna. Disponível em: http://www.clul.ul.pt/pt/recursos/462-post-scriptum-home
SANTIAGO. H. da S. A escrita por mãos inábeis: uma proposta de caracterização. 2019. 2v. 722 f. Tese (Doutorado em Língua e Cultura) – Programa de Pós-graduação em Língua e Cultura, Universidade Federal da Bahia, Salvador, 2019.
SANTIAGO, H. da S. Um estudo do português popular brasileiro em cartas pessoais de “mãos cândidas” do sertão baiano. 2012. 2v. 421 f. Dissertação (Mestrado em Estudos Linguísticos) – Programa de Pós-graduação em Estudos Linguísticos, Universidade Estadual de Feira de Santana, Feira de Santana, 2012.
SANTOS, E. B. O Livro do Gado do Brejo do Campo Seco (Bahia): edição semidiplomática e descrição de aspectos grafo-fonéticos. Dissertação (Mestrado em Estudos Linguísticos) -Programa de Pós-graduação em Estudos Linguísticos, Universidade Estadual de Feira de Santana, Feira de Santana, 2019.
SANTOS, J. V.; BRITO, Giovane Santos. Fotografia técnica de documentos para a formação de corpora digitais eletrônicos: o método desenvolvido no Lapelinc. Letras & Letras, v. 30, n. 2, p. 421, 30 jul./dez. 2014.
SCHREIBMAN, S. (et al.). A Companion to Digital Humanities. Oxford: Blackwell, 2004.
Vozes do sertão em dados: história, povos e formação do português brasileiro. Disponível em: .2011.