Corpus eletrônico de Documentos Históricos do Sertão

etapa 1 (1750-2000)

Authors

  • Zenaide de Oliveira Novais Carneiro Universidade Estadual de Feira de Santana – UEFS - Brasil
  • Mariana Fagundes de Oliveira Lacerda Universidade Estadual de Feira de Santana – UEFS - Brasil

DOI:

https://doi.org/10.22481/rbba.v8i1.5588

Keywords:

Português Brasileiro. Banco de Dados. Edições Eletrônicas.

Abstract

Resumo

Este trabalho apresenta o Banco CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão, na sua primeira etapa, que abrange o período que vai de 1750 a 2000, caracterizado pelo multilinguismo localizado. O CE-DOHS é a versão eletrônica – com textos editados em linguagem xml – do banco DOHS, do projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro, com textos em edição semidiplomática, além de amostras orais. A edição eletrônica é feita, no âmbito do CE-DOHS, usando o eDictor, desenvolvido por Paixão de Sousa, Kepler e Faria (2010); trata-se de um editor de textos especialmente voltado ao trabalho filológico e à análise linguística automática. Finalizada a primeira etapa, no ano de 2018, o banco CE-DOHS tem mais de um milhão de palavras, colaborando, de maneira muito significativa, com o Projeto Nacional para a História do Português Brasileiro (PHPB), do qual é parceiro.

Palavras-chave: Português Brasileiro. Banco de Dados. Edições Eletrônicas.

 

Resumen

Este documento presenta el Banco EC-DOHS - Corpus de Documentación Electrónica de Sertão, en su primera etapa, que abarca el período de 1750 a 2000, caracterizado por el multilingüismo localizado. CE-DOHS es la versión electrónica, con textos editados en lenguaje XML, del banco DOHS, del proyecto Vozes do Sertão en Datos: historia, pueblos y formación del portugués brasileño, con textos en edición semidiplomática y muestras orales. La edición electrónica se realiza, en el marco de CE-DOHS, utilizando eDictor, desarrollado por Paixão de Sousa, Kepler y Faria (2010); Es un editor de texto enfocado especialmente en el trabajo filológico y el análisis lingüístico automático. Después de la primera fase, en 2018, el banco CE-DOHS tiene más de un millón de palabras, colaborando de manera muy significativa con el Proyecto Nacional de Historia del Portugués Brasileño (PHPB), del cual es socio.

Palabras clave: Portugués brasileño. Banco de datos. Ediciones electrónicas.

 

Downloads

Download data is not yet available.

Author Biographies

Zenaide de Oliveira Novais Carneiro, Universidade Estadual de Feira de Santana – UEFS - Brasil

Zenaide de Oliveira Novais Carneiro. Possui Graduação em Letras com Inglês pela Universidade Estadual de Feira de Santana (1988), Mestrado em Letras e Linguística (1996) pela Universidade Federal da Bahia, Doutorado em Linguística (2005) e Pós-Doutorado em Linguística de Corpus (2010) pela Universidade Estadual de Campinas. Atualmente é Professora Plena da Universidade Estadual de Feira de Santana, onde coordena o projeto CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão (FAPESB), disponível em <www.uefs.br/cedohs>, e atua como Membro Permanente no Programa de Pós-Graduação em Estudos Linguísticos (PPGEL) e no Mestrado Profissional em Letras (PROFLETRAS). É Membro Colaborador do Programa de Pós-Graduação em Língua e Cultura da Universidade Federal da Bahia (PPGLinC), atuando como co-coordenadora do Banco Informatizado de Textos  do Programa para a História da Língua Portuguesa (BIT-PROHPOR/UFBA), disponível em <http://www.prohpor.org/bit-prohpor>. Integra também a equipe de pesquisadores do Projeto Nacional para a História do Português Brasileiro (PHPB), onde é co-coordenadora da Plataforma de Corpora Bahia, disponível em <https://sites.google.com/site/corporaphpbba/?pli=1>

Mariana Fagundes de Oliveira Lacerda, Universidade Estadual de Feira de Santana – UEFS - Brasil

Mariana Fagundes de Oliveira Lacerda. Possui Graduação em Letras Vernáculas (2002) pela Universidade Federal da Bahia (UFBA), Mestrado (2005) e Doutorado (2009) em Linguística pela mesma instituição, com estágio de doutoramento no Centro Linguístico da Universidade de Lisboa, financiado pela CAPES. Na Universidade Estadual de Feira de Santana (UEFS), onde é Professora Titular da subárea de Linguística Histórica e Membro Permanente do Programa de Pós-Graduação em Estudos Linguísticos (PPGEL) e do Mestrado Profissional em Letras (PROFLETRAS), coordena o Núcleo de Estudos de Língua Portuguesa (NELP) e é co-coordenadora do projeto CE-DOHS - Corpus Eletrônico de documentos Históricos do Sertão (FAPESB), disponível em <www.uefs.br/cedohs>. Integra, ainda, a equipe de pesquisadores do Projeto Nacional para a História do Português Brasileiro (PHPB), co-coordenando a Plataforma de Corpora Bahia, disponível em <https://sites.google.com/site/corporaphpbba/?pli=1>,  e a equipe do Programa para a História da Língua Portuguesa (PROHPOR-UFBA), onde é co-coordenadora do Banco Informatizado de textos (BIT), disponível em <http://www.prohpor.org/bit-prohpor>.

References

BACELAR DO NASCIMENTO, M. F. O lugar do corpus na investigação linguística. Disponível em:<http://www.clul.ul.pt/equipa/berlim-2000-nascimento.pdf.>. Acesso em: 20abr.2004.

BARBOSA, A. G. A plataforma de corpora do PHPB: uma apresentação ad infinitum. In: CARNEIRO, Z. de O. N. (Org.). Cartas brasileiras (1809-2000): coletânea de fontes para o estudo do português. Feira de Santana: UEFS,2011.

BRITO, G. S. Do texto ao documento digital: transposição fotográfica de documentos manuscritos históricos para formação de corpora linguísticos eletrônicos. Dissertação (Mestrado em Linguística) – Programa de Pós Graduação Linguística da Universidade Estadual do Sudoeste da Bahia, Vitória da Conquista, 2015.

CARNEIRO, Z. O. N. Cartas Brasileiras: um estudo linguístico-filológico. Tese (Doutorado em Estudos Linguísticos) – Programa de Pós-Graduação em Linguística, Universidade Estadual de Campinas, Campinas, 2005.

CARNEIRO, Z. de O. N., OLIVEIRAM. F. de. Publica-se em Feira de Santana: das cartas de leitores e redatores e dos anúncios em O Progresso e Na Folha do Norte (1901-2006). Feira de Santana: UEFS,2012.

CE-DOHS: Corpus eletrônico de documentos históricos do sertão. Disponível em: [www.uefs.br/cedohs]. 2011.

CHOMSKY, N. Knowledge of Language: its nature origin, and use. New York: Praeger, 1986.

CORPUS Histórico do Português Tycho Brahe. Disponível em: http://www.tycho.iel.unicamp.br/~tycho/corpus/

CRANE, G. (et al.). e Philology: when the boock stalk to their readers. Blackwell Campanion to Digital Literary Studies. Oxford: Blackwell,2008.

GONÇALVES, M. F.; BANZA, A. P. Fontes de metalinguísticas para a história do português clássico. In: GONÇALVES, M. F.; BANZA, A. P. Património Textual e Humanidades Digitais: da antiga à nova filologia. Évora: CIDEHUS, 2013. p.73-112.

LABOV, W. Principles of Linguistic Change: internal factors. Oxford: Blackwell, 1994.

LACERDA, M. F. O; CARNEIRO, Z. O. N. Edição filológica e edição digital do Livro do Gado e do Livro de Razão do Arquivo do Sobrado do Brejo (Bahia setecentista e oitocentista). In: Revista Labor Histórico. 2016, n. 2, p. 151-163. Disponível em: <https://revistas.ufrj.br/index.php/lh/article/download/4814/3522>.Acesso em: 3 mai 2019.

LOBO, T.; CARNEIRO, Z. N. Reflexões sobre a constituição e análise de corporalinguísticos históricos e sobre a identificação de perfis sociais de redatores do passado. In: CASTILHO, A. T. de. (Coord.). História do português brasileiro: corpus diacrônico do português brasileiro. São Paulo: Contexto, 2019.

LUCCHESI, D. Língua e sociedade partidas: a polarização sociolinguística do Brasil. São Paulo: Contexto, 2015.

LUCCHESI, D. A periodização da história sociolinguística do Brasil. In: Revista DELTA. 2017, vol.33, n.2, p.347-382. Disponível em: <http://dx.doi.org/10.1590/0102-445067529349614964>. Acesso em 4 mai 2019.

MATTOS E SILVA, R. V. Ensaios para uma sócio-história do português brasileiro. São Paulo: Parábola Editorial, 2004.M

ATTOS E SILVA, R. V. Caminhos da Linguística Histórica: ouvir o inaudível. São Paulo: Parábola Editorial, 2008. p.7-26.

PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. F. E-Dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: SHEPHERD T.; SARDINHAT. B.; PINTOM. V. (Org.). Caminhos da linguística de corpus. Campinas: Mercado de Letras,2010.

Penn Helsinki Parsed Corpus of Middle English. Disponível em: http://www.ling.upenn.edu/historpora/

PETRUCCI, A. La ciência de la escritura: primera lección de paleografía. Buenos Aires: Fondo de Cultura Económica de Argentina,2003.

Plataforma de Corpora do PHPB. Disponível em: https://sites.google.com/site/corporaphpb

Post Scriptum: archivo digital de escritura cotidiana em Portugal e Espanha na Época Moderna. Disponível em: http://www.clul.ul.pt/pt/recursos/462-post-scriptum-home

SANTIAGO. H. da S. A escrita por mãos inábeis: uma proposta de caracterização. 2019. 2v. 722 f. Tese (Doutorado em Língua e Cultura) – Programa de Pós-graduação em Língua e Cultura, Universidade Federal da Bahia, Salvador, 2019.

SANTIAGO, H. da S. Um estudo do português popular brasileiro em cartas pessoais de “mãos cândidas” do sertão baiano. 2012. 2v. 421 f. Dissertação (Mestrado em Estudos Linguísticos) – Programa de Pós-graduação em Estudos Linguísticos, Universidade Estadual de Feira de Santana, Feira de Santana, 2012.

SANTOS, E. B. O Livro do Gado do Brejo do Campo Seco (Bahia): edição semidiplomática e descrição de aspectos grafo-fonéticos. Dissertação (Mestrado em Estudos Linguísticos) -Programa de Pós-graduação em Estudos Linguísticos, Universidade Estadual de Feira de Santana, Feira de Santana, 2019.

SANTOS, J. V.; BRITO, Giovane Santos. Fotografia técnica de documentos para a formação de corpora digitais eletrônicos: o método desenvolvido no Lapelinc. Letras & Letras, v. 30, n. 2, p. 421, 30 jul./dez. 2014.

SCHREIBMAN, S. (et al.). A Companion to Digital Humanities. Oxford: Blackwell, 2004.

Vozes do sertão em dados: história, povos e formação do português brasileiro. Disponível em: .2011.

Published

2019-07-31

How to Cite

Carneiro, Z. de O. N., & Lacerda, M. F. de O. (2019). Corpus eletrônico de Documentos Históricos do Sertão: etapa 1 (1750-2000). Revista Binacional Brasil-Argentina: Dialogue Between the Sciences, 8(1), 205-221. https://doi.org/10.22481/rbba.v8i1.5588