Atlas sintático do português europeu
um recurso em construção
DOI:
https://doi.org/10.22481/rbba.v8i1.5593Palavras-chave:
Sintaxe dialetal. Dialetos do português europeu. Corpora digitais. Mineração de dados sintáticos. Cartografia linguística.Resumo
Resumo
Este artigo apresenta um projeto em curso que visa conceber, construir e disponibilizar em linha um atlas digital da sintaxe dos dialetos do Português Europeu (SynAPse). Este atlas combina um corpus dialetal sintaticamente anotado, um motor de busca sintática e uma aplicação de webGIS e permite mapear automaticamente e de forma dinâmica os resultados de pesquisas sintáticas definidas pelos utilizadores, evidenciando a correlação espacial entre fenómenos e facilitando a identificação no território português de áreas geográficas de convergência sintática. Neste artigo, discutem-se as vantagens de um recurso cartográfico com estas características e funcionalidades para a investigação em sintaxe dialetal. Particularmente, defende-se a sua relevância para a exploração da dimensão espacial da variação sintática e para uma análise comparada das variedades dialetais numa perspetiva de Princípios & Parâmetros. Descreve-se ainda o plano de implementação técnica do atlas, com particular enfoque na etapa do processo atualmente concluída: a edição digital em XML-TEI do corpus de discurso dialetal que alimenta a ferramenta a construir e sustenta empiricamente a investigação a desenvolver.
Palavras-chave: Sintaxe dialetal. Dialetos do português europeu. Corpora digitais. Mineração de dados sintáticos. Cartografia linguística.
Resumen
Este artículo presenta um proyecto en curso cuyo objetivo es concebir, construir y ofrecer en línea un atlas digital sobre la sintaxis de los dialectos del portugués europeo (SynAPse). Este atlas combina un corpus dialectal sintácticamente anotado, um motor de búsqueda sintáctica y una aplicación webGIS, y permite mapear automáticamente y de forma dinámica los resultados de búsquedas sintácticas definidas por los usuarios, evidenciando la correlación espacial entre fenómenos y facilitando la identificación en el territorio portugués de áreas geográficas de convergencia sintáctica. En este artículo, se exponen las ventajas de un recurso cartográfico con estas características y funcionalidades para la investigación en sintaxis dialectal. Particularmente, se defiende su relevancia para la exploración de la dimensión espacial de la variación sintáctica y para un análisis comparado de las variedades dialectales desde la perspectiva de Principios y Parámetros. Finalmente, se describe el plano de implementación técnica del atlas, con especial atención a la etapa del proceso que está actualmente concluida: la edición digital en XML-TEI del corpus de discurso dialectal que alimenta a la herramienta aquí descrita y sustenta empíricamente la investigación que con ella se pretende desarrollar
Palabras clave: Sintaxis dialectal. Dialectos del portugués europeo. Corpus digitales. Minería de datos sintácticos. Cartografía lingüística.
Downloads
Referências
BARBIERS, S. Dynamic Syntactic Atlas of the Dutch Dialects (Dynasand). Amsterdam: Meertens Institute, 2006. Disponível em: http://www.meertens.knaw.nl/sand/
.______.European Dialect Syntax (Edisyn). Amsterdam: Meertens Institute, 2012. Disponível em: <http://www.dialectsyntax.org/wiki/Main_Page>.
______. Where is syntactic variation? In: AUER, P.; REINA, J. C.; KAUFMANN, G. (ed.). Language Variation – European Perspectives IV. Amsterdam/Philadelphia: John Benjamins, 2013. p. 1-26.
BARBIERS, S.; CORNIPS, L.; KLEIJ, S. V. D. (ed.). Syntactic Microvariation. Amsterdam: Meertens Institute, 2002.
BARBIERS, S. et al. (ed.). Microvariation in syntactic doubling. Chicago: Brill, 2008.
BENINCÀ, P. Syntactic Atlas of Italy (Asit). Padova / Venezia: Università di Padova / Università di Venezia, s.d. Disponível em: <http://svrims2.dei.unipd.it:8080/asit-enterprise/>.
BETONI, S. O expletivo ele em domínios dependentes em Português Europeu. 2013. Dissertação (Mestrado em Linguística) – Faculdade de Letras, Universidade de Lisboa, Lisboa.
CARDOSO, A.; ALEXANDRE, N. Relativas clivadas em variedades não standard do português europeu. In: SILVA, F.; FALÉ, I.; PEREIRA, I. (ed.). Textos Selecionados do XVIII Encontro Nacional da Associação Portuguesa de Linguística. Porto: Associação Portuguesa de Linguística, 2013. p. 205-227.
CARDOSO, A.; CARRILHO, E.; PEREIRA, S. On verbal agreement variation in european portuguese: syntactic conditions for the 3SG/3PL alternation. Diacrítica, Braga, v. 25, n.1, p. 137-160, 2011.
CARDOSO, A.; MAGRO, C. The syntax of naming constructions in European Portuguese dialects: variation and change. Journal of Portuguese Linguistics, Lisboa, v. 11, n.1, p. 23-43, 2012.
CARRILHO, E. Expletive ele in European Portuguese dialects. 2005. Dissertação (Doutoramento em Linguística) – Faculdade de Letras, Universidade de Lisboa,
______. Tools for dialect syntax: the case of CORDIAL-SIN (an annotated corpus of Portuguese dialects). In: AURREKOETXEA, G.; ORMAETXEA, J. L. (ed.). Tools for Linguistic Variation. Bilbao: Universidad del Pais Vasco, 2010. p. 57-70.
______. Using an annotated corpus for dialect syntax: the case of European Portuguese in CORDIAL-SIN. Comunicação apresentada em VIIth Congress of the International Society for Dialectology and Geolinguistics (SIDG), Wien, 2012.
______. Demonstrativos neutros não-argumentais no CORDIAL-SIN: novos aspectos da interface sintaxe-discurso na periferia esquerda da frase. Comunicação apresentada em V Encuentro Wedisyn, Madrid, 2014.
CARRILHO, E.; MAGRO, C. A Anotação sintáctica do CORDIAL-SIN. In: BRITO, A. M. et al. (ed.). Textos Seleccionados do XXV Encontro Nacional da Associação Portuguesa de Linguística. Porto: Associação Portuguesa de Linguística, 2010. p. 225-241.
______. Syntactic Annotation for Dialect Syntax: CORDIAL-SIN ― The annotated corpus of Portuguese Dialects. Póster apresentado em 6th International Conference on Language Variation in Europe (ICLaVE), Freiburg, 2011a.
______. CORDIAL-SIN. Syntax-oriented Corpus of Portuguese Dialects. Syntactic Annotation System Manual. Lisboa: Centro de Linguística, Universidade de Lisboa, 2011b. Disponível em:<http://www.clul.ulisboa.pt/sectores/variacao/cordialsin/Syntactic%20annotation%20manual.html>.
CARRILHO, E.; MAGRO, C.; ÁLVAREZ, X. (ed.). Current Approaches to Limits and Areas in Dialectology. Newcastle upon Tyne: Cambridge Scholars Publishing, 2013.
CARRILHO, E.; PEREIRA, S. Sobre a distribuição geográfica de construções sintácticas não-padrão em português europeu. In: COSTA, A.; BARBOSA, P.; FALÉ, I. (ed.). Textos Seleccionados do XXVI Encontro da Associação Portuguesa de Linguística. Lisboa: Associação Portuguesa de Linguística, 2011. p. 125-139.
______. On the areal dimension of non-standard syntax: Evidence from a Portuguese corpus. In: BARYSEVICH, A.; D'ARCY, A.; HEAP, D. (ed.). Proceedings of Methods XIV: Papers from the Fourteenth International Conference on Methods in Dialectology. Pieterlen: Peter Lang, 2013. p. 69-79.
CHOMSKY, N. Lectures on Government and Binding. Dordrecht: Foris, 1981.
______. The Minimalist Program. Cambridge, Massachusetts: MIT Press, 1995.
CHRIST, O. et al. The Ims Corpus Workbench: Corpus Query Processor (Cqp): User’s Manual. Sttutgart: University of Sttutgart, 1999.
CINQUE, G.; KAYNE, R. (ed.). The Oxford Handbook of Comparative Syntax. New York: Oxford University Press, 2005.
CINTRA, L. F. L. Nova proposta de classificação dos dialectos galego-portugueses. Boletim de Filologia, Lisboa, v. 22, p. 81-116, 1971.
______. Os dialectos da ilha da Madeira no quadro dos dialectos galego-portugueses. In: FRANCO, J. E. (ed.). Cultura Madeirense. Temas e Problemas. Porto: Campo das Letras, 1990. p. 95-107.
CLUL (Coord.). P.S. Post Scriptum. A Digital Archive of Ordinary Writings (Early Modern Portugal and Spain). Lisboa: Centro de Linguística, Universidade de Lisboa, 2014. Disponível em: <http://ps.clul.ul.pt>.
COSTA, J.; LOBO, M. Estruturas clivadas: evidência dos dados do Português Europeu não standard. In: 2009, João Pessoa. Anais do Congresso Internacional da Abralin 2. João Pessoa: Ideia, 2009. p. 3800-3806.
COSTA, J.; MOURA, D.; PEREIRA, S. Concordância com a gente: um Problema para a Teoria de Verificação de Traços. In: Actas do XVI Encontro Nacional da Associação Portuguesa de Linguística, 2001, Lisboa. Lisboa: Associação Portuguesa de Linguística, 2001. p. 637-657.
COSTA, J.; PEREIRA, S. Phases and autonomous features: a case of mixed agreement in European Portuguese. In: MCGINNIS, M.; RICHARDS, N. (ed.). Perspectives on Phases. Cambridge, Massachusetts: MIT Press, 2005. p. 115-124.
______. ‘a gente’: pronominal status and agreement revisited. The Linguistic Review, Berlin/Boston, v. 30, n.2, p. 161-184, 2013.
DRYER, M.; HASPELMATH, M. The World Atlas of Language Structures Online.Leipzig: Max Planck Institute for Evolutionary Anthropology, 2013. Disponível em: <http://wals.info>.
FLEISCHER, J.; LENZ, A.; WEISS, H. Syntax of Hessian Dialects (Syhd). Marburg/Wien/Frankfurt: Philipps-Universität Marburg/ Universität Wien/Goethe Universität, s.d. Disponível em: <http://www.syhd.info/en/home/>. GALVES, C.; ANDRADE, A. L.; FARIA, P. Tycho Brahe Parsed Corpus of Historical Portuguese. Campinas: Instituto de Estudos da Linguagem, Universidade de Campinas, 2017. Disponível em: <http://www.tycho.iel.unicamp.br/~tycho/corpus/en/index.html.>.
GLASER, E.; BART, G. Dialect Syntax of Swiss German. Zürich: Universität Zürich, 2000. Disponível em: <http://www.research-projects.uzh.ch/p1794.htm>.
GRIES, S. T.; BEREZ, A. L. Annotation in/for Corpus Linguistics. In: IDE, N. P., James (ed.). Handbook of Linguistic Annotation. Berlin: Springer, 2017. p. 379-410.
HOCH, S.; HAYES, J. J. Geolinguistics: The incorporation of geographic information systems and science. The Geographical Bulletin, Lawrence Ville, Georgia, v. 51, p. 23-36, 2010.
JACKENDOFF, R. Foundations of Language. Brain, Meaning, Grammar, Evolution. Oxford: Oxford University Press, 2002.
JANSSEN, M. TEITOK – The tokenized TEI environment. Lisboa: Centro de Linguística da Universidade de Lisboa, 2014. Disponível em: <http://alfclul.clul.ul.pt/teitok/site/index.php?action=home>.
______. TEITOK: Text-Faithful Annotated Corpora. In: Tenth International Conference on Language Resources and Evaluation (LREC 2016), 2016, Portorož. Portorož: European Language Resources Association, 2016. p. 4037-4043.
KAYNE, R. Microparametric Syntax: Some Introductory Remarks. In: BLACK, J.; MOTAPANYANE, V. (ed.). Microparametric Syntax and Dialect Variation. Amsterdam/Philadelphia: John Benjamins, 1996. p. ix-xviii.
______. Some notes on comparative syntax, with special reference to English and French. In: CINQUE, G.; KAYNE, R. (ed.). The Oxford Handbook of Comparative Syntax. New York: Oxford University Press, 2005. p. 3-69.
______. Comparative syntax. Lingua, Amsterdam, v. 130, p. 132-151, 2013.
KORTMANN, B. Freiburg English Dialect Corpus. Freiburg: Universität Freiburg, 2002. Disponível em: <http://www2.anglistik.uni-freiburg.de/institut/lskortmann/FRED/>.
______. Dialectology Meets Typology: Dialect Grammar from a Cross-Linguistic Perspective. Berlim: Walter de Gruyter, 2004.
KUNST, J. P.; BARBIERS, S. Generating maps on the internet. In: LAMELI, A.; KEHREIN, R.; RABANUS, S. (ed.). Language and Space. An International Handbook of Linguistic Variation. Volume 2 Language Mapping. Berlin: De Gruyter, 2010. p. 401-422.
KUNST, J. P.; WESSELING, F. The Edisyn search engine. Oslo studies in language, Oslo, v. 3, n.2, p. 63-74, 2011.
LAMELI, A.; KEHREIN, R.; RABANUS, S. Introduction. In: LAMELI, A.; KEHREIN, R.; RABANUS, S. (ed.). Language and Space. An International Handbook of Linguistic Variation. Volume 2: Language Mapping. Part I. Berlin/New York: De Gruyter Mouton, 2010. p. xi-xxii.
LINDSTRÖM, L. Estonian Dialect Corpus. Tartu: University of Tartu / Institute of Estonian Language, s.d. Disponível em: <http://www.murre.ut.ee/estonian-dialect-corpus/>.
LOBO, M. Variação morfo-sintáctica em dialectos do Português europeu: o gerúndio flexionado. Diacrítica, Braga, v. 22, n.1, p. 25-55, 2008.
______. O gerúndio flexionado no português dialetal. In: MARTINS, A. M.; CARRILHO, E. (ed.). Manual de linguística portuguesa. Berlin: Mouton de Gruyter, 2016. p. 481-501.
MAGRO, C. Clíticos: Variações sobre o tema. 2007a. Dissertação (Doutoramento em Linguística) – Faculdade de Letras, Universidade de Lisboa, Lisboa.
______. (ed.) CORDIAL-SIN. Corpus Dialectal para o Estudo da Sintaxe. Normas de Transcrição. Lisboa: Centro de Linguística, Universidade de Lisboa, 2007b. Disponível em: <http://www.clul.ulisboa.pt/english/sectores/variacao/cordialsin/manual_normas.pdf>.
______. When CORDIAL becames friendly: endowing the CORDIAL-SIN corpus with a syntactic annotation layer. In: International Conference on Language Resources and Evaluation, 7, 2010a, La Valetta. Proceedings from Seventh International Conference on Language Resources and Evaluation (LREC 2010). La Valetta: European Language Resources Association, 2010a. p. 3705-3711.
______. When corpus analysis refutes common beliefs. The case of interpolation in European Portuguese dialects. Corpus, Nice, v. 9, p. 115-135, 2010b.
______. QETch. Queries for Tree Searching. Lisboa: Centro de Linguística da Universidade de Lisboa, 2018. Disponível em: <http://ps.clul.ul.pt/index.php?action=treequeries>.
(coord.). Synapse – Syntactic Atlas of European Portuguese / Atlas Sintático Do Português Europeu. Lisboa: Centro de Linguística da Universidade de Lisboa, em preparação. Disponível em: <http://cards-fly.clul.ul.pt/teitok/synapse/>.
MAGRO, C.; GALVES, C.; CARRILHO, E. Portuguese Syntactic Annotation Manual. Lisboa/Campinas: Centro de Linguística, Universidade de Lisboa/Instituto de Estudos da Linguagem, Universidade de Campinas, 2018. Disponível em: <https://sites.google.com/site/portuguesesyntacticannotation/>.
MAGRO, C.; MORGADO, C. (ed.) CORDIAL-SIN. Syntax-oriented Corpus of Portuguese Dialects. POS Annotation Manual. Lisboa: Centro de Linguística, Universidade de Lisboa, 2008. Disponível em:<http://www.clul.ulisboa.pt/english/sectores/variacao/cordialsin/pos_annotation_manual.pdf.
MARTINS, A. M. (Coord.). Corpus Dialetal Para O Estudo Da Sintaxe / the Syntax-Oriented Corpus of Portuguese Dialects (Cordial-Sin). Lisboa: Centro de Linguística da Universidade de Lisboa, 2000. Disponível em: <http://www.clul.ulisboa.pt/en/11-resources/314-cordial-sin-corpus-2>.
______. Subject doubling in European Portuguese dialects: The role of impersonal se. In: ABOH, E. O. et al. (ed.). Romance Languages and Linguistic Theory 2007. Amsterdam/Philadelphia: John Benjamins, 2009. p. 179-200.
______. (Coord.). Word Order and Word Order Change in Western European Languages (Wochwel). Lisboa: Centro de Linguística da Universidade de Lisboa, 2015. Disponível em: <http://alfclul.clul.ul.pt/wochwel/>.
PEREIRA, S. A. Áreas sintáticas no território português em preparação. Dissertação (Doutoramento em Linguística) – Faculdade de Letras, Universidade de Lisboa, Lisboa.
POLETTO, C.; BENINCÀ, P. The ASIS enterprise: a view on the construction of a syntactic atlas for the Northern Italian dialects. Nordlyd, Tromsø, v. 34, n.1, p. 35-52, 2007.
SANTORINI, B. Annotation manual for the Penn Historical Corpora and the York-Helsinki Corpus of Early English Correspondence. Philadelphia: Department of Linguistics, University of Pennsylvania, 2016. Disponível em: <https://www.ling.upenn.edu/hist-corpora/annotation/index.html>.
SEGURA, L. Dialectos açorianos. Contributos para a sua classificação. In: I Encontro de Estudos Dialectológicos – Actas, 2006, Ponta Delgada. Ponta Delgada: Instituto Cultural de Ponta Delgada, 2006. p. 325-344.
SMITH, A. Preservation. In: SCHREIBMAN, S.; SIEMENS, R.; UNSWORTH, J. (ed.). A Companion to Digital Humanities. Oxford: Blackwell, 2004. Disponível em: <http://www.digitalhumanities.org/companion/>
SÓRIA, M. ‘Nós’, ‘a gente’ e o sujeito nulo de primeira pessoa do plural. 2013. Dissertação (Mestrado em Linguística) – Faculdade de Letras, Universidade de Lisboa,
TEICONSORTIUM (ed.) TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 3.5.0. Last updated on 29th January 2019. TEI Consortium, 2019. Disponível em: <http://www.tei-c.org/Guidelines/P5/.>.
VANGSNES, Ø. A. Scandiasyn – Scandinavian Dialect Syntax. Tromsø: University of Tromsø, s.d. Disponível em:<http://websim.arkivert.uit.no/scandiasyn/index.html%3fLanguage=en>.
VERCAUTEREN, A. Como é que é com o ‘é que’? Análise de estruturas com ‘é que’ em variedades não-standard do Português Europeu. 2010. Dissertação (Mestrado em Linguística) – Faculdade de Ciências Sociais e Humanas, Universidade Nova de Lisboa, Lisboa.
______. A conspiracy theory for clefts: the syntax and interpretation of cleft constructions. 2015. Dissertação (Doutoramento em Linguística) – Faculdade de Ciências Sociais e Humanas, Universidade Nova de Lisboa, Lisboa.
WYNNE, M. Archiving, Distribution and Preservation. In: WYNNE, M. (ed.). Developing Linguistic Corpora: A Guide to Good Practice. Oxford: Oxford Books, 2005. Disponível em: https://ota.ox.ac.uk/documents/creating/dlc/
ZANUTTINI, R.; HORN, L.; WOOD, J. Yale Grammatical Diversity Project: English in North America. New Haven, Connecticut: Yale University, 2010. Disponível em: <http://ygdp.yale.edu>.