unesp UNIVERSIDADE ESTADUAL PAULISTA Faculdade de Ciências e Letras Campus de Araraquara - SP ALINE CAMILA LENHARO DESCRIÇÃO LÉXICO-GRAMATICAL E FUNCIONAL DOS VERBOS PRONOMINAIS DO PORTUGUÊS BRASILEIRO COM VISTAS AO APERFEIÇOAMENTO DA BASE DE VERBOS DA WORDNET BRASILEIRA E DO ALINHAMENTO SEMÂNTICO DESTA À BASE DE VERBOS DA WORDNET NORTE-AMERICANA ARARAQUARA – SP 2014 ALINE CAMILA LENHARO DESCRIÇÃO LÉXICO-GRAMATICAL E FUNCIONAL DOS VERBOS PRONOMINAIS DO PORTUGUÊS BRASILEIRO COM VISTAS AO APERFEIÇOAMENTO DA BASE DE VERBOS DA WORDNET BRASILEIRA E DO ALINHAMENTO SEMÂNTICO DESTA À BASE DE VERBOS DA WORDNET NORTE-AMERICANA Tese apresentada ao Programa de Pós-Graduação em Linguística e Língua Portuguesa da Faculdade de Ciências e Letras – Unesp/Araraquara, como requisito para a obtenção do título de Doutor em Linguística e Língua Portuguesa. Linha de pesquisa: Análise Fonológica, Morfossintática, Semântica e Pragmática. Orientadora: Dra. Angélica Terezinha Carmo Rodrigues Bolsa: CNPq ARARAQUARA – SP. 2014 Lenharo, Aline Camila Descrição léxico-gramatical e funcional dos verbos pronominais do português brasileiro com vistas ao aperfeiçoamento da base de verbos da wordnet brasileira e do alinhamento semântico desta à base de verbos da wordnet norte-americana / Aline Camila Lenharo – 2014 238 f. ; 30 cm Tese (Doutorado em Linguística e Língua Portuguesa) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Faculdade de Ciências e Letras (Campus de Araraquara) Orientador: Angélica Terezinha Carmo Rodrigues l. Língua portuguesa -- Brasil. 2. Linguística. 3. Lexicologia. I. Título. ALINE CAMILA LENHARO DESCRIÇÃO LÉXICO-GRAMATICAL E FUNCIONAL DOS VERBOS PRONOMINAIS DO PORTUGUÊS BRASILEIRO COM VISTAS AO APERFEIÇOAMENTO DA BASE DE VERBOS DA WORDNET BRASILEIRA E DO ALINHAMENTO SEMÂNTICO DESTA À BASE DE VERBOS DA WORDNET NORTE-AMERICANA Tese de Doutorado apresentada ao Programa de Pós-Graduação em Linguística e Língua Portuguesa da Faculdade de Ciências e Letras – Unesp/Araraquara, como requisito para a obtenção do título de Doutor em Linguística e Língua Portuguesa. Linha de pesquisa: Análise Fonológica, Morfossintática, Semântica e Pragmática. Bolsa: CNPq Data de aprovação: 26/05/2014 MEMBROS COMPONENTES DA BANCA EXAMINADORA: Presidente e Orientadora: Dra. Angélica Terezinha Carmo Rodrigues UNESP – Faculdade de Ciências e Letras – Araraquara/SP. Membro Titular: Dra. Rosane de Andrade Berlinck UNESP – Faculdade de Ciências e Letras – Araraquara/SP. Membro Titular: Dra. Flavia Bezerra de Menezes Hirata-Vale UFSCar – Centro de Educação e Ciências Humanas – São Carlos/SP. Membro Titular: Dra. Magali Sanches Duran Pós-doutoranda na USP – Instituto de Ciências Matemáticas e de Computação – São Carlos/SP. Membro Titular: Dr. Tiago Timponi Torrent UFJF – Faculdade de Letras – Juiz de Fora/MG. Membro Suplente: Dra. Ana Eliza Barbosa de Oliveira Baptista Profa. Substituta – UFSCar – Centro de Educação e Ciências Humanas – São Carlos/SP. Membro Suplente: Dra. Gladis Massini-Cagliari UNESP – Faculdade de Ciências e Letras – Araraquara/SP. Membro Suplente: Dr. Helio Roberto de Moraes FATEC – Faculdade de Tecnologia – Mococa/SP. Local: Universidade Estadual Paulista Faculdade de Ciências e Letras UNESP – Campus de Araraquara Dedico este trabalho a quatro pessoas muito amadas: Rodrigo, meu marido, o meu maior incentivador, e meus sobrinhos Alice, Caio e Helena, como um incentivo aos estudos. AGRADECIMENTOS Agradeço ao meu marido, meu amigo e companheiro, Dr. Rodrigo dos Santos: Ro, obrigada por sua constante presença e por seu apoio. Obrigada por acreditar no meu potencial, especialmente quando eu mesma não acreditava. Sem você, sem o seu incentivo, o curso de Doutorado seria um sonho distante e este trabalho não teria sido realizado! Agradeço aos meus orientadores, Dra. Angélica Terezinha Carmo Rodrigues, especialmente por ter aceitado o convite de assumir a orientação de uma pesquisa já em andamento, e Dr. Bento Carlos Dias da Silva, pelos longos anos de ensino e orientação que me ajudaram a trilhar o caminho até aqui. Muito obrigada aos dois. Agradeço aos integrantes da Banca Examinadora: Dra. Ana Eliza Barbosa de Oliveira Baptista, Dra. Flavia Bezerra de Menezes Hirata-Vale, Dra. Gladis Massini-Cagliari, Dr. Helio Roberto de Moraes, Dra. Magali Sanches Duran, Dra. Rosane de Andrade Berlinck e Dr. Tiago Timponi Torrent, pelas contribuições que trouxeram e pelas que trarão. Obrigada pela atenção dedicada. Agradeço também a todos os professores que, em alguma medida, contribuíram com minha formação e me instigaram a buscar, cada vez mais, o conhecimento – incluindo, com carinho, além dos professores da Faculdade de Ciências e Letras da Unesp de Araraquara, os professores da Escola Estadual “Prof. Sebastião Inoc Assumpção”, de Arealva, e do Colégio Técnico Industrial “Prof. Isaac Portal Roldán”, da Unesp, de Bauru – especialmente os professores Vera Aparecida do Prado Furlanetti, Ana Flávia Lopes Lenharo e Luiz Vitor Martinello, que fizeram com que eu me apaixonasse pela leitura e contribuíram com minha formação em língua portuguesa. Agradeço, por fim, ao CNPq, pelo financiamento da pesquisa. RESUMO Esta tese abrange temas de dois domínios complementares – o Domínio Linguístico e o Domínio Linguístico-Computacional. No Domínio Linguístico, este trabalho apresenta uma sistematização das diferentes propostas de classificação dos verbos pronominais do português, estabelece critérios para identificar os diferentes subtipos de verbos pronominais, construções do tipo [verbo+SE], e fornece uma proposta de formalização, baseada no Funcionalismo Holandês, para esses diferentes tipos de [verbo+SE]. Além disso, apresenta diferentes possibilidades de realização dos verbos pronominais no Brasil. Por fim, observando a interação entre léxico e gramática, situa os verbos pronominais, especialmente os do tipo [verbo+SE ], entre as idiossincrasias do léxico e a regularidade da gramática. No inerente Domínio Linguístico-Computacional, a partir da apresentação das redes do tipo wordnet, descreve os principais tipos de alinhamento semântico verificados entre a WordNet de Princeton e as demais wordnets criadas, especialmente aqueles verificados no alinhamento entre a base de verbos da WordNet.Br e a base de verbos da wordnet americana. De modo aplicado, esta pesquisa propõe o refinamento de alguns synsets de verbos constituídos por verbos+SE, identificando quais são compostos por verbos pronominais do tipo [verbo+SE ] e estabelecendo seus alinhamentos com os synsets correspondentes do inerente inglês. Esta tese fornece, assim, um parâmetro para o refinamento dos demais synsets de verbos pronominais da base da WordNet.Br. Palavras-chave: verbo pronominal, clítico se, alinhamento semântico, Processamento Automático de Língua Natural, wordnets, WordNet.Br. ABSTRACT This doctoral dissertation discusses the Brazilian Portuguese pronominal verbs in two complementary domains – Linguistic Domain and Linguistic-Computational Domain. In the Linguistic Domain, it presents a systematization of the different classification proposals of Portuguese pronominal verbs, establishes an identification criterion for the different subtypes of pronominal verbs, i.e., constructions of the type [verb+SE], and provides a formal proposal for different [verb+SE] types, based on Dutch Functionalism. Furthermore, it presents different possibilities of Brazilian pronominal verbs realizations. At last, through the observation of lexicon and grammar interaction, it places the pronominal verbs, especially those with [verb+SE ] form, between the lexicon idiosyncrasies and grammar regularity. inherent In the Computational-Linguistic Domain, after presenting wordnet projects, it describes the main types of semantic alignment that can be built between Princeton WordNet and other wordnets created, especially those found in the alignment between the WordNet.Br verbs base and American verbs wordnet. In an applied mode, this research proposes the refinement of some verbs synsets composed of verbs+SE, focusing on which are composed of pronominal verbs of [verb+SE ] type and on the establishment of their alignment with correspondent inherent Princeton WordNet synsets. Thus, this dissertation provides a parameter for refining other pronominal verbs synsets from WordNet.Br base. Keywords: pronominal verb, clitic SE, semantic alignment, Automatic Processing of Natural Language, wordnets, WordNet.Br. SUMÁRIO 1 INTRODUÇÃO ............................................................................................................................... 10 2 OS VERBOS PRONOMINAIS ..................................................................................................... 18 2.1 O problema: a discrepância verificada entre definições/classificações dos verbos pronominais em obras lexicográficas e gramaticais 19 2.1.1 Panorama dos estudos linguísticos sobre os verbos pronominais ................................................. 36 2.2 Sistematização dos diferentes tipos de clítico SE dos verbos pronominais 41 2.2.1 Sistematização de critérios para a identificação dos diferentes subtipos de verbos+SE ............... 49 2.3 Proposta de representação formal dos verbos pronominais 64 3 O COMPORTAMENTO DOS VERBOS PRONOMINAIS ....................................................... 69 3.1 Os diferentes usos do clítico SE no Brasil 71 3.2 Processos linguísticos concernentes aos verbos pronominais 81 3.2.1 Os verbos pronominais entre as idiossincrasias do léxico e a regularidade da gramática ............. 93 4 AS REDES WORDNETS .............................................................................................................. 99 4.1 A WordNet de Princeton 99 4.2 A EuroWordNet 115 4.3 A WordNet.Br 125 5 OS VERBOS PRONOMINAIS E A WORDNET.BR ............................................................... 138 5.1 Proposta de refinamento de synsets da WN.Br 146 6 CONCLUSÃO ................................................................................................................................ 184 REFERÊNCIAS ................................................................................................................................ 190 APÊNDICES ..................................................................................................................................... 204 APÊNDICE 1: Listagem comparativa dos verbos com SE oriundos do VOLP e do Webster’s 205 APÊNDICE 2: Metodologia empregada na pesquisa do Córpus web e resultados obtidos 208 ANEXO 1 .......................................................................................................................................... 235
Description: