UNIVERSIDADE FEDERAL DE JUIZ DE FORA PÓS-GRADUAÇÃO EM LINGUÍSTICA ALEXANDRA MOREIRA PROPOSTA DE UM FRAMEWORK APOIADO EM ONTOLOGIAS PARA DETECÇÃO DE FRAMES JUIZ DE FORA 2012 ALEXANDRA MOREIRA PROPOSTA DE UM FRAMEWORK APOIADO EM ONTOLOGIAS PARA A DETECÇÃO DE FRAMES Tese apresentada ao Programa de Pós-Graduação em Linguística da Universidade Federal de Juiz de Fora, como requisito parcial para obtenção do título de Doutora em Linguística. Orientadora: Profa. Dra. Maria Margarida M. Salomão JUIZ DE FORA 2012 M838p Moreira, Alexandra Proposta de um framework apoiado em ontologias para a detecção de frames./ Alexandra Moreira - 2012. 194 f. il. Orientador: Margarida Salomão. Tese (Doutorado em Linguística) – Universidade Federal de Juiz de Fora, 2012. 1. Frames. 2. Ontologias. 3. Semântica de Frames. I. Título. CDD: CDU: AGRADECIMENTOS É bom quando temos a oportunidade de agradecer àqueles que são parceiros em prol de um objetivo. Reconhecemos que estas parecerias ocorreram de diversas formas, seja financeira, seja pela transmissão de conhecimentos e, sobretudo, pelo apoio e carinho recebido durante esta longa jornada. A parceria de pessoas e instituições é o que permitiu a realização desta pesquisa. A estes dedico o meu MUITO OBRIGADO! Destaco o apoio financeiro concedido pela CAPES que permitiu dedicação exclusiva à pesquisa. No decurso desta tarefa pude contar com a estrutura da Universidade Federal de Juiz de Fora e conhecer pessoas que ficarão para sempre em minha lembrança. Destaco a participação de minha orientadora, a professora MARGARIDA SALOMÃO, que com competência e dedicação soube conduzir-me nesta tarefa e explorou minhas qualidades, adquiridas em outras áreas do conhecimento. Os professores LUIZ FERNANDO, MARIA CRISTINA NAME e NEUSA SALIM, que introduziram e guiaram na aquisição de conhecimento sobre o estado da arte dos estudos sobre a linguagem e cognição. À coordenadora LUCIANA TEIXEIRA e a secretária ROSÂNGELA MONTEIRO que com paciência e dedicação auxiliam os estudantes na resolução de suas dúvidas e problemas administrativos. À revisora Sandra Del-Gaudio que em curto espaço de tempo dedicou-se no aperfeiçoamento da redação do texto. Agradeço e espero manter a amizade adquirida com os colegas de classe ROBLEDO, FRANCINE, GABRIELA, IGOR, ANNA CARRARA, muitos outros que pude contar com esclarecimentos, ideias e informações. Não posso deixar de mencionar aqueles que sempre estiveram comigo antes mesmo de iniciar o curso de Doutorado. Começo pelo meu MARIDO que me incentivou nesta tarefa e em tantas outras atividades profissionais exercidas. A MINHA FAMÍLIA – pais e irmã pela torcida por meu sucesso pessoal e profissional, e por compreenderem as minhas ausências em várias ocasiões. Tenho certeza que eles sabem que meu pensamento estará sempre com eles. E ao meu grande e maravilhoso DEUS, amigo inseparável, em todos os meus momentos. First there is Ontology, the treatment of abstract and quite general philosophic categories, such as Being (ÓL) and its being the One and Good. (Christian Wolff) Proposta de um framework apoiado em ontologias para a detecção de frames RESUMO A Semântica de Frames é uma teoria que busca estabelecer o significado de um item lexical pela evocação da cena conceitual associada. A FrameNet é uma base léxico-semântica fundamentada na Semântica de Frames e é constituída de um conjunto de frames relacionados por ligações semânticas. A metodologia de descoberta e incorporação de frames à base obedece a critérios semi-formais e envolvem alguns critérios ontológicos. Nesta pesquisa buscamos o aprofundamento dessa análise ontológica de forma a permitir uma formalização mais abrangente do processo. Em linhas gerais, esta pesquisa visou estabelecer um arcabouço metodológico que relaciona ontologias e frames de modo a verificar a ocorrência e as fronteiras de um frame, segundo critérios ontológicos e uma análise mais fundamentada do enquadramento de um enunciado em um frame, permitindo a elaboração de uma FrameNet com maior precisão. Os resultados práticos desta pesquisa foram a formalização da FrameNet, a inserção da análise ontológica na metodologia da FrameNet e a sugestão de métodos de automação desta análise. A automação aplicada possibilitou a categorização de sentenças em frames de sentidos correlatos. Como resultado teórico essa pesquisa demonstrou que os aspectos ontológicos contribuem fortemente para a elucidação do significado de sentenças polissêmicas. Palavras-chave: Frames; Ontologias; Semântica de Frames. Proposal of a framework supported on ontologies for detecting frames ABSTRACT Frame semantics is a theory that aims to establish the semantics of a lexical item by the evocation of the associated conceptual scene. FrameNet is a lexical-semantic database developed based on the semantics frames and is constituted of a set of frames related by semantics links. The methodology for the discovery and incorporation of frames is based on semi-formal criteria and incorporate some ontological criteria. This thesis seeks to deepen this ontological analysis in order allow greater formalization of the process. Broadly speaking, this research aims to establish a methodological framework that relates to ontologies and frames to help identify the occurrence and the borders of a frame, according to ontological criteria and a more grounded analysis of the relationship of an utterance on a frame, allowing the development of a FrameNet more accurate and more useful. The practical results of this research were the formalization of FrameNet, the insertion of an ontological analysis step in the FrameNet methodology, and the suggestion of automation methods for this analysis. The automation applied enabled the categorization of sentences in frames of related meanings. As a theoretical result this research showed that the ontological aspects contribute greatly to the elucidation of the meaning of polysemic sentences. Keywords: Frames; Ontologies; Frame semantics. SUMÁRIO 1 INTRODUÇÃO ...................................................................................................... 1 1.1 Objetivos ............................................................................................................ 5 2 O TRATAMENTO COGNITIVISTA DA SIGNIFICAÇÃO ................................ 7 2.1 Os princípios da Linguística Cognitiva .............................................................. 7 2.2 A posição do Programa Minimalista ................................................................ 11 2.3 Dualismo versus corporificação ....................................................................... 13 3 FUNDAMENTOS TEÓRICOS ADOTADOS DA LINGUÍSTICA COGNITIVA . ............................................................................................................................... 17 3.1 A questão da corporificação da cognição ......................................................... 17 3.1.1 A conceptualização baseada na corporificação da cognição ................... 18 3.2 O Conceito de Frames ...................................................................................... 26 3.2.1 Frames Básicos e Frames Culturais ......................................................... 28 3.3 Uma nova concepção de categoria ................................................................... 32 3.3.1 O Conceito de prototipia .......................................................................... 33 3.3.2 A noção de categoria básica ..................................................................... 36 3.4 A Semântica de Frames .................................................................................... 37 3.4.1 Elementos participantes do frame ............................................................ 40 3.4.2 Perfilamento de frame .............................................................................. 40 3.4.3 As redes de frames ................................................................................... 41 3.5 Relações de projeção de frames ........................................................................ 42 3.5.1 Metáforas ................................................................................................. 42 3.5.2 Metonímias .............................................................................................. 46 4 FUNDAMENTOS COMPUTACIONAIS ADOTADOS ..................................... 49 4.1 Tratamentos computacionais ligados a Linguística Cognitiva ......................... 49 4.2 A rede semântica da FrameNet ........................................................................ 54 4.2.1 Tipos Semânticos ..................................................................................... 63 4.2.2 Anotação de relações metafóricas na FrameNet ...................................... 65 4.3 Ontologias ......................................................................................................... 66 4.3.1 Frames na Ciência da Computação .......................................................... 69 4.3.2 Ontologia na Ciência da Computação ...................................................... 73 4.3.3 Teoria, conceitos, relacionamentos e atributos de uma ontologia ........... 75 4.3.4 Classificação das ontologias .................................................................... 80 4.4 Alinhamento entre Ontologias e a FrameNet ................................................... 82 4.5 Limitações da FrameNet .................................................................................. 88 4.6 Benefícios da junção de Ontologias com a FrameNet ..................................... 90 5 METODOLOGIA ................................................................................................. 96 5.1 Corpus e campo de conhecimento .................................................................... 99 5.2 Procedimento de Anotação ............................................................................. 100 5.3 Anotação baseada na Ontologia SIMPLE-CLIPS .......................................... 103 5.4 Redes Bayesianas ........................................................................................... 111 6 DESCRIÇÃO DO EXPERIMENTO .................................................................. 114 6.1 O FRAMEWORK PROPOSTO ...................................................................... 114 6.2 Formalização .................................................................................................. 118 6.3 Comparação com a Formalização de Ovchinnikova ...................................... 125 6.4 Proposta de Alteração Metodológica ............................................................. 127 6.5 Aplicação da formalização ............................................................................. 129
Description: