ebook img

Análise bidirecional da língua na simplificação sintática em textos do português voltada à ... PDF

251 Pages·2013·1.35 MB·Portuguese
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Análise bidirecional da língua na simplificação sintática em textos do português voltada à ...

Análise bidirecional da língua na simplificação sintática em textos do português voltada à acessibilidade digital Arnaldo Candido Junior SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP Data de Depósito: Assinatura:______________________ Análise bidirecional da língua na simplificação sintática em textos do português voltada à acessibilidade digital Arnaldo Candido Junior Orientadora: Profa. Dra. Sandra Maria Aluísio Tese apresentada ao Instituto de Ciências Matemáticas e de Computação - ICMC-USP, como parte dos requisitos para obtenção do título de Doutor em Ciências - Ciências de Computação e Matemática Computacional. VERSÃO REVISADA USP – São Carlos Maio de 2013 Agradecimentos Em primeiro lugar, agradeço a Deus por esta oportunidade de estudo e desenvolvimento pessoal. Agradeço à Amanda, Arnaldo, Maria e Michelle assim como a toda a minha família pelos laços que foram criados e que não podem ser desfeitos. Agradeço à Sandra Maria Aluísio, pela orientação exemplar, pela paciência e pela dedicação nos últimos dois anos. Agradeço à Ann Copestake pela oportunidade de estudo e desenvolvimento junto ao projeto Delphin. Agradeço aos amigos da Link House Trust, Ammy, Ary, Arijita, Avradeep, Christian, Daniela, Diana, Helen, Julien, Kent, Lily, Pilar, Thomas, Tierry, Sonya, William, Yvette, e todos os demais; aos trustees e wardens, em particular a Lil e Mel Robson e Shirley pelo acolhimento. Agradeço aos amigos “das antigas” de São Carlos: Ariani, Carolina, Caroline, Eliane, Evandra, Eloize, Fernando, Erick, Jefferson, Lucia, Marco, Marcelo, Pedro; assim como os novos amigos Fernando, Jhonata, Lianet, Marcio, Takeu, e aos recém-chegados do laboratório; e todos os demais pela convivência e amizade. Agradeço aos professores do NILC Gladis, Graça, Oto, Thiago e todos os outros, pelo exemplo e pela orientação. Agradeço a todos os colegas de mestrado, aos amigos do ICMC e da USP em geral. Agradeço à FAPESP (processo 2008/08963-4), ao CNPq (201407/2010-8) e à CAPES (DS-3680951/D) por terem permitido o desenvolvimento do trabalho financiando a pesquisa em diferentes períodos. Agradeço a todas as pessoas não foram mencionadas nestas palavras mais do que breves, mas que foram e são pessoas importantes na minha vida. Pedi, e dar-se-vos-á; buscai, e encontrareis; batei, e abrir-se-vos-á. Porque, todo aquele que pede, recebe; e, o que busca, encontra; e, ao que bate, abrir-se-lhe-á. Mateus 7:7–12 Resumo O Processamento de Línguas Naturais é uma área interdisciplinar cujas pesquisas podem ser divididas em duas grandes linhas: análise e síntese da língua. Esta pesquisa de doutorado traz contribuições para ambas. Para a análise da língua, um modelo integrativo capaz de unir diferentes níveis linguísticos é apresentado e avaliado em relação aos níveis morfológico, (incluindo subníveis léxico e morfossintático), sintático e semântico. Enquanto análises tradicionais são feitas dos níveis mais baixos da língua para os mais altos, em uma estratégia em cascata, na qual erros dos níveis mais baixos são propagados para os níveis mais altos, o modelo de análise proposto é capaz de unificar a análise de diferentes níveis a partir de uma abordagem bidirecional. O modelo é baseado em uma grande rede neural, treinada em córpus, cujos padrões de treinamento são extraídos de tokens presentes nas orações. Um tipo de recorrência denominado coativação é aplicado no modelo para permitir que a análise de um padrão modifique e seja modificada pela análise de outros padrões em um mesmo contexto. O modelo de análise permite investigações para as quais não foi originalmente planejado, além de apresentar resultados considerados satisfatórios em lematização e análise morfossintática, porém ainda demandando aprimoramento para a tarefa de análise sintática. A ferramenta associada a esse modelo permitiu investigar a recorrência proposta e a interação bidirecional entre níveis da língua, incluindo seus subníveis. Experimentos para coativação e bidirecionalidade foram realizados e considerados satisfatórios. Para a área de síntese da língua, um modelo de simplificação sintática, tarefa considerada como adaptação de texto para texto, baseado em regras manuais é aplicado em textos analisados sintaticamente, tendo como objetivo tornar os textos sintaticamente mais simples para leitores com letramento rudimentar ou básico. A ferramenta associada a esse modelo permitiu realizar simplificação sintática com medida-f de 77,2%, simplificando aproximadamente 16% de orações em textos do gênero enciclopédico.

Description:
definidas no manual do projeto PorSimples, para a Língua Portuguesa. O Sinsim foi gramáticas lexicalizadas, como mostrado no Exemplo 2.4 para a oração “A IBM comprou a. Lotus” . quais usa-se a saída das ativações da análise morfológica como parte dos atributos de entrada da análise
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.