Universidade Federal de Santa Catarina Programa de Pós-Graduação em Engenharia de Produção Denilson Sell UMA ARQUITETURA PARA BUSINESS INTELLIGENCE BASEADA EM TECNOLOGIAS SEMÂNTICAS PARA SUPORTE A APLICAÇÕES ANALÍTICAS Florianópolis 2006 Denilson Sell UMA ARQUITETURA PARA BUSINESS INTELLIGENCE BASEADA EM TECNOLOGIAS SEMÂNTICAS PARA SUPORTE A APLICAÇÕES ANALÍTICAS Tese apresentada ao Programa de Pós- Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina para obtenção do título de Doutor em Engenharia de Produção Orientador: Prof. Roberto Carlos dos Santos Pacheco, Dr. Florianópolis 2006 FICHA CATALOGRÁFICA S467u Sell, Denilson Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas. / Denilson Sell. 210 f. : il Tese (doutorado) - Universidade Federal de Santa Catarina. Programa de Pós-graduação em Engenharia de Produção. Florianópolis, 2006. iii iv À Graciele v AGRADECIMENTOS Desejo manifestar minha enorme gratidão às pessoas que contribuíram direta e indiretamente para a realização deste trabalho. Primeiramente a Deus, que sempre me deu forças e iluminou o meu caminho. Por ter me acompanhado, por ter me dado a vida, saúde, bons amigos, uma ótima família e uma esposa maravilhosa. Ao meu mentor, professor Roberto Pacheco, que contribuiu muito para o desenvolvimento do trabalho e para a minha formação como pessoa e pesquisador. Aos grandes amigos, do Instituto Stela, que acompanharam e contribuíram para o meu trabalho, em especial ao pessoal das células de documentação e de business intelligence. À minha família, que mesmo acompanhando a minha luta de longe, foi fundamental para o meu triunfo. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pelo financiamento parcial do presente estudo. Ao Knowledge Media Institute (KMi) e The Open University pela acolhida, em especial, ao professor Enrico Motta, pelo grande apoio e incentivo. E, em especial, a quem dedico este trabalho, minha esposa Graciele Sell, pela compreensão, carinho, apoio e incentivo. vi SUMÁRIO 1 INTRODUÇÃO............................................................................................1 1.1 Apresentação.............................................................................................................................1 1.2 Caracterização do problema..................................................................................................5 1.2.1 Suporte para representação e utilização da semântica do negócio no apoio ao processamento analítico......................................................................................................................6 1.2.2 Extensão de Funcionalidades Exploratórias e Recomendação de Funcionalidades durante o Processo Decisório.............................................................................................................9 1.3 Pressuposto da Pesquisa.....................................................................................................13 1.4 Objetivos...................................................................................................................................13 1.4.1 Objetivo Geral.......................................................................................................................13 1.4.2 Objetivos Específicos...........................................................................................................14 1.5 Justificativa...............................................................................................................................15 1.6 Delimitação do Escopo..........................................................................................................17 1.7 Metodologia..............................................................................................................................18 1.8 Estrutura do Trabalho............................................................................................................20 2 BUSINESS INTELLIGENCE.....................................................................22 2.1 Introdução.................................................................................................................................22 2.2 Sistemas de Informação........................................................................................................22 2.2.1 Classificação de Sistemas de Informação........................................................................23 2.3 Soluções de Business Intelligence....................................................................................25 2.3.1 Definição................................................................................................................................25 2.3.2 Componentes de uma Arquitetura Típica de BI...............................................................27 2.4 Data Warehouse......................................................................................................................28 2.4.1 Definições, objetivos e características..............................................................................28 2.4.2 Modelagem de Dados em um Data Warehouse..............................................................29 2.5 Área de Apresentação............................................................................................................31 2.6 OLAP..........................................................................................................................................32 2.6.1 Definição................................................................................................................................32 2.6.2 Características do processamento OLAP.........................................................................34 2.6.3 Funcionalidades exploratórias............................................................................................36 2.6.4 Metadados para o suporte de funcionalidades analíticas..............................................38 2.7 A Metodologia BUS para Projetos de BI...........................................................................40 2.8 Limitações das Soluções Correntes de BI.......................................................................42 2.9 Considerações sobre o Capítulo.........................................................................................43 vii 3 TECNOLOGIAS SEMÂNTICAS...............................................................46 3.1 Introdução.................................................................................................................................46 3.2 Web Semântica........................................................................................................................46 3.2.1 Definição................................................................................................................................46 3.2.2 Camadas da Web Semântica.............................................................................................47 3.3 Ontologia...................................................................................................................................49 3.3.1 Definição................................................................................................................................49 3.3.2 Níveis de Representação....................................................................................................50 3.3.3 Tipos de Ontologias.............................................................................................................52 3.3.4 Formalismos para Representação de Ontologias...........................................................53 3.3.5 OCML.....................................................................................................................................53 3.4 Web services Semânticos.....................................................................................................56 3.4.1 Definição e Motivações........................................................................................................56 3.4.2 Frameworks para Web services Semânticos...................................................................57 3.4.3 IRS-III.....................................................................................................................................58 3.5 Aplicação de Tecnologias Semânticas no Domínio de BI............................................60 3.6 Aplicação de Tecnologias Semânticas para Suporte de Aplicações Analíticas....61 3.7 Considerações sobre o Capítulo.........................................................................................64 4 ARQUITETURA SEMANTIC BUSINESS INTELLIGENCE (SBI).............66 4.1 Introdução.................................................................................................................................66 4.2 Revisão dos Requisitos Funcionais para Arquiteturas de BI......................................66 4.3 Identificação de Requisitos não Funcionais para Arquiteturas de BI.......................71 4.4 Visão Geral da Arquitetura SBI............................................................................................72 4.5 A Camada Fontes de Dados.................................................................................................73 4.6 A Camada Repositórios de Ontologias.............................................................................74 4.7 A Camada Mecanismos de Inferência................................................................................75 4.8 A Camada Módulos Funcionais...........................................................................................76 4.9 A Camada Aplicações Clientes...........................................................................................77 4.10 O Processo de Desenvolvimento da Arquitetura SBI....................................................77 4.11 Considerações sobre o Capítulo.........................................................................................80 5 A EPISTEMOLOGIA DA ARQUITETURA................................................82 5.1 Introdução.................................................................................................................................82 5.2 Ontologia do Domínio............................................................................................................82 5.3 Ontologia BI..............................................................................................................................86 5.3.1 Mapeando dados do Data Warehouse aos conceitos do negócio................................87 viii 5.3.2 Realizando cortes semânticos nas análises.....................................................................94 5.3.3 Personalização da nomenclatura para a apresentação das informações...................95 5.3.4 Descrevendo semanticamente as análises criadas pelos usuários..............................97 5.3.5 Descrevendo temas de análise........................................................................................101 5.4 Ontologia de Serviços..........................................................................................................104 5.4.1 Descrevendo Web services na Ontologia de Serviços.................................................106 5.4.2 Suporte para Composição de Serviços...........................................................................109 5.5 Considerações sobre o Capítulo.......................................................................................118 6 OS MÓDULOS FUNCIONAIS DA ARQUITETURA SBI........................120 6.1 Introdução...............................................................................................................................120 6.2 Gerenciador de Ontologias.................................................................................................120 6.3 Gerenciador de Serviços.....................................................................................................125 6.3.1 Classes para localização e execução de WSS..............................................................127 6.3.2 Classes para montagem e execução de composições.................................................130 6.4 Gerenciador de Análises.....................................................................................................135 6.4.1 Suporte para a definição de análises..............................................................................137 6.4.2 Realizando cortes semânticos e reescrevendo análises..............................................140 6.4.3 Recomendação de análises..............................................................................................146 6.5 Considerações sobre o Capítulo.......................................................................................147 7 DEMONSTRAÇÃO DE VIABILIDADE E ANÁLISE COMPARATIVA....150 7.1 Apresentação.........................................................................................................................150 7.2 A ferramenta OntoDSS........................................................................................................150 7.2.1 Cenário de aplicação.........................................................................................................150 7.2.2 Os módulos da ferramenta OntoDSS..............................................................................153 7.2.3 Módulo de definição de análises......................................................................................154 7.2.4 Módulo de assistência à análise......................................................................................157 7.2.5 Módulo de composição de Web services semânticos..................................................162 7.3 Análise sobre a flexibilidade da Arquitetura SBI..........................................................166 7.4 Análise sobre o desempenho das inferências no protótipo utilizando o mecanismo de inferência OCML......................................................................................................172 7.5 Comparação entre a arquitetura SBI, iniciativas acadêmicas relacionadas e soluções comerciais...........................................................................................................................177 7.6 Considerações sobre o Capítulo.......................................................................................186 8 CONSIDERAÇÕES FINAIS....................................................................189 8.1 Trabalhos futuros..................................................................................................................192 REFERÊNCIAS BIBLIOGRÁFICAS..............................................................195 ix Lista de Ilustrações Figura 1 - Representação da metodologia utilizada no trabalho......................20 Figura 2 - Níveis do Conhecimento..................................................................23 Figura 3 – Arquitetura típica de uma solução de Business Intelligence ...........28 Figura 4 - Exemplo de modelo-estrela .............................................................30 Figura 5 - Exemplo de estrutura pai-filho como metadado para a definição de hierarquias em uma dimensão de produtos.....................................................40 Figura 6 - A Metodologia BUS..........................................................................41 Figura 7 - Estruturação das camadas da Web semântica................................47 Figura 8 - Arquitetura do IRS-III.......................................................................59 Figura 9 - Arquitetura SEWASIE......................................................................62 Figura 10 - Arquitetura Proposta por Priebe e Pernul (2003)...........................63 Figura 11 - Ilustração dos Módulos da Arquitetura Proposta ...........................73 Figura 12 – Adição das etapas de desenvolvimento específicas da Arquitetura SBI a Metodologia BUS....................................................................................80 Figura 13 - Ilustração de conceitos associados à gestão de C&T representados na Ontologia do Domínio..................................................................................83 Figura 14 - Visão geral dos principais elementos reunidos na Ontologia BI ....87 Figura 15 – Identificação dos elementos de uma análise.................................97 Figura 16 - Etapas da Metodologia do Instituto Stela para Projeto da Área de Apresentação de Soluções de BI...................................................................102 Figura 17 - Apresentação das Unidades de Análise, Filtros e de Conteúdo na Ferramenta Plano Tabular..............................................................................103 Figura 18 - Hierarquia de componentes no modelo de composição de WSS da Arquitetura SBI...............................................................................................110 Figura 19 - Exemplo de composição de serviços para uma análise de indicadores de instituições.............................................................................113 Figura 20 - Ilustração das classes que compõem o módulo Gerenciador de Ontologias......................................................................................................124 Figura 21 - Ilustração do processo de comparação de conceitos..................125 Figura 22 - Ilustração da interface principal do Gerenciador de Serviços, sua implementação para o framework IRS-III e classes de suporte.....................127 Figura 23 - Ilustração das classes utilizadas para a definição de uma composição....................................................................................................131 Figura 24 - Ilustração das classes utilizadas para a definição de Control Components, Service Components e Mediators em uma composição..........134 Figura 25 - Fluxo de processamento em um Service Component..................135
Description: