Departamento de Informática e Estatística

Programas de Ensino
Visitante (Entrar)

Programa de Ensino 20202

Aprovado pelo Departamento em: 10-12-2020

  1. Identificação: Visualizar em PDF
    • Disciplina: INE5643 - Data Warehouse
    • Carga horária: 72 horas-aula      Teóricas: 48      Práticas: 24
    • Período: 2º semestre de 2020 até a presente data
  2. Curso(s):
    • Ciências da Computação (208)
    • Engenharia, áreas Elétrica e Mecânica, habilitação Controle e Automação (220)
    • Sistemas de Informação (238)
  3. Requisito(s):
    • Ciências da Computação (208)
      • INE5417 - Engenharia de Software I
    • Sistemas de Informação (238)
      • INE5616 - Bancos de Dados II
      • INE5616 - Bancos de Dados II
  4. Ementa:
    • Conceitos básicos. Os Ecossistemas de Informação. O Ciclo de Vida do DW: Planejamento e Administração, Levantameto de Requisitos, Modelagem Dimensional, Projeto Físico, o Back-Room e o Froon-Room, Metadados, Arquiteturas, Implementação, Segurança e Internet. Implantação, Suporte e Treinamento.
  5. Objetivo(s):
    • Geral: Fornecer conhecimentos teóricos e práticos sobre data warehouses e tendências recentes como data lakes e ciência de dados, habilitando o aluno a aplicar os conhecimentos obtidos na concepção, construção e operação de Data Warehouses, data marts e data lakes para análise de informação.
    • Específicos:
      1. Assimilar os principais conceitos acerca da tecnologia de Data Warehouse (DW);
      2. Compreender as principais metodologias de desenvolvimento de DW;
      3. Conhecer e saber aplicar a modelagem dimensional (esquemas estrela e floco de neve);
      4. Aprender a implementar processos de Extração, Transformação e Carga de Dados (ETL/ELT).
      5. Saber efetuar análises de dados com Processamento Analítico OnLine (OLAP).
      6. Compreender o estado da arte e as tendências atuais em data warehouses, data lakes e análise de dados, utilizando inclusive algumas técnicas e ferramentas da ciência de dados.
  6. Conteúdo Programático:
    • Introdução [8 horas-aula]
      • Dos dados a informação.
    • A Evolução dos SADs [4 horas-aula]
      • Histórico
      • SGDBs e Sistemas transacionais
    • Ecossistemas de Informação [8 horas-aula]
      • Business Intelligence
      • Business Managment
      • Business Operacional
    • O Ciclo de Vida do DW [16 horas-aula]
      • Planejamento do DW
        • Escopo do projeto
        • Plano do projeto
      • Administração
      • Definição de requisitos
      • Questionários para entrevistas e sessões coordenadas
    • Modelagem Dimensional [8 horas-aula]
      • Passos para construção do esquema estrela
      • Técnicas básicas
      • Técnicas avançadas
    • Back Room (ETL) [4 horas-aula]
      • Extração, Transformação e Carga
      • Área de estagiamento
      • Ferramentas open source
    • Front Room (OLAP) [8 horas-aula]
      • Rolap, Molap, Holap, Dolap e Wolap
      • Ferramentas e seu uso
    • Projeto Final [16 horas-aula]
  7. Bibliografia Básica:
    • KIMBALL, Ralph. The data warehouse lifecycle toolkit: expert methods for designing, developing, and deploying data warehouses. 2nd edition. New York: John Wiley & Sons, 2011. 672p. ISBN 978-1-118-07956-0
  8. Bibliografia Complementar:
    • INMON, Willian H. Builging the data warehouse. 3rd ed New York: J. Wiley, c2002. 412p. ISBN 0471081302 (1 exemplar na BU)
    • KIMBALL, Ralph. The data warehouse lifecycle toolkit: expert methods for designing, developing, and deploying data warehouses. New York: John Wiley & Sons, c1998. 771p. ISBN 0471255475 (4 exemplares na BU)
    • KIMBALL, R. & ROSS, M. The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. Second Edition, John Wiley & sons, Inc., New York, 2002.
    • GOLFARELLI, M. & RIZZI, S. Data Warehouse Design: Modern Principles and Methodologies (1st. ed.). McGraw-Hill, Inc., USA, 2009.
    • MOSS, L. T. & ATRE, S. Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support Applications. Boston, MA - Addison-Wesley Information Technology Series, 2003. ISBN: 0201784203
    • MACHADO, F. N. Tecnologia e projeto de Data Warehouse: uma visão multidimensional. São Paulo: Érica, 2004.
    • TURBAN, E.; SHARDA, R.; ARONSON, J.; KING, D. BUSINESS INTELLIGENCE: um enfoque gerencial para a inteligência do negócio. Porto Alegre: Bookman, 2009.
    • SHARMA, B. Architecting Data Lakes, 2nd Edition, O'Reilly Media, Inc. 2018. ISBN: 9781492032991
    • GORELIK, A. The Enterprise Big Data Lake, O'Reilly Media, Inc., 2019. ISBN: 9781491931554.
    • LAURENT, A.; LAURENT, D.; MADERA, C. Data Lakes, Volume 2. Wiley 2020. Print ISBN:9781786305855 Online ISBN:9781119720430.