Tomada de Decisão Estratégica sobre Volumes Massivos de Dados
Ministrante(s):

Profa. Dra. Cristina Aguiar (ICMC/USP)

Resumo

Diversas aplicações comerciais atuais necessitam gerenciar gigantescos volumes de dados com o intuito de realizar a tomada de decisão estratégica, permitindo à empresa um planejamento rápido frente às mudanças nas condições do negócio, essencial na atual conjuntura de um mercado globalizado. O gigantesco volume de dados está diretamente relacionado ao contexto de big data, enquanto a tomada de decisão estratégica diz respeito ao uso analítico desses dados no contexto de business intelligence. Para oferecer suporte a essa demanda, neste curso são introduzidos conceitos, técnicas e ferramentas voltadas ao processamento analítico de dados. São detalhados conceitos de big data warehousing, cubo de dados e operações analíticas. Também são introduzidos o modelo de programação funcional MapReduce e as suas implementações amplamente utilizadas no mercado de trabalho, com destaque para Spark. Adicionalmente, são especificadas diferentes consultas analíticas voltadas à tomada de decisão estratégica usando PySpark, discutindo sua importância na tomada de decisão estratégica.

Bibliografia:

  • R. Kimball and M. Ross. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. Wiley, 2nd edition, 2002.
  • W. H. Inmon. Building the Data Warehouse. Wiley, 4th edition, 2005.
  • A. Vaismann and E. Zimányi. Data Warehouse Systems: Design and Implementation, 1st edition. Springer, 2014.
  • J. S. Damji, B. Wenig, T. Das, and D. Lee. Learning Spark: Lightning-Fast Data Analytics. O’Reilly, 2nd edition, 2020.
  • J. Dean and S. Ghemawat. MapReduce: Simplified Data Processing on Large Clusters. Communications of the ACM, v. 51, n. 1, p. 107-113, 2008.
  • Apache Spark. Disponível em: https://spark.apache.org/

Sobre a Ministrante

Cristina Aguiar possui graduação em Bacharelado em Ciência da Computação pela Universidade Federal de São Carlos (1992), mestrado em Ciência da Computação pela Universidade Estadual de Campinas (1995) e doutorado em Ciências da Computação pela Universidade Federal de Pernambuco (2002). Atualmente é professora doutora da Universidade de São Paulo. Tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados, atuando principalmente nos seguintes temas: procedência dos dados, integração dos dados, computação em nuvem, data warehousing, sistemas de informação geográficas, bancos de dados heterogêneos e distribuídos e bioinformática.

Currículo lattes: http://lattes.cnpq.br/8713285339065842

Não perca esta oportunidade!