As empresas geram a cada dia um volume muito grande de dados chegando a gerar mais do que 20 petabytes por dia como é o caso do Google. Este volume cresce rapidamente e existe a necessidade da análise dessa grande massa de dados.
As soluções de Big Data foram criadas para acelerar o processo de tomada de decisão, redução de custo e tempo de processamento dos servidores para entendimento do comportamento dos consumidores e necessidades das empresas.
Resolver problemas complexos de volumes cada vez maiores de dados (estruturados e não estruturados) é um grande desafio que necessita de ferramentas e técnicas de análises adequadas para a devida extração da informação.
O crescente volume de dados gerados atualmente implica na necessidade de processar e realizar a análise dos dados de maneira eficiente, rápida e simplificada. As aplicações criadas utilizando o framework Apache Spark atendem esses requisitos, uma vez que essas aplicações rodam 10-100 vezes mais rápido do que os trabalhos executados no Hadoop MapReduce, além de possibilitar o uso de diferentes linguagens de programação. Portanto, as empresas estão adaptando suas infraestruturas para essa tecnologia e buscando especialistas que dominem o desenvolvimento de soluções utilizando o Spark.
Este curso tem por objetivo, através do uso do Apache Spark e da linguagem de programação Python, realizar o processamento e análise de diversos conjuntos de dados, bem como entender o funcionamento dos componentes envolvidos neste framework de Big Data.
Perfil do Aluno
Profissionais das áreas: TI, Analytics, Engenharia de Computação, Analistas de Sistemas, Profissionais do Mercado que manipulam e precisam tomar rápidas decisões por meio de grandes bases de dados.
Metodologia
Este curso será baseado em casos reais e será realizada em programação Spark e Python.
Disciplinas
Engenharia de Dados I
Engenharia de Dados II
Coordenador
Profª. Drª. Alessandra de Ávila Montini
Apaixonada por dados e pela arte de lecionar, Alessandra Montini tem muito orgulho de ter criado na FIA cinco laboratórios para as aulas de Big Data e inteligência Artificial. Possui mais de 20 anos de trajetória nas áreas de Data Mining, Big Data, Inteligência Artificial e Analytics. Cientista de dados com carreira realizada na Universidade de São Paulo, Alessandra é graduada e mestra em estatística aplicada pelo IME-USP e doutora pela FEA-USP. Com muita dedicação, a profissional chegou ao cargo de professora e pesquisadora na FEA-USP, e já ganhou mais de 30 prêmios de excelência acadêmica pela FEA-USP e mais de 30 prêmios de excelência acadêmica como professora dos cursos de MBA da FIA. Orienta alunos de mestrado e de doutorado na FEA-USP. Membro do Conselho Curador da FIA, é coordenadora de grupos de pesquisa no CNPq, parecerista da FAPESP e colunista de grandes portais de tecnologia.
Apaixonada por dados e pela arte de lecionar, Alessandra Montini tem muito orgulho de ter criado na FIA cinco laboratórios para as aulas de Big Data e inteligência Artificial. Possui mais de 20 anos de trajetória nas áreas de Data Mining, Big Data, Inteligência Artificial e Analytics. Cientista de dados com carreira realizada na Universidade de São Paulo, Alessandra é graduada e mestra em estatística aplicada pelo IME-USP e doutora pela FEA-USP. Com muita dedicação, a profissional chegou ao cargo de professora e pesquisadora na FEA-USP, e já ganhou mais de 30 prêmios de excelência acadêmica pela FEA-USP e mais de 30 prêmios de excelência acadêmica como professora dos cursos de MBA da FIA. Orienta alunos de mestrado e de doutorado na FEA-USP. Membro do Conselho Curador da FIA, é coordenadora de grupos de pesquisa no CNPq, parecerista da FAPESP e colunista de grandes portais de tecnologia.