24 jun 20
O que é data mining e como pode ser uma ferramenta para seu futuro?
É difícil imaginar uma empresa antenada que não utilize o data mining (mineração de dados). Por isso saber o que é data mining é fundamental para um profissional de 2020, especialmente os futuros gestores.
A palavra “data” (em inglês) está na moda e saber como usar os dados e as informações que eles geram pode criar uma vantagem competitiva. O Big Data é justamente isso: a capacidade de armazenar uma enorme quantidade de informações criadas e tirar algo disso.
O “minerador” nesse caso é um asset que qualquer empresa adoraria ter, já que ele pode atacar esse banco de dados e extrair informações. Com elas é possível gerar soluções, levantar problemas, apontar tendências, indicar erros.
Agora que a importância do data mining ficou clara, vamos ao assunto.
O que é data mining?
Data são os dados, as informações que são geradas por toda pessoa, empresa, atividade etc. Mining é a “mineração” desses dados. Separar o joio do trigo, o que importa do que não importa.
Com a internet e todos os sistemas integrados que temos, uma pessoa em uma rede social, por exemplo, gera muitos gigabytes de informações. Nem tudo é relevante. Mas muita coisa pode ser.
Passando para o mundo das empresas, o data mining pode ajudar a criar padrões sobre os pedidos dos clientes. Ou o uso que eles fazem de seus produtos e outras respostas dadas em pesquisas de opinião.
Uma loja de comércio eletrônico pode monitorar o comportamento de seus usuários e ter informações valiosas em mãos. Um minerador de dados pode descobrir, analisando os acessos e compras diárias nos últimos cinco anos, se um visitante está mais inclinado a comprar em uma sexta do que em uma quarta, por exemplo.
As possibilidades são infinitas, assim como seus usos. E tanto pequenas como grandes empresas podem se beneficiar das informações que são geradas.
Antes de aprofundar mais no tema, é interessante apontar diferenças. Por exemplo, data mining e data analysis não são a mesma coisa.
Data analysis tem como foco testar modelos e hipóteses para chegar em resultados. Já data mining visa descobrir dados importantes e padrões de comportamento em grandes quantidades de informações.
Ou seja, são ações diferentes que podem ser realizadas dentro do campo do Big Data.
O processo de data mining é dependente da tecnologia. São máquinas as encarregadas de processar a enorme quantidade de informação. Algoritmos de inteligência artificial e machine learning vão ajudar nessa mineração.
Cabe ao profissional fazer a análise dessa mineração, interpretar as informações e apresentá-las para os líderes das respectivas áreas e da empresa.
Por isso é importante que além de uma base teórica em estatística, ou na área de ciência de dados, o profissional também tenha formação em administração, economia, engenharia, entre outras. Assim é possível participar do processo de data mining e ter o conhecimento para saber como lidar com a informação e traçar planos e estratégias.
Caso você tenha se interessado, confira o curso de pós-graduação de Análise de Dados, Data Mining e Inteligência Artificial da FIA para notar como os conhecimentos se encontram e é possível ter perfil completo para atuar nessas áreas.
Técnicas e Etapas do Processo de Data Mining
Não é possível explicar o que é data mining sem falar das técnicas usadas e as etapas do processo.
Primeiro, as etapas. O planejamento inicial é fundamental: saber qual é o objetivo do processo de mineração de dados, quais metas podem ser colocadas ao longo do caminho e o quê analisar.
Segundo, onde analisar. É preciso saber qual é a fonte desses dados. Por exemplo, caso você queira dados sobre o tráfego de pessoas para saber onde abrir uma loja que depende de público, é preciso ter os números coletados pela prefeitura da cidade.
Moradores do bairro, uso de transporte público, número de lojas na região, tudo isso pode fazer parte do seu processo de data mining. São grandes quantidades de informações que podem ser filtradas.
A modelagem, avaliação e apresentação desses dados são etapas fundamentais e finais. Como exibir esses dados? Mapas de calor? Gráficos?
Nesse momento que entram as técnicas do data mining. Uma delas é chamada clusterização. Um termo mais acessível pode ser agrupamento de dados e serve para criar um padrão e colocá-lo em um grupo.
A plataforma Datafloq separou sete exemplos do uso de clustering no nosso dia a dia. Uma delas é o filtro de spam.
Os serviços de email usam um robô para analisar o título do email, quem envia o email e seu conteúdo. Esse robô agrupa em categorias e filtra, rejeitando o que parece ser spam. Com a técnica de clustering, a eficácia do filtro aumenta para 97%.
Outra técnica é a árvore de decisão. O termo denuncia o formato da apresentação dos dados. Você pode conferir exemplos neste texto.
Por que data mining é uma ferramenta para seu futuro?
Um bom gestor toma decisões baseado em informações, dados e modelos. Intuição e palpite não são argumentos finais para optar por uma alternativa e rejeitar outra. Ainda mais quando essa decisão envolve muitas pessoas e possivelmente milhões de reais.
Conseguir ter acesso a dados, fazer o data mining e assim criar modelos visuais e ter insights sobre a operação de seu negócio é uma vantagem imensa.
Isso pode ser aplicado a muitos campos: finanças, saúde, segurança, comércio em geral, energia, pesquisa científica, gestão de empresas e muitos outros.
E não só para entender sua empresa. É possível fazer excelentes trabalhos de benchmarking para monitorar o mercado e entender oportunidades que você não está aproveitando. Portanto, ao pensar na sua carreira após a graduação, o caminho do big data e data mining é uma excelente opção. Para saber mais sobre o assunto confira o post que fizemos no blog da FIA sobre o assunto e navegue pelos cursos da Fundação Instituto de Administração.