Cobrimos alguns fundamentos e armadilhas da análise de dados em nossos posts anteriores. Nesta postagem do blog, nos concentramos nos quatro tipos de análise de dados que encontramos na ciência de dados: Descritiva, Diagnóstica, Preditiva e Prescritiva.
Quando converso com jovens analistas que estão entrando em nosso mundo da ciência de dados, frequentemente pergunto o que eles acham que é a habilidade mais importante do cientista de dados. Suas respostas foram bastante variadas.
Minha mensagem para eles é que sua habilidade mais importante será a capacidade de traduzir dados em percepções que sejam claras e significativas para um não-quant. O estatístico sueco Hans Rosling é famoso por isso. É uma habilidade muitas vezes esquecida. O seguinte TedTalk de Hans Rosling lança alguma luz:
Sobre esse tema, valeria a pena revelar algumas das ferramentas usadas para ajudar as pessoas a entender a função da análise para ajudar a desenvolver percepções valiosas. Uma dessas ferramentas é o paradigma quadridimensional de analítica.
De forma simplista, a análise pode ser dividida em quatro categorias principais. Vou explicar esses quatro em mais detalhes abaixo.
1. Descritivo: O que está acontecendo?
Este é o mais comum de todos os formulários. Nos negócios, ele fornece ao analista uma visão das principais métricas e medidas dentro do negócio.
Um exemplo disso poderia ser uma declaração mensal de lucros e perdas. Da mesma forma, um analista pode ter dados sobre uma grande população de clientes. Compreender as informações demográficas de seus clientes (por exemplo, 30{6fe806ed0149b39de755432bb5e5be210830c855186440c904e927e4b30be9be} de nossos clientes são autônomos) seria classificado como “análise descritiva”. A utilização de ferramentas de visualização eficazes aprimora a mensagem da análise descritiva.
2. Diagnóstico: Por que isso está acontecendo?
Esta é a próxima etapa de complexidade na análise de dados é a análise descritiva. Na avaliação dos dados descritivos, as ferramentas de diagnóstico analítico capacitarão um analista a fazer uma pesquisa detalhada e, assim, isolar a causa raiz de um problema.
Painéis de informações de negócios (BI) bem projetados que incorporam a leitura de dados de série temporal (ou seja, dados em vários pontos sucessivos no tempo), filtros e recursos de detalhamento permitem essa análise.
3. Preditivo: O que provavelmente acontecerá?
A análise preditiva tem tudo a ver com previsões. Seja a probabilidade de um evento acontecer no futuro, a previsão de uma quantidade quantificável ou a estimativa de um ponto no tempo em que algo pode acontecer – tudo isso é feito por meio de modelos preditivos.
Os modelos preditivos normalmente utilizam uma variedade de dados variáveis para fazer a previsão. A variabilidade dos dados do componente terá uma relação com o que é provável prever (por exemplo, quanto mais velha uma pessoa, mais suscetível a um ataque cardíaco – diríamos que a idade tem uma correlação linear com o risco de ataque cardíaco) . Esses dados são então compilados juntos em uma pontuação ou previsão.
Em um mundo de grande incerteza, ser capaz de prever permite tomar decisões melhores. Os modelos preditivos são alguns dos mais importantes utilizados em vários campos.
4. Prescritivo: O que eu preciso fazer?
O próximo passo em termos de valor e complexidade é o modelo prescritivo. O modelo prescritivo utiliza uma compreensão do que aconteceu, por que aconteceu e uma variedade de análises de “o que pode acontecer” para ajudar o usuário a determinar o melhor curso de ação a ser executado. A análise prescritiva normalmente não envolve apenas uma ação individual, mas é, na verdade, uma série de outras ações.
Um bom exemplo disso é um aplicativo de trânsito que ajuda você a escolher o melhor trajeto para casa e levando em consideração a distância de cada trajeto, a velocidade com que se pode viajar em cada estrada e, principalmente, as atuais restrições de tráfego.
Outro exemplo pode ser a produção de um horário de exame de forma que nenhum aluno tenha horários conflitantes.
Conclusão
Embora diferentes formas de análise possam fornecer valores variados para uma empresa, todas elas têm seu lugar.