Publicado em 25/05/2020
Analytics e Big Data são duas coisas diferentes e, frequentemente, confundidas até mesmo nas comunidades técnicas. Big Data é o termo técnico que refere-se ao tratameto de grandes conjuntos de dados que necessitam de transformação e armazenamento. Quanto que, Data Analytics (não confunda com Business Intelligence que depende do Data Analytics para seus processos) permite a entrega dessa informação de forma que possam ser analisadas e comprendidas pelas áreas de negócio.
Data Analytics é o processo de analisar informações (dados¹) com um propósito específico, e sem o risco do clichê, é estudar o passado para prever o futuro. Data Analytics entre outras palavras é reunião de dados, higienização e consolidação dos mesmo para que possam ser analisados e exibidos através de gráficos, dashboards entre outros.
E, falar de visualização em dados e não citar Florence Nightingale é o mesmo que falar da história da computação sem mencionar a importância de Alan Turing, então vamos com um pouco de história...
Florence foi uma enfermeira britânica que cuidava de doentes carentes durante a Guerra da Crimeia e se revoltou com a situação precária e mortalidade alta desses pacientes. Entre os anos de 1854 e 1856 ela reuniu dados nos hospitais e começou a elaborar os resultados em gráfico setorial, o famoso gráfico de pizza. Florence conseguiu uma audiência com a rainha para mostrar-lhe a pesquisa e sabia que a monarca teria pouco tempo para entender e analisar os números então utilizou a representação gráfica conhecida como Diagrama de Florence (ou a Rosa de Florence imagem²) para exibir o resultado de suas coletas. Florence dizia que o diagrama deveria atingir os olhos, coisa que um monte de palavras e números jamais conseguiriam. Para a época a utilização de gráficos para demonstrar análises estatísticas era algo extremamente inovador.
E o que é Big Data, afinal?
Big Data é uma nova abordagem no tratamento do volume de dados que cresce exponencialmente nos dias atuais; essa abordagem leva em consideração o que chamamos dos 5V's do Big Data: o Volume, a Velocidade, a Variedade, a Veracidade e o Valor.
Conforme a seguir:
• Volume: diariamente produzimos um número absurdo de dados, pensem na quantidade de troca de e-mails (pessoais e corporativos), transações bancárias, publicações em redes sociais, registro de chamadas telefônicas e chats, entre outros.
• Velocidade: atualmente os dados são analisados somente após serem armazenados (espera-se num futuro próximo que isso ocorra real time). Agora, o quão rápido consigo consumir, higienizar, armazenar e gerar análises?
• Variedade: de quantas fontes diferentes podemos recuperar a informação? Redes sociais, arquivos textos, planilhas eletrônicas, imagens, etc. E de quais formas conseguimos armazenar? Dados estruturados, semiestruturados e não estruturados (assuntos para outra postagem!).
• Veracidade: O quão os dados que consumimos são confiáveis? E aqui precisamos observar alguns pontos: confiança nas fontes das informações, confiança no processo de carga e transformações, adequação às normas legislativas governamentais e de compliance das empresas.
• Valor: O quão os dados gerados podem agregar valor ao negócio? O quão estão aderentes aos processos? O quanto pode apoiar em estratégias competitivas? As respostas às essas questão, individualmente e fortemente orientado ao negócio do cliente identificam o valor dos dados armazenados.
Então...
Data Analytisc e BI são:
- Processos pré-definidos de análise das informações para o negócio;
- Limpeza, organização e consolidação de dados para entrega aos usuários de negócio – independente do conhecimento técnico;
- Porção de ferramentas de BI que permitem a visualização e análise de dados e/ou resultados, como a criação de dahsboards.
Big Data é:
- Armazenamento de grandes volumes e variedades de dados (imagens, arquivos, bancos de dados);
- Reunião de porções de dados recuperados de diferentes fontes de informação e acumulado de diversas formas e em N períodos;
- Técnicas e softwares para tratamento de grandes volumes que as ferramentas de ETLs tradicionais não suportam;
O que define se um processo deve utilizar Big Data ou Data Analytics é a necessidade do negócio, por exemplo: a solução precisa manipular uma grande quantidade de dados e entregá-los rapidamente? Se sim, sua solução precisa ser Big Data. Mas mesmo para esse cenário é preciso analizar o budget do cliente; o mesmo deve ser levado em consideração se a resposta a nossa pergunta for Não, imagine que o cliente não precisa, mas quer uma processamento rápido da suas informações para tê-las a mão quando necessário.
Outro ponto que devemos levar em consideração é que o Big Data permite análises mais granulares, ou seja, com maior riqueza de detalhes, que em carga de volumes menores não seria possível.
Por fim, esses e diversos outros fatores devem ser mapeados para análise e tomada de decisão das tecnologias que serão utilizadas.
E quais ferramentas utilizar?
E para finalizar, não podemos deixar de falar sobre como implementar Big Data ou Data Analytics; existe uma gama enorme de ferramentas disponíveis no mercado, com recursos e valores diferentes. O ideal é entender (através de mapeamentos e entrevistas com o cliente) a necessidade da aplicação para guiar a escolha.
A imagem a seguir do artigo sobre DATA & AI LANDSCAPE 2019 de 16 de julho de 2019³ e ilustra ferramentas disponíveis, e de conhecimento público, até a data da publicação:
Espero ter esclarecido as diferenças entre os termos BI x Big Data, e nos vemos no próximo artigo.
Grata!
¹ Dado é a menor unidade de medida de uma informação
² Florence Museum: www.florence-nightingale.co.uk
³ Fonte da imagem: http://mattturck.com/data2019