Big Data X Data Analytics

Publicado em 25/05/2020

Analytics e Big Data são duas coisas diferentes e, frequentemente, confundidas até mesmo nas comunidades técnicas. Big Data é o termo técnico que refere-se ao tratameto de grandes conjuntos de dados que necessitam de transformação e armazenamento. Quanto que, Data Analytics (não confunda com Business Intelligence que depende do Data Analytics para seus processos) permite a entrega dessa informação de forma que possam ser analisadas e comprendidas pelas áreas de negócio.

 

Data Analytics é o processo de analisar informações (dados¹) com um propósito específico, e sem o risco do clichê, é estudar o passado para prever o futuro. Data Analytics entre outras palavras é reunião de dados, higienização e consolidação dos mesmo para que possam ser analisados e exibidos através de gráficos, dashboards entre outros.

E, falar de visualização em dados e não citar Florence Nightingale é o mesmo  que falar da história da computação sem mencionar a importância de Alan Turing, então vamos com um pouco de história...

 

Florence foi uma enfermeira britânica que cuidava de doentes carentes durante a Guerra da Crimeia e se revoltou com a situação precária e mortalidade alta desses pacientes. Entre os anos de 1854 e 1856 ela reuniu dados nos hospitais e começou a elaborar os resultados em gráfico setorial, o famoso gráfico de pizza. Florence conseguiu uma audiência com a rainha para mostrar-lhe a pesquisa e sabia que a monarca teria pouco tempo para entender e analisar os números então utilizou a representação gráfica conhecida como Diagrama de Florence (ou a Rosa de Florence imagem²) para exibir o resultado de suas coletas. Florence dizia que o diagrama deveria atingir os olhos, coisa que um monte de palavras e números jamais conseguiriam. Para a época a utilização de gráficos para demonstrar análises estatísticas era algo extremamente inovador.

E o que é Big Data, afinal?

Big Data é uma nova abordagem no tratamento do volume de dados que cresce exponencialmente nos dias atuais; essa abordagem leva em consideração o que chamamos dos 5V's do Big Data: o Volume, a Velocidade, a Variedade, a Veracidade e o Valor.

Conforme a seguir:
 

Volume: diariamente produzimos um número absurdo de dados, pensem na quantidade de troca de e-mails (pessoais e corporativos), transações bancárias, publicações em redes sociais, registro de chamadas telefônicas e chats, entre outros. 
Velocidade: atualmente os dados são analisados somente após serem armazenados (espera-se num futuro próximo que isso ocorra real time). Agora, o quão rápido consigo consumir, higienizar, armazenar e gerar análises? 

Variedade: de quantas fontes diferentes podemos recuperar a informação? Redes sociais, arquivos textos, planilhas eletrônicas, imagens, etc. E de quais formas conseguimos armazenar? Dados estruturados, semiestruturados e não estruturados (assuntos para outra postagem!).

Veracidade: O quão os dados que consumimos são confiáveis? E aqui precisamos observar alguns pontos: confiança nas fontes das informações, confiança no processo de carga e transformações, adequação às normas legislativas governamentais e de compliance das empresas.

Valor: O quão os dados gerados podem agregar valor ao negócio? O quão estão aderentes aos processos? O quanto pode apoiar em estratégias competitivas? As respostas às essas questão, individualmente e fortemente orientado ao negócio do cliente identificam o valor dos dados armazenados.

 

 

Então...

Data Analytisc e BI são:

 

- Processos pré-definidos de análise das informações para o negócio;

- Limpeza, organização e consolidação de dados para entrega aos usuários de negócio – independente do conhecimento técnico;

- Porção de ferramentas de BI que permitem a visualização e análise de dados e/ou resultados, como a criação de dahsboards.

Big Data é:

 

- Armazenamento de grandes volumes e variedades de dados (imagens, arquivos, bancos de dados);

- Reunião de porções de dados recuperados de diferentes fontes de informação e acumulado de diversas formas e em N períodos;

- Técnicas e softwares para tratamento de grandes volumes que as ferramentas de ETLs tradicionais não suportam;

O que define se um processo deve utilizar Big Data ou Data Analytics é a necessidade do negócio, por exemplo: a solução precisa manipular uma grande quantidade de dados e entregá-los rapidamente? Se sim, sua solução precisa ser Big Data. Mas mesmo para esse cenário é preciso analizar o budget do cliente; o mesmo deve ser levado em consideração se a resposta a nossa pergunta for Não, imagine que o cliente não precisa, mas quer uma processamento rápido da suas informações para tê-las a mão quando necessário.

 

Outro ponto que devemos levar em consideração é que o Big Data permite análises mais granulares, ou seja, com maior riqueza de detalhes, que em carga de volumes menores não seria possível.

 

Por fim, esses e diversos outros fatores devem ser mapeados para análise e tomada de decisão das tecnologias que serão utilizadas.

E quais ferramentas utilizar?

 

E para finalizar, não podemos deixar de falar sobre como implementar Big Data ou Data Analytics; existe uma gama enorme de ferramentas disponíveis no mercado, com recursos e valores diferentes. O ideal é entender (através de mapeamentos e entrevistas com o cliente) a necessidade da aplicação para guiar a escolha.

 

A imagem a seguir do artigo sobre DATA & AI LANDSCAPE 2019 de 16 de julho de 2019³  e ilustra ferramentas disponíveis, e de conhecimento público, até a data da publicação:

landscape_technology.png

Espero ter esclarecido as diferenças entre os termos BI x Big Data, e nos vemos no próximo artigo.

Grata!

¹ Dado é a menor unidade de medida de uma informação

² Florence Museum: www.florence-nightingale.co.uk

³ Fonte da imagem: http://mattturck.com/data2019

separador1.png