195 views 10 mins

Data Lakehouse: sua empresa no caminho da cultura analítica

em Destaques
quinta-feira, 13 de outubro de 2022

Rafael Dourado (*)

A adoção de uma plataforma corporativa baseada em inteligência artificial capaz de converter dados em informação de negócios é fundamental para aumentar a capacidade das organizações de aprimorar os seus processos de decisão de forma inteligente e eficiente. Mas para chegar nesse estágio, é necessário elevar a qualidade das informações usadas para ajudar os líderes na tomada de decisões.

Segundo uma pesquisa realizada pela Cappra Institute, que entrevistou diversos empresários com objetivo de mensurar a maturidade analítica no mercado brasileiro em 2020, as áreas de negócios estão, em média, 33% satisfeitas com as entregas recebidas (análises, relatórios, dashboards, entre outros produtos).

O estudo aponta que um dos fatores que contribuem para esse resultado é que a informação não vem pronta para a tomada de decisão, gerando maior retrabalho das equipes e custos para a organização. Esse baixo índice de satisfação representa um gap entre o que as áreas de negócios esperam e o que as equipes de analytics entregam. Isso ocorre, em boa parte, pela dificuldade de interpretar um enorme volume de dados e cruzar esse acervo de um sistema para outro.

Em uma abordagem comum, as empresas buscam superar esse desafio por meio de repositórios de dados brutos (Data Lake), responsáveis pelo armazenamento de uma grande quantidade de informações, não filtradas, ou por meio de uma solução de Data Warehouse, que centraliza e consolida dados estruturados. Porém, lidar com tantos sistemas gera complexidade e, por consequência, atrasos na entrega das análises mais assertivas que dão sustentação para tomadas de decisões mais inteligentes.

Felizmente, esse problema tem solução e se chama Data Lakehouse. Ele unifica o potencial do Data Lake e Data Warehouse ao centralizar e armazenar dados estruturados e não estruturados em um único ambiente, simplificando a rotina das equipes de analytics. Assim, as empresas podem extrair insights valiosos que servem para direcionar as melhores estratégias de negócios, usando apenas um repositório de dados, em vez de precisar da infraestrutura de duas arquiteturas diferentes.

Além do benefício de unificar os dados, o Lakehouse também simplifica o consumo dessas informações, que pode tanto servir na utilização de análises complexas, como na criação de algoritmos de aprendizado de máquina, processamento de alto volume de dados, análise em tempo real e, também, para a criação de relatórios que ajudam na visualização desses dados.

Essa plataforma tem como objetivo simplificar a arquitetura de dados, centralizando as informações, reduzindo custos operacionais, melhorando a governança e acabando de vez com a redundância de dados.

. Como a Indústria 4.0 pode obter vantagens? – A Indústria é um bom exemplo de setor que pode se beneficiar de uma arquitetura de dados unificada. Isso porque sob o conceito de Indústria 4.0, um fator importante que diferencia esse setor para os demais é o alto volume de informações geradas no chão de fábrica a partir da conexão massiva entre dispositivos e sistemas.

Na abordagem comum, muitas empresas acabam usando o Warehouse para analisar dados estruturados para obter informações relevantes, e paralelamente com Data Lake para armazenar e gerenciar dados não estruturados, gerando uma dificuldade em ter uma visão estratégica do negócio.

O Data Lakehouse preenche essa lacuna ao fornecer uma arquitetura unificada de gerenciamento e análise de dados. A solução permite que as empresas integrem e analisem os dados dos sistemas corporativos e do chão de fábrica, favorecendo os gestores, que passam a ter uma visão completa de todos os processos produtivos da companhia e podem lidar melhor com desafios de ineficiências operacionais, interrupções na cadeia de suprimentos, gestão de estoques, entre outros problemas que impactam a produtividade da indústria.

Por meio de uma abordagem moderna como o Data Lakehouse, as indústrias poderiam coletar KPIs de produtividade de máquinas e equipamentos e, ao fazer o cruzamento dessas informações, enriquecer com outros dados estruturados que a empresa possui como de custos de matéria-prima e de logística, permitindo que a equipe de supply chain tenha em mãos uma análise completa sobre desafios e oportunidades para a sua área.

. Benefícios do Data Lakehouse – Os dados são recursos extremamente valiosos para garantir o sucesso de uma empresa. Quem se aproveita de uma arquitetura moderna de dados como o Data Lakehouse pode obter vantagens consideráveis para o seu projeto. Confira alguns dos principais benefícios:

  • Democratização dos dados: torna o dado acessível de forma simples e dissemina a informação e o conhecimento para o usuário;
  • Redução de custo: evita ter alto custo para manter uma base de dados para armazenamento em diferentes arquiteturas;
  • Centralização dos dados: a centralização dos dados em um único ambiente garante análises e tomadas de decisão mais assertivas e, com isso, melhores resultados para o negócio;
  • Atender perfis variados de usuários: analistas de BI e cientistas usaram a mesma base de dados;
  • Governança: normalmente, em uma arquitetura que se usa diferentes ferramentas de persistência de dados para cada uso, há duplicações de tabelas em ambientes diferentes. Por isso, um dos benefícios é eliminar a redundância de tabela, além de facilitar a gestão dos dados quando é necessário ter um controle maior sobre informações pessoais, muito em função da LGPD.

Com a evolução da área de dados, é natural que as arquiteturas atuais também sofram adaptações e novas arquiteturas surjam. Com a chegada do Data Lakehouse, o Data Lake e o Data Warehouse continuam desempenhando um papel fundamental em diversos cenários de dados.

Contudo, vale fazer uma análise de qual o objetivo da empresa, para entender qual arquitetura será mais aderente, uma vez que a definição envolve diversos pontos como o quão segregados as bases estão e quais são os dados a serem armazenados.

O Data Lakehouse combina a flexibilidade, a eficiência de custos e a escala dos Data Lakes com o gerenciamento de dados e transações ACID de Data Warehouses. É esperado que tenhamos uma evolução da tecnologia haja visto o seu potencial, mas poderemos usufruir de fato do seu valor apenas se a empresa possuir uma forte cultura data-driven.

Para tirar o melhor proveito, as empresas também precisam mudar o mindset para “produtos de dados”, que vai dar às equipes de dados maior autonomia e propósito do que os profissionais de projetos, que são focados na entrega do escopo contratado. Além disso, outras vantagens dessa mudança de mentalidade focada na evolução do produto e não no escopo são agilidade na tomada de decisão e maior capacidade de reorientação.

Tudo isso pavimenta o sucesso da sua empresa rumo à cultura digital corporativa e será o grande diferencial em busca de melhores resultados.

(*) – É Operations Manager da Programmers (https://www.programmers.com.br/).