Rogério Soares (*)
Dark Data é definido pela consultoria Gartner como sendo as informações coletadas processadas e armazenadas pela empresa de maneira regular e sem aproveitamento para outras formas de uso.
Sendo assim, as empresas mantêm esses dados coletados e armazenados por tempo indefinido, sem estruturação e sem plano de uso, o que gera custos adicionais e riscos não previstos. De acordo com a IDC, até 90% dos dados armazenados pelas empresas são Dark Data e não tem seu conteúdo estruturado e gerenciado. Muitas companhias coletam e geram Dark Data de forma sistemática, fazendo deste um problema crescente.
Ao solicitar dados diversos de seus clientes, empresas geram logs e registros de suas transações e, em muitas vezes, procuram registrar a maior quantidade de dados possíveis. Por questões de compliance, ou por não ter clareza em políticas de retenção, esses dados são simplesmente armazenados para que se houver necessidade de qualquer consulta futura as evidências estarão lá para serem coletadas. Mas quais problemas há nesse tipo de atitude?
Existirão dificuldades enquanto as empresas seguirem cultivando e fazendo crescer seu depósito de dados. O problema mais evidente é de custo, já que esses dados vão diariamente ocupando mais espaço de armazenamento, políticas de backup, redundância e até consumo em nuvem. Um outro problema ainda maior é referente ao compliance das empresas brasileiras com a Lei Geral de Proteção de Dados.
Uma parte significativa do Dark Data pode conter dados sensíveis em que, como sabemos, haverá legislação muito rígida sobre como mantê-los e quais as responsabilidades das empresas que os coletam e os mantêm. Assim, conhecer o conteúdo é uma necessidade urgente, pois é necessário garantir que os dados sensíveis que lá estão sigam as políticas de acesso restrito, armazenamento em conformidade com LGPD e regras de sua área de atuação e, no futuro, estejam preparados para informar a qualquer cliente sobre onde estão seus dados, quais são e como podem ser esquecidos.
Neste cenário, as empresas possuem alguns aspectos em que devem começar a trabalhar. A começar pelo seu processo de coleta de dados para que novas informações já possam ser armazenadas de forma estruturada atendendo às regulamentações do setor e estar em conformidade com as leis.
Em uma pesquisa global de 2019, realizada pela Serasa Experian sobre qualidade de dados, constatou-se que 95% das empresas acreditam que a má qualidade das informações nas companhias impacta negativamente a interação com o consumidor. Isso revela muito sobre a importância do conhecimento do conteúdo já armazenado, em que é necessário separar o joio do trigo e assim poder começar a transformar dados desconhecidos em informações que sejam de grande valor para seu negócio.
E, para finalizar, não podemos esquecer de um ponto fundamental: a segurança desta informação e como estes dados estarão protegidos e disponíveis. No aspecto de segurança, deve-se pensar não somente em como recuperá-los em caso de perda, mas também sobre criar políticas claras de quem pode acessá-los, quando podem acessá-los, além de identidade única de quem os faz.
E após tudo isso estabelecido, é importante também manter um monitoramento deste ambiente de forma a ser capaz de detectar qualquer tentativa de invasão, fraude ou roubo desta informação.
(*) – É diretor de Pré-Vendas e Serviços Profissionais Latam da Quest Software.