Sherlock no data center: o valor da correlação na investigação e solução de problemas de desempenho

Os constructos tecnológicos estão se tornando cada vez mais complexos e variados

226757b temporario

Kong Yang (*)

Isso significa que os problemas de desempenho do data center – sejam relacionados a aplicativos, computação, rede, armazenamento, virtualização, Web, nuvem ou, mais provavelmente, a uma combinação deles – estão mais difíceis que nunca de solucionar. São verdadeiros mistérios. Para isso, você precisa se tornar um verdadeiro Sherlock Holmes® da TI. Tudo gira em torno da solução de problemas, uma das habilidades mais importantes para qualquer profissional de TI.

Raciocínio = Solução de problemas
Holmes é famoso por sua capacidade de raciocínio e pensamento lógico. Na TI, isso equivale ao processo de solução de problemas. A solução de problemas de TI é uma habilidade básica e um elemento essencial do que, na SolarWinds, denominamos monitoramento com disciplina. Ele permite que você faça drill down para descobrir a causa raiz de um problema. Sem essa habilidade, é quase impossível compreender a causa e dos efeitos subjacentes a qualquer incidente. Contudo, os problemas que envolvem várias pilhas, normalmente enfrentados pelos profissionais de TI atualmente, ultrapassam os silos funcionais na organização como um todo. Tecnologias como nuvem, virtualização, TI híbrida e infraestrutura hiperconvergente transformaram as bases da TI, tornando a solução de problemas entre esses sistemas distribuídos mais importante e complexa que nunca.

A esta altura, é importante rever as oito etapas fundamentais da solução de problemas, aplicáveis a qualquer profissional, organização ou ambiente de TI:
1. Definir o problema
2. Reunir e analisar as informações relevantes
3. Construir uma hipótese ou causa provável
4. Elaborar um plano de correção
5. Implementar o plano
6. Observar os resultados e recriar o plano de modo a reproduzir ou fazer a engenharia reversa dos resultados
7. Repetir as etapas 2 a 6, conforme necessário
8. Determinar a causa raiz e documentá-la

Embora essas etapas se mantenham consistentes, independentemente dos novos constructos tecnológicos, o volume e a velocidade da tecnologia e dos serviços mudaram, o que afeta as regras para os profissionais de TI. Nosso tempo é sempre escasso – as horas do dia nunca parecem ser suficientes e precisamos corrigir problemas o mais rápido possível.

É a correlação, meu caro Watson
Causalidade e correlação são importantes conceitos associados à solução eficaz de problemas. Entretanto, como você deve saber, correlação não equivale necessariamente a causalidade.

Causalidade é o resultado ideal na solução de problemas em qualquer ambiente; consiste em encontrar a causa exata e seu efeito, o que permite sua correção. Em outras palavras, as oito etapas da solução de problemas mencionadas acima foram projetadas para chegar à causalidade.

Por outro lado, a correlação é a exploração do contexto conectado de diversas variáveis ao longo do tempo para ver se elas conduzem à causa do problema de desempenho ou incidente, ainda que não a comprove com precisão. O ponto principal é associar e comparar uma variedade de métricas principais, como contadores de desempenho da rede e dos aplicativos, para monitorar a situação durante um período e, com o respaldo de experiência e competência, identificar a causa e corrigi-la. Por exemplo, correlacionar dados de latência da rede e largura de banda com dados específicos a computação e aplicativos de máquinas virtuais para determinar a causa raiz do problema de desempenho de um aplicativo distribuído.

Dessa forma, quando a questão é solucionar problemas de TI, embora a correlação não seja o mesmo que causalidade, a primeira deve fazer parte das etapas um a sete acima para ajudar a chegar à etapa oito.

Encontrando seu Sherlock interior
A correlação entre métricas e dados de desempenho requer que você tenha um certo nível de competência e familiaridade com seu ambiente, além de reconhecer status ativo/inativo ou verde/amarelo/vermelho. Ela também apresenta desafios em termos de habilidades pessoais. Habilidades pessoais se referem ao local de trabalho, como colaboração e comunicação. No entanto, essas habilidades pessoais, especialmente a colaboração, estão se tornando cada vez mais importantes para a devida solução de problemas de desempenho em sistemas altamente distribuídos, visto que estes apresentam uma probabilidade cada vez maior de envolver causas raiz que abrangem vários silos de tecnologias, regiões e provedores de serviços. Além disso, correlação e colaboração, embora sejam certamente dois conceitos diferentes, estão relacionadas – uma boa correlação normalmente exige colaboração, da mesma forma que a colaboração pode melhorar a correlação.

Aqui estão sugestões para ajudar você a encontrar seu Holmes interior e superar esses desafios:
• Implemente o monitoramento com disciplina: Como já mencionei, usar a correlação para solucionar problemas de desempenho exige que você tenha um certo nível de competência e familiaridade com seu ambiente. A melhor maneira de conseguir isso é com o devido monitoramento de seu data center ao longo de toda a pilha. Isso exigirá um investimento em recursos, como um software de monitoramento e gerenciamento de TI.
• Use seu conjunto de ferramentas de monitoramento para ajudar na correlação: Um bom conjunto de ferramentas de monitoramento deve ser capaz de ajudar você a visualizar e correlacionar dados de monitoramento da TI a fim de melhorar a solução de problemas de desempenho em todo o ambiente de TI, desde a infraestrutura até a rede e os aplicativos e desde a infraestrutura local até os provedores de serviços na nuvem. Busque a capacidade de simplesmente combinar e correlacionar métricas de séries temporais, bem como métricas de desempenho históricas de várias fontes de dados da TI híbrida, o que inclui aplicativos, computação, rede, armazenamento, virtualização, Web e nuvem, em um único painel compartilhável para visualização do relacionamento entre elementos suspeitos. Em seguida, colabore com especialistas no assunto que abranjam os silos envolvidos nesse painel.
• Desenvolva suas habilidades pessoais: Habilidades pessoais servem para derrubar as barreiras entre os silos. No entanto, nem sempre são pontos fortes de profissionais de TI que podem ter sido atraídos para a área devido a uma inclinação para tecnologia e ciências. Dessa forma, cabe a nós desenvolver essas habilidades. As capacidades de se comunicar e de colaborar eficazmente são duas das habilidades pessoais mais importantes. Não há melhor maneira de começar a aprimorá-las do que colocando-as em prática.
• Lembre-se das oito etapas da solução de problemas e siga-as: Embora simples e básicas, a aplicação das oito etapas da solução de problemas que mencionei aqui é quase universal. Embora as ferramentas que nos ajudam nessas etapas estejam evoluindo para lidarmos com os desafios, nunca se esqueça de que os princípios básicos da solução de problemas ainda se aplicam.

Conclusão
O processo de solução de problemas pode ser mais intricado que nunca, exigindo, com frequência, a colaboração entre muitos silos funcionais diferentes na TI e além dela, como provedores de serviços de nuvem. Entretanto, com o processo adequado e as ferramentas corretas, o uso da correlação para determinar a causalidade pode tornar a solução de problemas mais eficaz. Elementar, meus caros profissionais de TI.

Tecnologia Cognitiva não é mais ficção científica

ComputaCAO temporario

Em janeiro deste ano a imprensa noticiou o uso de inteligência artificial (IA) a partir da plataforma cognitiva IBM Watson, pela seguradora japonesa Fukoku Mutual Life. Ainda que reforce a nossa percepção de que o Japão produz inovações comparáveis ao mundo da ficção científica, a notícia demonstrou o fato de que as empresas de seguros já estão à frente, inovando e ditando tendências ao aplicarem em seus processos de negócios plataformas sofisticadas como o IBM Watson.
Na Fukoku o novo sistema fará cálculos de pagamentos devidos ao segurados, com base em análises de informações não estruturadas de texto, vídeo e imagens. Serão analisados sem intervenção humana milhares de dados, com informações médicas como tempo de internação, procedimentos realizados, histórico dos pacientes, entre muitas outras. Claro que os valores apontados pelo sistema de IA terão que passar pela aprovação dos profissionais da companhia que finalizarão o processo para efetuar os pagamentos.
A Fukoku investiu o valor correspondente a R$ 5,5 milhões e espera economizar, por ano, quase R$ 4 milhões neste processo em que está substituindo a mão de obra humana por algoritmos. Em menos de dois anos, a empresa pretende alcançar o almejado ROI e, segundo o jornal britânico The Guardian, esta mudança resultou em um aumento de produtividade de 30%.
Enfim, o processo de inclusão de tecnologias avançadas é irreversível e sistemas como este da Fukoku podem tornar-se assistentes poderosos dentro das organizações, elevando a eficiência a níveis difíceis de serem atingidos apenas com equipes humanas. As capacidades gigantescas dos sistemas cognitivos e seus constantes aprendizados produzem resultados humanamente impossíveis de serem alcançados. Por isso, as empresas em países como o Japão intensificam os processos de automação para somar tecnologias à experiência das equipes em muitos processos e indústrias. A mesma reportagem do The Guardian menciona um relatório do Instituto de Pesquisas Nomura que prevê que, até 2035, 50% dos trabalhos feitos no país serão executados por robôs. As empresas e desenvolvedoras de soluções estão diante de um cenário de grandes oportunidades, uma vez que existe uma infinidade de possibilidades que se abrem com o mundo cognitivo e com o processamento de dados não estruturados, as quais podem ser desenvolvidas e aplicadas em diferentes indústrias, a exemplo do que a seguradora Fukoku Mutual Life faz hoje, pioneiramente.

(Fonte: Acácio Alves é Diretor Executivo da Provider IT, uma das consultorias e provedoras de serviços de TI que mais cresce e inova no país, com vasta experiência e foco no mercado de Seguros, Previdência e Saúde).

Tecnologia: o remédio para a saúde

Normênio Momm (*)

Num levantamento rápido feito com alguns dos principais municípios do país, identifiquei um dado comum a praticamente todos: a quantidade de pacientes que deixa de comparecer às consultas marcadas na rede pública chega, em média, a 30%

Pode parecer pouco, mas não é. Qualquer um que lide com saúde ou se dedique minimamente ao tema sabe que esta é uma das maiores carências da população do Brasil e coleciona relatos de falta de estrutura, baixa qualidade nos atendimentos e filas, muitas filas. Mas, para um sistema sobrecarregado e necessitado de uma reformulação na gestão, o absenteísmo não deve nem ser sentido, certo? Errado. Ele faz toda a diferença na atenção dedicada ao cidadão nas unidades básicas.
É importante entender o que representa uma desistência e porque é tão difícil evitá-la. Primeiro, observe o cenário: uma pesquisa recente do Instituto Datafolha a pedido do Conselho Federal de Medicina mostra que 87% dos eleitores brasileiros consideram a saúde oferecida à população pelo SUS péssima, ruim ou regular. Entre os indicadores que levam a este percentual está a demora em conseguir marcar uma consulta e a dificuldade no processo. Muita gente reclama da necessidade de ter que ir às unidades de saúde ainda de madrugada, aguardar numa fila a retirada de poucas senhas oferecidas por dia para daí agendar um horário — que, não raras as vezes, só vai chegar dali alguns meses. A indignação por ter o acesso a um serviço básico dificultado não o faz perceber que aquilo é coisa séria e muitos esquecem do seu compromisso de comparecer no dia do agendamento, prejudicando todo mundo, pois aquela consulta tão valiosa foi perdida.
Questionados sobre como lidam com a situação, muitos gestores públicos dizem que as equipes de atendimento ficam de mãos atadas. Com o horário de expediente dedicado a demandas administrativas repetitivas e que poderiam ser digitalizadas, muitos profissionais não conseguem nem ligar para os pacientes alguns dias antes da data, confirmando ou desmarcando o horário com o doutor, o que permitiria chamar outra pessoa. Mas isso pode mudar, e em algumas cidades, a transformação já começou.
Em dezembro de 2016, o Ministério da Saúde determinou que todos os municípios do país adotassem o Protocolo Eletrônico para a saúde básica (e-SUS AB). A ideia é contar com o reforço da tecnologia e permitir o controle, dentre outras tarefas, de rotinas como o agendamento de consultas e exames, a evolução clínica e a criação de um histórico da saúde dos pacientes, e até o controle em tempo real dos estoques de medicamentos nas cidades. Hoje, mais de 57,5 milhões de brasileiros têm a saúde monitorada digitalmente, e os poucos municípios que não aderiram à tecnologia podem ter repasses do Governo Federal suspensos, inviabilizando a gestão.
Conheço cidades que usam soluções digitais para a gestão pública de forma irrestrita e transformaram a administração, ganhando em eficiência, celeridade e mais dinheiro em caixa para investimentos, seja por meio da economia que a digitalização traz ou pelo aumento de arrecadação, por exemplo. Numa delas, a economia chegou a R$ 84 milhões por ano, pois foi possível desenvolver um planejamento estratégico conforme o que a cidade precisava. Com softwares criados especialmente para esta finalidade, é mais fácil ver quais áreas têm mais necessidades, se há desperdícios e gerenciar rapidamente os atendimentos médicos, por exemplo. O gestor público pode deixar de se preocupar com as tarefas que tomam tempo e trazem pouco resultado para se concentrar no que realmente faz diferença para a população. A tecnologia é um ótimo remédio para melhorar a gestão das cidades, dos estados e do Brasil, com resultados surpreendentes. Mas, como todo tratamento, exige o abandono de velhos hábitos e a vontade de melhorar.

(*) É Administrador e Gerente de Desenvolvimento do IPM Saúde.

 
 
 
 
 
Outras Matérias sobre Tecnologia

 

Mais Lidas