Inovação em saúde: a implementação de um data lake para o armazenamento, sistematização e disponibilização de dados em saúde no Brasil

Este artigo tem como objetivo apresentar o problema relativo ao armazenamento, a sistematização e a disponibilização de dados em saúde no Brasil, e uma solução inovadora, como a implementação de um data lake com dados do setor de saúde. O data lake foi construído a partir de três etapas: (1) planejamento e priorização das bases de dados a serem importadas para o repositório; (2) extração, carregamento e tratamento dessas bases com o apoio das ferramentas Apache Airflow e Dremio; e (3) aplicação do uso. Os resultados evidenciam a capacidade da plataforma de armazenar um grande volume de dados (Big Data), bem como, de propiciar uma navegação intuitiva, facilitando a compreensão e manuseio dos dados por analistas em saúde. Constata, ainda, que gestores públicos e pesquisadores reconhecem as contribuições da ferramenta para as suas decisões e a potencialidade desta para o desenvolvimento de outras soluções de inteligência na análise de dados da área de saúde. A solução apresentada visa contribuir para a gestão e o planejamento de políticas de saúde, permitindo o acesso, de modo rápido e amplo, a dados diversos, que suportam a tomada de decisões na área de saúde com mais agilidade, segurança e qualidade.

Para acessar o artigo publicado no XLVI Encontro da ANPAD – EnANPAD 2022, clique aqui.