Implantação de Data Lake e Visualização de Dados para auditoria pública na Controladoria-Geral do Estado de Mato Grosso
DOI:
https://doi.org/10.22481/recic.v8i1.19165Palavras-chave:
data lake, auditoria publica, análise de dadosResumo
Este trabalho teve como objetivo apresentar a implementação e avaliação de um Data Lake na Controladoria-Geral do Estado de Mato Grosso (CGE-MT), visando otimizar os processos de auditoria e análise de dados. Inicialmente, foi apresentado o conjunto de sistemas de código aberto que compõem o ambiente (como Apache HDFS, Spark e Trino) e, posteriormente, foram utilizados dois critérios para avaliação: técnico e operacional. Os resultados demonstraram que a infraestrutura implantada se mostrou eficiente para as atividades de análise de dados, proporcionando um ambiente seguro para o armazenamento e processamento das informações, garantindo a integridade dos dados. Além disso, com base no Data Lake, a CGE desenvolveu o sistema “CGE Alerta”, que possibilitou a redução de 51% nas irregularidades de inassiduidade nas Secretarias do Estado de Mato Grosso e automatizou os processos de monitoramento. Também foi possível demonstrar a viabilidade da solução a longo prazo, uma vez que, considerando o espaço de armazenamento disponível, seria possível armazenar aproximadamente 15 anos de dados sem a necessidade de investimentos imediatos.
Downloads
Referências
Apache Airflow, “What is Airflow?,” Apache Airflow Documentation, 2024. [Online]. Available: https://airflow.apache.org/docs/apache-airflow/stable/. Accessed: Nov. 6, 2024.
K. Shvachko, H. Kuang, S. Radia and R. Chansler, "The Hadoop Distributed File System," 2010 IEEE 26th Symposium on Mass Storage Systems and Technologies (MSST), Incline Village, NV, USA, 2010, pp. 1-10.
J. Schneider, C. Gröger, A. Lutsch, et al., “The Lakehouse: State of the Art on Concepts and Technologies,” SN Computer Science, vol. 5, p. 449, 2024.
M. Zaharia et al., “Resilient distributed datasets: A Fault-Tolerant abstraction for In-Memory cluster computing,” in 9th USENIX Symposium on Networked Systems Design and Implementation (NSDI 12), San Jose, CA, USA, 2012, pp. 15-28.
C. Avci, B. Tekinerdogan, and I. N. Athanasiadis, “Software architectures for big data: a systematic literature review,” Big Data Analytics, vol. 5, no. 1, p. 5, 2020.
A. R. E. Da Silva et al., “Análise da relevância da arquitetura de implementação de Delta Lake para banco de dados empresariais,” 2024.
D. Borges, “CGE Alerta transforma gestão pública em 2024 e reduz pendências em até 51%,” 2025. [Online]. Available: https://www.cge.mt.gov.br/w/cge-alerta-transforma-gest%C3%A3o-p%C3%BAblica-em-2024-e-reduz-pend%C3%AAncias-em-at%C3%A9-51-/. Accessed: Mar. 3, 2025.
Dremio, “Project Nessie,” 2024. [Online]. Available: https://www.dremio.com/open-source/nessie/. Accessed: Nov. 6, 2024.
S. Fanelli et al., “Big data analysis for decision-making processes: challenges and opportunities for the management of health-care organizations,” Management Research Review, vol. 46, no. 3, pp. 369–389, 2023.
G. Boscov, “Mato Grosso é destaque no SECOP 2023: Excelência em Governo Digital,” Secretaria de Estado de Meio Ambiente, Desenvolvimento Sustentável e Turismo (MTI), Cuiabá, MT, 4 set. 2023. Online. Available: https://www.mti.mt.gov.br/-/mato-grosso-é-destaque-no-secop-2023-excelência-em-governo-digital. Accessed: Apr. 14, 2026.
T. Kluyver et al., “Jupyter Notebooks-a publishing format for reproducible computational workflows,” in Positioning and Power in Academic Publishing: Players, Agents and Agendas, 20th International Conference on Electronic Publishing, IOS Press, 2016, pp. 87-90.
T. Kafel, A. Wodecka-Hyjek, and R. Kusa, “Multidimensional public sector organizations' digital maturity model,” Administration & Public Management Review, vol. 37, pp. 64-82, 2021.
D. D. H. Ameen, S. W. Kareem, and S. B. Hasan, “A Big Data, Bigger Impact: A Comprehensive Review of Machine Learning Advancements,” in 2024 International Conference on Electrical Engineering and Computer Science (ICECOS), IEEE, 2024, pp. 1-6.
O. M. Ribeiro and J. M. R. Coelho, Auditoria fácil, 2. ed. São Paulo: Saraiva, 2013.
M. Santos, “O impacto das novas tecnologias na profissão do auditor,” KPMG Business Magazine, vol. 46, pp. 16-21, 2019.
L. Silveira, “CGE lança sistema que permite monitoramento e correção proativa de questões administrativas,” 2024. [Online]. Available: https://www.mti.mt.gov.br/-/cge-lan%C3%A7a-sistema-que-permite-monitoramento-e-corre%C3%A7%C3%A3o-proativa-de-quest%C3%B5es-administrativas/. Accessed: Mar. 3, 2025.
D. Appelbaum et al., “Impact of business analytics and enterprise systems on managerial accounting,” International Journal of Accounting Information Systems, vol. 25, pp. 29-44, 2017.
Trino, “Trino 464 Documentation.” [Online]. Available: https://trino.io/docs/current/overview/use-cases.html/. Accessed: Nov. 6, 2024.
R. Sethi et al., “Presto: SQL on everything,” in 2019 IEEE 35th International Conference on Data Engineering (ICDE), IEEE, 2019, pp. 1802-1813.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2026 Revista de Ciência da Computação

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.