Evaluación de LLMs en la detección de vulnerabilidades en contratos inteligentes

Autores/as

DOI:

https://doi.org/10.22481/recic.v8i1.18263

Palabras clave:

contratos inteligentes, LLMs, blockchain, seguridad, vulnerabilidades

Resumen

La auditoría de contratos inteligentes es esencial para garantizar la seguridad de aplicaciones descentralizadas, previniendo fallos críticos en entornos inmutables como las cadenas de bloques. Este estudio tiene como objetivo evaluar la eficacia de los Modelos de Lenguaje de Gran Escala (LLMs) en la detección automatizada de vulnerabilidades en contratos inteligentes. Para ello, se analizaron 40 contratos de diferentes categorías mediante cuatro LLMs — GPT-4o, DeepSeek-R1, Llama-3.3 y Gemini 2.0 Flash — utilizando un prompt unificado para extraer y clasificar vulnerabilidades según su severidad. El rendimiento se midió mediante precisión, recall, F1-score y error absoluto medio, comparando las detecciones con auditorías de referencia. El modelo con mejor desempeño alcanzó un 10,36% de precisión y un 22,48% de recall, lo que indica que los LLMs aún requieren mejoras para un uso autónomo confiable.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Lis Loureiro Sousa, Universidade Estadual do Sudoeste da Bahia

Soy Lis Loureiro Sousa, estudiante de grado en Derecho y Ciencias de la Computación, con una trayectoria marcada por la intersección entre los campos jurídico y tecnológico. Mi propósito es combinar técnica, innovación y compromiso social para afrontar los desafíos jurídicos contemporáneos.

Actualmente, soy pasante en VERT Capital, donde trabajo con enfoque en Derecho Regulatorio y Estructuración de Operaciones de Crédito, especialmente en el mercado de capitales. Esta experiencia ha ampliado mi comprensión sobre instrumentos financieros complejos, titulización y las innovaciones tecnológicas en el mercado financiero, particularmente aquellas relacionadas con blockchain, conectando aspectos jurídicos y económicos en operaciones estructuradas.

Paralelamente, desarrollo investigación jurídica en colaboración con la Procuraduría General de la Hacienda Nacional (PGFN) y la Universidad de Brasilia (UnB), en el marco de un proyecto de iniciación científica enfocado en el estudio de las aplicaciones de la inteligencia artificial en el sistema jurídico brasileño. La investigación analiza los impactos positivos de la IA y su optimización en el sector público, especialmente en demandas tributarias.

Apasionada por estudiar cómo el Derecho puede reinventarse frente a las transformaciones sociales y tecnológicas, busco contribuir a un sistema más eficiente, justo y accesible. Me interesan especialmente las soluciones tecnológicas aplicadas al ámbito jurídico y administrativo, la regulación de nuevas tecnologías y los efectos jurídicos de la digitalización de las relaciones jurídicas.

Cauê Rodrigues de Aguiar, Universidade Estadual do Sudoeste da Bahia

Estudiante de Ciencias de la Computación en la Universidad Estatal del Suroeste de Bahía (UESB). Tiene experiencia en desarrollo de software, diseño de experiencia de usuario (UX) e inteligencia artificial. Trabajó como pasante de desarrollo de chatbots, con enfoque en diseño de flujos conversacionales, integración de APIs REST y documentación técnica. Fue residente de software, desarrollando soluciones en entornos de nube. Actualmente es becario de Iniciación Científica en la UESB, investigando Ética e Inteligencia Artificial en la Educación en Computación. Participa del grupo de estudios NUPEL/LABIDD-UFBA, con enfoque en IA y Derechos Digitales.

Breno Novais Couto, Universidade Estadual do Sudoeste da Bahia

Soy estudiante de Ciencias de la Computación en la Universidad Estatal del Sudoeste de Bahía (UESB), con experiencia en desarrollo de software y soluciones digitales. A lo largo de mi formación, he desarrollado habilidades en programación, bases de datos, algoritmos e ingeniería de software.

He participado en diversos proyectos tecnológicos dentro y fuera de la universidad, como Embarcatech, donde trabajé con sistemas embebidos. En el sector de revistas de la UESB, contribuí al desarrollo y mantenimiento de soluciones digitales en la plataforma DigiPub, orientada a mejorar las publicaciones científicas en línea.

Actualmente, participo en el PET – Salud Digital, colaborando en la actualización de la aplicación MPI Brasil junto a profesionales del área de la salud. El proyecto tiene como objetivo apoyar la prescripción y desprescripción de medicamentos para personas mayores, promoviendo mayor seguridad e impacto en la práctica clínica.

Ângela Gabriele de Souza Silva, Universidade Estadual do Sudoeste da Bahia

Actualmente, estudio Ciencias de la Computación en la Universidad Estatal del Sudoeste de Bahía (UESB), donde he desarrollado un interés en el desarrollo de software y tecnologías web. A lo largo de la carrera, he adquirido una base sólida en algoritmos, estructuras de datos e ingeniería de software.

He participado en proyectos como becaria en el sector de revistas de la UESB, trabajando en la plataforma DigiPub, donde contribuyo al mantenimiento y mejora de publicaciones científicas digitales. También formo parte del Colectivo Lovelace, una iniciativa orientada a promover la participación de mujeres en la tecnología, colaborando en la organización de eventos y actividades en el área.

Hélio Lopes dos Santos, Universidade Estadual do Sudoeste da Bahia

Possui graduação em Ciência da Computação pela Universidade Federal de Mato Grosso (2000), mestrado (2003) e doutorado(2008) em Ciências da Computação pela Universidade Federal de Pernambuco . Tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados e Engenharia de Software, atuando principalmente nos seguintes temas: mof, mof - meta object facility, metamodelo, metamodelagem e xml.

Citas

Z. Wei, J. Sun, Z. Zhang, and X. Zhang, “LLM-SmartAudit: Advanced Smart Contract Vulnerability Detection,” arXiv, Oct. 2024. Available: http://arxiv.org/abs/2410.09381

D. Perez and B. Livshits, “Smart contract vulnerabilities: Vulnerable does not imply exploited,” in 30th USENIX Security Symposium (USENIX Security 21), Aug. 2021, pp. 1325–1341. Available: https://www.usenix.org/conference/usenixsecurity21/presentation/perez

C. Chen, J. Su, J. Chen, Y. Wang, T. Bi, J. Yu, Y. Wang, X. Lin, T. Chen, and Z. Zheng, “When ChatGPT meets Smart Contract Vulnerability Detection: How far are we?,” ACM Transactions on Software Engineering and Methodology, Nov. 2024. Available: https://doi.org/10.1145/3702973

D. He, Z. Deng, Y. Zhang, S. Chan, Y. Cheng, and N. Guizani, “Smart Contract Vulnerability Analysis and Security Audit,” IEEE Network, vol. 34, no. 5, pp. 276–282, Jul. 2020. Available: https://doi.org/10.1109/MNET.001.1900656

H. Zhou, A. M. Fard, and A. Makanju, “The State of Ethereum Smart Contracts Security: Vulnerabilities, Countermeasures, and Tool Support,” Journal of Cybersecurity and Privacy, vol. 2, no. 2, pp. 358–378, May 2022. Available: https://doi.org/10.3390/jcp2020019

S. S. Kushwaha, S. Joshi, D. Singh, M. Kaur, and H.-N. Lee, “Systematic Review of Security Vulnerabilities in Ethereum Blockchain Smart Contract,” IEEE Access, vol. 10, pp. 6605–6621, Jan. 2022. Available: https://doi.org/10.1109/ACCESS.2021.3140091

S. Hu, T. Huang, F. İlhan, S. F. Tekin, and L. Liu, “Large Language Model-Powered Smart Contract Vulnerability Detection: New Perspectives,” arXiv, Jan. 2023. Available: https://arxiv.org/abs/2310.01152

I. David, L. Zhou, K. Qin, D. Song, L. Cavallaro, and A. Gervais, “Do You Still Need a Manual Smart Contract Audit?,” arXiv preprint arXiv:2306.12338, 2023.

Z. Xiao, Q. Wang, H. Pearce, and S. Chen, “Logic Meets Magic: LLMs Cracking Smart Contract Vulnerabilities,” arXiv, 2025. Available: https://arxiv.org/abs/2501.07058

W. Ma, D. Wu, Y. Sun, T. Wang, S. Liu, J. Zhang, Y. Xue, and Y. Liu, “Combining Fine-Tuning and LLM-Based Agents for Intuitive Smart Contract Auditing with Justifications,” arXiv preprint arXiv:2403.16073, 2024.

Y. Liu, Y. Xue, D. Wu, Y. Sun, Y. Li, M. Shi, and Y. Liu, “PropertyGPT: LLM-Driven Formal Verification of Smart Contracts Through Retrieval-Augmented Property Generation,” arXiv preprint arXiv:2405.02580, 2025, to appear in NDSS.

G. Iuliano and D. N. Dario, “Smart Contract Vulnerabilities, Tools, and Benchmarks: An Updated Systematic Literature Review,” arXiv, Dec. 2024. Available: http://arxiv.org/abs/2412.01719

P. Sahoo, A. K. Singh, S. Saha, V. Jain, S. Mondal, and A. Chadha, “A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications,” arXiv, Feb. 2024. Available: http://arxiv.org/abs/2402.07927

Quantstamp, “Athens Token Smart Contract Audit,” 2023. Available: https://certificate.quantstamp.com/full/athens.pdf

StormX, “Athens Token Smart Contracts,” 2023. Available: https://github.com/stormxio/athens-token/tree/7ed63ba12f03c4e7856eb5845a5a234d0f806bd2/contracts

Hacken, “CryptoToday ERC20/ERC1155 Voting Smart Contract Audit,” 2022. Available: https://hacken.io/audits/cryptotoday/sca-cryptotoday-erc20-erc1155-voting-feb2022/

CryptoToday, “CryptoToday Contracts,” 2022. Available: https://github.com/cryptotodaycom/contracts/tree/548c1ef24d996a3adc0557638601d099a5ef745d

Hacken, “Openware Yellow Network Smart Contract Audit,” 2023. Available: https://hacken.io/audits/openware-yellow-network/sca-yellow-network-erc20-mar2023/

Layer-3, “ClearSync Smart Contracts,” 2023. Available: https://github.com/layer-3/clearsync/tree/5b86a2134d295ac11af97d4f239782222e95fe24/contracts

Hacken, “ZKRace ERC20 Smart Contract Audit,” 2024. Available: https://hacken.io/audits/zkrace/sca-zkrace-erc20-mar2024/

Hacken, “Bloqhouse Technologies RWA Smart Contract Audit,” 2023. Available: https://hacken.io/audits/bloqhouse-technologies-b-v/sca-bloqhouse-technologies-rwa-mar2023/

A. Persson, “Token Shares Solidity Contracts,” 2023. Available: https://bitbucket.org/alfredpersson/token-shares-solidity/src/cbdc7c0d6162346b96cf62cb2ff93c15f416819e/

Hacken, “Ethereum Towers Staking Smart Contract Audit,” 2022. Available: https://hacken.io/audits/ethereum-towers/sca-ethereum-towers-staking-jun2022/

Ethereum Towers, “Ethereum Towers Contracts,” 2022. Available: https://github.com/ethereumtowers/contracts/tree/94eb48031a02455bb3c48285ffe41fbbe3498079

Quantstamp, “Tengoku Senso Smart Contract Audit Certificate,” 2023. Available: https://certificate.quantstamp.com/full/tengoku-senso/5361cc88-760a-4571-8284-7951b4dbbff4/index.html

A. Sharma, “TGK Smart Contracts Audit,” 2023. Available: https://github.com/AkshaySharma96/TGK-Smart-Contracts-Audit/tree/68f99d348ee637d90ba91b2996d1e132f7cf4268

Quantstamp, “Sequence Smart Wallet Audit Report,” 2023. Available: https://certificate.quantstamp.com/full/sequence-smart-wallet.pdf

xSequence, “Sequence Wallet Contracts,” 2023. Available: https://github.com/0xsequence/wallet-contracts/tree/7492cb33cea25696355a0e2a76f1fe9ea2adfbbd

QuillAudits, “Taiko Smart Contract Audit,” 2024. Available: https://www.quillaudits.com/leaderboard/taiko

Taiko Labs, “Taiko Mono Smart Contracts,” 2024. Available: https://github.com/taikoxyz/taiko-mono/tree/based%20contestable%20zkrollup

QuillAudits, “Meta Monkey Smart Contract Audit,” 2024. Available: https://www.quillaudits.com/leaderboard/meta-monkey

J. Li, G. Li, Y. Li, and Z. Jin, “Structured Chain-of-Thought Prompting for Code Generation,” arXiv, Jan. 2023. Available: https://arxiv.org/abs/2305.06599

A. Radford, J. Wu, R. Child, D. Luan, D. Amodei, I. Sutskever, et al., “Language Models are Unsupervised Multitask Learners,” OpenAI Blog, vol. 1, no. 8, 2019.

X. Zhao, M. Li, W. Lu, C. Weber, J. H. Lee, K. Chu, and S. Wermter, “Enhancing Zero-Shot Chain-of-Thought Reasoning in Large Language Models through Logic,” arXiv, Jan. 2023. Available: https://arxiv.org/abs/2309.13339

Y. Gao, Y. Xiong, X. Gao, K. Jia, J. Pan, Y. Bi, J. Sun, H. Wang, and H. Wang, “Retrieval-Augmented Generation for Large Language Models: A Survey,” arXiv preprint arXiv:2312.10997, vol. 2, no. 1, 2023.

J. R. Landis and G. G. Koch, “The Measurement of Observer Agreement for Categorical Data,” Biometrics, vol. 33, no. 1, p. 159, Mar. 1977. Available: https://doi.org/10.2307/2529310

T. Durieux, J. F. Ferreira, R. Abreu, and P. Cruz, “Empirical Review of Automated Analysis Tools on 47,587 Ethereum Smart Contracts,” in ICSE, Jun. 2020. Available: https://doi.org/10.1145/3377811.3380364

L. S. H. Colin, P. M. Mohan, J. Pan, and P. L. K. Keong, “An Integrated Smart Contract Vulnerability Detection Tool Using Multi-Layer Perceptron on Real-Time Solidity Smart Contracts,” IEEE Access, vol. 12, pp. 23 549–23 567, Jan. 2024. Available: https://doi.org/10.1109/ACCESS.2024.3364351

I. Amaro, A. Della Greca, R. Francese, G. Tortora, and C. Tucci, AI Unreliable Answers: A Case Study on ChatGPT, Jan. 2023. Available: https://doi.org/10.1007/978-3-031-35894-4_2

Y. Liu, Y. Xue, D. Wu, Y. Sun, Y. Li, M. Shi, and Y. Liu, “PropertyGPT: LLM-Driven Formal Verification of Smart Contracts Through Retrieval-Augmented Property Generation,” arXiv, May 2024. Available: http://arxiv.org/abs/2405.02580

Publicado

2026-05-20

Cómo citar

LOUREIRO SOUSA, Lis; RODRIGUES DE AGUIAR, Cauê; NOVAIS COUTO, Breno; GABRIELE DE SOUZA SILVA, Ângela; LOPES DOS SANTOS, Hélio. Evaluación de LLMs en la detección de vulnerabilidades en contratos inteligentes. Revista de Ciência da Computação, [S. l.], v. 8, n. 1, p. e18263, 2026. DOI: 10.22481/recic.v8i1.18263. Disponível em: https://periodicos2.uesb.br/recic/article/view/18263. Acesso em: 21 may. 2026.