Guardrails em IA Generativa
N/D
Autores
Pereira, Fernanda de Oliveira
Hermida, Gabriel Mendonça de Mello
Medeiros, Rodrigo Paoliello de
Orientador
Co-orientadores
Citações na Scopus
Tipo de documento
Trabalho de Conclusão de Curso
Data
2025
Resumo
A inteligência artificial (IA) generativa, quando aplicada no desenvolvimento de assistentes
virtuais, pode, em muitos casos, retornar respostas inadequadas ou incorretas, confundindo
usuários e gerando desinformação. Atualmente, são desenvolvidas guardrails que
analisam tanto as entradas fornecidas pelos usuários quanto as saídas geradas pelos modelos,
garantindo que as respostas devolvidas sejam adequadas. Nesse contexto, a solução
deste projeto consistiu na implementação de diferentes tipos de guardrails (escopo, competidores,
toxicidade, alucinação, dados sensíveis e técnicas de jailbreak), na definição
de métricas específicas para avaliar seu funcionamento e na construção de uma arquitetura
suficientemente modular para ser adaptável a diversos contextos. As guardrails
implementadas alcançaram resultados satisfatórios conforme as métricas estabelecidas,
indicando viabilidade técnica para utilização inicial pela empresa parceira em consultorias
de assistência virtual com IA. Apesar disso, o projeto identificou oportunidades de
melhoria, especialmente relacionadas à ampliação das bases de treinamento e avaliação,
à adoção de mecanismos adaptativos e ao aprimoramento da mitigação de alucinações,
visando ampliar sua eficácia em aplicações práticas futuras.
Palavras-chave
Inteligência Artificial; Assistentes Virtuais; Large Language Models (LLM); Gardrails
Titulo de periódico
URL da fonte
Título de Livro
URL na Scopus
Sinopse
Objetivos de aprendizagem
Idioma
Português
Notas
Projeto realizado para a empresa Dell Technologies
Membros da banca
Área do Conhecimento CNPQ
ENGENHARIAS
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
