Guardrails em IA Generativa

N/D

Autores

Pereira, Fernanda de Oliveira
Hermida, Gabriel Mendonça de Mello
Medeiros, Rodrigo Paoliello de

Co-orientadores

Citações na Scopus

Tipo de documento

Trabalho de Conclusão de Curso

Data

2025

Unidades Organizacionais

Resumo

A inteligência artificial (IA) generativa, quando aplicada no desenvolvimento de assistentes virtuais, pode, em muitos casos, retornar respostas inadequadas ou incorretas, confundindo usuários e gerando desinformação. Atualmente, são desenvolvidas guardrails que analisam tanto as entradas fornecidas pelos usuários quanto as saídas geradas pelos modelos, garantindo que as respostas devolvidas sejam adequadas. Nesse contexto, a solução deste projeto consistiu na implementação de diferentes tipos de guardrails (escopo, competidores, toxicidade, alucinação, dados sensíveis e técnicas de jailbreak), na definição de métricas específicas para avaliar seu funcionamento e na construção de uma arquitetura suficientemente modular para ser adaptável a diversos contextos. As guardrails implementadas alcançaram resultados satisfatórios conforme as métricas estabelecidas, indicando viabilidade técnica para utilização inicial pela empresa parceira em consultorias de assistência virtual com IA. Apesar disso, o projeto identificou oportunidades de melhoria, especialmente relacionadas à ampliação das bases de treinamento e avaliação, à adoção de mecanismos adaptativos e ao aprimoramento da mitigação de alucinações, visando ampliar sua eficácia em aplicações práticas futuras.

Palavras-chave

Inteligência Artificial; Assistentes Virtuais; Large Language Models (LLM); Gardrails

Titulo de periódico

URL da fonte

Título de Livro

URL na Scopus

Sinopse

Objetivos de aprendizagem

Idioma

Português

Notas

Projeto realizado para a empresa Dell Technologies

Área do Conhecimento CNPQ

ENGENHARIAS

CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO

Citação

Avaliação

Revisão

Suplementado Por

Referenciado Por