Skills vs. RAG vs. System Prompt: Entendendo as diferenças

Ao construir sistemas de IA, é fundamental compreender as diferenças entre Skills (Habilidades), RAG (Retrieval-Augmented Generation) e System Prompt (Instruções de Sistema). Cada abordagem serve propósitos específicos e é otimizada para diferentes cenários. Esta página explora em detalhes como cada técnica funciona, quando utilizá-las e suas principais diferenças.

Em termos simples: Qual a diferença?

Pense no seu assistente de IA como um funcionário em uma empresa:

🎭 System Prompt = Personalidade e valores da pessoa

É como a personalidade, valores e comportamento básico do funcionário. Define como ele age, fala e se comporta em todas as situações.

Exemplo prático: "Seja sempre educado", "Fale de forma profissional", "Nunca invente informações"

Use quando: Você quer que o comportamento seja sempre igual, independente da situação.

🎓 Skills = Especializações que a pessoa sabe fazer

São habilidades especiais que o funcionário pode usar quando necessário. Como ter um especialista em diferentes áreas que só é chamado quando precisa.

Exemplo prático:

Precisa falar com executivos? Ativa a skill "Comunicação Executiva"
Precisa analisar código? Ativa a skill "Code Review"
Precisa resolver problema técnico? Ativa a skill "Troubleshooting"

Use quando: Você precisa de diferentes formas de fazer as coisas dependendo da situação. O próprio modelo decide qual skill usar baseado no que o usuário está pedindo.

📚 RAG (Coleções) = Manual de instruções e documentos

É como ter acesso a uma biblioteca de documentos, manuais e informações específicas da empresa. O funcionário busca informações quando precisa de dados específicos.

Exemplo prático:

"Qual a política de férias?" → Busca no manual de RH
"Como configurar o produto X?" → Busca no manual do produto
"Qual o preço do item Y?" → Busca no catálogo de produtos

Use quando: Você tem informações específicas, dados e fatos que mudam com frequência ou são muito extensos para colocar nas instruções.

🤔 Perguntas rápidas para decidir

Minha informação muda com frequência?

✅ Sim → Use RAG (Coleções)
❌ Não, é fixa → Use System Prompt ou Skills

É um comportamento ou uma informação?

🎭 Comportamento (como fazer) → Use Skills
📄 Informação (o que é) → Use RAG

Deve ser usado sempre ou só às vezes?

🔄 Sempre → Use System Prompt
🎯 Às vezes → Use Skills ou RAG

É curto ou longo?

📝 Curto (poucas frases) → Use System Prompt
📖 Longo (páginas de informação) → Use RAG
🎓 Médio (instruções detalhadas) → Use Skills

System Prompt (Instruções de Sistema)

System Prompt são instruções fixas que definem o comportamento fundamental do modelo de IA. Elas estabelecem a personalidade, o tom, as regras básicas e o papel que o agente deve desempenhar em todas as interações.

Características principais:

Sempre ativo: Presente em cada requisição ao modelo
Estático: Não muda durante a conversa
Prioritário: Tem alta influência sobre o comportamento do modelo
Conciso: Deve ser breve para economizar tokens
Universal: Aplica-se a todos os tipos de requisição

Quando usar System Prompt:

Definir personalidade e tom

Você é um assistente técnico experiente e amigável.
Sempre responda de forma clara, profissional e didática.
Use exemplos práticos sempre que possível.

Estabelecer regras universais

- Nunca invente informações que você não sabe
- Sempre cite fontes quando fornecidas
- Quando incerto, admita e ofereça alternativas
- Priorize segurança e boas práticas em todas as sugestões

Definir formato de resposta padrão

Estruture suas respostas em:
1. Resumo executivo
2. Explicação detalhada
3. Exemplos práticos
4. Próximos passos recomendados

Restrições de segurança e conformidade

- Nunca forneça conselhos médicos, legais ou financeiros específicos
- Não processe informações pessoalmente identificáveis
- Recuse solicitações que violem políticas de uso

Limitações do System Prompt:

❌ Não é aconselhável ter informações extensas (consumo constante de tokens)
❌ Não se adapta dinamicamente ao contexto
❌ Difícil de manter múltiplos comportamentos especializados

Exemplo prático:

# System Prompt para assistente de código
Você é um desenvolvedor sênior especializado em revisão de código.

Diretrizes:
- Analise código com foco em legibilidade, manutenibilidade e performance
- Sugira melhorias seguindo princípios SOLID e clean code
- Sempre explique o "porquê" das suas sugestões
- Forneça exemplos de código refatorado quando apropriado
- Seja construtivo e educativo nas críticas

Formato de resposta:
1. Resumo da análise
2. Pontos positivos
3. Áreas de melhoria
4. Código refatorado (se aplicável)

Veja também:

Skills (Habilidades)

Skills são conjuntos de instruções especializadas que são carregadas sob demanda quando o modelo identifica que uma tarefa específica requer conhecimento ou comportamento especializado. Funcionam como "módulos de expertise" que podem ser ativados dinamicamente.

Características principais:

Ativação sob demanda: Carregadas apenas quando necessário
Dinâmicas: O modelo escolhe qual skill usar baseado no contexto
Especializadas: Cada skill foca em um domínio específico
Econômicas em tokens: Só consomem tokens quando ativadas
Intercambiáveis: O modelo pode alternar entre skills durante a conversa

Como funcionam: O modelo recebe uma lista de skills disponíveis (nome + descrição breve). Quando identifica que precisa de expertise específica, chama uma função especial para carregar as instruções completas da skill, que são então injetadas temporariamente no contexto.

Quando usar Skills:

Múltiplas áreas de especialização

# Skill: Análise de SQL Performance
Descrição: Use para otimizar queries SQL e resolver problemas de performance em bancos de dados

Instruções:
- Analise planos de execução (EXPLAIN)
- Identifique missing indexes
- Sugira otimizações específicas para o SGBD
- Considere impacto de JOIN, subqueries e CTEs
- Avalie necessidade de desnormalização

Diferentes personas ou tons de comunicação

# Skill: Comunicação C-Level
Descrição: Use ao criar apresentações ou comunicações para executivos

Instruções:
- Foque em impacto nos negócios e ROI
- Use linguagem não-técnica
- Apresente dados em formato executivo (resumos, métricas-chave)
- Destaque riscos e oportunidades estratégicas
- Seja conciso - máximo 3 pontos principais

Frameworks e metodologias específicas

# Skill: Arquitetura Event-Driven
Descrição: Use para design de sistemas baseados em eventos e mensageria

Instruções:
- Aplique padrões: Event Sourcing, CQRS, Saga
- Considere consistência eventual
- Avalie message brokers apropriados (Kafka, RabbitMQ, SNS/SQS)
- Projete eventos com schema evolution em mente
- Implemente idempotência e dead letter queues

Conhecimento de domínio extenso

# Skill: Compliance LGPD
Descrição: Use ao lidar com questões de privacidade e proteção de dados no Brasil

Instruções:
- Verifique conformidade com LGPD (Lei 13.709/2018)
- Identifique dados pessoais e sensíveis
- Avalie bases legais para tratamento
- Sugira medidas de segurança apropriadas
- Considere direitos dos titulares (acesso, correção, exclusão)
- Avalie necessidade de DPO e RIPD

Vantagens das Skills:

✅ Especialização profunda sem sobrecarregar o prompt base
✅ Economia de tokens (só usa o necessário)
✅ Flexibilidade para múltiplos domínios
✅ Manutenção modular (edite skills independentemente)
✅ Escala melhor que System Prompt para conhecimento diverso

Limitações das Skills:

❌ Requer modelos com suporte a function calling
❌ O modelo pode não escolher a skill correta
❌ Latência adicional na primeira ativação
❌ Complexidade de implementação maior

Exemplo de fluxo:

Usuário: "Como otimizar esta query que está demorando 30 segundos?"

1. Modelo identifica necessidade de expertise em SQL
2. Chama função: load_skill("Análise de SQL Performance")
3. Instruções da skill são injetadas no contexto
4. Modelo responde com análise especializada
5. Skill permanece ativa até que outra seja necessária

Veja também:

RAG (Retrieval-Augmented Generation)

O que é: RAG é uma técnica que combina recuperação de informações (retrieval) com geração de texto. O sistema busca em uma base de conhecimento informações relevantes para a consulta do usuário e as fornece como contexto para o modelo gerar uma resposta fundamentada.

O módulo de RAG é implementado através de Coleções que contêm Documentos. Cada coleção é uma biblioteca de conhecimento que abriga vários documentos indexados, prontos para serem recuperados quando relevantes. Você pode usar o RAG da AIVAX de forma independente ou através de um AI Gateway.

Características principais:

Baseado em dados reais: Usa documentos específicos da sua base de conhecimento
Dinâmico: Informações podem ser atualizadas adicionando/modificando documentos
Escalável: Suporta milhares de documentos por coleção
Rastreável: Pode citar fontes e documentos específicos
Específico do domínio: Ideal para bases de conhecimento corporativas

Como funciona na AIVAX:

Você cria uma Coleção para organizar documentos por finalidade (produto, empresa, serviço)
Adiciona Documentos à coleção - cada documento contém informações sobre um tópico específico
Documentos são processados e convertidos em embeddings (vetores) automaticamente
Vincula a coleção ao seu AI Gateway através do pipeline de RAG
Quando usuário faz uma pergunta, a AIVAX busca documentos relevantes na coleção
Documentos recuperados são inseridos no contexto do modelo
Modelo gera resposta fundamentada nos documentos encontrados

Quando usar RAG (Coleções):

Base de conhecimento corporativa
- Políticas e procedimentos internos
- Manuais de RH e benefícios
- Processos operacionais
- FAQs da empresa
Documentação técnica extensa
- Manuais de produto
- APIs e referências técnicas
- Artigos de troubleshooting
- Guias de instalação e configuração
Informações que mudam frequentemente
- Catálogos de produtos e preços
- Regulamentações e compliance
- Status e atualizações de sistemas
- Notícias e comunicados
Responder com fontes citáveis
- Documentação legal e contratos
- Normas e regulamentações
- Artigos científicos e pesquisas
- Histórico de decisões e precedentes
Compliance e auditoria
- Rastreabilidade de onde vêm as informações
- Garantia de que respostas são baseadas em documentos oficiais
- Atualização automática quando documentos são modificados
- Versionamento e controle de mudanças

Vantagens do RAG (Coleções na AIVAX):

✅ Acesso a informações atualizadas sem retreinar o modelo
✅ Reduz alucinações (informações inventadas pelo modelo)
✅ Transparência com citação de fontes e documentos
✅ Escala para milhares de documentos organizados em coleções
✅ Informações proprietárias/confidenciais ficam seguras e privadas
✅ Fácil manutenção: adicione, edite ou remova documentos a qualquer momento
✅ Sem custo de armazenamento de coleções (apenas custo de indexação)

Limitações do RAG (Coleções):

❌ Qualidade depende de como os documentos são escritos e organizados
❌ Custos de indexação de documentos (por tokens processados)
❌ Latência adicional para busca na coleção
❌ Requer organização e estruturação adequada dos documentos
❌ Documentos muito longos ou mal escritos reduzem a qualidade

Como criar documentos eficazes:

Para obter os melhores resultados com RAG na AIVAX, siga estas diretrizes ao criar documentos:

✅ Faça:

Foque cada documento em um único tópico ou assunto
Seja explícito e repita palavras-chave importantes
Use linguagem clara e objetiva
Mantenha documentos entre 20 e 700 palavras
Use tags para organizar e categorizar documentos

❌ Evite:

Documentos muito curtos (menos de 10 palavras)
Documentos muito longos (mais de 700 palavras)
Misturar múltiplos assuntos em um único documento
Usar linguagem técnica excessiva ou código
Ser vago ou implícito nas informações

Veja mais:

Coleções (RAG) - Como criar e gerenciar coleções
Documentos - Como adicionar e organizar documentos
Pipelines de AI Gateway - RAG - Como vincular coleções ao gateway
Funções de Protocolo - query-collection - Buscar em coleções via função

Comparação rápida: Qual usar?

O que você precisa	System Prompt	Skills	RAG (Coleções)
Informações constantes	✅ Ideal	❌ Não	❌ Não
Definir comportamento básico	✅ Sempre	❌ Não	❌ Não
Múltiplas especializações	❌ Não	✅ Sim	❌ Não
Acessar documentos e dados	❌ Não	❌ Não	✅ Sim
Informações que mudam	❌ Difícil	❌ Difícil	✅ Fácil
Sempre ativo	✅ Sim	❌ Só quando necessário	❌ Só quando necessário
Tamanho ideal	Pequeno	Médio	Grande
Custo por uso	Sempre cobra	Só quando ativa	Só quando busca

Comparação detalhada (técnica)

Para desenvolvedores e usuários avançados:

Critério	System Prompt	Skills	RAG
Propósito	Comportamento base constante	Expertise especializada sob demanda	Acesso a conhecimento factual específico
Ativação	Sempre ativo	Sob demanda (function calling)	Sob demanda (busca vetorial)
Tamanho do conteúdo	Pequeno (< 1000 tokens)	Médio (1000-5000 tokens)	Grande (milhares de documentos)
Consumo de tokens	Constante em toda requisição	Apenas quando skill ativada	Apenas docs recuperados
Atualização	Estático (requer redeployment)	Estático (requer atualização manual)	Dinâmico (docs podem ser atualizados)
Tipo de conhecimento	Comportamental, regras gerais	Metodologias, frameworks, processos	Fatos, dados, documentos específicos
Complexidade de implementação	Baixa	Média	Média
Custo de operação	Baixo	Baixo-Médio	Médio (indexação)
Rastreabilidade	Não aplicável	Limitada	Alta (citação de fontes)
Latência	Nenhuma adicional	Pequena (primeira ativação)	Média (busca + embedding)
Requer function calling	Não	Sim	Não (mas recomendado)
Melhor para	Personalidade, tom, regras universais	Múltiplas expertises contextuais	Bases de conhecimento extensas

Cenários de uso combinado

Na prática, as três técnicas frequentemente são usadas em conjunto para criar sistemas robustos:

Exemplo 1: Suporte técnico de produto

System Prompt: "Você é um agente de suporte técnico amigável e eficiente. Sempre seja educado e ofereça soluções práticas."

Skills disponíveis:

"Troubleshooting Hardware": Para problemas físicos de equipamentos
"Troubleshooting Software": Para bugs e problemas de aplicativos
"Escalation Procedures": Para casos que requerem escalação

RAG (Coleções):

Coleção "Base de Conhecimento": 5000 documentos de troubleshooting
Coleção "Manuais de Produtos": Documentação técnica atualizada
Coleção "Resoluções": Histórico de tickets resolvidos com sucesso

Fluxo:

System Prompt define o tom amigável e comportamento básico
Usuário relata: "Meu aplicativo está crashando ao abrir"
Modelo ativa skill "Troubleshooting Software" para expertise específica
RAG busca automaticamente em "Base de Conhecimento" artigos sobre crashes
Resposta combina a expertise da skill + informações específicas dos documentos encontrados

Exemplo 2: Assistente jurídico

System Prompt: "Você é um assistente jurídico. Sempre inclua disclaimers apropriados e nunca forneça aconselhamento legal definitivo."

Skills disponíveis:

"Análise Contratual": Para revisar cláusulas e termos
"Due Diligence": Para processos de M&A
"Compliance LGPD": Para questões de privacidade

RAG (Coleções):

Coleção "Legislação": Leis e regulamentos brasileiros atualizados
Coleção "Jurisprudência": Precedentes e decisões judiciais relevantes
Coleção "Templates": Modelos de documentos jurídicos da firma
Coleção "Procedimentos Internos": Processos e políticas do escritório

Exemplo 3: Assistente de desenvolvimento

System Prompt: "Você é um desenvolvedor sênior. Sempre priorize boas práticas, segurança e código manutenível."

Skills disponíveis:

"Code Review": Para análise detalhada de código
"Architecture Design": Para decisões arquiteturais
"Security Audit": Para identificar vulnerabilidades

RAG (Coleções):

Coleção "APIs Internas": Documentação das APIs da empresa
Coleção "Padrões de Código": Standards e conventions do time
Coleção "Componentes": Biblioteca de componentes reutilizáveis com exemplos
Coleção "Troubleshooting": Problemas comuns e suas soluções

Árvore de decisão: Qual técnica usar?

Passo 1: O que você está definindo?

O que você precisa?
│
├─ 🎭 COMPORTAMENTO (como a IA deve agir/falar)
│  │
│  └─ Isso muda dependendo da situação?
│     ├─ NÃO, sempre igual → SYSTEM PROMPT
│     └─ SIM, depende do contexto → SKILLS
│
├─ 📄 INFORMAÇÃO/DADOS (fatos, documentos, conhecimento)
│  │
│  └─ É muito conteúdo ou muda frequentemente?
│     ├─ SIM → RAG (Coleções)
│     └─ NÃO → SYSTEM PROMPT
│
└─ 🎓 METODOLOGIA (processo passo-a-passo, framework)
   └─ Usa em todas as conversas?
      ├─ SIM → SYSTEM PROMPT
      └─ NÃO → SKILLS

Passo 2: Exemplos práticos

Cenário A: "Quero que a IA sempre seja educada e profissional" → SYSTEM PROMPT (comportamento fixo, sempre ativo)

Cenário B: "Quero que a IA fale de forma diferente quando atender executivos vs. técnicos" → SKILLS (2 skills: "Comunicação Executiva" e "Comunicação Técnica")

Cenário C: "Tenho 500 páginas de manual do produto que a IA precisa consultar" → RAG (crie uma Coleção "Manual do Produto" com os documentos)

Cenário D: "Quero que a IA siga o processo ITIL para resolver tickets" → SKILLS (crie uma skill "Processo ITIL" que será ativada quando relevante)

Cenário E: "Tenho um catálogo de 10.000 produtos com preços que mudam semanalmente" → RAG (crie uma Coleção "Catálogo" e atualize os documentos quando preços mudarem)

Cenário F: "Quero que a IA sempre responda em 3 passos: resumo, detalhes, conclusão" → SYSTEM PROMPT (formato fixo de resposta)

Passo 3: Casos especiais

E se eu precisar dos três? ✅ Perfeitamente normal! Combine:

System Prompt: Define comportamento básico
Skills: Adiciona especialização contextual
RAG: Fornece acesso aos dados e documentos

Exemplo completo:

System Prompt: "Você é um assistente de suporte amigável e profissional"
Skills: "Troubleshooting", "Escalação", "Vendas"
RAG: Coleção "Base de Conhecimento" + Coleção "Produtos"

⚠️ Erros comuns (evite isso!)

❌ Erro 1: Colocar dados no System Prompt

Errado: Colocar lista de 100 produtos no System Prompt

System Prompt:
Você é um assistente de vendas. Nossos produtos são:
1. Produto A - R$ 50
2. Produto B - R$ 100
... (98 produtos depois)

Correto: Use RAG (Coleções)

Crie uma Coleção "Catálogo"
Adicione um documento para cada produto
A IA busca quando necessário

❌ Erro 2: Criar Skills para informações

Errado: Criar uma skill com dados de produtos

Skill: Produtos
Descrição: Informações sobre produtos

Instruções:
- Produto A custa R$ 50
- Produto B custa R$ 100
- Produto C custa R$ 150

Correto: Use RAG (Coleções) Skills são para como fazer, não para informações/dados

❌ Erro 3: Usar RAG para comportamento

Errado: Criar documentos sobre como a IA deve agir

Documento 1: "Você deve ser educado"
Documento 2: "Você deve ser profissional"

Correto: Use System Prompt RAG é para informações, não para comportamento

❌ Erro 4: Duplicar informações

Errado: Colocar a mesma informação em Skills E RAG E System Prompt

Correto: Escolha UM lugar baseado na natureza da informação:

Comportamento fixo → System Prompt
Metodologia/processo → Skills
Dados/documentos → RAG

❌ Erro 5: Skills demais

Errado: Criar 50 skills diferentes

Correto: Mantenha entre 3-10 skills focadas

Muitas skills confundem o modelo
Agrupe skills similares

Métricas de sucesso para cada abordagem

System Prompt:

Consistência no tom e comportamento
Taxa de seguimento de regras gerais
Qualidade percebida das interações

Skills:

Taxa de ativação correta da skill
Qualidade das respostas especializadas
Economia de tokens vs. instruções sempre ativas

RAG:

Precisão da recuperação (relevância dos docs)
Taxa de citação de fontes
Redução de alucinações
Atualidade das informações fornecidas

Conclusão e recomendações

Use System Prompt para:

Definir a personalidade e tom fundamental
Estabelecer regras que sempre se aplicam
Configurar comportamentos de segurança

Use Skills para:

Múltiplas áreas de expertise distintas
Processos e metodologias especializadas
Diferentes personas ou estilos de comunicação
Economizar tokens em conhecimento contextual

Use RAG (Coleções) para:

Acessar bases de conhecimento extensas e organizadas
Informações que mudam frequentemente (produtos, preços, políticas)
Necessidade de citação de fontes e rastreabilidade
Conhecimento factual específico do domínio
Documentação técnica, manuais e procedimentos

Combine as três quando:

Construir assistentes corporativos complexos
Precisar de comportamento consistente + expertise + conhecimento factual
Escalar para múltiplos domínios e casos de uso

A escolha certa depende do seu caso de uso específico. Comece simples com System Prompt, adicione Skills quando precisar de especialização, e implemente RAG quando tiver uma base de conhecimento substancial que precisa ser acessada dinamicamente.

📚 Leitura adicional:

Table of Contents

Skills vs. RAG vs. System Prompt: Entendendo as diferenças

Em termos simples: Qual a diferença?

🎭 System Prompt = Personalidade e valores da pessoa

🎓 Skills = Especializações que a pessoa sabe fazer

📚 RAG (Coleções) = Manual de instruções e documentos

🤔 Perguntas rápidas para decidir

System Prompt (Instruções de Sistema)

Skills (Habilidades)

RAG (Retrieval-Augmented Generation)

Comparação rápida: Qual usar?

Comparação detalhada (técnica)

Cenários de uso combinado

Exemplo 1: Suporte técnico de produto

Exemplo 2: Assistente jurídico

Exemplo 3: Assistente de desenvolvimento

Árvore de decisão: Qual técnica usar?

Passo 1: O que você está definindo?

Passo 2: Exemplos práticos

Passo 3: Casos especiais

⚠️ Erros comuns (evite isso!)

❌ Erro 1: Colocar dados no System Prompt

❌ Erro 2: Criar Skills para informações

❌ Erro 3: Usar RAG para comportamento

❌ Erro 4: Duplicar informações

❌ Erro 5: Skills demais

Métricas de sucesso para cada abordagem

Conclusão e recomendações