🎯 Objetivo do vídeo


Demonstrar como funciona uma aplicação de IA generativa com RAG (Retrieval-Augmented Generation) rodando 100% local, explicando primeiro a arquitetura, o papel de cada componente e, só então, a implementação prática.

📚 Conceitos

O problema

RAG

RAG é um padrão arquitetural onde, antes de perguntar algo para a LLM, eu busco informações relevantes em uma base externa e coloco esse conteúdo dentro do prompt.

Embeddings

Um embedding é uma forma de transformar texto em números que representam significado. Textos parecidos ficam próximos nesse espaço.

Busca Semântica

Não é palavra-chave, é proximidade de significado.

Prompt Aumentado