Trace Id is missing
Pular para o conteúdo principal
Azure

O que é geração aumentada por recuperação (RAG)?

Aprenda como a tecnologia de geração aumentada por recuperação (RAG) melhora a precisão e a relevância das respostas geradas por modelos de linguagem grande (LLMs).

O RAG aumenta a precisão da IA integrando conhecimento externo, garantindo respostas atualizadas e relevantes

Ao aprimorar as funcionalidades de computação em nuvem e influenciar o avanço da IA, o RAG ajuda a melhorar a precisão e a relevância das respostas geradas por IA, tornando os sistemas de IA mais confiáveis e eficazes em várias aplicações.

Principais conclusões

  • A história e evolução do RAG na IA reflete uma tendência mais ampla em direção a sistemas mais inteligentes e com reconhecimento de contexto, que conseguem combinar grandes quantidades de informação com capacidades sofisticadas de geração.
  • A arquitetura do RAG permite que sistemas de IA produzam conteúdo mais informado e confiável ao fundamentar a geração pré-treinada no conhecimento externo recuperado.
     
  • Os benefícios do RAG o tornam uma técnica poderosa para criar sistemas de IA mais precisos, confiáveis e versáteis, com amplas aplicações em vários domínios, setores e tarefas.
     
  • Desenvolvedores usam o RAG para construir sistemas de IA que podem gerar conteúdo baseado em informações precisas, resultando em aplicações mais confiáveis, reconhecimento de contexto e centradas no usuário.

  • Sistemas RAG combinam recuperação e geração, tornando-se uma ferramenta poderosa para uma ampla gama de aplicações, setores e casos de uso.

  • À medida que os modelos RAG avançam, espera-se que desempenhem um papel crucial em várias aplicações, desde o atendimento ao cliente até a pesquisa e criação de conteúdo.

  • O RAG está preparado para desempenhar um papel crucial no futuro dos LLMs, aprimorando a integração dos processos de recuperação e geração.

RAG: Mecânica, história e impacto

Como o RAG funciona

Geração aumentada por recuperação (RAG) é uma estrutura de IA que combina duas técnicas; primeiro, ele recupera informações relevantes de fontes externas, como bancos de dados, documentos ou a Web. Uma vez reunida essa informação, ela é usada para informar e aprimorar a geração de respostas. Essa abordagem capitaliza os pontos fortes das técnicas de recuperação e geração, garantindo que as respostas sejam precisas, relevantes e enriquecidas contextualmente pela informação mais atualizada e específica disponível. Essa capacidade dupla permite que os sistemas RAG produzam saídas mais informadas e detalhadas do que os modelos puramente generativos.

A história do RAG

O RAG tem suas raízes nos primeiros sistemas de recuperação básica de informações. À medida que as tecnologias de IA generativa avançaram rapidamente e modelos de linguagem generativa como GPT-2 e BERT surgiram, a necessidade de respostas mais precisas e relevantes cresceu.   Em 2020, a arquitetura RAG foi introduzida, marcando um avanço significativo. Usando aprendizado de máquina para combinar módulos de recuperação e geração—integrando a base de conhecimento interna dos LLMs com fontes externas de conhecimento—os RAGs foram capazes de produzir textos mais precisos, atualizados, coerentes e contextualmente corretos.   Com aprendizado profundo no núcleo, os modelos RAG podem ser treinados de ponta a ponta, permitindo saídas que otimizam as respostas, melhorando a qualidade do conteúdo gerado à medida que o modelo aprende a recuperar as informações mais confiáveis e contextualmente úteis.

A importância do RAG para a IA

O RAG desempenha um papel crucial no avanço das funcionalidades de IA, refletindo uma tendência em direção a sistemas mais inteligentes e reconhecimento de contexto, que conseguem combinar grandes quantidades de informações com capacidades sofisticadas de geração. Aqui estão as principais razões pelas quais o RAG é fundamental para a IA:

 
  • Precisão avançada: Ao integrar fontes externas de conhecimento, o RAG melhora significativamente a precisão e a relevância das respostas geradas pelos LLMs.
  • Relevância contextual: O RAG permite que sistemas de IA gerem respostas mais apropriadas ao contexto ao recuperar informações específicas relacionadas à solicitação.

  • Custo-benefício: Implementar o RAG é mais eficiente do que treinar continuamente LLMs com novos dados. 

  • Transparência: Ao fornecer fontes para as informações usadas nas respostas, o RAG melhora a credibilidade e a confiança.
     
  • Versatilidade: O RAG pode ser aplicado em vários setores, como saúde, educação e finanças, para finalidades como atendimento ao cliente, pesquisa e criação de conteúdo.

  • Experiência aprimorada:: Ao fornecer respostas mais precisas e relevantes, a tecnologia RAG resulta em interações mais satisfatórias e produtivas para os usuários.
 

Arquitetura RAG

A arquitetura dos sistemas RAG é uma combinação de dois módulos principais, além de um mecanismo de fusão que trabalham juntos para produzir saídas precisas e contextualmente relevantes. Os módulos do RAG podem ser treinados de ponta a ponta, permitindo que o algoritmo otimize conjuntamente a recuperação e a geração, resultando em um resultado mais informado e confiável.

Veja como a arquitetura RAG funciona:

O módulo de recuperação pesquisa um grande conjunto de dados para encontrar as informações mais relevantes com base na consulta.

Após a recuperação, o módulo de geração usa as informações recuperadas como contexto adicional para gerar uma resposta coerente e relevante. Tipicamente, os módulos de geração são um modelo de linguagem pré-treinado, como transformador generativo pré-treinado (GPT) ou transformador bidirecional e autorregressivo (BART), que foram ajustados para gerar texto com base na entrada e nas informações recuperadas.

O mecanismo de fusão garante que as informações recuperadas sejam combinadas de forma eficaz no processo de geração. Essa interação entre os módulos permite que os sistemas RAG produzam conteúdo mais informado e confiável, fundamentando a geração em conhecimento recuperado. 

Os benefícios do RAG

Arquitetura poderosa para melhorar a IA

Desenvolvedores usam a arquitetura RAG para criar sistemas de IA mais precisos, confiáveis e versáteis, com amplas aplicações em vários setores e tarefas. Os benefícios do RAG são:
   
  • Melhoria na precisão, relevância e precisão contextual: Ao recuperar documentos ou dados relevantes, o RAG garante que a saída gerada esteja baseada em informações factuais e pertinentes, melhorando a precisão e relevância gerais das respostas.

  • Redução de alucinações por meio de geração baseada em fatos: O RAG reduz a probabilidade de alucinações—gerando informações plausíveis, mas incorretas—baseando a saída do modelo generativo em conteúdo realmente recuperado, levando a resultados mais confiáveis.

  • Melhor desempenho em tarefas de domínio aberto com amplo acesso ao conhecimento: O RAG se destaca em perguntas de domínio aberto e tarefas semelhantes, recuperando eficientemente informações de fontes vastas e diversificadas, permitindo lidar com uma ampla gama de tópicos com profundidade e abrangência.

  • Escalabilidade e capacidade de lidar com grandes bases de conhecimento: O RAG pode pesquisar e recuperar informações relevantes de conjuntos de dados massivos de forma eficiente, tornando-o escalonável e adequado para aplicações que exigem amplo acesso ao conhecimento. Bancos de dados NoSQL permitem que os modelos RAG aproveitem grandes quantidades de dados para gerar respostas contextualmente enriquecidas.

  • Personalização e aplicações específicas de domínio: Os modelos RAG são adaptáveis e podem ser ajustados para domínios específicos, permitindo que desenvolvedores criem sistemas de IA especializados para indústrias ou tarefas particulares, como aconselhamento jurídico, diagnósticos médicos ou análise financeira.

  • Aprendizado interativo e adaptativo: Por meio da adaptação centrada no usuário, os sistemas RAG podem aprender com as interações dos usuários, recuperando informações mais relevantes ao longo do tempo e adaptando suas respostas para atender melhor às necessidades dos usuários, melhorando a experiência e o compromisso.

  • Versatilidade e integração multimodal: O RAG pode ser estendido para trabalhar com dados multimodais (texto, imagens, dados estruturados), enriquecendo a diversidade das informações usadas na geração e ampliando as aplicações do modelo.

  • Escrita informada para criação eficiente de conteúdo: O RAG fornece uma ferramenta poderosa ao recuperar fatos e referências relevantes, garantindo que o conteúdo gerado seja não apenas criativo, mas também preciso e bem fundamentado.

Tipos de sistemas RAG

Versatilidade em várias aplicações

A geração aumentada por recuperação é uma arquitetura de IA adaptativa e versátil com uma ampla gama de casos de uso em diferentes domínios e setores. Aqui estão  as principais aplicações do RAG:
 
  • Perguntas de domínio aberto (ODQA) 
    Caso de uso:
    O RAG é altamente eficaz em sistemas ODQA, no quais os usuários podem fazer perguntas sobre praticamente qualquer tópico.
    Exemplo: Chatbots de suporte ao cliente usam o RAG para fornecer respostas precisas, recuperando informações de grandes bases de conhecimento ou perguntas frequentes (FAQs).

  • Consultas especializadas de domínio específico 
    Caso de uso:
    Para o setor jurídico, o RAG pode auxiliar na análise e geração de resumos de jurisprudências, precedentes e estatutos ao recuperar documentos relevantes.
    Exemplo: Uma ferramenta de assistência jurídica recupera e resume documentos para finalidades específicas.

  • Resumos de conteúdo
    Caso de uso:
    O RAG pode ajudar a gerar conteúdo de alta qualidade, como notas de reunião de assistentes virtuais ou resumos de artigos, relatórios ou posts de blogs, recuperando informações relevantes e integrando-as no texto gerado.
    Exemplo: Um jornalista usa o RAG para gerar resumos de artigos de notícias recentes ao extrair detalhes importantes de várias fontes.

  • Recomendações personalizadas
    Caso de uso:
    O RAG pode aprimorar sistemas de recomendação ao recuperar informações específicas do usuário e gerar sugestões personalizadas.
    Exemplo: Uma plataforma de comércio eletrônico usa o RAG para recomendar produtos com base no histórico de navegação e preferências do usuário, oferecendo explicações geradas a partir de avaliações ou descrições de produtos relevantes.

  • Análise de cenários complexos e criação de conteúdo 
    Caso de uso:
    Um modelo híbrido de RAG pode ser usado para gerar e sintetizar relatórios detalhados ou análises ao recuperar dados relevantes, documentos ou notícias de várias fontes complexas.
    Exemplo: Uma ferramenta de análise financeira gera projeções de investimentos, análises ou relatórios ao recuperar e resumir tendências de mercado recentes, dados financeiros históricos, desempenho de ações, comentários de especialistas e indicadores econômicos.

  • Pesquisa e síntese de informações
    Caso de Uso:
    Pesquisadores podem usar o RAG para recuperar e sintetizar informações de artigos acadêmicos, relatórios ou bancos de dados, facilitando revisões e projetos de pesquisa.
    Exemplo: Uma ferramenta acadêmica gera resumos de artigos de pesquisa relevantes ao extrair as principais descobertas de vários estudos.

  • Aplicações multilíngues e interlinguísticas
    Caso de Uso:
    O RAG pode ser implantado em ambientes multilíngues para recuperar informações em diferentes idiomas e gerar conteúdo interlinguístico.
    Exemplo: Uma ferramenta de tradução traduz textos enquanto recupera informações culturalmente relevantes para garantir que a tradução seja adequada ao contexto.

O RAG impulsionará a IA do futuro

Aumentando a precisão nas saídas de IA

A geração aumentada por recuperação está preparada para desempenhar um papel crucial no futuro dos LLMs, aprimorando a integração dos processos de recuperação e geração. Os avanços esperados nessa área levarão a uma fusão mais contínua e sofisticada desses componentes, permitindo que os LLMs forneçam saídas altamente precisas e contextualmente relevantes em uma gama mais ampla de aplicações e setores.

À medida que o RAG continua a evoluir, podemos antecipar sua adoção em novos domínios, como educação personalizada, em que pode adaptar experiências de aprendizado com base nas necessidades individuais, e ferramentas de pesquisa avançadas, oferecendo recuperação precisa e abrangente de informações para consultas complexas.

Abordar limitações atuais, como melhorar a precisão da recuperação e reduzir os vieses, será fundamental para maximizar o potencial dos sistemas RAG. Iterações futuras do RAG provavelmente apresentarão sistemas mais interativos e reconhecimento de contexto, aprimorando as experiências dos usuários ao se adaptar dinamicamente às entradas dos usuários.

Além disso, o desenvolvimento de modelos RAG multimodais, que utilizam pesquisa visual computacional para integrar texto, imagens e outros tipos de dados, expandirá ainda mais as possibilidades, tornando os LLMs mais versáteis e poderosos do que nunca.
Perguntas frequentes

Perguntas frequentes

  • Geração aumentada por recuperação (RAG) é uma técnica de IA que combina um modelo de recuperação com um modelo generativo. Ele recupera informações relacionadas de um banco de dados ou conjunto de documentos e as usa para gerar respostas mais precisas e contextualmente relevantes. Essa abordagem aprimora a qualidade do texto gerado pela IA ao fundamentá-lo em dados do mundo real, tornando-o particularmente útil para tarefas como responder perguntas, resumir e criar conteúdo.
  • O RAG melhora o conteúdo gerado por IA ao incorporar dados externos. Ele recupera informações relevantes de um banco de dados e usa esses dados para gerar respostas mais precisas e reconhecimento de contexto. Esse processo garante que a saída do sistema de IA seja mais bem informada e confiável.
  • O RAG combina um modelo de linguagem de grande (LLM) com um mecanismo de recuperação. Enquanto um LLM gera texto com base em dados pré-treinados, o RAG aprimora isso ao recuperar informações relevantes de fontes externas em tempo real, melhorando a precisão e a relevância. Essencialmente, o LLM depende de padrões aprendidos, enquanto o RAG obtém ativamente informações atualizadas para informar suas respostas.