Crie
RAG com Bases de conhecimento do Amazon Bedrock

RAG com Bases de conhecimento do Amazon Bedrock

Implante o chatbot de geração aumentada via recuperação (RAG) usando Bases de conhecimento do Amazon Bedrock

Por arquitetos de soluções da AWS

Método de implantação

Guia de implementação

Tempo de implantação estimado

60 minutos

Serviços da AWS

Bedrock

Custo

Calcular custos

Pronto para implantar a aplicação RAG?

Precisa da ajuda dos especialistas da AWS? Publique seu projeto e trabalhe com parceiros hoje mesmo. Saiba mais.

Seu nível gratuito acabou? Startups estão qualificadas para até USD 100 mil em créditos da AWS. Solicite agora.

Visão geral

Geração aumentada via recuperação (RAG) é o processo de otimizar a saída de um grande modelo de linguagem, de modo que ele faça referência a uma base de conhecimento autorizada fora de suas fontes de dados de treinamento antes de gerar uma resposta. Os grandes modelos de linguagem (LLMs) são treinados em grandes volumes de dados e usam bilhões de parâmetros para gerar resultados originais para tarefas como responder a perguntas, traduzir idiomas e completar frases. O RAG amplia os já poderosos recursos dos LLMs para domínios específicos ou para a base de conhecimento interna de uma organização, tudo isso sem a necessidade de treinar novamente o modelo. É uma abordagem econômica para melhorar o resultado do LLM, de modo que ele permaneça relevante, preciso e útil em vários contextos.

Detalhes técnicos

O Amazon Bedrock é um serviço totalmente gerenciado que oferece uma variedade de modelos básicos de alto desempenho, juntamente com um amplo conjunto de recursos, para criar aplicações de IA generativa e, ao mesmo tempo, simplificar o desenvolvimento e manter a privacidade e a segurança.

A base de conhecimento para o Amazon Bedrock ajuda você a aproveitar a geração aumentada via recuperação (RAG), uma técnica popular que envolve a extração de informações de um armazenamento de dados para aumentar as respostas geradas por grandes modelos de linguagem (LLMs). Quando você configura uma base de conhecimento com suas fontes de dados, sua aplicação pode consultar a base de conhecimento para retornar informações para responder à consulta com citações diretas das fontes ou com respostas naturais geradas a partir dos resultados da consulta.

Com as bases de conhecimento, você pode criar aplicações que são enriquecidas pelo contexto que é recebido ao consultar uma base de conhecimento. Isso habilita um tempo de lançamento mais rápido no mercado, abstraindo o trabalho pesado de criar pipelines e fornecendo uma solução de RAG pronta para uso para reduzir o tempo de criação de sua aplicação. A adição de uma base de conhecimento também aumenta a relação custo-benefício, pois elimina a necessidade de treinar continuamente o modelo para poder aproveitar seus dados privados.