Geração aumentada via recuperação (RAG) é o processo de otimizar a saída de um grande modelo de linguagem, de modo que ele faça referência a uma base de conhecimento autorizada fora de suas fontes de dados de treinamento antes de gerar uma resposta. Os grandes modelos de linguagem (LLMs) são treinados em grandes volumes de dados e usam bilhões de parâmetros para gerar resultados originais para tarefas como responder a perguntas, traduzir idiomas e completar frases. O RAG amplia os já poderosos recursos dos LLMs para domínios específicos ou para a base de conhecimento interna de uma organização, tudo isso sem a necessidade de treinar novamente o modelo. É uma abordagem econômica para melhorar o resultado do LLM, de modo que ele permaneça relevante, preciso e útil em vários contextos.
O Amazon Bedrock é um serviço totalmente gerenciado que oferece uma variedade de modelos básicos de alto desempenho, juntamente com um amplo conjunto de recursos, para criar aplicações de IA generativa e, ao mesmo tempo, simplificar o desenvolvimento e manter a privacidade e a segurança.
A base de conhecimento para o Amazon Bedrock ajuda você a aproveitar a geração aumentada via recuperação (RAG), uma técnica popular que envolve a extração de informações de um armazenamento de dados para aumentar as respostas geradas por grandes modelos de linguagem (LLMs). Quando você configura uma base de conhecimento com suas fontes de dados, sua aplicação pode consultar a base de conhecimento para retornar informações para responder à consulta com citações diretas das fontes ou com respostas naturais geradas a partir dos resultados da consulta.
Com as bases de conhecimento, você pode criar aplicações que são enriquecidas pelo contexto que é recebido ao consultar uma base de conhecimento. Isso habilita um tempo de lançamento mais rápido no mercado, abstraindo o trabalho pesado de criar pipelines e fornecendo uma solução de RAG pronta para uso para reduzir o tempo de criação de sua aplicação. A adição de uma base de conhecimento também aumenta a relação custo-benefício, pois elimina a necessidade de treinar continuamente o modelo para poder aproveitar seus dados privados.