Crear
RAG con bases de conocimiento de Amazon Bedrock

RAG con bases de conocimiento de Amazon Bedrock

Despliegue un chatbot de generación aumentada por recuperación (RAG) mediante las bases de conocimiento de Amazon Bedrock

De los Solutions Architects de AWS

Método de implementación

Guía de implementación

Tiempo de implementación estimado

60 minutos

Servicios de AWS

Bedrock

Costo

Calcular los costos

¿Está listo para desplegar la aplicación RAG?

¿Necesita ayuda de expertos de AWS? Publique su proyecto y trabaje con socios hoy mismo. Más información.

¿Se le agotó el nivel gratuito? Las startups pueden optar a hasta 100 000 USD en créditos de AWS. Realice la solicitud ahora.

Resumen

La generación aumentada por recuperación (RAG) es el proceso de optimización del resultado de un modelo de lenguaje de gran tamaño, por lo que hace referencia a una base de conocimiento autorizada fuera de sus orígenes de datos de entrenamiento antes de generar una respuesta. Los modelos de lenguaje de gran tamaño (LLM) se entrenan con grandes volúmenes de datos y utilizan miles de millones de parámetros para generar resultados originales para tareas como responder preguntas, traducir idiomas y completar oraciones. RAG amplía las ya poderosas capacidades de los LLM a dominios específicos o a la base de conocimientos interna de una organización, sin necesidad de volver a entrenar el modelo. Es un enfoque rentable para mejorar los resultados del LLM, por lo que sigue siendo relevante, preciso y útil en diversos contextos.

Detalles técnicos

Amazon Bedrock es un servicio totalmente gestionado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento, junto con un amplio conjunto de capacidades, para crear aplicaciones de IA generativa, lo que simplifica el desarrollo y mantiene la privacidad y la seguridad.

La base de conocimientos de Amazon Bedrock ayuda a aprovechar la generación aumentada por recuperación (RAG), una técnica popular que consiste en extraer información de un almacén de datos para aumentar las respuestas generadas por los modelos de lenguaje de gran tamaño (LLM). Al configurar una base de conocimientos con los orígenes de datos, la aplicación puede consultarla para obtener información que permita responder a la consulta, ya sea con citas directas de las orígenes o con respuestas naturales generadas a partir de los resultados de la consulta.

Con las bases de conocimiento, puede crear aplicaciones que se enriquezcan con el contexto que se recibe al consultar una base de conocimientos. Permite acelerar el tiempo de lanzamiento al mercado al abstraerse del trabajo pesado que supone la construcción de procesos y proporcionarle una solución RAG lista para usar que reduce el tiempo de creación de su aplicación. La adición de una base de conocimientos también aumenta la rentabilidad, ya que elimina la necesidad de entrenar continuamente su modelo para poder aprovechar sus datos privados.