Conceptos de la Plataforma

Layerum está diseñado para RAG en producción: espacios de trabajo estructurados, acceso seguro mediante API keys, ingestión confiable y control predecible de capacidad desde la carga hasta la consulta.

Qué es Layerum

Layerum es una plataforma RAG alojada para equipos que necesitan ingerir conocimiento, controlar el acceso por workspace y ofrecer respuestas confiables mediante API o SDK.

  • Endpoint alojado: https://api.layerum.com.
  • Contrato público: /v1/*.
  • Autenticación: API keys de workspace (lyr_wk_...).

Modelo de Workspace

Cada equipo trabaja en workspaces aislados. Permisos, modelos, entidades, documentos y API keys se gestionan a nivel de workspace.

  • Múltiples workspaces por cuenta según el plan.
  • Miembros, roles y límites operativos permanecen dentro del workspace.
  • Las API keys pueden limitarse por entidades y configuraciones de modelo.

Modelo de Datos

El conocimiento se organiza para soportar gobernanza y precisión en la recuperación.

  • Entity Types definen categorías de alto nivel.
  • Entities forman la jerarquía y el alcance de recuperación.
  • Los documentos se adjuntan a entidades y se indexan en chunks/vectores.

Ciclo de Ingesta

Los documentos siguen un flujo predecible: carga, parseo, fragmentación, embeddings, indexación y seguimiento de estado.

  • Archivos pequeños: upload directo multipart.
  • Archivos grandes: flujo presigned (init → S3 → complete).
  • Estados: pending, processing, completed, failed.
  • SDK: ingestion.waitUntilReady maneja el polling.

Control de Capacidad

La capacidad es a nivel de cuenta y se distribuye dinámicamente entre workspaces.

  • Se cuenta: entidades, tamaño de documentos, chunks, archivos S3, reservas.
  • No se cuenta: logs, metadata de API keys o modelos.
  • Uploads protegidos: reserva, validación, limpieza.

Seguridad y Gobernanza

El acceso es explícito, limitado y revocable.

  • API keys solo en UI.
  • Capacidades: query:read, data:ingest, config:manage.
  • Controles por key: scope, límites, expiración.
  • Rotación y revocación inmediatas.

Calidad de Recuperación

Las consultas están diseñadas para respuestas controlables y explicables.

  • Scopes por entidad mantienen relevancia.
  • Top-K ajusta amplitud.
  • Citas permiten trazabilidad.
  • Endpoint debug para análisis.

Experiencia de Desarrollo

Integración vía SDK o HTTP con mismo contrato.

  • SDK: @layerum-team/rag-sdk.
  • API: https://api.layerum.com/v1.
  • Mismo modelo de autenticación.
ts

Operaciones y Fiabilidad

Enfocado en estabilidad y errores observables.

  • Errores persistidos.
  • Endpoints de retry.
  • Indexación ligada al ciclo de vida.
  • Control de crecimiento.

Casos de Uso

  • Asistentes de soporte.
  • Búsqueda documental interna.
  • Consultas de compliance.
  • Copilotos por equipo.

Cómo Empezar

  • 1. Crear workspace.
  • 2. Crear API key.
  • 3. Crear entidades y documentos.
  • 4. Ejecutar queries.

Consulta la Referencia para más detalles. Referencia.