Was ist Layerum
Layerum ist eine gehostete RAG-Plattform für Teams, die Wissen ingestieren, Zugriff über Workspaces steuern und zuverlässige Antworten über API oder SDK bereitstellen müssen.
- Gehosteter Endpoint: https://api.layerum.com.
- Öffentliche API-Struktur: /v1/*.
- Authentifizierung: Workspace-API-Keys (lyr_wk_...).
Workspace-Modell
Jedes Team arbeitet in isolierten Workspaces. Berechtigungen, Modelle, Entitäten, Dokumente und API-Keys werden auf Workspace-Ebene verwaltet.
- Mehrere Workspaces pro Account je nach Tarif.
- Teammitglieder, Rollen und operative Grenzen bleiben innerhalb eines Workspaces.
- API-Keys können auf Entitäten und Modellkonfigurationen eingeschränkt werden.
Datenmodell
Wissen wird so organisiert, dass sowohl Governance als auch präzises Retrieval unterstützt werden.
- Entity Types definieren übergeordnete Kategorien.
- Entities bilden Hierarchie und Retrieval-Kontext.
- Dokumente sind Entitäten zugeordnet und werden in Chunks/Vektoren indexiert.
Ingestion-Lebenszyklus
Dokumente durchlaufen einen klar definierten Prozess: Upload, Parsing, Chunking, Embedding, Indexierung und Statusverfolgung.
- Kleine Dateien: direkter Multipart-Upload.
- Große Dateien: presigned Flow (init → S3 POST → complete).
- Status: pending, processing, completed, failed.
- SDK-Helfer ingestion.waitUntilReady übernimmt Polling.
Kapazitätskontrolle
Kapazität ist kontoabhängig und wird dynamisch auf Workspaces verteilt. Durchsetzung erfolgt serverseitig.
- Gezählt: Entitäten, Dokumentgröße, Chunks, S3-Dateien, Upload-Reservierungen.
- Nicht gezählt: Logs, API-Key-Metadaten, Modell-Metadaten.
- Uploads sind abgesichert: Reservierung, Validierung, Cleanup.
Sicherheit und Governance
Zugriff ist explizit, granular und jederzeit widerrufbar.
- API-Keys werden nur im UI erstellt.
- Capabilities: query:read, data:ingest, config:manage.
- Kontrollen: Scope, Limits, Ablaufdatum.
- Rotation und Widerruf wirken sofort.
Retrieval-Qualität
Abfragen liefern kontrollierbare und nachvollziehbare Antworten.
- Entity-Scopes halten Kontext relevant.
- Top-K und Parent-Scopes steuern Breite.
- Zitate ermöglichen Rückverfolgbarkeit.
- Debug-Endpoint für Analyse.
Developer Experience
Integration über SDK oder HTTP mit identischem API-Vertrag.
- SDK: @layerum-team/rag-sdk.
- API: https://api.layerum.com/v1.
- Gleiche Auth- und Limit-Logik.
Betrieb und Zuverlässigkeit
Fokus auf stabile Produktion und nachvollziehbare Fehler.
- Fehler werden persistiert.
- Retry-Endpunkte vorhanden.
- Indexierung folgt Dokument-Lifecycle.
- Kapazitätschecks verhindern Overuse.
Typische Anwendungsfälle
- Support-Knowledge-Assistenten.
- Interne Dokumentensuche.
- Compliance-Abfragen mit Zitaten.
- Team-spezifische Copilots.
Erste Schritte
- 1. Workspace erstellen.
- 2. API-Key erzeugen.
- 3. Entitäten & Dokumente anlegen.
- 4. Nach Ingestion Queries ausführen.
Siehe Referenz für Details. Referenz.