Schnellstart-Anleitung

Was ist Layerum

Layerum ist eine gehostete RAG-Plattform für Teams, die Wissen ingestieren, Zugriff über Workspaces steuern und zuverlässige Antworten über API oder SDK bereitstellen müssen.

Gehosteter Endpoint: https://api.layerum.com.
Öffentliche API-Struktur: /v1/*.
Authentifizierung: Workspace-API-Keys (lyr_wk_...).

Workspace-Modell

Jedes Team arbeitet in isolierten Workspaces. Berechtigungen, Modelle, Entitäten, Dokumente und API-Keys werden auf Workspace-Ebene verwaltet.

Mehrere Workspaces pro Account je nach Tarif.
Teammitglieder, Rollen und operative Grenzen bleiben innerhalb eines Workspaces.
API-Keys können auf Entitäten und Modellkonfigurationen eingeschränkt werden.

Datenmodell

Wissen wird so organisiert, dass sowohl Governance als auch präzises Retrieval unterstützt werden.

Entity Types definieren übergeordnete Kategorien.
Entities bilden Hierarchie und Retrieval-Kontext.
Dokumente sind Entitäten zugeordnet und werden in Chunks/Vektoren indexiert.

Ingestion-Lebenszyklus

Dokumente durchlaufen einen klar definierten Prozess: Upload, Parsing, Chunking, Embedding, Indexierung und Statusverfolgung.

Kleine Dateien: direkter Multipart-Upload.
Große Dateien: presigned Flow (init → S3 POST → complete).
Status: pending, processing, completed, failed.
SDK-Helfer ingestion.waitUntilReady übernimmt Polling.

Kapazitätskontrolle

Kapazität ist kontoabhängig und wird dynamisch auf Workspaces verteilt. Durchsetzung erfolgt serverseitig.

Gezählt: Entitäten, Dokumentgröße, Chunks, S3-Dateien, Upload-Reservierungen.
Nicht gezählt: Logs, API-Key-Metadaten, Modell-Metadaten.
Uploads sind abgesichert: Reservierung, Validierung, Cleanup.

Sicherheit und Governance

Zugriff ist explizit, granular und jederzeit widerrufbar.

API-Keys werden nur im UI erstellt.
Capabilities: query:read, data:ingest, config:manage.
Kontrollen: Scope, Limits, Ablaufdatum.
Rotation und Widerruf wirken sofort.

Retrieval-Qualität

Abfragen liefern kontrollierbare und nachvollziehbare Antworten.

Entity-Scopes halten Kontext relevant.
Top-K und Parent-Scopes steuern Breite.
Zitate ermöglichen Rückverfolgbarkeit.
Debug-Endpoint für Analyse.

Developer Experience

Integration über SDK oder HTTP mit identischem API-Vertrag.

SDK: @layerum-team/rag-sdk.
API: https://api.layerum.com/v1.
Gleiche Auth- und Limit-Logik.

Betrieb und Zuverlässigkeit

Fokus auf stabile Produktion und nachvollziehbare Fehler.

Fehler werden persistiert.
Retry-Endpunkte vorhanden.
Indexierung folgt Dokument-Lifecycle.
Kapazitätschecks verhindern Overuse.

Typische Anwendungsfälle

Support-Knowledge-Assistenten.
Interne Dokumentensuche.
Compliance-Abfragen mit Zitaten.
Team-spezifische Copilots.

Erste Schritte

1. Workspace erstellen.
2. API-Key erzeugen.
3. Entitäten & Dokumente anlegen.
4. Nach Ingestion Queries ausführen.

Siehe Referenz für Details. Referenz.

Plattform-Konzepte