Developer Tools

Testen, bevor
Sie committen.

Eine sichere Sandbox zum Experimentieren mit Experten-Agenten, Vergleichen von Modellen, Validieren von Guardrails und Previewing von Workflows — ohne Produktion zu berühren.

Zugang anfragen
Prompt-Lab Guardrail-Tester Tool-Tester Testlauf
Prompt

PROMPT

Auth-Modul prüfen und Verbesserungen vorschlagen

Modell

MODELL

claude-sonnet-4-6

aktiver Turn TURN 1/3
Tool-Calls

file_read

auth/index.ts

↑ 1.2K ↓ 380 · 420ms

grep_search

TODO|FIXME

↑ 2.1K ↓ 740 · 680ms

Antwort

FERTIG

2.4s

3 Turns

4,3K Tokens

AGENTIC-LOOP-TRACE

T1
file_read ↑1.2K ↓380 · 420ms
T2
grep_search ↑2.1K ↓740 · 680ms
T3
(text) ↑3.4K ↓1.1K · 1.3s
Prompt geht ans Modell — der Experten-Agent erhält seine Aufgabe und beginnt Turn 1
Tools aufgerufen und zurückgegeben — file_read und grep_search werden ausgeführt; Ergebnisse fließen zurück ins Modell
Finale Antwort verlässt — nach 3 Turns erzeugt das Modell seine Textantwort mit vollständigem Token-Trace

Agent Chat

Interaktive Gespräche mit jedem Experten-Agenten. Modell auswählen, Agententyp wählen und testen, wie er auf echte Prompts reagiert. Voller Session-Verlauf mit Auto-Save.

Prompt Lab

Mehrere Modelle Side-by-Side vergleichen. Wort-Level-Diffs zwischen Antworten sehen. Token-Nutzung und Kosten vergleichen. Das beste Modell für jeden Use Case finden.

Guardrail Tester

Guardrail-Regeln gegen echte Dateiänderungen validieren, bevor sie deployed werden. Exakt sehen, welche Regeln greifen würden und warum.

Workflow Dry Run

Vorschau, was ein Experten-Agent für einen gegebenen Job planen würde — ohne Ausführung. Strategie prüfen, bevor Ressourcen eingesetzt werden.

Sicher experimentieren

Jedes Gespräch, jeder Vergleich und jeder Test wird automatisch gespeichert. Dort weitermachen, wo Sie aufgehört haben, vergangene Experimente überprüfen oder Sessions mit Ihrem Team teilen. Automatisch benannt nach Ihrer ersten Nachricht.

Ein typischer Erkundungsflow

     Ihre Frage
          │
          ▼
   ┌───────────────┐       Side-by-Side
   │  Prompt-Labor │────────────────────► Modell A Diff vs. Modell B
   └───────┬───────┘
           │  Sieger übernehmen
           ▼
   ┌───────────────┐
   │  Agent-Chat   │◄── Experte + Tools wählen
   └───────┬───────┘
           │  Dry-Run
           ▼
   ┌───────────────┐
   │ Workflow-Plan │── (keine Tool-Ausführung, keine Kosten)
   └───────┬───────┘
           ▼
    Guardrail-Tester → Regeln deployen oder anpassen
  1. 01

    Modelle im Prompt-Labor vergleichen

    Denselben Prompt gegen Haiku, Sonnet und ein lokales Modell laufen lassen. Die Diff-Ansicht zeigt Wort-Unterschiede; die Kostenspalte zeigt, was Sie pro Million Tokens gezahlt hätten.

  2. 02

    Den Sieger in den Agent-Chat übernehmen

    Prompt in eine vollständige agentische Session mit Tools überführen. Jeder Tool-Call wird protokolliert; Sie können zwischen Turns stoppen, zurückspulen oder Guardrails anpassen.

  3. 03

    Workflow dry-runnen, dann eine Regel

    Workflow-Dry-Run zerlegt einen echten Job ohne Ausführung — Sie sehen den DAG, bevor Kosten entstehen. Der Guardrail-Tester spielt eine vorgeschlagene Regel auf vergangene Findings ab, damit Sie sehen, was gefeuert hätte.

Die Sandbox ausprobieren

Zugang anfragen, um in einer sicheren Umgebung mit Experten-Agenten zu experimentieren.

Frühzugang anfragen