Click "Evaluate" to see results
No samples recorded yet
Add feedback to see stats
Loading templates...
Record samples and get evaluations to see suggestions
┌─────────────────────────────────────────────────────────────────────────┐
│ RLHF Pipeline Architecture │
├─────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│ │ User │ │ LLM-as- │ │ Human │ │
│ │ Message │────▶│ Judge │◀────│ Feedback │ │
│ └──────────────┘ └──────────────┘ └──────────────┘ │
│ │ │ │ │
│ │ ┌─────▼─────┐ │ │
│ │ │ Evaluation│ │ │
│ │ │ Scores │ │ │
│ │ └───────────┘ │ │
│ │ │ │ │
│ │ ┌─────▼─────┐ │ │
│ │ │ Response │◀─────────────┘ │
│ │ │ Samples │ │
│ │ └───────────┘ │
│ │ │ │
│ │ ┌─────▼─────┐ │
│ │ │ Prompt │ │
│ └─────────────▶│ Optimizer │ │
│ └───────────┘ │
│ │ │
│ ┌────────▼────────┐ │
│ │ Training Data │ │
│ │ Generation │ │
│ └─────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────────────┘