Feedback & Improvement Loops

INTERACTIVE DEMO Test the LLM-as-judge evaluation system
Evaluation Results

Click "Evaluate" to see results

Recorded Samples

No samples recorded yet

Feedback Stats

Add feedback to see stats

Prompt Templates

Loading templates...

Optimization Suggestions

Record samples and get evaluations to see suggestions

0
Total Samples
--
Average Score
0
Optimizations Applied
0
Human Feedback Items
Score Distribution
Criterion Performance
RLHF Pipeline Architecture
┌─────────────────────────────────────────────────────────────────────────┐
│                    RLHF Pipeline Architecture                          │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  ┌──────────────┐     ┌──────────────┐     ┌──────────────┐             │
│  │   User       │     │   LLM-as-   │     │   Human      │             │
│  │   Message    │────▶│   Judge      │◀────│   Feedback   │             │
│  └──────────────┘     └──────────────┘     └──────────────┘             │
│         │                    │                    │                     │
│         │              ┌─────▼─────┐              │                     │
│         │              │ Evaluation│              │                     │
│         │              │  Scores   │              │                     │
│         │              └───────────┘              │                     │
│         │                    │                    │                     │
│         │              ┌─────▼─────┐              │                     │
│         │              │ Response  │◀─────────────┘                     │
│         │              │ Samples   │                                    │
│         │              └───────────┘                                    │
│         │                    │                                          │
│         │              ┌─────▼─────┐                                    │
│         │              │   Prompt  │                                    │
│         └─────────────▶│ Optimizer │                                    │
│                        └───────────┘                                    │
│                             │                                           │
│                    ┌────────▼────────┐                                   │
│                    │  Training Data │                                   │
│                    │  Generation     │                                   │
│                    └─────────────────┘                                   │
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘
            
Features Implemented