All models
Meta

Meta

Llama 3.3 70B Instruct

meta/llama-3.3-70b

operationalZDRtexttoolsjsonstreaming

01·01

Overview

Modell-Beschreibung und Capability-Matrix.

About this model

Open-Source Llama 3.3 70B von Meta — Performance nahe Llama 405B.

Capabilities matrix

streaming
tools
json
vision
reasoning
embedding

02·02

Providers

1 EU-Provider mit Region, ZDR-Status und Preisen pro Million Tokens.

ProviderProvider Model IDRegionZDRInput €/MOutput €/MPriority
Scalewayllama-3.3-70b-instructfr-par-1 ZDR€0.90€0.90100

03·03

Performance

Throughput, TTFT, E2E-Latency und Tool-Error-Rate — pro Provider, p50 über 24h.

Best Throughput

Scaleway179 tok/s

Lowest Latency

Scaleway1.68s

Scaleway

fr-par-1

Throughput

179tok/s

p50 · 24h
TTFT

237ms

p50 · 24h
E2E Latency

1.68s

p50 · 24h
Tool Err Rate

0.23%

last 7d

Note · Real metrics ship in Phase 4 once we log per-request TTFT + TPS into requests table aggregations.

04·04

Pricing

Pro Provider — relative Preisvisualisierung gegen den teuersten Anbieter dieses Modells.

Scaleway

ZDR
Input · per 1M tokens€0.90
Output · per 1M tokens€0.90
Regionfr-par-1

05·05

Uptime

30-Tage-Heatmap pro Provider, aggregierte Verfügbarkeit und Incident-Historie.

Aggregated uptime

100.00%

Last 30 days · all providers combined

≥ 99 %95–99 %< 95 %

Scaleway

fr-par-1ZDR

100.00%

last 30 days

Recent incidents · last 30 days

Minor02 May 2026, 08:00 UTCScaleway3 min

Brief 502 spike during failover

Während eines Failovers haben wir kurz 502er gesehen, weil ein Pod nicht sauber drainiert wurde.

06·06

API

Drop-in OpenAI-kompatibler Endpoint. Tausche nur die baseURL — der Rest bleibt.

use-llama-3.3-70b.ts
curl https://cleverouter.eu/v1/chat/completions \
  -H "Authorization: Bearer $CLEVERROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta/llama-3.3-70b",
    "messages": [
      { "role": "user", "content": "Hallo aus der EU." }
    ]
  }'