Level 1 — Basics
Fundamentale Browser-Interaktionen. Jeder MCP muss diese Tests bestehen.
T1.1 Click the Button
Finde und klicke den Button. Der Text aendert sich bei Erfolg.
T1.2 Read Text Content
Lies den versteckten Wert aus dem Element und gib ihn in das Eingabefeld ein.
Der geheime Code lautet:
T1.3 Fill a Complete Form
Fuelle alle Felder korrekt aus und sende das Formular ab.
T1.4 Element Selection Challenge
Finde Elemente ueber 5 verschiedene Selektoren und klicke alle: ID, Klasse, data-Attribut, aria-label, Textinhalt.
T1.5 Navigation Sequence
Klicke die Links in Reihenfolge: Alpha, Beta, Gamma. Dann Verify.
T1.6 Read Table Data
Lies die Tabelle und gib die Summe der Score-Spalte ein.
| Name | Category | Score |
|---|
Level 2 — Intermediate
Dynamischer Content, Timing, mehrstufige Interaktionen.
T2.1 Wait for Async Content
Klicke Load. Nach 2 Sekunden erscheint ein Wert. Lies ihn und gib ihn ein.
T2.2 Infinite Scroll
Scrolle die Liste bis Item 30 sichtbar ist. Neue Items laden beim Scrollen nach.
T2.3 Multi-Step Wizard
Durchlaufe alle 3 Schritte des Wizards und schliesse ihn ab.
Step 1/3: Waehle dein Paket
T2.4 Searchable Dropdown
Tippe in das Suchfeld, waehle "" aus der gefilterten Liste.
T2.5 Tab Management
Klicke den Link (neuer Tab), lies den Wert dort, kehre zurueck und gib ihn ein.
PENDINGT2.6 Sort Table and Find Value
Sortiere nach Price absteigend. Gib den Namen des teuersten Produkts ein.
| Product | Price | Stock |
|---|
Level 3 — Advanced
Shadow DOM, iFrames, Drag and Drop, Canvas, Keyboard-Interaktion.
T3.1 Shadow DOM Interaction
Interagiere mit Elementen innerhalb eines Shadow DOM. Lies den Wert und gib ihn ein.
T3.2 Nested iFrame Interaction
Navigiere in den verschachtelten iFrame, lies den Wert und gib ihn ein.
T3.3 Drag and Drop Reorder
Ordne die Items in die richtige Reihenfolge 1 bis 5 von oben nach unten.
- Item 3
- Item 1
- Item 5
- Item 2
- Item 4
T3.4 Canvas Click Target
Klicke auf den roten Kreis im Canvas. Position ist zufaellig.
T3.5 Keyboard Shortcut Sequence
Fuehre die Tastenkombinationen in der richtigen Reihenfolge aus.
T3.6 Rich Text Editor (contenteditable)
Schreibe "Hello World" in den Editor und mache "World" fett (Ctrl+B).
Level 4 — Hardest
Timing, Race Conditions, DOM-Stress, State-Management.
T4.1 Delayed Element Appearance
Klicke Start. Ein Button erscheint nach 1-5 Sekunden an zufaelliger Position. Klicke ihn.
T4.2 Racing Content Updates
Der Zaehler aendert sich alle 500ms (0-9). Klicke Capture genau wenn der Wert ist.
T4.3 Large DOM — Find the Needle
10.000 Elemente im DOM. Finde das Element mit data-needle="true" und lies seinen Text.
T4.4 State Chain: localStorage + Cookies
Setze localStorage und cookie wie beschrieben, dann kombiniere die Werte.
T4.5 Mutation Observer Challenge
Der Wert aendert sich 3x in 3 Sekunden. Sammle alle 3 Werte und gib sie kommasepariert ein.
T4.6 Final Boss: Multi-Modal Chain
1) Klicke den Button, 2) fuelle das Modal-Formular aus, 3) generiere Token, 4) lies und gib ihn ein.
---T4.7 Token Budget — Large DOM
Generiere 1000+ Elemente (interaktive + nicht-interaktive). Pruefe dass read_page unter 8000 Tokens bleibt, mit filter:"interactive" unter 2000.
Level 5 — Community Pain Points
Session Persistence, CDP-Fingerprint, Console-Logs, File-Upload, SPA-Navigation, Reconnect.
T5.1 Session Persistence (Cookie/localStorage)
Setzt Cookie und localStorage per evaluate, liest beide sofort zurueck und verifiziert die Werte.
T5.2 CDP Fingerprint Detection
Prueft CDP-Detection-Flags: navigator.webdriver, cdc-Variablen, DOM-Injections. Alle Flags muessen unauffaellig sein.
T5.3 Console Log Capture
Logge verschiedene Typen (log, warn, error) in die Console und pruefe ob der MCP-Server sie vollstaendig erfasst.
Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (evaluate → console.log → console_logs). Kann nicht manuell im Browser gestartet werden.
T5.4 File Upload
Lade eine Datei ueber ein File-Input-Element hoch und pruefe ob Dateiname und Inhalt korrekt gelesen werden.
Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (file_upload → evaluate → verify). Kann nicht manuell im Browser gestartet werden.
T5.5 SPA Navigation (History API)
Navigiere per History API (pushState/popstate) zwischen SPA-Views und pruefe ob der Content korrekt wechselt.
Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (evaluate → pushState → wait_for → read_page). Kann nicht manuell im Browser gestartet werden.
T5.6 Reconnect Recovery
Crashe den Tab via chrome://crash, pruefe ob der MCP-Server sich erholt.
Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (navigate → chrome://crash → tab_status). Kann nicht manuell im Browser gestartet werden.
T5.7 Toast Detection — Success
Klicke den Button. Ein gruener Success-Toast mit role="alert" erscheint fuer 5 Sekunden. Der MCP muss ihn in read_page oder click-Response erkennen.
T5.8 Toast Detection — Error
Klicke den Button. Ein roter Error-Toast mit role="alert" erscheint fuer 5 Sekunden. Der MCP muss ihn erkennen und den Typ (error) unterscheiden.
T5.9 Toast Detection — Persistent Warning Banner
Klicke den Button. Ein gelber Warning-Banner mit aria-live="assertive" erscheint oben im Test-Bereich und bleibt persistent. Der MCP muss ihn erkennen.
T5.10 Toast Detection — Quick Disappearing Toast
Klicke den Button. Ein Toast erscheint fuer nur 2 Sekunden, dann verschwindet er. Teste ob der MCP ihn noch erkennt, bevor er weg ist.
MCP Comparison
Vergleich aller gespeicherten Laeufe nebeneinander — Status und Dauer pro Test.
Noch keine Laeufe gespeichert. Fuehre Tests durch und klicke "Aktuellen Lauf speichern".
Benchmark Results
Zusammenfassung aller Tests mit Metriken.
| Test | Status | Time (ms) | Details |
|---|