SilbercueChrome — Test Hardest

0Passed
0Failed
0Total
0sElapsed

Level 1 — Basics

Fundamentale Browser-Interaktionen. Jeder MCP muss diese Tests bestehen.

T1.1 Click the Button

Finde und klicke den Button. Der Text aendert sich bei Erfolg.

PENDING

T1.2 Read Text Content

Lies den versteckten Wert aus dem Element und gib ihn in das Eingabefeld ein.

Der geheime Code lautet:

PENDING

T1.3 Fill a Complete Form

Fuelle alle Felder korrekt aus und sende das Formular ab.

PENDING

T1.4 Element Selection Challenge

Finde Elemente ueber 5 verschiedene Selektoren und klicke alle: ID, Klasse, data-Attribut, aria-label, Textinhalt.

PENDING

T1.5 Navigation Sequence

Klicke die Links in Reihenfolge: Alpha, Beta, Gamma. Dann Verify.

Sequence: []
PENDING

T1.6 Read Table Data

Lies die Tabelle und gib die Summe der Score-Spalte ein.

NameCategoryScore
PENDING

Level 2 — Intermediate

Dynamischer Content, Timing, mehrstufige Interaktionen.

T2.1 Wait for Async Content

Klicke Load. Nach 2 Sekunden erscheint ein Wert. Lies ihn und gib ihn ein.

PENDING

T2.2 Infinite Scroll

Scrolle die Liste bis Item 30 sichtbar ist. Neue Items laden beim Scrollen nach.

PENDING

T2.3 Multi-Step Wizard

Durchlaufe alle 3 Schritte des Wizards und schliesse ihn ab.

Step 1/3: Waehle dein Paket

PENDING

T2.4 Searchable Dropdown

Tippe in das Suchfeld, waehle "" aus der gefilterten Liste.

Selected: none
PENDING

T2.5 Tab Management

Klicke den Link (neuer Tab), lies den Wert dort, kehre zurueck und gib ihn ein.

PENDING

T2.6 Sort Table and Find Value

Sortiere nach Price absteigend. Gib den Namen des teuersten Produkts ein.

Product Price Stock
PENDING

Level 3 — Advanced

Shadow DOM, iFrames, Drag and Drop, Canvas, Keyboard-Interaktion.

T3.1 Shadow DOM Interaction

Interagiere mit Elementen innerhalb eines Shadow DOM. Lies den Wert und gib ihn ein.

PENDING

T3.2 Nested iFrame Interaction

Navigiere in den verschachtelten iFrame, lies den Wert und gib ihn ein.

PENDING

T3.3 Drag and Drop Reorder

Ordne die Items in die richtige Reihenfolge 1 bis 5 von oben nach unten.

  • Item 3
  • Item 1
  • Item 5
  • Item 2
  • Item 4
PENDING

T3.4 Canvas Click Target

Klicke auf den roten Kreis im Canvas. Position ist zufaellig.

PENDING

T3.5 Keyboard Shortcut Sequence

Fuehre die Tastenkombinationen in der richtigen Reihenfolge aus.

1. Press Ctrl + K waiting...
2. Press Escape waiting...
3. Press Enter waiting...
PENDING

T3.6 Rich Text Editor (contenteditable)

Schreibe "Hello World" in den Editor und mache "World" fett (Ctrl+B).

PENDING

Level 4 — Hardest

Timing, Race Conditions, DOM-Stress, State-Management.

T4.1 Delayed Element Appearance

Klicke Start. Ein Button erscheint nach 1-5 Sekunden an zufaelliger Position. Klicke ihn.

PENDING

T4.2 Racing Content Updates

Der Zaehler aendert sich alle 500ms (0-9). Klicke Capture genau wenn der Wert ist.

0
PENDING

T4.3 Large DOM — Find the Needle

10.000 Elemente im DOM. Finde das Element mit data-needle="true" und lies seinen Text.

PENDING

T4.4 State Chain: localStorage + Cookies

Setze localStorage und cookie wie beschrieben, dann kombiniere die Werte.

PENDING

T4.5 Mutation Observer Challenge

Der Wert aendert sich 3x in 3 Sekunden. Sammle alle 3 Werte und gib sie kommasepariert ein.

Current value: ---
PENDING

T4.6 Final Boss: Multi-Modal Chain

1) Klicke den Button, 2) fuelle das Modal-Formular aus, 3) generiere Token, 4) lies und gib ihn ein.

Generated Token: ---
PENDING

T4.7 Token Budget — Large DOM

Generiere 1000+ Elemente (interaktive + nicht-interaktive). Pruefe dass read_page unter 8000 Tokens bleibt, mit filter:"interactive" unter 2000.

PENDING

Level 5 — Community Pain Points

Session Persistence, CDP-Fingerprint, Console-Logs, File-Upload, SPA-Navigation, Reconnect.

T5.1 Session Persistence (Cookie/localStorage)

Setzt Cookie und localStorage per evaluate, liest beide sofort zurueck und verifiziert die Werte.

PENDING

T5.2 CDP Fingerprint Detection

Prueft CDP-Detection-Flags: navigator.webdriver, cdc-Variablen, DOM-Injections. Alle Flags muessen unauffaellig sein.

PENDING

T5.3 Console Log Capture

Logge verschiedene Typen (log, warn, error) in die Console und pruefe ob der MCP-Server sie vollstaendig erfasst.

Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (evaluate → console.log → console_logs). Kann nicht manuell im Browser gestartet werden.

PENDING

T5.4 File Upload

Lade eine Datei ueber ein File-Input-Element hoch und pruefe ob Dateiname und Inhalt korrekt gelesen werden.

Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (file_upload → evaluate → verify). Kann nicht manuell im Browser gestartet werden.

PENDING

T5.5 SPA Navigation (History API)

Navigiere per History API (pushState/popstate) zwischen SPA-Views und pruefe ob der Content korrekt wechselt.

Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (evaluate → pushState → wait_for → read_page). Kann nicht manuell im Browser gestartet werden.

PENDING

T5.6 Reconnect Recovery

Crashe den Tab via chrome://crash, pruefe ob der MCP-Server sich erholt.

Runner-Only Test — wird via MCP Benchmark Runner ausgefuehrt (navigate → chrome://crash → tab_status). Kann nicht manuell im Browser gestartet werden.

PENDING

T5.7 Toast Detection — Success

Klicke den Button. Ein gruener Success-Toast mit role="alert" erscheint fuer 5 Sekunden. Der MCP muss ihn in read_page oder click-Response erkennen.

PENDING

T5.8 Toast Detection — Error

Klicke den Button. Ein roter Error-Toast mit role="alert" erscheint fuer 5 Sekunden. Der MCP muss ihn erkennen und den Typ (error) unterscheiden.

PENDING

T5.9 Toast Detection — Persistent Warning Banner

Klicke den Button. Ein gelber Warning-Banner mit aria-live="assertive" erscheint oben im Test-Bereich und bleibt persistent. Der MCP muss ihn erkennen.

PENDING

T5.10 Toast Detection — Quick Disappearing Toast

Klicke den Button. Ein Toast erscheint fuer nur 2 Sekunden, dann verschwindet er. Teste ob der MCP ihn noch erkennt, bevor er weg ist.

PENDING

MCP Comparison

Vergleich aller gespeicherten Laeufe nebeneinander — Status und Dauer pro Test.

Noch keine Laeufe gespeichert. Fuehre Tests durch und klicke "Aktuellen Lauf speichern".

Benchmark Results

Zusammenfassung aller Tests mit Metriken.

TestStatusTime (ms)Details