The monetization control plane for AI apps

Bill every token. Enforce every credit. Route every model. No deploys.

Switchboard is a drop-in, bring-your-own-keys LLM gateway that meters every request and enforces wallets and quotas atomically at request time. Flip models, run A/B tests, and watch live margins — all from a dashboard, never a deploy.

lib/llm.ts1-line diff

  const client = new OpenAI({-   baseURL: "https://api.openai.com/v1",+   baseURL: "https://switchboard-delta.vercel.app/api/v1", // your keys, our meter  })   await client.chat.completions.create({+   model: "email-summarize", user: "usr_alice_4f21",    messages, // "email-summarize" is a route — your dashboard picks the model  })

Open dashboard Try the demo inbox

Atomic enforcement

Credit wallets and plan quotas enforced at request time with DynamoDB conditional writes. Overspend is structurally impossible — the database says no, not your retry logic.

Model flags & A/B

Route every request through dashboard-controlled flags. Free gets gpt-5-mini, pro gets gpt-5, and your 80/20 experiment ships without a deploy.

Live margins

Every request is metered against provider prices in real time. Watch gross margin per flag, simulate price changes, and reroute before a model update eats your unit economics.

+0ms added TTFT

50 parallel requests, 0 oversells

2 databases, 0 stored passwords

Your keys. Our meter. Zero oversells.

Swap one baseURL, tag requests with a user and a route, and Switchboard handles metering, enforcement, and routing from there.

Open dashboard