🤖 feat: default OpenAI service_tier to priority (#1105)

ammar-agent · web-flow · commit c150c301276b · 2025-12-11T22:42:46.000-06:00
Change OpenAI service_tier default from `auto` to `priority` for
low-latency responses.

## Changes
- Default to `priority` service tier for faster responses
- Support all OpenAI service tiers: `auto`, `default`, `flex`,
`priority`
- Allow override via `providers.jsonc`

## Usage
Users can configure in `~/.mux/providers.jsonc`:
```json
{
  "openai": {
    "apiKey": "sk-...",
    "serviceTier": "flex"
  }
}
```

Service tier options:
- **priority**: Low-latency responses (new default)
- **flex**: 50% cheaper, higher latency (o3, o4-mini, gpt-5)
- **auto/default**: Standard processing

_Generated with `mux`_
diff --git a/src/common/orpc/schemas/providerOptions.ts b/src/common/orpc/schemas/providerOptions.ts
@@ -10,6 +10,10 @@ export const MuxProviderOptionsSchema = z.object({
     .optional(),
   openai: z
     .object({
+      serviceTier: z.enum(["auto", "default", "flex", "priority"]).optional().meta({
+        description:
+          "OpenAI service tier: priority (low-latency), flex (50% cheaper, higher latency), auto/default (standard)",
+      }),
       disableAutoTruncation: z
         .boolean()
         .optional()
diff --git a/src/common/utils/ai/providerOptions.ts b/src/common/utils/ai/providerOptions.ts
@@ -217,11 +217,12 @@ export function buildProviderOptions(
       disableAutoTruncation,
     });
 
+    const serviceTier = muxProviderOptions?.openai?.serviceTier ?? "priority";
+
     const options: ProviderOptions = {
       openai: {
         parallelToolCalls: true, // Always enable concurrent tool execution
-        // TODO: allow this to be configured
-        serviceTier: "auto", // Use "auto" to automatically select the best service tier
+        serviceTier,
         // Automatically truncate conversation to fit context window, unless disabled for testing
         truncation: disableAutoTruncation ? "disabled" : "auto",
         // Conditionally add reasoning configuration
diff --git a/src/node/services/aiService.ts b/src/node/services/aiService.ts
@@ -500,6 +500,16 @@ export class AIService extends EventEmitter {
             provider: providerName,
           });
         }
+
+        // Extract serviceTier from config to pass through to buildProviderOptions
+        const configServiceTier = providerConfig.serviceTier as string | undefined;
+        if (configServiceTier && muxProviderOptions) {
+          muxProviderOptions.openai = {
+            ...muxProviderOptions.openai,
+            serviceTier: configServiceTier as "auto" | "default" | "flex" | "priority",
+          };
+        }
+
         const baseFetch = getProviderFetch(providerConfig);
 
         // Wrap fetch to force truncation: "auto" for OpenAI Responses API calls.