diff --git a/src/browser/components/Settings/sections/ProvidersSection.tsx b/src/browser/components/Settings/sections/ProvidersSection.tsx
index 1361b6ee8c..e8147a04b4 100644
--- a/src/browser/components/Settings/sections/ProvidersSection.tsx
+++ b/src/browser/components/Settings/sections/ProvidersSection.tsx
@@ -1,7 +1,12 @@
 import React, { useState, useCallback } from "react";
 import { ChevronDown, ChevronRight, Check, X, Eye, EyeOff } from "lucide-react";
 import { createEditKeyHandler } from "@/browser/utils/ui/keybinds";
-import { SUPPORTED_PROVIDERS } from "@/common/constants/providers";
+import {
+  SUPPORTED_PROVIDERS,
+  OPENAI_SERVICE_TIERS,
+  OPENAI_DEFAULT_SERVICE_TIER,
+  isValidOpenAIServiceTier,
+} from "@/common/constants/providers";
 import type { ProviderName } from "@/common/constants/providers";
 import { ProviderWithIcon } from "@/browser/components/ProviderIcon";
 import { useAPI } from "@/browser/contexts/API";
@@ -389,17 +394,10 @@ export function ProvidersSection() {
                       </TooltipProvider>
                     </div>
                     <Select
-                      value={config?.openai?.serviceTier ?? "auto"}
+                      value={config?.openai?.serviceTier ?? OPENAI_DEFAULT_SERVICE_TIER}
                       onValueChange={(next) => {
                         if (!api) return;
-                        if (
-                          next !== "auto" &&
-                          next !== "default" &&
-                          next !== "flex" &&
-                          next !== "priority"
-                        ) {
-                          return;
-                        }
+                        if (!isValidOpenAIServiceTier(next)) return;
 
                         updateOptimistically("openai", { serviceTier: next });
                         void api.providers.setProviderConfig({
@@ -413,10 +411,11 @@ export function ProvidersSection() {
                         <SelectValue />
                       </SelectTrigger>
                       <SelectContent>
-                        <SelectItem value="auto">auto</SelectItem>
-                        <SelectItem value="default">default</SelectItem>
-                        <SelectItem value="flex">flex</SelectItem>
-                        <SelectItem value="priority">priority</SelectItem>
+                        {OPENAI_SERVICE_TIERS.map((tier) => (
+                          <SelectItem key={tier} value={tier}>
+                            {tier}
+                          </SelectItem>
+                        ))}
                       </SelectContent>
                     </Select>
                   </div>
diff --git a/src/common/constants/providers.ts b/src/common/constants/providers.ts
index d7f9eacb54..936007badb 100644
--- a/src/common/constants/providers.ts
+++ b/src/common/constants/providers.ts
@@ -85,6 +85,39 @@ export const PROVIDER_DEFINITIONS = {
 /**
  * Union type of all supported provider names
  */
+/**
+ * OpenAI service tier options for API requests.
+ * - priority: Low-latency responses (default)
+ * - flex: 50% cheaper, higher latency (o3, o4-mini, gpt-5)
+ * - auto: Let OpenAI select appropriate tier
+ * - default: Standard processing
+ */
+export const OPENAI_SERVICE_TIERS = ["auto", "default", "flex", "priority"] as const;
+export type OpenAIServiceTier = (typeof OPENAI_SERVICE_TIERS)[number];
+
+/** Default service tier for OpenAI requests */
+export const OPENAI_DEFAULT_SERVICE_TIER: OpenAIServiceTier = "auto";
+
+/**
+ * Type guard to check if a string is a valid OpenAI service tier
+ */
+export function isValidOpenAIServiceTier(tier: unknown): tier is OpenAIServiceTier {
+  return typeof tier === "string" && OPENAI_SERVICE_TIERS.includes(tier as OpenAIServiceTier);
+}
+
+/**
+ * Cost multipliers for OpenAI service tiers relative to standard pricing.
+ * - flex: 50% cheaper (0.5x)
+ * - priority: 2x premium
+ * - default/auto: standard pricing (1x)
+ */
+export const OPENAI_SERVICE_TIER_COST_MULTIPLIERS: Record<OpenAIServiceTier, number> = {
+  flex: 0.5,
+  priority: 2.0,
+  default: 1.0,
+  auto: 1.0,
+};
+
 export type ProviderName = keyof typeof PROVIDER_DEFINITIONS;
 
 /**
diff --git a/src/common/orpc/schemas/api.ts b/src/common/orpc/schemas/api.ts
index 46c44da95e..f5e83eb875 100644
--- a/src/common/orpc/schemas/api.ts
+++ b/src/common/orpc/schemas/api.ts
@@ -1,5 +1,6 @@
 import { eventIterator } from "@orpc/server";
 import { z } from "zod";
+import { OPENAI_SERVICE_TIERS } from "@/common/constants/providers";
 import { ChatStatsSchema, SessionUsageFileSchema } from "./chatStats";
 import { SendMessageErrorSchema } from "./errors";
 import { BranchListResultSchema, ImagePartSchema, MuxMessageSchema } from "./message";
@@ -71,7 +72,7 @@ export const ProviderConfigInfoSchema = z.object({
   baseUrl: z.string().optional(),
   models: z.array(z.string()).optional(),
   /** OpenAI-specific fields */
-  serviceTier: z.enum(["auto", "default", "flex", "priority"]).optional(),
+  serviceTier: z.enum(OPENAI_SERVICE_TIERS).optional(),
   /** AWS-specific fields (only present for bedrock provider) */
   aws: AWSCredentialStatusSchema.optional(),
   /** Mux Gateway-specific fields */
diff --git a/src/common/orpc/schemas/message.ts b/src/common/orpc/schemas/message.ts
index 2f9689409a..6b886d6ff7 100644
--- a/src/common/orpc/schemas/message.ts
+++ b/src/common/orpc/schemas/message.ts
@@ -74,6 +74,7 @@ export const MuxMessageSchema = z.object({
       historySequence: z.number().optional(),
       timestamp: z.number().optional(),
       model: z.string().optional(),
+      historicalUsage: z.any().optional(),
       usage: z.any().optional(),
       contextUsage: z.any().optional(),
       providerMetadata: z.record(z.string(), z.unknown()).optional(),
diff --git a/src/common/orpc/schemas/providerOptions.ts b/src/common/orpc/schemas/providerOptions.ts
index c58c4eda22..c24f3056c4 100644
--- a/src/common/orpc/schemas/providerOptions.ts
+++ b/src/common/orpc/schemas/providerOptions.ts
@@ -1,4 +1,5 @@
 import { z } from "zod";
+import { OPENAI_SERVICE_TIERS } from "@/common/constants/providers";
 
 export const MuxProviderOptionsSchema = z.object({
   anthropic: z
@@ -10,7 +11,7 @@ export const MuxProviderOptionsSchema = z.object({
     .optional(),
   openai: z
     .object({
-      serviceTier: z.enum(["auto", "default", "flex", "priority"]).optional().meta({
+      serviceTier: z.enum(OPENAI_SERVICE_TIERS).optional().meta({
         description:
           "OpenAI service tier: priority (low-latency), flex (50% cheaper, higher latency), auto/default (standard)",
       }),
diff --git a/src/common/types/message.ts b/src/common/types/message.ts
index f8af4dd71c..e14ffc52f0 100644
--- a/src/common/types/message.ts
+++ b/src/common/types/message.ts
@@ -1,4 +1,5 @@
 import type { UIMessage } from "ai";
+import type { ChatUsageDisplay } from "@/common/utils/tokens/usageAggregator";
 import type { LanguageModelV2Usage } from "@ai-sdk/provider";
 import type { StreamErrorType } from "./errors";
 import type { ToolPolicy } from "@/common/utils/tools/toolPolicy";
@@ -101,6 +102,13 @@ export interface MuxMetadata {
   usage?: LanguageModelV2Usage;
   // Last step's usage only (for context window display - inputTokens = current context size)
   contextUsage?: LanguageModelV2Usage;
+  /**
+   * Snapshot of cumulative costs/tokens from before a compaction.
+   *
+   * This is only set on compaction summary messages so we can rebuild session usage
+   * from chat.jsonl if session-usage.json is missing/corrupted.
+   */
+  historicalUsage?: ChatUsageDisplay;
   // Aggregated provider metadata across all steps (for cost calculation)
   providerMetadata?: Record<string, unknown>;
   // Last step's provider metadata (for context window cache display)
diff --git a/src/common/utils/ai/providerOptions.ts b/src/common/utils/ai/providerOptions.ts
index 6193c9d041..515939ca46 100644
--- a/src/common/utils/ai/providerOptions.ts
+++ b/src/common/utils/ai/providerOptions.ts
@@ -18,6 +18,7 @@ import {
   OPENROUTER_REASONING_EFFORT,
 } from "@/common/types/thinking";
 import { log } from "@/node/services/log";
+import { OPENAI_DEFAULT_SERVICE_TIER } from "@/common/constants/providers";
 import type { MuxMessage } from "@/common/types/message";
 import { enforceThinkingPolicy } from "@/browser/utils/thinking/policy";
 import { normalizeGatewayModel } from "./models";
@@ -217,7 +218,7 @@ export function buildProviderOptions(
       disableAutoTruncation,
     });
 
-    const serviceTier = muxProviderOptions?.openai?.serviceTier ?? "auto";
+    const serviceTier = muxProviderOptions?.openai?.serviceTier ?? OPENAI_DEFAULT_SERVICE_TIER;
 
     const options: ProviderOptions = {
       openai: {
diff --git a/src/common/utils/tokens/displayUsage.test.ts b/src/common/utils/tokens/displayUsage.test.ts
index a11015938c..29ce77f633 100644
--- a/src/common/utils/tokens/displayUsage.test.ts
+++ b/src/common/utils/tokens/displayUsage.test.ts
@@ -195,4 +195,90 @@ describe("createDisplayUsage", () => {
       expect(result!.cacheCreate.tokens).toBe(1500);
     });
   });
+
+  describe("OpenAI service tier cost adjustments", () => {
+    // gpt-5 has tier-specific pricing in models.json:
+    // - standard: input $1.25/M, output $10/M
+    // - flex: input $0.625/M, output $5/M (~50% cheaper)
+    // - priority: input $2.50/M, output $20/M (~2x)
+    const usage: LanguageModelV2Usage = {
+      inputTokens: 1000000, // 1M tokens for easy math
+      outputTokens: 100000, // 100K tokens
+      totalTokens: 1100000,
+    };
+
+    test("applies standard pricing when serviceTier is undefined", () => {
+      const result = createDisplayUsage(usage, "openai:gpt-5");
+
+      expect(result).toBeDefined();
+      // Standard: $1.25/M input = $1.25 for 1M tokens
+      expect(result!.input.cost_usd).toBeCloseTo(1.25, 2);
+      // Standard: $10/M output = $1.00 for 100K tokens
+      expect(result!.output.cost_usd).toBeCloseTo(1.0, 2);
+    });
+
+    test("applies standard pricing when serviceTier is 'default'", () => {
+      const result = createDisplayUsage(usage, "openai:gpt-5", {
+        openai: { serviceTier: "default" },
+      });
+
+      expect(result).toBeDefined();
+      expect(result!.input.cost_usd).toBeCloseTo(1.25, 2);
+      expect(result!.output.cost_usd).toBeCloseTo(1.0, 2);
+    });
+
+    test("applies flex pricing when serviceTier is 'flex'", () => {
+      const result = createDisplayUsage(usage, "openai:gpt-5", {
+        openai: { serviceTier: "flex" },
+      });
+
+      expect(result).toBeDefined();
+      // Flex: $0.625/M input = $0.625 for 1M tokens
+      expect(result!.input.cost_usd).toBeCloseTo(0.625, 3);
+      // Flex: $5/M output = $0.50 for 100K tokens
+      expect(result!.output.cost_usd).toBeCloseTo(0.5, 2);
+    });
+
+    test("applies priority pricing when serviceTier is 'priority'", () => {
+      const result = createDisplayUsage(usage, "openai:gpt-5", {
+        openai: { serviceTier: "priority" },
+      });
+
+      expect(result).toBeDefined();
+      // Priority: $2.50/M input = $2.50 for 1M tokens
+      expect(result!.input.cost_usd).toBeCloseTo(2.5, 2);
+      // Priority: $20/M output = $2.00 for 100K tokens
+      expect(result!.output.cost_usd).toBeCloseTo(2.0, 2);
+    });
+
+    test("ignores serviceTier for non-OpenAI models", () => {
+      // Even if serviceTier is present, non-OpenAI models should use standard pricing
+      const result = createDisplayUsage(usage, "anthropic:claude-sonnet-4-5", {
+        openai: { serviceTier: "flex" }, // Should be ignored
+      });
+
+      expect(result).toBeDefined();
+      // Anthropic pricing shouldn't change based on OpenAI serviceTier
+      // Just verify tokens are correct (pricing varies by model)
+      expect(result!.input.tokens).toBe(1000000);
+      expect(result!.output.tokens).toBe(100000);
+    });
+
+    test("applies flex pricing to cached tokens", () => {
+      const usageWithCache: LanguageModelV2Usage = {
+        inputTokens: 1000000, // Includes cached
+        outputTokens: 100000,
+        totalTokens: 1100000,
+        cachedInputTokens: 500000, // 500K cached
+      };
+
+      const result = createDisplayUsage(usageWithCache, "openai:gpt-5", {
+        openai: { serviceTier: "flex" },
+      });
+
+      expect(result).toBeDefined();
+      // Flex cache: $0.0625/M = $0.03125 for 500K tokens
+      expect(result!.cached.cost_usd).toBeCloseTo(0.03125, 4);
+    });
+  });
 });
diff --git a/src/common/utils/tokens/displayUsage.ts b/src/common/utils/tokens/displayUsage.ts
index f936d67926..6c2be19ccf 100644
--- a/src/common/utils/tokens/displayUsage.ts
+++ b/src/common/utils/tokens/displayUsage.ts
@@ -9,6 +9,21 @@ import type { LanguageModelV2Usage } from "@ai-sdk/provider";
 import { getModelStats } from "./modelStats";
 import type { ChatUsageDisplay } from "./usageAggregator";
 import { normalizeGatewayModel } from "../ai/models";
+import {
+  OPENAI_SERVICE_TIER_COST_MULTIPLIERS,
+  isValidOpenAIServiceTier,
+} from "@/common/constants/providers";
+
+/**
+ * Get cost multiplier for OpenAI service tier.
+ * Returns 1.0 for unknown tiers (standard pricing).
+ */
+function getServiceTierMultiplier(serviceTier: string | undefined): number {
+  if (serviceTier && isValidOpenAIServiceTier(serviceTier)) {
+    return OPENAI_SERVICE_TIER_COST_MULTIPLIERS[serviceTier];
+  }
+  return 1.0;
+}
 
 /**
  * Create a display-friendly usage object from AI SDK usage
@@ -60,6 +75,12 @@ export function createDisplayUsage(
   // Get model stats for cost calculation
   const modelStats = getModelStats(model);
 
+  // Extract OpenAI service tier from response metadata (actual tier used, not requested)
+  // AI SDK returns serviceTier in providerMetadata.openai.serviceTier
+  const serviceTier = isOpenAI
+    ? (providerMetadata?.openai as { serviceTier?: string } | undefined)?.serviceTier
+    : undefined;
+
   // Calculate costs based on model stats (undefined if model unknown)
   let inputCost: number | undefined;
   let cachedCost: number | undefined;
@@ -68,11 +89,14 @@ export function createDisplayUsage(
   let reasoningCost: number | undefined;
 
   if (modelStats) {
-    inputCost = inputTokens * modelStats.input_cost_per_token;
-    cachedCost = cachedTokens * (modelStats.cache_read_input_token_cost ?? 0);
+    // Get tier multiplier (flex ~50% cheaper, priority ~2x)
+    const tierMultiplier = getServiceTierMultiplier(serviceTier);
+
+    inputCost = inputTokens * modelStats.input_cost_per_token * tierMultiplier;
+    cachedCost = cachedTokens * (modelStats.cache_read_input_token_cost ?? 0) * tierMultiplier;
     cacheCreateCost = cacheCreateTokens * (modelStats.cache_creation_input_token_cost ?? 0);
-    outputCost = outputWithoutReasoning * modelStats.output_cost_per_token;
-    reasoningCost = reasoningTokens * modelStats.output_cost_per_token;
+    outputCost = outputWithoutReasoning * modelStats.output_cost_per_token * tierMultiplier;
+    reasoningCost = reasoningTokens * modelStats.output_cost_per_token * tierMultiplier;
   }
 
   return {
diff --git a/src/node/services/agentSession.ts b/src/node/services/agentSession.ts
index 57dffc0fbc..4d51a9996e 100644
--- a/src/node/services/agentSession.ts
+++ b/src/node/services/agentSession.ts
@@ -28,6 +28,7 @@ import { prepareUserMessageForSend } from "@/common/types/message";
 import { createRuntime } from "@/node/runtime/runtimeFactory";
 import { MessageQueue } from "./messageQueue";
 import type { StreamEndEvent } from "@/common/types/stream";
+import type { SessionUsageService } from "./sessionUsageService";
 import { CompactionHandler } from "./compactionHandler";
 import type { BackgroundProcessManager } from "./backgroundProcessManager";
 import { computeDiff } from "@/node/utils/diff";
@@ -85,6 +86,7 @@ interface AgentSessionOptions {
   config: Config;
   historyService: HistoryService;
   partialService: PartialService;
+  sessionUsageService?: SessionUsageService;
   aiService: AIService;
   initStateManager: InitStateManager;
   backgroundProcessManager: BackgroundProcessManager;
@@ -134,6 +136,7 @@ export class AgentSession {
       workspaceId,
       config,
       historyService,
+      sessionUsageService,
       partialService,
       aiService,
       initStateManager,
@@ -156,6 +159,7 @@ export class AgentSession {
 
     this.compactionHandler = new CompactionHandler({
       workspaceId: this.workspaceId,
+      sessionUsageService,
       historyService: this.historyService,
       partialService: this.partialService,
       emitter: this.emitter,
diff --git a/src/node/services/aiService.ts b/src/node/services/aiService.ts
index 373346c32c..e6c452380d 100644
--- a/src/node/services/aiService.ts
+++ b/src/node/services/aiService.ts
@@ -12,6 +12,7 @@ import type { WorkspaceMetadata } from "@/common/types/workspace";
 import {
   PROVIDER_REGISTRY,
   PROVIDER_DEFINITIONS,
+  isValidOpenAIServiceTier,
   type ProviderName,
 } from "@/common/constants/providers";
 
@@ -502,11 +503,10 @@ export class AIService extends EventEmitter {
         }
 
         // Extract serviceTier from config to pass through to buildProviderOptions
-        const configServiceTier = providerConfig.serviceTier as string | undefined;
-        if (configServiceTier && muxProviderOptions) {
+        if (isValidOpenAIServiceTier(providerConfig.serviceTier) && muxProviderOptions) {
           muxProviderOptions.openai = {
             ...muxProviderOptions.openai,
-            serviceTier: configServiceTier as "auto" | "default" | "flex" | "priority",
+            serviceTier: providerConfig.serviceTier,
           };
         }
 
diff --git a/src/node/services/compactionHandler.test.ts b/src/node/services/compactionHandler.test.ts
index db2b0201d6..628144c9d5 100644
--- a/src/node/services/compactionHandler.test.ts
+++ b/src/node/services/compactionHandler.test.ts
@@ -3,6 +3,8 @@ import { CompactionHandler } from "./compactionHandler";
 import type { HistoryService } from "./historyService";
 import type { PartialService } from "./partialService";
 import type { EventEmitter } from "events";
+import type { ChatUsageDisplay } from "@/common/utils/tokens/usageAggregator";
+import type { SessionUsageService } from "./sessionUsageService";
 import { createMuxMessage, type MuxMessage } from "@/common/types/message";
 import type { StreamEndEvent } from "@/common/types/stream";
 import { Ok, Err, type Result } from "@/common/types/result";
@@ -102,6 +104,14 @@ const createStreamEndEvent = (
 });
 
 // DRY helper to set up successful compaction scenario
+const createChatUsage = (input: number, output: number): ChatUsageDisplay => ({
+  input: { tokens: input },
+  cached: { tokens: 0 },
+  cacheCreate: { tokens: 0 },
+  output: { tokens: output },
+  reasoning: { tokens: 0 },
+});
+
 const setupSuccessfulCompaction = (
   mockHistoryService: ReturnType<typeof createMockHistoryService>,
   messages: MuxMessage[] = [createCompactionRequest()],
@@ -289,15 +299,49 @@ describe("CompactionHandler", () => {
       });
       expect(summaryEvent).toBeDefined();
       const sevt = summaryEvent?.data.message as MuxMessage;
-      // providerMetadata is omitted to avoid inflating context with pre-compaction cacheCreationInputTokens
       expect(sevt.metadata).toMatchObject({
         model: "claude-3-5-sonnet-20241022",
         usage,
         duration: 2000,
         systemMessageTokens: 100,
         compacted: true,
+        providerMetadata: { anthropic: { cacheCreationInputTokens: 50000 } },
+      });
+    });
+
+    it("should store historicalUsage snapshot on compaction summary when available", async () => {
+      const compactionReq = createCompactionRequest();
+      setupSuccessfulCompaction(mockHistoryService, [compactionReq]);
+
+      const sessionUsage = {
+        byModel: {
+          "openai:gpt-5": createChatUsage(100, 50),
+          "anthropic:claude-sonnet-4-5": createChatUsage(200, 75),
+        },
+        version: 1 as const,
+      };
+
+      const mockSessionUsageService: Pick<SessionUsageService, "getSessionUsage"> = {
+        getSessionUsage: mock(() => Promise.resolve(sessionUsage)),
+      };
+
+      handler = new CompactionHandler({
+        workspaceId,
+        historyService: mockHistoryService as unknown as HistoryService,
+        partialService: mockPartialService as unknown as PartialService,
+        emitter: mockEmitter,
+        sessionUsageService: mockSessionUsageService as unknown as SessionUsageService,
+      });
+
+      const event = createStreamEndEvent("Summary");
+      await handler.handleCompletion(event);
+
+      const appendedMsg = mockHistoryService.appendToHistory.mock.calls[0][1] as MuxMessage;
+      expect(appendedMsg.metadata?.historicalUsage).toBeDefined();
+      expect(appendedMsg.metadata?.historicalUsage).toMatchObject({
+        input: { tokens: 300 },
+        output: { tokens: 125 },
       });
-      expect(sevt.metadata?.providerMetadata).toBeUndefined();
     });
 
     it("should emit stream-end event to frontend", async () => {
diff --git a/src/node/services/compactionHandler.ts b/src/node/services/compactionHandler.ts
index dfdd02d345..d9ae3d2079 100644
--- a/src/node/services/compactionHandler.ts
+++ b/src/node/services/compactionHandler.ts
@@ -5,6 +5,8 @@ import type { StreamEndEvent } from "@/common/types/stream";
 import type { WorkspaceChatMessage, DeleteMessage } from "@/common/orpc/types";
 import type { Result } from "@/common/types/result";
 import { Ok, Err } from "@/common/types/result";
+import type { SessionUsageService } from "./sessionUsageService";
+import { sumUsageHistory } from "@/common/utils/tokens/usageAggregator";
 import type { LanguageModelV2Usage } from "@ai-sdk/provider";
 
 import { createMuxMessage, type MuxMessage } from "@/common/types/message";
@@ -16,6 +18,7 @@ import {
 
 interface CompactionHandlerOptions {
   workspaceId: string;
+  sessionUsageService?: SessionUsageService;
   historyService: HistoryService;
   partialService: PartialService;
   emitter: EventEmitter;
@@ -31,6 +34,7 @@ interface CompactionHandlerOptions {
  */
 export class CompactionHandler {
   private readonly workspaceId: string;
+  private readonly sessionUsageService?: SessionUsageService;
   private readonly historyService: HistoryService;
   private readonly partialService: PartialService;
   private readonly emitter: EventEmitter;
@@ -42,6 +46,7 @@ export class CompactionHandler {
   private cachedFileDiffs: FileEditDiff[] = [];
 
   constructor(options: CompactionHandlerOptions) {
+    this.sessionUsageService = options.sessionUsageService;
     this.workspaceId = options.workspaceId;
     this.historyService = options.historyService;
     this.partialService = options.partialService;
@@ -134,6 +139,7 @@ export class CompactionHandler {
       model: string;
       usage?: LanguageModelV2Usage;
       duration?: number;
+      contextProviderMetadata?: Record<string, unknown>;
       providerMetadata?: Record<string, unknown>;
       systemMessageTokens?: number;
     },
@@ -152,6 +158,17 @@ export class CompactionHandler {
     }
 
     // Extract diffs BEFORE clearing history (they'll be gone after clear)
+
+    // Snapshot cumulative usage BEFORE clearing history.
+    // This preserves pre-compaction costs if session-usage.json is missing/corrupted
+    // and needs to be rebuilt from chat.jsonl.
+    const historicalUsage = await (async () => {
+      if (!this.sessionUsageService) return undefined;
+      const sessionUsage = await this.sessionUsageService.getSessionUsage(this.workspaceId);
+      if (!sessionUsage) return undefined;
+      const values = Object.values(sessionUsage.byModel);
+      return values.length > 0 ? sumUsageHistory(values) : undefined;
+    })();
     this.cachedFileDiffs = extractEditedFileDiffs(messages);
 
     // Clear entire history and get deleted sequences
@@ -162,12 +179,8 @@ export class CompactionHandler {
     const deletedSequences = clearResult.data;
 
     // Create summary message with metadata.
-    // We omit providerMetadata because it contains cacheCreationInputTokens from the
-    // pre-compaction context, which inflates context usage display.
-    // Note: We no longer store historicalUsage here. Cumulative costs are tracked in
-    // session-usage.json, which is updated on every stream-end. If that file is deleted
-    // or corrupted, pre-compaction costs are lost - this is acceptable since manual
-    // file deletion is out of scope for data recovery.
+    // - providerMetadata: needed for accurate cost reconstruction (cacheCreate tokens, serviceTier, etc.)
+    // - historicalUsage: snapshot of cumulative pre-compaction costs/tokens for rebuildFromMessages()
     const summaryMessage = createMuxMessage(
       `summary-${Date.now()}-${Math.random().toString(36).substring(2, 11)}`,
       "assistant",
@@ -176,6 +189,9 @@ export class CompactionHandler {
         timestamp: Date.now(),
         compacted: true,
         model: metadata.model,
+        historicalUsage,
+        providerMetadata: metadata.providerMetadata,
+        contextProviderMetadata: metadata.contextProviderMetadata,
         usage: metadata.usage,
         duration: metadata.duration,
         systemMessageTokens: metadata.systemMessageTokens,
diff --git a/src/node/services/providerService.ts b/src/node/services/providerService.ts
index ba75aa3533..4f2f776447 100644
--- a/src/node/services/providerService.ts
+++ b/src/node/services/providerService.ts
@@ -1,6 +1,6 @@
 import { EventEmitter } from "events";
 import type { Config } from "@/node/config";
-import { SUPPORTED_PROVIDERS } from "@/common/constants/providers";
+import { SUPPORTED_PROVIDERS, isValidOpenAIServiceTier } from "@/common/constants/providers";
 import type { Result } from "@/common/types/result";
 import type {
   AWSCredentialStatus,
@@ -65,15 +65,8 @@ export class ProviderService {
       };
 
       // OpenAI-specific fields
-      const serviceTier = config.serviceTier;
-      if (
-        provider === "openai" &&
-        (serviceTier === "auto" ||
-          serviceTier === "default" ||
-          serviceTier === "flex" ||
-          serviceTier === "priority")
-      ) {
-        providerInfo.serviceTier = serviceTier;
+      if (provider === "openai" && isValidOpenAIServiceTier(config.serviceTier)) {
+        providerInfo.serviceTier = config.serviceTier;
       }
 
       // AWS/Bedrock-specific fields
diff --git a/src/node/services/serviceContainer.ts b/src/node/services/serviceContainer.ts
index d3927ed7a5..0688f48a8e 100644
--- a/src/node/services/serviceContainer.ts
+++ b/src/node/services/serviceContainer.ts
@@ -87,7 +87,8 @@ export class ServiceContainer {
       this.aiService,
       this.initStateManager,
       this.extensionMetadata,
-      this.backgroundProcessManager
+      this.backgroundProcessManager,
+      this.sessionUsageService
     );
     this.workspaceService.setMCPServerManager(this.mcpServerManager);
     this.providerService = new ProviderService(config);
diff --git a/src/node/services/workspaceService.test.ts b/src/node/services/workspaceService.test.ts
index 49cda4476f..da5850227e 100644
--- a/src/node/services/workspaceService.test.ts
+++ b/src/node/services/workspaceService.test.ts
@@ -6,6 +6,7 @@ import type { PartialService } from "./partialService";
 import type { AIService } from "./aiService";
 import type { InitStateManager } from "./initStateManager";
 import type { ExtensionMetadataService } from "./ExtensionMetadataService";
+import type { SessionUsageService } from "./sessionUsageService";
 import type { BackgroundProcessManager } from "./backgroundProcessManager";
 
 // Helper to access private renamingWorkspaces set
@@ -47,6 +48,8 @@ describe("WorkspaceService rename lock", () => {
 
     const mockInitStateManager: Partial<InitStateManager> = {};
     const mockExtensionMetadataService: Partial<ExtensionMetadataService> = {};
+
+    const mockSessionUsageService: Partial<SessionUsageService> = {};
     const mockBackgroundProcessManager: Partial<BackgroundProcessManager> = {
       cleanup: mock(() => Promise.resolve()),
     };
@@ -58,7 +61,8 @@ describe("WorkspaceService rename lock", () => {
       mockAIService,
       mockInitStateManager as InitStateManager,
       mockExtensionMetadataService as ExtensionMetadataService,
-      mockBackgroundProcessManager as BackgroundProcessManager
+      mockBackgroundProcessManager as BackgroundProcessManager,
+      mockSessionUsageService as SessionUsageService
     );
   });
 
diff --git a/src/node/services/workspaceService.ts b/src/node/services/workspaceService.ts
index b87d0175c9..bd67fac692 100644
--- a/src/node/services/workspaceService.ts
+++ b/src/node/services/workspaceService.ts
@@ -9,6 +9,7 @@ import { log } from "@/node/services/log";
 import { AgentSession } from "@/node/services/agentSession";
 import type { HistoryService } from "@/node/services/historyService";
 import type { PartialService } from "@/node/services/partialService";
+import type { SessionUsageService } from "@/node/services/sessionUsageService";
 import type { AIService } from "@/node/services/aiService";
 import type { InitStateManager } from "@/node/services/initStateManager";
 import type { ExtensionMetadataService } from "@/node/services/ExtensionMetadataService";
@@ -100,7 +101,8 @@ export class WorkspaceService extends EventEmitter {
     private readonly aiService: AIService,
     private readonly initStateManager: InitStateManager,
     private readonly extensionMetadata: ExtensionMetadataService,
-    private readonly backgroundProcessManager: BackgroundProcessManager
+    private readonly backgroundProcessManager: BackgroundProcessManager,
+    private readonly sessionUsageService: SessionUsageService
   ) {
     super();
     this.setupMetadataListeners();
@@ -238,6 +240,7 @@ export class WorkspaceService extends EventEmitter {
       workspaceId: trimmed,
       config: this.config,
       historyService: this.historyService,
+      sessionUsageService: this.sessionUsageService,
       partialService: this.partialService,
       aiService: this.aiService,
       initStateManager: this.initStateManager,