Token Optimizer - 开源AI助手OpenClaw令牌优化工具包，降低API成本50-80% | SkillsMD

Token Optimizer - 开源AI助手OpenClaw令牌优化工具包，降低API成本50-80%

token-optimizer by asif2bd/openclaw-token-optimizer

158 周安装量

4 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/asif2bd/openclaw-token-optimizer --skill token-optimizer

AI/机器学习自动化性能优化

🇨🇳中文介绍

Token Optimizer

OpenClaw 部署中用于减少令牌使用和 API 成本的综合工具包。结合智能模型路由、优化的心跳间隔、使用量跟踪和多提供商策略。

快速开始

立即行动（无需更改配置）：

生成优化的 AGENTS.md（最大收益！）：

python3 scripts/context_optimizer.py generate-agents
# 创建 AGENTS.md.optimized — 检查并替换您当前的 AGENTS.md

检查您实际需要的上下文：

python3 scripts/context_optimizer.py recommend "hi, how are you?"
# 显示：仅需 2 个文件（而非 50+！）

安装优化后的心跳：

cp assets/HEARTBEAT.template.md ~/.openclaw/workspace/HEARTBEAT.md

强制在闲聊时使用更便宜的模型：

python3 scripts/model_router.py "thanks!"
# 单提供商 Anthropic 设置：使用 Sonnet，而非 Opus
# 多提供商设置（OpenRouter/Together）：使用 Haiku 以最大化节省

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

相关 Skills

FlyClaw：零登录航班聚合查询工具，Python实现多源航班信息与价格搜索

4,000,000 周安装

find-skills 技能搜索工具 - Vercel Labs 开源智能体技能包管理器

843,800 周安装

Azure RBAC 权限管理工具：查找最小角色、创建自定义角色与自动化分配

127,200 周安装

React 组合模式指南：Vercel 组件架构最佳实践，提升代码可维护性

113,700 周安装

python3 scripts/context_optimizer.py recommend "<用户提示>"

# 简单问候 → 最小上下文（仅 2 个文件！）
context_optimizer.py recommend "hi"
→ 加载：SOUL.md, IDENTITY.md
→ 跳过：其他所有内容
→ 节省：约 80% 的上下文

# 标准工作 → 选择性加载
context_optimizer.py recommend "write a function"
→ 加载：SOUL.md, IDENTITY.md, memory/TODAY.md
→ 跳过：文档、旧记忆、知识库
→ 节省：约 50% 的上下文

# 复杂任务 → 完整上下文
context_optimizer.py recommend "analyze our entire architecture"
→ 加载：SOUL.md, IDENTITY.md, MEMORY.md, memory/TODAY+YESTERDAY.md
→ 有条件地加载：仅相关文档
→ 节省：约 30% 的上下文

{
  "complexity": "simple",
  "context_level": "minimal",
  "recommended_files": ["SOUL.md", "IDENTITY.md"],
  "file_count": 2,
  "savings_percent": 80,
  "skip_patterns": ["docs/**/*.md", "memory/20*.md"]
}

from context_optimizer import recommend_context_bundle

user_prompt = "thanks for your help"
recommendation = recommend_context_bundle(user_prompt)

if recommendation["context_level"] == "minimal":
    # 仅加载 SOUL.md + IDENTITY.md
    # 跳过其他所有内容
    # 节省约 80% 的令牌！

context_optimizer.py generate-agents
# 创建带有延迟加载指令的 AGENTS.md.optimized
# 检查并替换您当前的 AGENTS.md

python3 scripts/model_router.py "<用户提示>" [current_model] [force_tier]

# 通信（新功能！） → 始终使用 Haiku
python3 scripts/model_router.py "thanks!"
python3 scripts/model_router.py "hi"
python3 scripts/model_router.py "ok got it"
→ 强制：Haiku（闲聊绝不使用 Sonnet/Opus）

# 简单任务 → 建议 Haiku
python3 scripts/model_router.py "read the log file"

# 中等任务 → 建议 Sonnet
python3 scripts/model_router.py "write a function to parse JSON"

# 复杂任务 → 建议 Opus
python3 scripts/model_router.py "design a microservices architecture"

from model_router import route_task

user_prompt = "show me the config"
routing = route_task(user_prompt)

if routing["should_switch"]:
    # 使用 routing["recommended_model"]
    # 节省 routing["cost_savings_percent"]

# 将模板复制到工作区
cp assets/HEARTBEAT.template.md ~/.openclaw/workspace/HEARTBEAT.md

# 计划应运行哪些检查
python3 scripts/heartbeat_optimizer.py plan

# 检查特定类型现在是否应运行
heartbeat_optimizer.py check email
heartbeat_optimizer.py check calendar

# 记录已执行检查
heartbeat_optimizer.py record email

# 更新检查间隔（秒）
heartbeat_optimizer.py interval email 7200  # 2 小时

# 重置状态
heartbeat_optimizer.py reset

## 电子邮件检查
仅在以下情况运行：`heartbeat_optimizer.py check email` → `should_check: true`
检查后：`heartbeat_optimizer.py record email`

任务类型	模型	示例
监控/警报	Haiku	检查服务器健康状态、磁盘空间
数据解析	Haiku	提取 CSV/JSON/日志
提醒	Haiku	每日站会、备份提醒
简单报告	Haiku	状态摘要
内容生成	Sonnet	博客摘要（质量重要）
深度分析	Sonnet	每周洞察
复杂推理	定时任务绝不使用 Opus

# 使用 Haiku 解析每日日志
cron add --schedule "0 2 * * *" \
  --payload '{
    "kind":"agentTurn",
    "message":"Parse yesterday error logs and summarize",
    "model":"anthropic/claude-haiku-4"
  }' \
  --sessionTarget isolated

# ❌ 对简单检查使用 Opus（贵 60 倍！）
cron add --schedule "*/15 * * * *" \
  --payload '{
    "kind":"agentTurn",
    "message":"Check email",
    "model":"anthropic/claude-opus-4"
  }' \
  --sessionTarget isolated

# 测试您的定时任务是否应使用 Haiku
model_router.py "parse daily error logs"
# → 输出：Haiku（检测到后台任务模式）

# 检查当前每日使用量
python3 scripts/token_tracker.py check

# 获取模型建议
python3 scripts/token_tracker.py suggest general

# 重置每日跟踪
python3 scripts/token_tracker.py reset

{
  "date": "2026-02-06",
  "cost": 2.50,
  "tokens": 50000,
  "limit": 5.00,
  "percent_used": 50,
  "status": "ok",
  "alert": null
}

import json
import subprocess

result = subprocess.run(
    ["python3", "scripts/token_tracker.py", "check"],
    capture_output=True, text=True
)
budget = json.loads(result.stdout)

if budget["status"] == "exceeded":
    # 切换到更便宜的模型或推迟非紧急工作
    use_model = "anthropic/claude-haiku-4"
elif budget["status"] == "warning":
    # 使用平衡模型
    use_model = "anthropic/claude-sonnet-4-5"

提供商	模型	成本/MTok	使用场景
Anthropic	Haiku 4	$0.25	简单任务
Anthropic	Sonnet 4.5	$3.00	平衡默认
Anthropic	Opus 4	$15.00	复杂推理
OpenRouter	Gemini 2.5 Flash	$0.075	批量操作
Google AI	Gemini 2.0 Flash Exp	FREE	开发/测试
Together	Llama 3.3 70B	$0.18	开源替代方案

# 示例：启用多提供商回退
gateway config.patch --patch '{"providers": [...]}'

/context list    → 每个注入文件的令牌计数（准确显示消耗提示的内容）
/context detail  → 完整细分，包括工具、技能和系统提示部分

/usage tokens    → 在每个回复后附加令牌计数
/usage full      → 在每个回复后附加令牌 + 成本估算
/usage cost      → 显示会话日志中的累计成本摘要
/usage off       → 禁用使用量页脚

/status          → 模型、上下文百分比、上次响应令牌数、估算成本

# 为您的缓存 TTL 获取最佳间隔
python3 scripts/heartbeat_optimizer.py cache-ttl
# → recommended_interval: 55min (3300s)
# → explanation: 保持 1 小时 Anthropic 缓存温暖

# 自定义 TTL（例如，如果您配置了 2 小时缓存）
python3 scripts/heartbeat_optimizer.py cache-ttl 7200
# → recommended_interval: 115min

{
  "agents": {
    "defaults": {
      "heartbeat": {
        "every": "55m"
      }
    }
  }
}

# 1. 用户发送消息
user_msg="debug this error in the logs"

# 2. 路由到适当的模型
routing=$(python3 scripts/model_router.py "$user_msg")
model=$(echo $routing | jq -r .recommended_model)

# 3. 在继续之前检查预算
budget=$(python3 scripts/token_tracker.py check)
status=$(echo $budget | jq -r .status)

if [ "$status" = "exceeded" ]; then
    # 无论路由如何，都使用最便宜的模型
    model="anthropic/claude-haiku-4"
fi

# 4. 使用选定的模型处理
# （OpenClaw 通过配置或覆盖处理此步骤）

## HEARTBEAT.md

# 计划检查内容
result=$(python3 scripts/heartbeat_optimizer.py plan)
should_run=$(echo $result | jq -r .should_run)

if [ "$should_run" = "false" ]; then
    echo "HEARTBEAT_OK"
    exit 0
fi

# 仅运行计划的检查
planned=$(echo $result | jq -r '.planned[].type')

for check in $planned; do
    case $check in
        email) check_email ;;
        calendar) check_calendar ;;
    esac
    python3 scripts/heartbeat_optimizer.py record $check
done

策略	上下文	模型	每日成本	每月	节省
基线（无优化）	50K	Sonnet	$0.30	$9.00	0%
仅上下文优化	10K (-80%)	Sonnet	$0.18	$5.40	40%
仅模型路由	50K	混合	$0.18	$5.40	40%
两者（此技能）	10K	混合	$0.09	$2.70	70%
激进 + Gemini	10K	Gemini	$0.03	$0.90	90%

🇺🇸English

Token Optimizer

Comprehensive toolkit for reducing token usage and API costs in OpenClaw deployments. Combines smart model routing, optimized heartbeat intervals, usage tracking, and multi-provider strategies.

Quick Start

Immediate actions (no config changes needed):

Generate optimized AGENTS.md (BIGGEST WIN!):

python3 scripts/context_optimizer.py generate-agents
# Creates AGENTS.md.optimized — review and replace your current AGENTS.md

Check what context you ACTUALLY need:

python3 scripts/context_optimizer.py recommend "hi, how are you?"
# Shows: Only 2 files needed (not 50+!)

Install optimized heartbeat:

cp assets/HEARTBEAT.template.md ~/.openclaw/workspace/HEARTBEAT.md

Enforce cheaper models for casual chat:

python3 scripts/model_router.py "thanks!"
# Single-provider Anthropic setup: Use Sonnet, not Opus
# Multi-provider setup (OpenRouter/Together): Use Haiku for max savings

Check current token budget:
```
python3 scripts/token_tracker.py check
```

Expected savings: 50-80% reduction in token costs for typical workloads (context optimization is the biggest factor!).

Core Capabilities

1. Context Optimization (NEW!)

Biggest token saver — Only load files you actually need, not everything upfront.

Problem: Default OpenClaw loads ALL context files every session:

SOUL.md, AGENTS.md, USER.md, TOOLS.md, MEMORY.md
docs/**/*.md (hundreds of files)
memory/2026-*.md (daily logs)
Total: Often 50K+ tokens before user even speaks!

Solution: Lazy loading based on prompt complexity.

Usage:

python3 scripts/context_optimizer.py recommend "<user prompt>"

Examples:

# Simple greeting → minimal context (2 files only!)
context_optimizer.py recommend "hi"
→ Load: SOUL.md, IDENTITY.md
→ Skip: Everything else
→ Savings: ~80% of context

# Standard work → selective loading
context_optimizer.py recommend "write a function"
→ Load: SOUL.md, IDENTITY.md, memory/TODAY.md
→ Skip: docs, old memory, knowledge base
→ Savings: ~50% of context

# Complex task → full context
context_optimizer.py recommend "analyze our entire architecture"
→ Load: SOUL.md, IDENTITY.md, MEMORY.md, memory/TODAY+YESTERDAY.md
→ Conditionally load: Relevant docs only
→ Savings: ~30% of context

Output format:

{
  "complexity": "simple",
  "context_level": "minimal",
  "recommended_files": ["SOUL.md", "IDENTITY.md"],
  "file_count": 2,
  "savings_percent": 80,
  "skip_patterns": ["docs/**/*.md", "memory/20*.md"]
}

Integration pattern: Before loading context for a new session:

from context_optimizer import recommend_context_bundle

user_prompt = "thanks for your help"
recommendation = recommend_context_bundle(user_prompt)

if recommendation["context_level"] == "minimal":
    # Load only SOUL.md + IDENTITY.md
    # Skip everything else
    # Save ~80% tokens!

Generate optimized AGENTS.md:

context_optimizer.py generate-agents
# Creates AGENTS.md.optimized with lazy loading instructions
# Review and replace your current AGENTS.md

Expected savings: 50-80% reduction in context tokens.

2. Smart Model Routing (ENHANCED!)

Automatically classify tasks and route to appropriate model tiers.

NEW: Communication pattern enforcement — Never waste Opus tokens on "hi" or "thanks"!

Usage:

python3 scripts/model_router.py "<user prompt>" [current_model] [force_tier]

Examples:

# Communication (NEW!) → ALWAYS Haiku
python3 scripts/model_router.py "thanks!"
python3 scripts/model_router.py "hi"
python3 scripts/model_router.py "ok got it"
→ Enforced: Haiku (NEVER Sonnet/Opus for casual chat)

# Simple task → suggests Haiku
python3 scripts/model_router.py "read the log file"

# Medium task → suggests Sonnet
python3 scripts/model_router.py "write a function to parse JSON"

# Complex task → suggests Opus
python3 scripts/model_router.py "design a microservices architecture"

Patterns enforced to Haiku (NEVER Sonnet/Opus):

Communication:

Greetings: hi, hey, hello, yo
Thanks: thanks, thank you, thx
Acknowledgments: ok, sure, got it, understood
Short responses: yes, no, yep, nope
Single words or very short phrases

Background tasks:

Heartbeat checks: "check email", "monitor servers"
Cronjobs: "scheduled task", "periodic check", "reminder"
Document parsing: "parse CSV", "extract data from log", "read JSON"
Log scanning: "scan error logs", "process logs"

Integration pattern:

from model_router import route_task

user_prompt = "show me the config"
routing = route_task(user_prompt)

if routing["should_switch"]:
    # Use routing["recommended_model"]
    # Save routing["cost_savings_percent"]

Customization: Edit ROUTING_RULES or COMMUNICATION_PATTERNS in scripts/model_router.py to adjust patterns and keywords.

3. Heartbeat Optimization

Reduce API calls from heartbeat polling with smart interval tracking:

Setup:

# Copy template to workspace
cp assets/HEARTBEAT.template.md ~/.openclaw/workspace/HEARTBEAT.md

# Plan which checks should run
python3 scripts/heartbeat_optimizer.py plan

Commands:

# Check if specific type should run now
heartbeat_optimizer.py check email
heartbeat_optimizer.py check calendar

# Record that a check was performed
heartbeat_optimizer.py record email

# Update check interval (seconds)
heartbeat_optimizer.py interval email 7200  # 2 hours

# Reset state
heartbeat_optimizer.py reset

How it works:

Tracks last check time for each type (email, calendar, weather, etc.)
Enforces minimum intervals before re-checking
Respects quiet hours (23:00-08:00) — skips all checks
Returns HEARTBEAT_OK when nothing needs attention (saves tokens)

Default intervals:

Email: 60 minutes
Calendar: 2 hours
Weather: 4 hours
Social: 2 hours
Monitoring: 30 minutes

Integration in HEARTBEAT.md:

## Email Check
Run only if: `heartbeat_optimizer.py check email` → `should_check: true`
After checking: `heartbeat_optimizer.py record email`

Expected savings: 50% reduction in heartbeat API calls.

Model enforcement: Heartbeat should ALWAYS use Haiku — see updated HEARTBEAT.template.md for model override instructions.

4. Cronjob Optimization (NEW!)

Problem: Cronjobs often default to expensive models (Sonnet/Opus) even for routine tasks.

Solution: Always specify Haiku for 90% of scheduled tasks.

See: assets/cronjob-model-guide.md for comprehensive guide with examples.

Quick reference:

Task Type	Model	Example
Monitoring/alerts	Haiku	Check server health, disk space
Data parsing	Haiku	Extract CSV/JSON/logs
Reminders	Haiku	Daily standup, backup reminders
Simple reports	Haiku	Status summaries
Content generation	Sonnet	Blog summaries (quality matters)
Deep analysis	Sonnet	Weekly insights
Complex reasoning	Never use Opus for cronjobs

Example (good):

# Parse daily logs with Haiku
cron add --schedule "0 2 * * *" \
  --payload '{
    "kind":"agentTurn",
    "message":"Parse yesterday error logs and summarize",
    "model":"anthropic/claude-haiku-4"
  }' \
  --sessionTarget isolated

Example (bad):

# ❌ Using Opus for simple check (60x more expensive!)
cron add --schedule "*/15 * * * *" \
  --payload '{
    "kind":"agentTurn",
    "message":"Check email",
    "model":"anthropic/claude-opus-4"
  }' \
  --sessionTarget isolated

Savings: Using Haiku instead of Opus for 10 daily cronjobs = $17.70/month saved per agent.

Integration with model_router:

# Test if your cronjob should use Haiku
model_router.py "parse daily error logs"
# → Output: Haiku (background task pattern detected)

5. Token Budget Tracking

Monitor usage and alert when approaching limits:

Setup:

# Check current daily usage
python3 scripts/token_tracker.py check

# Get model suggestions
python3 scripts/token_tracker.py suggest general

# Reset daily tracking
python3 scripts/token_tracker.py reset

Output format:

{
  "date": "2026-02-06",
  "cost": 2.50,
  "tokens": 50000,
  "limit": 5.00,
  "percent_used": 50,
  "status": "ok",
  "alert": null
}

Status levels:

ok: Below 80% of daily limit
warning: 80-99% of daily limit
exceeded: Over daily limit

Integration pattern: Before starting expensive operations, check budget:

import json
import subprocess

result = subprocess.run(
    ["python3", "scripts/token_tracker.py", "check"],
    capture_output=True, text=True
)
budget = json.loads(result.stdout)

if budget["status"] == "exceeded":
    # Switch to cheaper model or defer non-urgent work
    use_model = "anthropic/claude-haiku-4"
elif budget["status"] == "warning":
    # Use balanced model
    use_model = "anthropic/claude-sonnet-4-5"

Customization: Edit daily_limit_usd and warn_threshold parameters in function calls.

6. Multi-Provider Strategy

See references/PROVIDERS.md for comprehensive guide on:

Alternative providers (OpenRouter, Together.ai, Google AI Studio)
Cost comparison tables
Routing strategies by task complexity
Fallback chains for rate-limited scenarios
API key management

Quick reference:

Provider	Model	Cost/MTok	Use Case
Anthropic	Haiku 4	$0.25	Simple tasks
Anthropic	Sonnet 4.5	$3.00	Balanced default
Anthropic	Opus 4	$15.00	Complex reasoning
OpenRouter	Gemini 2.5 Flash	$0.075	Bulk operations
Google AI	Gemini 2.0 Flash Exp	FREE	Dev/testing
Together	Llama 3.3 70B	$0.18	Open alternative

Configuration Patches

See assets/config-patches.json for advanced optimizations:

Implemented by this skill:

✅ Heartbeat optimization (fully functional)
✅ Token budget tracking (fully functional)
✅ Model routing logic (fully functional)

Native OpenClaw 2026.2.15 — apply directly:

✅ Session pruning (contextPruning: cache-ttl) — auto-trims old tool results after Anthropic cache TTL expires
✅ Bootstrap size limits (bootstrapMaxChars / bootstrapTotalMaxChars) — caps workspace file injection size
✅ Cache retention long (cacheRetention: "long" for Opus) — amortizes cache write costs

Requires OpenClaw core support:

⏳ Prompt caching (Anthropic API feature — verify current status)
⏳ Lazy context loading (use context_optimizer.py script today)
⏳ Multi-provider fallback (partially supported)

Apply config patches:

# Example: Enable multi-provider fallback
gateway config.patch --patch '{"providers": [...]}'

Native OpenClaw Diagnostics (2026.2.15+)

OpenClaw 2026.2.15 added built-in commands that complement this skill's Python scripts. Use these first for quick diagnostics before reaching for the scripts.

Context breakdown

/context list    → token count per injected file (shows exactly what's eating your prompt)
/context detail  → full breakdown including tools, skills, and system prompt sections

Use before applyingbootstrap_size_limits — see which files are oversized, then set bootstrapMaxChars accordingly.

Per-response usage tracking

/usage tokens    → append token count to every reply
/usage full      → append tokens + cost estimate to every reply
/usage cost      → show cumulative cost summary from session logs
/usage off       → disable usage footer

Combine withtoken_tracker.py — /usage cost gives session totals; token_tracker.py tracks daily budget.

Session status

/status          → model, context %, last response tokens, estimated cost

Cache TTL Heartbeat Alignment (NEW in v1.4.0)

The problem: Anthropic charges ~3.75x more for cache writes than cache reads. If your agent goes idle and the 1h cache TTL expires, the next request re-writes the entire prompt cache — expensive.

The fix: Set heartbeat interval to 55min (just under the 1h TTL). The heartbeat keeps the cache warm, so every subsequent request pays cache-read rates instead.

# Get optimal interval for your cache TTL
python3 scripts/heartbeat_optimizer.py cache-ttl
# → recommended_interval: 55min (3300s)
# → explanation: keeps 1h Anthropic cache warm

# Custom TTL (e.g., if you've configured 2h cache)
python3 scripts/heartbeat_optimizer.py cache-ttl 7200
# → recommended_interval: 115min

Apply to your OpenClaw config:

{
  "agents": {
    "defaults": {
      "heartbeat": {
        "every": "55m"
      }
    }
  }
}

Who benefits: Anthropic API key users only. OAuth profiles already default to 1h heartbeat (OpenClaw smart default). API key profiles default to 30min — bumping to 55min is both cheaper (fewer calls) and cache-warm.

Deployment Patterns

For Personal Use

Install optimized HEARTBEAT.md
Run budget checks before expensive operations
Manually route complex tasks to Opus only when needed

Expected savings: 20-30%

For Managed Hosting (xCloud, etc.)

Default all agents to Haiku
Route user interactions to Sonnet
Reserve Opus for explicitly complex requests
Use Gemini Flash for background operations
Implement daily budget caps per customer

Expected savings: 40-60%

For High-Volume Deployments

Use multi-provider fallback (OpenRouter + Together.ai)
Implement aggressive routing (80% Gemini, 15% Haiku, 5% Sonnet)
Deploy local Ollama for offline/cheap operations
Batch heartbeat checks (every 2-4 hours, not 30 min)

Expected savings: 70-90%

Integration Examples

Workflow: Smart Task Handling

# 1. User sends message
user_msg="debug this error in the logs"

# 2. Route to appropriate model
routing=$(python3 scripts/model_router.py "$user_msg")
model=$(echo $routing | jq -r .recommended_model)

# 3. Check budget before proceeding
budget=$(python3 scripts/token_tracker.py check)
status=$(echo $budget | jq -r .status)

if [ "$status" = "exceeded" ]; then
    # Use cheapest model regardless of routing
    model="anthropic/claude-haiku-4"
fi

# 4. Process with selected model
# (OpenClaw handles this via config or override)

Workflow: Optimized Heartbeat

## HEARTBEAT.md

# Plan what to check
result=$(python3 scripts/heartbeat_optimizer.py plan)
should_run=$(echo $result | jq -r .should_run)

if [ "$should_run" = "false" ]; then
    echo "HEARTBEAT_OK"
    exit 0
fi

# Run only planned checks
planned=$(echo $result | jq -r '.planned[].type')

for check in $planned; do
    case $check in
        email) check_email ;;
        calendar) check_calendar ;;
    esac
    python3 scripts/heartbeat_optimizer.py record $check
done

Troubleshooting

Issue: Scripts fail with "module not found"

Fix: Ensure Python 3.7+ is installed. Scripts use only stdlib.

Issue: State files not persisting

Fix: Check that ~/.openclaw/workspace/memory/ directory exists and is writable.

Issue: Budget tracking shows $0.00

Fix: token_tracker.py needs integration with OpenClaw's session_status tool. Currently tracks manually recorded usage.

Issue: Routing suggests wrong model tier

Fix: Customize ROUTING_RULES in model_router.py for your specific patterns.

Maintenance

Daily:

Check budget status: token_tracker.py check

Weekly:

Review routing accuracy (are suggestions correct?)
Adjust heartbeat intervals based on activity

Monthly:

Compare costs before/after optimization
Review and update PROVIDERS.md with new options

Cost Estimation

Example: 100K tokens/day workload

Without skill:

50K context tokens + 50K conversation tokens = 100K total
All Sonnet: 100K × $3/MTok = $0.30/day = $9/month

Strategy	Context	Model	Daily Cost	Monthly	Savings
Baseline (no optimization)	50K	Sonnet	$0.30	$9.00	0%
Context opt only	10K (-80%)	Sonnet	$0.18	$5.40	40%
Model routing only	50K	Mixed	$0.18	$5.40	40%
Both (this skill)	10K	Mixed	$0.09	$2.70

Key insight: Context optimization (50K → 10K tokens) saves MORE than model routing!

xCloud hosting scenario (100 customers, 50K tokens/customer/day):

Baseline (all Sonnet, full context): $450/month
With token-optimizer: $135/month
Savings: $315/month per 100 customers (70%)

Resources

Scripts (4 total)

context_optimizer.py — Context loading optimization and lazy loading (NEW!)
model_router.py — Task classification, model suggestions, and communication enforcement (ENHANCED!)
heartbeat_optimizer.py — Interval management and check scheduling
token_tracker.py — Budget monitoring and alerts

References

PROVIDERS.md — Alternative AI providers, pricing, and routing strategies

Assets (3 total)

HEARTBEAT.template.md — Drop-in optimized heartbeat template with Haiku enforcement (ENHANCED!)
cronjob-model-guide.md — Complete guide for choosing models in cronjobs (NEW!)
config-patches.json — Advanced configuration examples

Future Enhancements

Ideas for extending this skill:

Auto-routing integration — Hook into OpenClaw message pipeline
Real-time usage tracking — Parse session_status automatically
Cost forecasting — Predict monthly spend based on recent usage
Provider health monitoring — Track API latency and failures
A/B testing — Compare quality across different routing strategies

Weekly Installs

Repository

asif2bd/opencla…ptimizer

GitHub Stars

First Seen

Feb 18, 2026

Security Audits

Gen Agent Trust HubPass SocketPass SnykPass

Installed on

opencode62

gemini-cli62

github-copilot61

amp61

codex61

openclaw61

Token Optimizer - 开源AI助手OpenClaw令牌优化工具包，降低API成本50-80%

🇨🇳中文介绍

Token Optimizer

快速开始

相关 Skills

核心功能

1. 上下文优化（新功能！）

2. 智能模型路由（增强版！）

3. 心跳优化

4. 定时任务优化（新功能！）

5. 令牌预算跟踪

6. 多提供商策略

配置补丁

原生 OpenClaw 诊断（2026.2.15+）

上下文细分

每次响应使用量跟踪

会话状态

缓存 TTL 心跳对齐（v1.4.0 新增功能）

部署模式

个人使用

托管服务（xCloud 等）

高流量部署

集成示例

工作流：智能任务处理

工作流：优化心跳

故障排除

维护

成本估算

资源

脚本（共 4 个）

参考资料

资源文件（共 3 个）

未来增强

🇺🇸English

Token Optimizer

Quick Start

Core Capabilities

1. Context Optimization (NEW!)

2. Smart Model Routing (ENHANCED!)

3. Heartbeat Optimization

4. Cronjob Optimization (NEW!)

5. Token Budget Tracking

6. Multi-Provider Strategy

Configuration Patches

Native OpenClaw Diagnostics (2026.2.15+)

Context breakdown

Per-response usage tracking

Session status

Cache TTL Heartbeat Alignment (NEW in v1.4.0)

Deployment Patterns

For Personal Use

For Managed Hosting (xCloud, etc.)

For High-Volume Deployments

Integration Examples

Workflow: Smart Task Handling

Workflow: Optimized Heartbeat

Troubleshooting

Maintenance

Cost Estimation

Resources

Scripts (4 total)

References

Assets (3 total)

Future Enhancements

最新 Skills