codex by softaworks/agent-toolkit
npx skills add https://github.com/softaworks/agent-toolkit --skill codexgpt-5.2 模型。通过 AskUserQuestion 询问用户要使用的推理强度(xhigh、high、medium 或 low)。用户可以根据需要覆盖模型(参见下面的模型选项)。--sandbox read-only。-m, --model <MODEL>--config model_reasoning_effort="<high|medium|low>"广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
--sandbox <read-only|workspace-write|danger-full-access>--full-auto-C, --cd <DIR>--skip-git-repo-check--skip-git-repo-check。codex exec --skip-git-repo-check resume --last。恢复时不要使用任何配置标志,除非用户明确请求,例如,当用户请求恢复会话时指定了模型或推理强度。恢复语法:echo "your prompt here" | codex exec --skip-git-repo-check resume --last 2>/dev/null。所有标志必须插入在 exec 和 resume 之间。codex exec 命令后附加 2>/dev/null 以抑制思考令牌(stderr)。仅当用户明确要求查看思考令牌或需要调试时才显示 stderr。| 用例 | 沙盒模式 | 关键标志 |
|---|---|---|
| 只读审查或分析 | read-only | --sandbox read-only 2>/dev/null |
| 应用本地编辑 | workspace-write | --sandbox workspace-write --full-auto 2>/dev/null |
| 允许网络或广泛访问 | danger-full-access | --sandbox danger-full-access --full-auto 2>/dev/null |
| 恢复最近会话 | 继承自原始会话 | `echo "prompt" |
| 从其他目录运行 | 匹配任务需求 | -C <DIR> 加上其他标志 2>/dev/null |
| 模型 | 最适合 | 上下文窗口 | 关键特性 |
|---|---|---|---|
gpt-5.2-max | 最大模型:超复杂推理、深度问题分析 | 400K 输入 / 128K 输出 | 76.3% SWE-bench,自适应推理,$1.25/$10.00 |
gpt-5.2 ⭐ | 旗舰模型:软件工程、智能体编码工作流 | 400K 输入 / 128K 输出 | 76.3% SWE-bench,自适应推理,$1.25/$10.00 |
gpt-5.2-mini | 高性价比编码(使用额度增加 4 倍) | 400K 输入 / 128K 输出 | 接近 SOTA 性能,$0.25/$2.00 |
gpt-5.1-thinking | 超复杂推理、深度问题分析 | 400K 输入 / 128K 输出 | 自适应思考深度,在最难任务上运行速度慢 2 倍 |
GPT-5.2 优势:76.3% SWE-bench(对比 GPT-5 的 72.8%),平均任务速度快 30%,更好的工具处理能力,减少幻觉,提高代码质量。知识截止日期:2024 年 9 月 30 日。
推理强度等级:
xhigh - 超复杂任务(深度问题分析、复杂推理、深入理解问题)high - 复杂任务(重构、架构、安全分析、性能优化)medium - 标准任务(重构、代码组织、功能添加、错误修复)low - 简单任务(快速修复、简单更改、代码格式化、文档编写)缓存输入折扣:对于重复的上下文内容,享受 90% 的折扣($0.125/M 令牌),缓存最长可持续 24 小时。
codex 命令后,立即使用 AskUserQuestion 确认后续步骤、收集澄清信息,或决定是否使用 codex exec resume --last 恢复会话。echo "new prompt" | codex exec resume --last 2>/dev/null。恢复的会话会自动使用原始会话的相同模型、推理强度和沙盒模式。codex --version 或 codex exec 命令以非零状态退出时,停止并报告失败;在重试前请求指示。--full-auto、--sandbox danger-full-access、--skip-git-repo-check)之前,除非已获得许可,否则使用 AskUserQuestion 请求用户许可。AskUserQuestion 询问如何调整。需要 Codex CLI v0.57.0 或更高版本以支持 GPT-5.2 模型。CLI 在 macOS/Linux 上默认使用 gpt-5.2,在 Windows 上也默认使用 gpt-5.2。检查版本:codex --version
在 Codex 会话中使用 /model 斜杠命令切换模型,或在 ~/.codex/config.toml 中配置默认值。
每周安装数
572
仓库
GitHub 星标数
1.2K
首次出现
2026 年 1 月 20 日
安全审计
安装于
gemini-cli417
cursor417
codex416
claude-code416
opencode399
cline398
gpt-5.2 model. Ask the user (via AskUserQuestion) which reasoning effort to use (xhigh,high, medium, or low). User can override model if needed (see Model Options below).--sandbox read-only unless edits or network access are necessary.-m, --model <MODEL>--config model_reasoning_effort="<high|medium|low>"--sandbox <read-only|workspace-write|danger-full-access>--full-auto-C, --cd <DIR>--skip-git-repo-checkcodex exec --skip-git-repo-check resume --last via stdin. When resuming don't use any configuration flags unless explicitly requested by the user e.g. if he species the model or the reasoning effort when requesting to resume a session. Resume syntax: echo "your prompt here" | codex exec --skip-git-repo-check resume --last 2>/dev/null. All flags have to be inserted between exec and resume.2>/dev/null to all codex exec commands to suppress thinking tokens (stderr). Only show stderr if the user explicitly requests to see thinking tokens or if debugging is needed.| Use case | Sandbox mode | Key flags |
|---|---|---|
| Read-only review or analysis | read-only | --sandbox read-only 2>/dev/null |
| Apply local edits | workspace-write | --sandbox workspace-write --full-auto 2>/dev/null |
| Permit network or broad access | danger-full-access | --sandbox danger-full-access --full-auto 2>/dev/null |
| Model | Best for | Context window | Key features |
|---|---|---|---|
gpt-5.2-max | Max model : Ultra-complex reasoning, deep problem analysis | 400K input / 128K output | 76.3% SWE-bench, adaptive reasoning, $1.25/$10.00 |
gpt-5.2 ⭐ | Flagship model : Software engineering, agentic coding workflows | 400K input / 128K output | 76.3% SWE-bench, adaptive reasoning, $1.25/$10.00 |
gpt-5.2-mini | Cost-efficient coding (4x more usage allowance) | 400K input / 128K output | Near SOTA performance, $0.25/$2.00 |
gpt-5.1-thinking |
GPT-5.2 Advantages : 76.3% SWE-bench (vs 72.8% GPT-5), 30% faster on average tasks, better tool handling, reduced hallucinations, improved code quality. Knowledge cutoff: September 30, 2024.
Reasoning Effort Levels :
xhigh - Ultra-complex tasks (deep problem analysis, complex reasoning, deep understanding of the problem)high - Complex tasks (refactoring, architecture, security analysis, performance optimization)medium - Standard tasks (refactoring, code organization, feature additions, bug fixes)low - Simple tasks (quick fixes, simple changes, code formatting, documentation)Cached Input Discount : 90% off ($0.125/M tokens) for repeated context, cache lasts up to 24 hours.
codex command, immediately use AskUserQuestion to confirm next steps, collect clarifications, or decide whether to resume with codex exec resume --last.echo "new prompt" | codex exec resume --last 2>/dev/null. The resumed session automatically uses the same model, reasoning effort, and sandbox mode from the original session.codex --version or a codex exec command exits non-zero; request direction before retrying.--full-auto, --sandbox danger-full-access, --skip-git-repo-check) ask the user for permission using AskUserQuestion unless it was already given.AskUserQuestion.Requires Codex CLI v0.57.0 or later for GPT-5.2 model support. The CLI defaults to gpt-5.2 on macOS/Linux and gpt-5.2 on Windows. Check version: codex --version
Use /model slash command within a Codex session to switch models, or configure default in ~/.codex/config.toml.
Weekly Installs
572
Repository
GitHub Stars
1.2K
First Seen
Jan 20, 2026
Security Audits
Gen Agent Trust HubFailSocketPassSnykWarn
Installed on
gemini-cli417
cursor417
codex416
claude-code416
opencode399
cline398
agent-browser 浏览器自动化工具 - Vercel Labs 命令行网页操作与测试
136,300 周安装
OpenAPI 转 TypeScript 工具 - 自动生成 API 接口与类型守卫
563 周安装
数据库模式设计器 - 内置最佳实践,自动生成生产级SQL/NoSQL数据库架构
564 周安装
Rust Unsafe代码检查器 - 安全使用Unsafe Rust的完整指南与最佳实践
564 周安装
.NET并发编程模式指南:async/await、Channels、Akka.NET选择决策树
565 周安装
韩语语法检查器 - 基于国立国语院标准的拼写、空格、语法、标点错误检测与纠正
565 周安装
技能安全扫描器 - 检测Claude技能安全漏洞,防范提示注入与恶意代码
565 周安装
| Resume recent session | Inherited from original | `echo "prompt" |
| Run from another directory | Match task needs | -C <DIR> plus other flags 2>/dev/null |
| Ultra-complex reasoning, deep problem analysis |
| 400K input / 128K output |
| Adaptive thinking depth, runs 2x slower on hardest tasks |