grepai-embeddings-openai by yoanbernabeu/grepai-skills
npx skills add https://github.com/yoanbernabeu/grepai-skills --skill grepai-embeddings-openai此技能涵盖将 OpenAI 的嵌入 API 与 GrepAI 结合使用,以获得高质量的、基于云的嵌入。
| 方面 | 详情 |
|---|---|
| ✅ 质量 | 最先进的嵌入 |
| ✅ 速度 | 快速,无需本地计算 |
| ✅ 可扩展性 | 可处理任何规模的代码库 |
| ⚠️ 隐私 | 代码会发送到 OpenAI 服务器 |
| ⚠️ 成本 | 按令牌付费 |
| ⚠️ 网络 | 需要网络连接 |
在以下网址获取您的 API 密钥:https://platform.openai.com/api-keys
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
# .grepai/config.yaml
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
设置环境变量:
export OPENAI_API_KEY="sk-..."
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
parallelism: 8 # 并发请求以提高速度
embedder:
provider: openai
model: text-embedding-3-small
api_key: sk-your-api-key-here # 避免提交密钥!
警告: 切勿将 API 密钥提交到版本控制系统。
| 属性 | 值 |
|---|---|
| 维度 | 1536 |
| 价格 | $0.00002 / 1K 令牌 |
| 质量 | 非常高 |
| 速度 | 快 |
最适合: 大多数用例,成本/质量平衡良好。
embedder:
provider: openai
model: text-embedding-3-small
| 属性 | 值 |
|---|---|
| 维度 | 3072 |
| 价格 | $0.00013 / 1K 令牌 |
| 质量 | 最高 |
| 速度 | 快 |
最适合: 追求最高精度,成本不是问题。
embedder:
provider: openai
model: text-embedding-3-large
dimensions: 3072
您可以减少维度以节省存储空间:
embedder:
provider: openai
model: text-embedding-3-large
dimensions: 1024 # 从 3072 降低
| 模型 | 维度 | 成本/1K 令牌 | 质量 |
|---|---|---|---|
text-embedding-3-small | 1536 | $0.00002 | ⭐⭐⭐⭐ |
text-embedding-3-large | 3072 | $0.00013 | ⭐⭐⭐⭐⭐ |
每 1000 个源文件的近似成本:
| 代码库大小 | 块数 | 小模型 | 大模型 |
|---|---|---|---|
| 小型 (100 文件) | ~500 | $0.01 | $0.06 |
| 中型 (1000 文件) | ~5,000 | $0.10 | $0.65 |
| 大型 (10000 文件) | ~50,000 | $1.00 | $6.50 |
注意: 成本是初始索引的一次性费用。更新时仅重新嵌入已更改的文件。
GrepAI v0.24.0+ 支持自适应速率限制和并行请求:
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
parallelism: 8 # 根据您的速率限制层级调整
并行度建议:
GrepAI 会自动对块进行批处理,以实现高效的 API 使用。
OpenAI 根据您的账户层级设有速率限制:
| 层级 | RPM | TPM |
|---|---|---|
| 免费 | 3 | 150,000 |
| 层级 1 | 500 | 1,000,000 |
| 层级 2 | 5,000 | 5,000,000 |
GrepAI 通过自适应退避机制自动处理速率限制。
macOS/Linux:
# 在 ~/.bashrc, ~/.zshrc, 或 ~/.profile 中
export OPENAI_API_KEY="sk-..."
Windows (PowerShell):
$env:OPENAI_API_KEY = "sk-..."
# 或永久设置
[System.Environment]::SetEnvironmentVariable('OPENAI_API_KEY', 'sk-...', 'User')
在项目根目录创建 .env 文件:
OPENAI_API_KEY=sk-...
添加到 .gitignore:
.env
对于 Azure 托管的 OpenAI:
embedder:
provider: openai
model: your-deployment-name
api_key: ${AZURE_OPENAI_API_KEY}
endpoint: https://your-resource.openai.azure.com
.env 文件❌ 问题: 401 Unauthorized
✅ 解决方案: 检查 API 密钥是否正确以及环境变量是否已设置:
echo $OPENAI_API_KEY
❌ 问题: 429 Rate limit exceeded
✅ 解决方案: 降低并行度或升级 OpenAI 层级:
embedder:
parallelism: 2 # 降低值
❌ 问题: 成本过高 ✅ 解决方案:
text-embedding-3-small 替代大模型❌ 问题: 索引速度慢 ✅ 解决方案: 增加并行度:
embedder:
parallelism: 8
❌ 问题: 隐私顾虑 ✅ 解决方案: 改用 Ollama 进行本地嵌入
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
rm .grepai/index.gob
grepai watch
重要提示: 您不能混合使用来自不同模型/提供商的嵌入。
成功的 OpenAI 配置:
✅ OpenAI 嵌入提供程序已配置
提供程序: OpenAI
模型: text-embedding-3-small
维度: 1536
并行度: 4
API 密钥: sk-...xxxx (来自环境变量)
此代码库的预估成本:
- 文件: 245
- 块: ~1,200
- 成本: ~$0.02
注意: 代码将被发送到 OpenAI 服务器。
每周安装数
195
仓库
GitHub 星标数
15
首次出现
2026年1月28日
安全审计
安装于
opencode162
codex154
github-copilot143
gemini-cli142
kimi-cli134
amp132
This skill covers using OpenAI's embedding API with GrepAI for high-quality, cloud-based embeddings.
| Aspect | Details |
|---|---|
| ✅ Quality | State-of-the-art embeddings |
| ✅ Speed | Fast, no local compute needed |
| ✅ Scalability | Handles any codebase size |
| ⚠️ Privacy | Code sent to OpenAI servers |
| ⚠️ Cost | Pay per token |
| ⚠️ Internet | Requires connection |
Get your API key at: https://platform.openai.com/api-keys
# .grepai/config.yaml
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
Set the environment variable:
export OPENAI_API_KEY="sk-..."
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
parallelism: 8 # Concurrent requests for speed
embedder:
provider: openai
model: text-embedding-3-small
api_key: sk-your-api-key-here # Avoid committing secrets!
Warning: Never commit API keys to version control.
| Property | Value |
|---|---|
| Dimensions | 1536 |
| Price | $0.00002 / 1K tokens |
| Quality | Very high |
| Speed | Fast |
Best for: Most use cases, good balance of cost/quality.
embedder:
provider: openai
model: text-embedding-3-small
| Property | Value |
|---|---|
| Dimensions | 3072 |
| Price | $0.00013 / 1K tokens |
| Quality | Highest |
| Speed | Fast |
Best for: Maximum accuracy, cost not a concern.
embedder:
provider: openai
model: text-embedding-3-large
dimensions: 3072
You can reduce dimensions to save storage:
embedder:
provider: openai
model: text-embedding-3-large
dimensions: 1024 # Reduced from 3072
| Model | Dimensions | Cost/1K tokens | Quality |
|---|---|---|---|
text-embedding-3-small | 1536 | $0.00002 | ⭐⭐⭐⭐ |
text-embedding-3-large | 3072 | $0.00013 | ⭐⭐⭐⭐⭐ |
Approximate costs per 1000 source files:
| Codebase Size | Chunks | Small Model | Large Model |
|---|---|---|---|
| Small (100 files) | ~500 | $0.01 | $0.06 |
| Medium (1000 files) | ~5,000 | $0.10 | $0.65 |
| Large (10000 files) | ~50,000 | $1.00 | $6.50 |
Note: Costs are one-time for initial indexing. Updates only re-embed changed files.
GrepAI v0.24.0+ supports adaptive rate limiting and parallel requests:
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
parallelism: 8 # Adjust based on your rate limit tier
Parallelism recommendations:
GrepAI automatically batches chunks for efficient API usage.
OpenAI has rate limits based on your account tier:
| Tier | RPM | TPM |
|---|---|---|
| Free | 3 | 150,000 |
| Tier 1 | 500 | 1,000,000 |
| Tier 2 | 5,000 | 5,000,000 |
GrepAI handles rate limiting automatically with adaptive backoff.
macOS/Linux:
# In ~/.bashrc, ~/.zshrc, or ~/.profile
export OPENAI_API_KEY="sk-..."
Windows (PowerShell):
$env:OPENAI_API_KEY = "sk-..."
# Or permanently
[System.Environment]::SetEnvironmentVariable('OPENAI_API_KEY', 'sk-...', 'User')
Create .env in your project root:
OPENAI_API_KEY=sk-...
Add to .gitignore:
.env
For Azure-hosted OpenAI:
embedder:
provider: openai
model: your-deployment-name
api_key: ${AZURE_OPENAI_API_KEY}
endpoint: https://your-resource.openai.azure.com
.env files❌ Problem: 401 Unauthorized ✅ Solution: Check API key is correct and environment variable is set:
echo $OPENAI_API_KEY
❌ Problem: 429 Rate limit exceeded ✅ Solution: Reduce parallelism or upgrade OpenAI tier:
embedder:
parallelism: 2 # Lower value
❌ Problem: High costs ✅ Solutions:
text-embedding-3-small instead of large❌ Problem: Slow indexing ✅ Solution: Increase parallelism:
embedder:
parallelism: 8
❌ Problem: Privacy concerns ✅ Solution: Use Ollama for local embeddings instead
embedder:
provider: openai
model: text-embedding-3-small
api_key: ${OPENAI_API_KEY}
2. Delete existing index:
rm .grepai/index.gob
3. Re-index:
grepai watch
Important: You cannot mix embeddings from different models/providers.
Successful OpenAI configuration:
✅ OpenAI Embedding Provider Configured
Provider: OpenAI
Model: text-embedding-3-small
Dimensions: 1536
Parallelism: 4
API Key: sk-...xxxx (from environment)
Estimated cost for this codebase:
- Files: 245
- Chunks: ~1,200
- Cost: ~$0.02
Note: Code will be sent to OpenAI servers.
Weekly Installs
195
Repository
GitHub Stars
15
First Seen
Jan 28, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
opencode162
codex154
github-copilot143
gemini-cli142
kimi-cli134
amp132
React 组合模式指南:Vercel 组件架构最佳实践,提升代码可维护性
116,600 周安装
blu CLI 命令行工具:控制 Bluesound/NAD 播放器,实现音频设备自动化管理
2 周安装
Claude代码插件MCP集成指南:连接外部服务与API的完整教程
3 周安装
Sheetsmith - 轻量级 CSV/Excel 数据处理工具,pandas 封装,支持预览、筛选、转换
3 周安装
Trello API 集成指南:在 Moltbot 中管理看板、列表和卡片的完整教程
3 周安装
Things 3 命令行工具 - 在终端管理 macOS 待办事项,支持读写 Things 数据库
3 周安装
skill-creator 技能创建指南 - 高效构建AI技能模块与工具集成
3 周安装