Cloudflare Vectorize 完整指南：全球分布式向量数据库，实现语义搜索与RAG应用

cloudflare-vectorize by jezweb/claude-skills

326 周安装量

652 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/jezweb/claude-skills --skill cloudflare-vectorize

AI/机器学习开发云服务

🇨🇳中文介绍

Cloudflare Vectorize

Cloudflare Vectorize 的完整实现指南 - 这是一个全球分布式向量数据库，用于在 Cloudflare Workers 上构建语义搜索、RAG（检索增强生成）和 AI 驱动的应用程序。

状态：生产就绪 ✅ 最后更新：2026-01-21 依赖项：cloudflare-worker-base（用于 Worker 设置），cloudflare-workers-ai（用于嵌入）最新版本：wrangler@4.59.3，@cloudflare/workers-types@4.20260109.0 节省 Token：~70% 预防错误：14 节省开发时间：~4 小时

此技能提供的内容

核心能力

✅ 索引管理：创建、配置和管理向量索引
✅ 向量操作：插入、更新插入、查询、删除和列出向量（list-vectors 于 2025 年 8 月添加）
✅ 元数据过滤：每个索引最多支持 10 个元数据索引的高级过滤
✅ 语义搜索：使用余弦、欧几里得或点积度量查找相似向量
✅ RAG 模式：完整的检索增强生成工作流
✅ Workers AI 集成：使用 @cf/baai/bge-base-en-v1.5 进行原生嵌入生成
✅ OpenAI 集成：支持 text-embedding-3-small/large 模型
✅ 文档处理：文本分块和批量摄取管道
✅ 测试设置：包含 Vectorize 绑定的 Vitest 配置

包含的模板

basic-search.ts - 使用 Workers AI 的简单向量搜索
rag-chat.ts - 带有上下文检索的完整 RAG 聊天机器人
document-ingestion.ts - 文档分块和嵌入管道

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

⚠️ Vectorize V2 重大变更（2024 年 9 月）

重要提示：Vectorize V2 于 2024 年 9 月正式发布，带来了重大的破坏性变更。

索引容量：每个索引 200,000 → 5 百万个向量
查询延迟：中位数 549ms → 31ms（快 18 倍）
TopK 限制：每次查询 20 → 100 个结果
规模限制：每个账户 100 → 50,000 个索引
命名空间限制：每个索引 100 → 50,000 个命名空间

破坏性的 API 变更：

异步变更 - 所有变更操作现在都是异步的：

// V2: 返回 mutationId
const result = await env.VECTORIZE_INDEX.insert(vectors);
console.log(result.mutationId); // "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"

// 向量插入/删除可能需要几秒钟才能反映出来

returnMetadata 参数 - 布尔值 → 字符串枚举：

// ❌ V1（已弃用）
{ returnMetadata: true }

// ✅ V2（必需）
{ returnMetadata: 'all' | 'indexed' | 'none' }

插入前需要元数据索引：
- V2 要求在插入向量之前创建元数据索引
- 在元数据索引创建之前添加的向量将不会被索引
- 创建元数据索引后必须重新更新插入向量

V1 弃用时间线：

2024 年 12 月：无法再创建 V1 索引
现有 V1 索引：继续工作（其他操作不受影响）
迁移：对 V1 操作使用 wrangler vectorize --deprecated-v1 标志

所需的 Wrangler 版本：

最低版本：wrangler@3.71.0 用于 V2 命令
推荐版本：wrangler@4.54.0+（最新）

// 获取索引信息以检查最后处理的变更
const info = await env.VECTORIZE_INDEX.describe();
console.log(info.mutationId); // 最后变更 ID
console.log(info.processedUpToMutation); // 最后处理的时间戳

⚠️ 插入向量前必须执行的操作

# 1. 使用固定的维度和度量创建索引
npx wrangler vectorize create my-index \
  --dimensions=768 \
  --metric=cosine

# 2. 立即创建元数据索引（在插入向量之前！）
npx wrangler vectorize create-metadata-index my-index \
  --property-name=category \
  --type=string

npx wrangler vectorize create-metadata-index my-index \
  --property-name=timestamp \
  --type=number

原因：元数据索引必须在向量插入之前存在。在元数据索引创建之前添加的向量将无法在该属性上进行过滤。

索引配置（之后无法更改）

# 维度必须与您的嵌入模型输出匹配：
# - Workers AI @cf/baai/bge-base-en-v1.5: 768 维度
# - OpenAI text-embedding-3-small: 1536 维度
# - OpenAI text-embedding-3-large: 3072 维度

# 度量决定相似度计算：
# - cosine: 最适合归一化嵌入（最常见）
# - euclidean: 向量之间的绝对距离
# - dot-product: 用于非归一化向量

wrangler.jsonc：

{
  "name": "my-vectorize-worker",
  "main": "src/index.ts",
  "compatibility_date": "2025-10-21",
  "vectorize": [
    {
      "binding": "VECTORIZE_INDEX",
      "index_name": "my-index"
    }
  ],
  "ai": {
    "binding": "AI"
  }
}

export interface Env {
  VECTORIZE_INDEX: VectorizeIndex;
  AI: Ai;
}

interface VectorizeVector {
  id: string;
  values: number[] | Float32Array | Float64Array;
  namespace?: string;
  metadata?: Record<string, string | number | boolean | string[]>;
}

interface VectorizeMatches {
  matches: Array<{
    id: string;
    score: number;
    values?: number[];
    metadata?: Record<string, any>;
    namespace?: string;
  }>;
  count: number;
}

元数据过滤运算符（V2）

Vectorize V2 支持带有范围查询的高级元数据过滤：

// 相等（隐式 $eq）
{ category: "docs" }

// 不等于
{ status: { $ne: "archived" } }

// 在数组中/不在数组中
{ category: { $in: ["docs", "tutorials"] } }
{ category: { $nin: ["deprecated", "draft"] } }

// 范围查询（数字）- V2 新增
{ timestamp: { $gte: 1704067200, $lt: 1735689600 } }

// 范围查询（字符串）- 前缀搜索
{ url: { $gte: "/docs/workers", $lt: "/docs/workersz" } }

// 使用点表示法的嵌套元数据
{ "author.id": "user123" }

// 多个条件（隐式 AND）
{ category: "docs", language: "en", "metadata.published": true }

元数据最佳实践

低基数（适合 $eq 过滤器）：

// 少量唯一值 - 高效过滤
metadata: {
  category: "docs",        // ~10 个类别
  language: "en",          // ~5 种语言
  published: true          // 2 个值（布尔值）
}

高基数（避免在范围查询中使用）：

// 许多唯一值 - 避免大范围扫描
metadata: {
  user_id: "uuid-v4...",         // 数百万个唯一值
  timestamp_ms: 1704067200123    // 改用秒
}

每个 Vectorize 索引最多 10 个元数据索引
每个向量最多 10 KiB 元数据
字符串索引：前 64 字节（UTF-8）
数字索引：Float64 精度
过滤器大小：最大 2048 字节（紧凑 JSON）

3. 向量维度限制

当前限制：每个向量 1536 个维度来源：GitHub Issue #8729

支持的嵌入模型：

Workers AI @cf/baai/bge-base-en-v1.5：768 维度 ✅
OpenAI text-embedding-3-small：1536 维度 ✅
OpenAI text-embedding-3-large：3072 维度 ❌（需要降维）

不支持的模型（>1536 维度）：

nomic-embed-code：3584 维度
Qodo-Embed-1-7B：>1536 维度

解决方法：使用降维技术（例如 PCA）将嵌入压缩到 1536 或更少的维度，但这可能会降低语义质量。

功能请求：更高维度的支持正在考虑中。如果这阻碍了您的用例，请使用限制增加请求表。

// ❌ 无效的元数据键
metadata: {
  "": "value",              // 空键
  "user.name": "John",      // 包含点（保留用于嵌套）
  "$admin": true,           // 以 $ 开头
  "key\"with\"quotes": 1    // 包含引号
}

// ✅ 有效的元数据键
metadata: {
  "user_name": "John",
  "isAdmin": true,
  "nested": { "allowed": true }  // 在过滤器中以 "nested.allowed" 访问
}

关键：使用 5000 个向量的批次大小以获得最佳性能。

单独插入：36+ 小时内 250 万个向量（未完成）
批量插入（5000）：约 12 小时内 400 万个向量
使用适当的批处理快 18 倍

为什么是 5000？

Vectorize 的内部预写日志（WAL）针对此大小进行了优化
避免 Cloudflare API 速率限制
平衡吞吐量和内存使用

const BATCH_SIZE = 5000;

async function insertVectors(vectors: VectorizeVector[]) {
  for (let i = 0; i < vectors.length; i += BATCH_SIZE) {
    const batch = vectors.slice(i, i + BATCH_SIZE);
    const result = await env.VECTORIZE.insert(batch);
    console.log(`Inserted batch ${i / BATCH_SIZE + 1}, mutationId: ${result.mutationId}`);

    // 可选：速率限制延迟
    if (i + BATCH_SIZE < vectors.length) {
      await new Promise(resolve => setTimeout(resolve, 100));
    }
  }
}

Vectorize 默认使用近似最近邻（ANN）搜索，与精确搜索相比，精度约为 80%。

默认模式：近似评分（约 80% 精度）

延迟更低
适合 RAG、搜索、推荐
topK 最多 100

高精度模式：接近 100% 精度

通过 returnValues: true 启用
延迟更高
限制为 topK=20

// 快速，约 80% 精度，topK 最多 100
const results = await env.VECTORIZE.query(embedding, {
  topK: 50,
  returnValues: false  // 默认
});

// 较慢，约 100% 精度，topK 最多 20
const preciseResults = await env.VECTORIZE.query(embedding, {
  topK: 10,
  returnValues: true   // 高精度评分
});

何时使用高精度：

关键应用（欺诈检测、法律合规）
小结果集（topK < 20）
精度比延迟更重要

常见错误及解决方案

错误 1：在向量插入后创建元数据索引

问题：对现有向量的过滤不起作用
解决方案：删除并重新插入向量 或 在插入之前创建元数据索引

错误 2：维度不匹配

问题："向量维度与索引配置不匹配"
解决方案：确保嵌入模型输出与索引维度匹配：
  - Workers AI bge-base: 768
  - OpenAI small: 1536
  - OpenAI large: 3072

错误 3：无效的元数据键

问题："无效的元数据键"
解决方案：键不能：
  - 为空
  - 包含 .（点）
  - 包含 "（引号）
  - 以 $（美元符号）开头

错误 4：过滤器过大

问题："过滤器超过 2048 字节"
解决方案：简化过滤器或拆分为多个查询

错误 5：对高基数进行范围查询

问题：查询缓慢或精度降低
解决方案：对范围查询使用低基数字段，或对时间戳使用秒而不是毫秒

错误 6：插入与更新插入混淆

问题：更新未反映在索引中
解决方案：使用 upsert() 覆盖现有向量，而不是 insert()

错误 7：缺少绑定

问题："VECTORIZE_INDEX 未定义"
解决方案：将 [[vectorize]] 绑定添加到 wrangler.jsonc

错误 8：命名空间与元数据混淆

问题：不清楚何时使用命名空间与元数据过滤
解决方案：
  - 命名空间：分区键，在元数据过滤器之前应用
  - 元数据：命名空间内灵活的键值过滤

错误 9：V2 异步变更时序（V2 新增）

问题：插入的向量不能立即查询
解决方案：V2 变更是异步的 - 向量可能需要几秒钟才能反映出来
  - 使用 mutationId 跟踪变更状态
  - 检查 env.VECTORIZE_INDEX.describe() 中的 processedUpToMutation 时间戳

错误 10：V1 returnMetadata 布尔值（V2 破坏性变更）

问题："returnMetadata 必须是 'all'、'indexed' 或 'none'"
解决方案：V2 将 returnMetadata 从布尔值更改为字符串枚举：
  - ❌ V1: { returnMetadata: true }
  - ✅ V2: { returnMetadata: 'all' }

错误 11：Wrangler --json 输出包含日志前缀

错误：wrangler vectorize list --json 输出以日志消息开头，破坏了 JSON 解析来源：GitHub Issue #11011

受影响的命令：

wrangler vectorize list --json
wrangler vectorize list-metadata-index --json

$ wrangler vectorize list --json
📋 Listing Vectorize indexes...
[
  { "created_on": "2025-10-18T13:28:30.259277Z", ... }
]

日志消息使输出成为无效 JSON，破坏了通过管道传输到 jq 或其他工具。

解决方案：在解析前删除第一行：

# 使用 tail
wrangler vectorize list --json | tail -n +2 | jq '.'

# 使用 sed
wrangler vectorize list --json | sed '1d' | jq '.'

错误 12：TypeScript 类型缺少过滤运算符

错误：wrangler types 生成不完整的 VectorizeVectorMetadataFilterOp 类型来源：GitHub Issue #10092 状态：OPEN（内部跟踪为 VS-461）

问题：生成的类型仅包含 $eq 和 $ne，缺少 V2 运算符：$in、$nin、$lt、$lte、$gt、$gte

影响：当使用有效的 V2 元数据过滤运算符时，TypeScript 显示错误：

const vectorizeRes = env.VECTORIZE.queryById(imgId, {
  filter: { gender: { $in: genderFilters } }, // ❌ TS 错误但有效！
  topK,
  returnMetadata: 'indexed',
});

解决方法：在 wrangler types 修复之前手动覆盖类型：

// 添加到您的类型文件中
type VectorizeMetadataFilter = Record<string,
  | string
  | number
  | boolean
  | {
      $eq?: string | number | boolean;
      $ne?: string | number | boolean;
      $in?: (string | number | boolean)[];
      $nin?: (string | number | boolean)[];
      $lt?: number | string;
      $lte?: number | string;
      $gt?: number | string;
      $gte?: number | string;
    }
>;

错误 13：Windows 开发注册表失败（已修复）

错误：在 Windows 上运行 wrangler dev 时出现 ENOENT: no such file or directory 来源：GitHub Issue #10383 状态：在 wrangler@4.32.0 中修复

问题：Wrangler 尝试创建名称中包含冒号的外部 worker 文件（在 Windows 上无效）：

Error: ENOENT: ... '__WRANGLER_EXTERNAL_VECTORIZE_WORKER:<project>:<binding>'

解决方案：更新到 wrangler@4.32.0 或更高版本：

npm install -g wrangler@latest

错误 14：topK 限制取决于 returnValues/returnMetadata

错误：topK 超过允许的最大值 来源：Vectorize 限制

问题：最大 topK 值根据查询选项而变化：

配置	最大 topK
`returnValues: false`, `returnMetadata: 'none'`	100
`returnValues: true` 或 `returnMetadata: 'all'`	20
`returnMetadata: 'indexed'`	100

// ❌ 错误 - 使用 returnValues 时 topK 过高
query(embedding, {
  topK: 100,            // 超过限制！
  returnValues: true    // 当为 true 时，最大 topK=20
});

// ✅ 正确 - 遵守条件限制
query(embedding, {
  topK: 20,
  returnValues: true
});

// ✅ 正确 - 没有返回值时更高的 topK
query(embedding, {
  topK: 100,
  returnValues: false,
  returnMetadata: 'indexed'
});

如果从 V1 迁移到 V2：

✅ 更新 wrangler 到 3.71.0+ (npm install -g wrangler@latest)
✅ 创建新的 V2 索引（无法升级 V1 → V2）
✅ 在插入向量之前创建元数据索引
✅ 更新 returnMetadata 布尔值 → 字符串枚举（'all'、'indexed'、'none'）
✅ 处理异步变更（响应中期望 mutationId）
✅ 使用 V2 限制进行测试（topK 最多 100，每个索引 500 万个向量）
✅ 更新异步行为的错误处理

2024 年 12 月之后：无法创建新的 V1 索引
现有 V1 索引：继续工作
对 V1 操作使用 wrangler vectorize --deprecated-v1

使用 Vectorize 绑定的 Vitest

问题：将 @cloudflare/vitest-pool-workers 与 Vectorize 或 Workers AI 绑定一起使用会导致运行时失败。来源：GitHub Issue #7434

错误：wrapped binding module can't be resolved

创建没有 Vectorize/AI 绑定的 wrangler-test.jsonc
将 vitest 配置指向测试专用的 wrangler 文件
在测试中模拟绑定

// wrangler-test.jsonc（无 Vectorize 绑定）
{
  "name": "my-worker-test",
  "main": "src/index.ts",
  "compatibility_date": "2025-10-21"
  // 无 vectorize 绑定
}

// vitest.config.ts
import { defineWorkersProject } from '@cloudflare/vitest-pool-workers/config';

export default defineWorkersProject({
  test: {
    poolOptions: {
      workers: {
        wrangler: {
          configPath: "./wrangler-test.jsonc"
        }
      }
    }
  }
});

// 在测试中模拟
import { vi } from 'vitest';

const mockVectorize = {
  query: vi.fn().mockResolvedValue({
    matches: [
      { id: 'test-1', score: 0.95, metadata: { category: 'docs' } }
    ],
    count: 1
  }),
  insert: vi.fn().mockResolvedValue({ mutationId: "test-mutation-id" }),
  upsert: vi.fn().mockResolvedValue({ mutationId: "test-mutation-id" })
};

// 在测试中使用模拟
test('vector search', async () => {
  const env = { VECTORIZE_INDEX: mockVectorize };
  // ... 测试逻辑
});

注意：这些提示来自社区讨论和官方博客文章。请根据您的 Vectorize 版本进行验证。

提示 1：大规模范围查询可能精度降低（社区来源）

来源：查询最佳实践 置信度：中等 适用于：约 1000 万+ 向量的数据集

对大型数据集进行范围查询（$lt、$lte、$gt、$gte）可能会遇到精度降低的问题。

// ❌ 大规模高基数范围
metadata: {
  timestamp_ms: 1704067200123
}
filter: { timestamp_ms: { $gte: 1704067200000 } }

// ✅ 分桶为离散值
metadata: {
  timestamp_bucket: "2025-01-01-00:00",  // 1 小时桶
  timestamp_ms: 1704067200123  // 原始值（未索引）
}
filter: {
  timestamp_bucket: {
    $in: ["2025-01-01-00:00", "2025-01-01-01:00"]
  }
}

基于时间的过滤，跨越数月/年
用户 ID、交易 ID（UUID 范围）
任何高基数的连续数据

替代方案：使用分桶值的相等过滤器（$eq、$in）。

提示 2：列出向量操作（2025 年 8 月添加）

Vectorize V2 添加了对 list-vectors 操作的支持，用于通过向量 ID 进行分页迭代。

审计向量集合
批量向量操作
调试索引内容

const result = await env.VECTORIZE_INDEX.list({
  limit: 1000,  // 每页最多 1000 个
  cursor?: string
});

// result.vectors: Array<{ id: string }>
// result.cursor: string | undefined
// result.count: number

// 分页示例
let cursor: string | undefined;
const allVectorIds: string[] = [];

do {
  const result = await env.VECTORIZE_INDEX.list({
    limit: 1000,
    cursor
  });
  allVectorIds.push(...result.vectors.map(v => v.id));
  cursor = result.cursor;
} while (cursor);

仅返回 ID（不包括值或元数据）
每页最多 1000 个向量
使用游标进行分页

状态：生产就绪 ✅（Vectorize V2 正式发布 - 2024 年 9 月） 最后更新：2026-01-21 节省 Token：~70% 预防错误：14（包括 V2 破坏性变更、测试设置、TypeScript 类型）变更：添加了 4 个新错误（wrangler --json、TypeScript 类型、Windows 开发、topK 限制）、批量性能最佳实践、查询精度模式、测试设置、关于范围查询和列出向量操作的社区提示。

2026 年 1 月 20 日

🇺🇸English

Cloudflare Vectorize

Complete implementation guide for Cloudflare Vectorize - a globally distributed vector database for building semantic search, RAG (Retrieval Augmented Generation), and AI-powered applications with Cloudflare Workers.

Status : Production Ready ✅ Last Updated : 2026-01-21 Dependencies : cloudflare-worker-base (for Worker setup), cloudflare-workers-ai (for embeddings) Latest Versions : wrangler@4.59.3, @cloudflare/workers-types@4.20260109.0 Token Savings : ~70% Errors Prevented : 14 Dev Time Saved : ~4 hours

What This Skill Provides

Core Capabilities

✅ Index Management : Create, configure, and manage vector indexes
✅ Vector Operations : Insert, upsert, query, delete, and list vectors (list-vectors added August 2025)
✅ Metadata Filtering : Advanced filtering with 10 metadata indexes per index
✅ Semantic Search : Find similar vectors using cosine, euclidean, or dot-product metrics
✅ RAG Patterns : Complete retrieval-augmented generation workflows
✅ Workers AI Integration : Native embedding generation with @cf/baai/bge-base-en-v1.5
✅ OpenAI Integration : Support for text-embedding-3-small/large models
✅ Document Processing : Text chunking and batch ingestion pipelines
✅ Testing Setup : Vitest configuration with Vectorize bindings

Templates Included

basic-search.ts - Simple vector search with Workers AI
rag-chat.ts - Full RAG chatbot with context retrieval
document-ingestion.ts - Document chunking and embedding pipeline
metadata-filtering.ts - Advanced filtering patterns

⚠️ Vectorize V2 Breaking Changes (September 2024)

IMPORTANT : Vectorize V2 became GA in September 2024 with significant breaking changes.

What Changed in V2

Performance Improvements :

Index capacity : 200,000 → 5 million vectors per index
Query latency : 549ms → 31ms median (18× faster)
TopK limit : 20 → 100 results per query
Scale limits : 100 → 50,000 indexes per account
Namespace limits : 100 → 50,000 namespaces per index

Breaking API Changes :

Async Mutations - All mutations now asynchronous:

// V2: Returns mutationId
const result = await env.VECTORIZE_INDEX.insert(vectors);
console.log(result.mutationId); // "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"

// Vector inserts/deletes may take a few seconds to be reflected

returnMetadata Parameter - Boolean → String enum:

// ❌ V1 (deprecated)
{ returnMetadata: true }

// ✅ V2 (required)
{ returnMetadata: 'all' | 'indexed' | 'none' }

Metadata Indexes Required Before Insert :
- V2 requires metadata indexes created BEFORE vectors inserted
- Vectors added before metadata index won't be indexed
- Must re-upsert vectors after creating metadata index

V1 Deprecation Timeline :

December 2024 : Can no longer create V1 indexes
Existing V1 indexes : Continue to work (other operations unaffected)
Migration : Use wrangler vectorize --deprecated-v1 flag for V1 operations

Wrangler Version Required :

Minimum : wrangler@3.71.0 for V2 commands
Recommended : wrangler@4.54.0+ (latest)

Check Mutation Status

// Get index info to check last mutation processed
const info = await env.VECTORIZE_INDEX.describe();
console.log(info.mutationId); // Last mutation ID
console.log(info.processedUpToMutation); // Last processed timestamp

Critical Setup Rules

⚠️ MUST DO BEFORE INSERTING VECTORS

# 1. Create the index with FIXED dimensions and metric
npx wrangler vectorize create my-index \
  --dimensions=768 \
  --metric=cosine

# 2. Create metadata indexes IMMEDIATELY (before inserting vectors!)
npx wrangler vectorize create-metadata-index my-index \
  --property-name=category \
  --type=string

npx wrangler vectorize create-metadata-index my-index \
  --property-name=timestamp \
  --type=number

Why : Metadata indexes MUST exist before vectors are inserted. Vectors added before a metadata index was created won't be filterable on that property.

Index Configuration (Cannot Be Changed Later)

# Dimensions MUST match your embedding model output:
# - Workers AI @cf/baai/bge-base-en-v1.5: 768 dimensions
# - OpenAI text-embedding-3-small: 1536 dimensions
# - OpenAI text-embedding-3-large: 3072 dimensions

# Metrics determine similarity calculation:
# - cosine: Best for normalized embeddings (most common)
# - euclidean: Absolute distance between vectors
# - dot-product: For non-normalized vectors

Wrangler Configuration

wrangler.jsonc :

{
  "name": "my-vectorize-worker",
  "main": "src/index.ts",
  "compatibility_date": "2025-10-21",
  "vectorize": [
    {
      "binding": "VECTORIZE_INDEX",
      "index_name": "my-index"
    }
  ],
  "ai": {
    "binding": "AI"
  }
}

TypeScript Types

export interface Env {
  VECTORIZE_INDEX: VectorizeIndex;
  AI: Ai;
}

interface VectorizeVector {
  id: string;
  values: number[] | Float32Array | Float64Array;
  namespace?: string;
  metadata?: Record<string, string | number | boolean | string[]>;
}

interface VectorizeMatches {
  matches: Array<{
    id: string;
    score: number;
    values?: number[];
    metadata?: Record<string, any>;
    namespace?: string;
  }>;
  count: number;
}

Metadata Filter Operators (V2)

Vectorize V2 supports advanced metadata filtering with range queries:

// Equality (implicit $eq)
{ category: "docs" }

// Not equals
{ status: { $ne: "archived" } }

// In/Not in arrays
{ category: { $in: ["docs", "tutorials"] } }
{ category: { $nin: ["deprecated", "draft"] } }

// Range queries (numbers) - NEW in V2
{ timestamp: { $gte: 1704067200, $lt: 1735689600 } }

// Range queries (strings) - prefix searching
{ url: { $gte: "/docs/workers", $lt: "/docs/workersz" } }

// Nested metadata with dot notation
{ "author.id": "user123" }

// Multiple conditions (implicit AND)
{ category: "docs", language: "en", "metadata.published": true }

Metadata Best Practices

1. Cardinality Considerations

Low Cardinality (Good for $eq filters) :

// Few unique values - efficient filtering
metadata: {
  category: "docs",        // ~10 categories
  language: "en",          // ~5 languages
  published: true          // 2 values (boolean)
}

High Cardinality (Avoid in range queries) :

// Many unique values - avoid large range scans
metadata: {
  user_id: "uuid-v4...",         // Millions of unique values
  timestamp_ms: 1704067200123    // Use seconds instead
}

2. Metadata Limits

Max 10 metadata indexes per Vectorize index
Max 10 KiB metadata per vector
String indexes : First 64 bytes (UTF-8)
Number indexes : Float64 precision
Filter size : Max 2048 bytes (compact JSON)

3. Vector Dimension Limit

Current Limit : 1536 dimensions per vector Source : GitHub Issue #8729

Supported Embedding Models :

Workers AI @cf/baai/bge-base-en-v1.5: 768 dimensions ✅
OpenAI text-embedding-3-small: 1536 dimensions ✅
OpenAI text-embedding-3-large: 3072 dimensions ❌ (requires dimension reduction)

Unsupported Models (>1536 dimensions):

nomic-embed-code: 3584 dimensions
Qodo-Embed-1-7B: >1536 dimensions

Workaround : Use dimensionality reduction (e.g., PCA) to compress embeddings to 1536 or fewer dimensions, though this may reduce semantic quality.

Feature Request : Higher dimension support is under consideration. Use Limit Increase Request Form if this blocks your use case.

4. Key Restrictions

// ❌ INVALID metadata keys
metadata: {
  "": "value",              // Empty key
  "user.name": "John",      // Contains dot (reserved for nesting)
  "$admin": true,           // Starts with $
  "key\"with\"quotes": 1    // Contains quotes
}

// ✅ VALID metadata keys
metadata: {
  "user_name": "John",
  "isAdmin": true,
  "nested": { "allowed": true }  // Access as "nested.allowed" in filters
}

Best Practices

Batch Insert Performance

Critical : Use batch size of 5000 vectors for optimal performance.

Performance Data :

Individual inserts : 2.5M vectors in 36+ hours (incomplete)
Batch inserts (5000) : 4M vectors in ~12 hours
18× faster with proper batching

Why 5000?

Vectorize's internal Write-Ahead Log (WAL) optimized for this size
Avoids Cloudflare API rate limits
Balances throughput and memory usage

Optimal Pattern :

const BATCH_SIZE = 5000;

async function insertVectors(vectors: VectorizeVector[]) {
  for (let i = 0; i < vectors.length; i += BATCH_SIZE) {
    const batch = vectors.slice(i, i + BATCH_SIZE);
    const result = await env.VECTORIZE.insert(batch);
    console.log(`Inserted batch ${i / BATCH_SIZE + 1}, mutationId: ${result.mutationId}`);

    // Optional: Rate limiting delay
    if (i + BATCH_SIZE < vectors.length) {
      await new Promise(resolve => setTimeout(resolve, 100));
    }
  }
}

Sources :

Query Accuracy Modes

Vectorize uses approximate nearest neighbor (ANN) search by default with ~80% accuracy compared to exact search.

Default Mode : Approximate scoring (~80% accuracy)

Faster latency
Good for RAG, search, recommendations
topK up to 100

High-Precision Mode : Near 100% accuracy

Enabled via returnValues: true
Higher latency
Limited to topK=20

Trade-off Example :

// Fast, ~80% accuracy, topK up to 100
const results = await env.VECTORIZE.query(embedding, {
  topK: 50,
  returnValues: false  // Default
});

// Slower, ~100% accuracy, topK max 20
const preciseResults = await env.VECTORIZE.query(embedding, {
  topK: 10,
  returnValues: true   // High-precision scoring
});

When to Use High-Precision :

Critical applications (fraud detection, legal compliance)
Small result sets (topK < 20)
Accuracy is higher priority than latency

Source : Cloudflare Blog - Building Vectorize

Common Errors & Solutions

Error 1: Metadata Index Created After Vectors Inserted

Problem: Filtering doesn't work on existing vectors
Solution: Delete and re-insert vectors OR create metadata indexes BEFORE inserting

Error 2: Dimension Mismatch

Problem: "Vector dimensions do not match index configuration"
Solution: Ensure embedding model output matches index dimensions:
  - Workers AI bge-base: 768
  - OpenAI small: 1536
  - OpenAI large: 3072

Error 3: Invalid Metadata Keys

Problem: "Invalid metadata key"
Solution: Keys cannot:
  - Be empty
  - Contain . (dot)
  - Contain " (quote)
  - Start with $ (dollar sign)

Error 4: Filter Too Large

Problem: "Filter exceeds 2048 bytes"
Solution: Simplify filter or split into multiple queries

Error 5: Range Query on High Cardinality

Problem: Slow queries or reduced accuracy
Solution: Use lower cardinality fields for range queries, or use seconds instead of milliseconds for timestamps

Error 6: Insert vs Upsert Confusion

Problem: Updates not reflecting in index
Solution: Use upsert() to overwrite existing vectors, not insert()

Error 7: Missing Bindings

Problem: "VECTORIZE_INDEX is not defined"
Solution: Add [[vectorize]] binding to wrangler.jsonc

Error 8: Namespace vs Metadata Confusion

Problem: Unclear when to use namespace vs metadata filtering
Solution:
  - Namespace: Partition key, applied BEFORE metadata filters
  - Metadata: Flexible key-value filtering within namespace

Error 9: V2 Async Mutation Timing (NEW in V2)

Problem: Inserted vectors not immediately queryable
Solution: V2 mutations are asynchronous - vectors may take a few seconds to be reflected
  - Use mutationId to track mutation status
  - Check env.VECTORIZE_INDEX.describe() for processedUpToMutation timestamp

Error 10: V1 returnMetadata Boolean (BREAKING in V2)

Problem: "returnMetadata must be 'all', 'indexed', or 'none'"
Solution: V2 changed returnMetadata from boolean to string enum:
  - ❌ V1: { returnMetadata: true }
  - ✅ V2: { returnMetadata: 'all' }

Error 11: Wrangler --json Output Contains Log Prefix

Error : wrangler vectorize list --json output starts with log message, breaking JSON parsing Source : GitHub Issue #11011

Affected Commands :

wrangler vectorize list --json
wrangler vectorize list-metadata-index --json

Problem :

$ wrangler vectorize list --json
📋 Listing Vectorize indexes...
[
  { "created_on": "2025-10-18T13:28:30.259277Z", ... }
]

The log message makes output invalid JSON, breaking piping to jq or other tools.

Solution : Strip first line before parsing:

# Using tail
wrangler vectorize list --json | tail -n +2 | jq '.'

# Using sed
wrangler vectorize list --json | sed '1d' | jq '.'

Error 12: TypeScript Types Missing Filter Operators

Error : wrangler types generates incomplete VectorizeVectorMetadataFilterOp type Source : GitHub Issue #10092 Status : OPEN (tracked internally as VS-461)

Problem : Generated type only includes $eq and $ne, missing V2 operators: $in, $nin, $lt, $lte, $gt, $gte

Impact : TypeScript shows false errors when using valid V2 metadata filter operators:

const vectorizeRes = env.VECTORIZE.queryById(imgId, {
  filter: { gender: { $in: genderFilters } }, // ❌ TS error but works!
  topK,
  returnMetadata: 'indexed',
});

Workaround : Manual type override until wrangler types is fixed:

// Add to your types file
type VectorizeMetadataFilter = Record<string,
  | string
  | number
  | boolean
  | {
      $eq?: string | number | boolean;
      $ne?: string | number | boolean;
      $in?: (string | number | boolean)[];
      $nin?: (string | number | boolean)[];
      $lt?: number | string;
      $lte?: number | string;
      $gt?: number | string;
      $gte?: number | string;
    }
>;

Error 13: Windows Dev Registry Failure (FIXED)

Error : ENOENT: no such file or directory when running wrangler dev on Windows Source : GitHub Issue #10383 Status : FIXED in wrangler@4.32.0

Problem : Wrangler attempted to create external worker files with colons in the name (invalid on Windows):

Error: ENOENT: ... '__WRANGLER_EXTERNAL_VECTORIZE_WORKER:<project>:<binding>'

Solution : Update to wrangler@4.32.0 or later:

npm install -g wrangler@latest

Error 14: topK Limit Depends on returnValues/returnMetadata

Error : topK exceeds maximum allowed value Source : Vectorize Limits

Problem : Maximum topK value changes based on query options:

Configuration	Max topK
`returnValues: false`, `returnMetadata: 'none'`	100
`returnValues: true` OR `returnMetadata: 'all'`	20
`returnMetadata: 'indexed'`	100

Common Error :

// ❌ ERROR - topK too high with returnValues
query(embedding, {
  topK: 100,            // Exceeds limit!
  returnValues: true    // Max topK=20 when true
});

Solution :

// ✅ OK - respects conditional limit
query(embedding, {
  topK: 20,
  returnValues: true
});

// ✅ OK - higher topK without values
query(embedding, {
  topK: 100,
  returnValues: false,
  returnMetadata: 'indexed'
});

V2 Migration Checklist

If migrating from V1 to V2 :

✅ Update wrangler to 3.71.0+ (npm install -g wrangler@latest)
✅ Create new V2 index (can't upgrade V1 → V2)
✅ Create metadata indexes BEFORE inserting vectors
✅ Update returnMetadata boolean → string enum ('all', 'indexed', 'none')
✅ Handle async mutations (expect mutationId in responses)
✅ Test with V2 limits (topK up to 100, 5M vectors per index)
✅ Update error handling for async behavior

V1 Deprecation :

After December 2024: Cannot create new V1 indexes
Existing V1 indexes: Continue to work
Use wrangler vectorize --deprecated-v1 for V1 operations

Testing Considerations

Vitest with Vectorize Bindings

Issue : Using @cloudflare/vitest-pool-workers with Vectorize or Workers AI bindings causes runtime failure. Source : GitHub Issue #7434

Error : wrapped binding module can't be resolved

Workaround :

Create wrangler-test.jsonc without Vectorize/AI bindings
Point vitest config to test-specific wrangler file
Mock bindings in your tests

Example :

// wrangler-test.jsonc (no Vectorize binding)
{
  "name": "my-worker-test",
  "main": "src/index.ts",
  "compatibility_date": "2025-10-21"
  // No vectorize binding
}

// vitest.config.ts
import { defineWorkersProject } from '@cloudflare/vitest-pool-workers/config';

export default defineWorkersProject({
  test: {
    poolOptions: {
      workers: {
        wrangler: {
          configPath: "./wrangler-test.jsonc"
        }
      }
    }
  }
});

// Mock in tests
import { vi } from 'vitest';

const mockVectorize = {
  query: vi.fn().mockResolvedValue({
    matches: [
      { id: 'test-1', score: 0.95, metadata: { category: 'docs' } }
    ],
    count: 1
  }),
  insert: vi.fn().mockResolvedValue({ mutationId: "test-mutation-id" }),
  upsert: vi.fn().mockResolvedValue({ mutationId: "test-mutation-id" })
};

// Use mock in tests
test('vector search', async () => {
  const env = { VECTORIZE_INDEX: mockVectorize };
  // ... test logic
});

Community Tips

Note : These tips come from community discussions and official blog posts. Verify against your Vectorize version.

Tip 1: Range Queries at Scale May Have Reduced Accuracy (Community-sourced)

Source : Query Best Practices Confidence : MEDIUM Applies to : Datasets with ~10M+ vectors

Range queries ($lt, $lte, $gt, $gte) on large datasets may experience reduced accuracy.

Optimization Strategy :

// ❌ High-cardinality range at scale
metadata: {
  timestamp_ms: 1704067200123
}
filter: { timestamp_ms: { $gte: 1704067200000 } }

// ✅ Bucketed into discrete values
metadata: {
  timestamp_bucket: "2025-01-01-00:00",  // 1-hour buckets
  timestamp_ms: 1704067200123  // Original (non-indexed)
}
filter: {
  timestamp_bucket: {
    $in: ["2025-01-01-00:00", "2025-01-01-01:00"]
  }
}

When This Matters :

Time-based filtering over months/years
User IDs, transaction IDs (UUID ranges)
Any high-cardinality continuous data

Alternative : Use equality filters ($eq, $in) with bucketed values.

Tip 2: List Vectors Operation (Added August 2025)

Source : Vectorize Changelog

Vectorize V2 added support for the list-vectors operation for paginated iteration through vector IDs.

Use Cases :

Auditing vector collections
Bulk vector operations
Debugging index contents

API :

const result = await env.VECTORIZE_INDEX.list({
  limit: 1000,  // Max 1000 per page
  cursor?: string
});

// result.vectors: Array<{ id: string }>
// result.cursor: string | undefined
// result.count: number

// Pagination example
let cursor: string | undefined;
const allVectorIds: string[] = [];

do {
  const result = await env.VECTORIZE_INDEX.list({
    limit: 1000,
    cursor
  });
  allVectorIds.push(...result.vectors.map(v => v.id));
  cursor = result.cursor;
} while (cursor);

Limitations :

Returns IDs only (not values or metadata)
Max 1000 vectors per page
Use cursor for pagination

Official Documentation

Vectorize V2 Docs : https://developers.cloudflare.com/vectorize/
V2 Changelog : https://developers.cloudflare.com/vectorize/platform/changelog/
V1 to V2 Migration : https://developers.cloudflare.com/vectorize/reference/transition-vectorize-legacy/
Metadata Filtering : https://developers.cloudflare.com/vectorize/reference/metadata-filtering/
Workers AI Models : https://developers.cloudflare.com/workers-ai/models/

Status : Production Ready ✅ (Vectorize V2 GA - September 2024) Last Updated : 2026-01-21 Token Savings : ~70% Errors Prevented : 14 (includes V2 breaking changes, testing setup, TypeScript types) Changes : Added 4 new errors (wrangler --json, TypeScript types, Windows dev, topK limits), batch performance best practices, query accuracy modes, testing setup, community tips on range queries and list-vectors operation.

Weekly Installs

326

Repository

jezweb/claude-skills

GitHub Stars

652

First Seen

Jan 20, 2026

Security Audits

Gen Agent Trust HubPass SocketPass SnykWarn

Installed on

claude-code269

gemini-cli222

opencode215

cursor206

antigravity200

codex192

React 组合模式指南：Vercel 组件架构最佳实践，提升代码可维护性

105,000 周安装

Cloudflare Vectorize 完整指南：全球分布式向量数据库，实现语义搜索与RAG应用

🇨🇳中文介绍

Cloudflare Vectorize

此技能提供的内容

核心能力

包含的模板

相关 Skills

⚠️ Vectorize V2 重大变更（2024 年 9 月）

V2 中的变更

检查变更状态

关键设置规则

⚠️ 插入向量前必须执行的操作

索引配置（之后无法更改）

Wrangler 配置

TypeScript 类型

元数据过滤运算符（V2）

元数据最佳实践

1. 基数考虑

2. 元数据限制

3. 向量维度限制

4. 键限制

最佳实践

批量插入性能

查询精度模式

常见错误及解决方案

错误 1：在向量插入后创建元数据索引

错误 2：维度不匹配

错误 3：无效的元数据键

错误 4：过滤器过大

错误 5：对高基数进行范围查询

错误 6：插入与更新插入混淆

错误 7：缺少绑定

错误 8：命名空间与元数据混淆

错误 9：V2 异步变更时序（V2 新增）

错误 10：V1 returnMetadata 布尔值（V2 破坏性变更）

错误 11：Wrangler --json 输出包含日志前缀

错误 12：TypeScript 类型缺少过滤运算符

错误 13：Windows 开发注册表失败（已修复）

错误 14：topK 限制取决于 returnValues/returnMetadata

V2 迁移清单

测试注意事项

使用 Vectorize 绑定的 Vitest

社区提示

提示 1：大规模范围查询可能精度降低（社区来源）

提示 2：列出向量操作（2025 年 8 月添加）

官方文档

🇺🇸English

Cloudflare Vectorize

What This Skill Provides

Core Capabilities

Templates Included

⚠️ Vectorize V2 Breaking Changes (September 2024)

What Changed in V2

Check Mutation Status

Critical Setup Rules

⚠️ MUST DO BEFORE INSERTING VECTORS

Index Configuration (Cannot Be Changed Later)

Wrangler Configuration

TypeScript Types

Metadata Filter Operators (V2)

Metadata Best Practices

1. Cardinality Considerations

2. Metadata Limits

3. Vector Dimension Limit

4. Key Restrictions

Best Practices

Batch Insert Performance

Query Accuracy Modes

Common Errors & Solutions

Error 1: Metadata Index Created After Vectors Inserted

Error 2: Dimension Mismatch

Error 3: Invalid Metadata Keys

Error 4: Filter Too Large

Error 5: Range Query on High Cardinality

Error 6: Insert vs Upsert Confusion

Error 7: Missing Bindings

Error 8: Namespace vs Metadata Confusion

Error 9: V2 Async Mutation Timing (NEW in V2)

Error 10: V1 returnMetadata Boolean (BREAKING in V2)

Error 11: Wrangler --json Output Contains Log Prefix