阿里云DashVector向量搜索教程：Python SDK快速入门与AI搜索实践

alicloud-ai-search-dashvector by cinience/alicloud-skills

244 周安装量

363 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/cinience/alicloud-skills --skill alicloud-ai-search-dashvector

AI/机器学习云服务数据处理

🇨🇳中文介绍

Category: provider

DashVector 向量搜索

使用 DashVector 管理集合并执行带可选过滤器和稀疏向量的向量相似性搜索。

前提条件

安装 SDK（建议在虚拟环境中安装以避免 PEP 668 限制）：

python3 -m venv .venv . .venv/bin/activate python -m pip install dashvector
通过环境变量提供凭证和端点：
- DASHVECTOR_API_KEY
- DASHVECTOR_ENDPOINT（集群端点）

标准化操作

创建集合

name (str)
dimension (int)
metric (str: cosine | | )

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

快速开始 (Python SDK)

import os
import dashvector
from dashvector import Doc

client = dashvector.Client(
    api_key=os.getenv("DASHVECTOR_API_KEY"),
    endpoint=os.getenv("DASHVECTOR_ENDPOINT"),
)

# 1) 创建一个集合
ret = client.create(
    name="docs",
    dimension=768,
    metric="cosine",
    fields_schema={"title": str, "source": str, "chunk": int},
)
assert ret

# 2) 更新/插入文档
collection = client.get(name="docs")
ret = collection.upsert(
    [
        Doc(id="1", vector=[0.01] * 768, fields={"title": "Intro", "source": "kb", "chunk": 0}),
        Doc(id="2", vector=[0.02] * 768, fields={"title": "FAQ", "source": "kb", "chunk": 1}),
    ]
)
assert ret

# 3) 查询
ret = collection.query(
    vector=[0.01] * 768,
    topk=5,
    filter="source = 'kb' AND chunk >= 0",
    output_fields=["title", "source", "chunk"],
    include_vector=False,
)
for doc in ret:
    print(doc.id, doc.fields)

python skills/ai/search/alicloud-ai-search-dashvector/scripts/quickstart.py

DASHVECTOR_API_KEY
DASHVECTOR_ENDPOINT
DASHVECTOR_COLLECTION (可选)
DASHVECTOR_DIMENSION (可选)

可选参数：--collection, --dimension, --topk, --filter。

给 Claude Code/Codex 的注意事项

优先使用 upsert 以实现幂等的数据摄取。
保持 dimension 与您的嵌入模型输出大小一致。
使用过滤器来强制实施租户或数据集范围。
如果使用稀疏向量，在更新/插入或查询时传递 sparse_vector={token_id: weight, ...}。

401/403: 无效的 DASHVECTOR_API_KEY
400: 无效的集合模式或维度不匹配
429/5xx: 使用指数退避重试

mkdir -p output/alicloud-ai-search-dashvector
for f in skills/ai/search/alicloud-ai-search-dashvector/scripts/*.py; do
  python3 -m py_compile "$f"
done
echo "py_compile_ok" > output/alicloud-ai-search-dashvector/validate.txt

通过标准：命令以 0 退出且生成 output/alicloud-ai-search-dashvector/validate.txt 文件。

将工件、命令输出和 API 响应摘要保存在 output/alicloud-ai-search-dashvector/ 目录下。
在证据文件中包含关键参数（区域/资源 ID/时间范围）以确保可复现性。

确认用户意图、区域、标识符以及操作是只读还是可变操作。
首先运行一个最小化的只读查询以验证连接性和权限。
使用明确的参数和有界的范围执行目标操作。
验证结果并保存输出/证据文件。

DashVector Python SDK: Client.create, Collection.upsert, Collection.query
来源列表: references/sources.md

🇺🇸English

Category: provider

DashVector Vector Search

Use DashVector to manage collections and perform vector similarity search with optional filters and sparse vectors.

Prerequisites

Install SDK (recommended in a venv to avoid PEP 668 limits):

python3 -m venv .venv . .venv/bin/activate python -m pip install dashvector
Provide credentials and endpoint via environment variables:
- DASHVECTOR_API_KEY
- DASHVECTOR_ENDPOINT (cluster endpoint)

Normalized operations

Create collection

name (str)
dimension (int)
metric (str: cosine | dotproduct | euclidean)
fields_schema (optional dict of field types)

Upsert docs

docs list of {id, vector, fields} or tuples
Supports sparse_vector and multi-vector collections

Query docs

vector or id (one required; if both empty, only filter is applied)
topk (int)
filter (SQL-like where clause)
output_fields (list of field names)
include_vector (bool)

Quickstart (Python SDK)

import os
import dashvector
from dashvector import Doc

client = dashvector.Client(
    api_key=os.getenv("DASHVECTOR_API_KEY"),
    endpoint=os.getenv("DASHVECTOR_ENDPOINT"),
)

# 1) Create a collection
ret = client.create(
    name="docs",
    dimension=768,
    metric="cosine",
    fields_schema={"title": str, "source": str, "chunk": int},
)
assert ret

# 2) Upsert docs
collection = client.get(name="docs")
ret = collection.upsert(
    [
        Doc(id="1", vector=[0.01] * 768, fields={"title": "Intro", "source": "kb", "chunk": 0}),
        Doc(id="2", vector=[0.02] * 768, fields={"title": "FAQ", "source": "kb", "chunk": 1}),
    ]
)
assert ret

# 3) Query
ret = collection.query(
    vector=[0.01] * 768,
    topk=5,
    filter="source = 'kb' AND chunk >= 0",
    output_fields=["title", "source", "chunk"],
    include_vector=False,
)
for doc in ret:
    print(doc.id, doc.fields)

Script quickstart

python skills/ai/search/alicloud-ai-search-dashvector/scripts/quickstart.py

Environment variables:

DASHVECTOR_API_KEY
DASHVECTOR_ENDPOINT
DASHVECTOR_COLLECTION (optional)
DASHVECTOR_DIMENSION (optional)

Optional args: --collection, --dimension, --topk, --filter.

Notes for Claude Code/Codex

Prefer upsert for idempotent ingestion.
Keep dimension aligned to your embedding model output size.
Use filters to enforce tenant or dataset scoping.
If using sparse vectors, pass sparse_vector={token_id: weight, ...} when upserting/querying.

Error handling

401/403: invalid DASHVECTOR_API_KEY
400: invalid collection schema or dimension mismatch
429/5xx: retry with exponential backoff

Validation

mkdir -p output/alicloud-ai-search-dashvector
for f in skills/ai/search/alicloud-ai-search-dashvector/scripts/*.py; do
  python3 -m py_compile "$f"
done
echo "py_compile_ok" > output/alicloud-ai-search-dashvector/validate.txt

Pass criteria: command exits 0 and output/alicloud-ai-search-dashvector/validate.txt is generated.

Output And Evidence

Save artifacts, command outputs, and API response summaries under output/alicloud-ai-search-dashvector/.
Include key parameters (region/resource id/time range) in evidence files for reproducibility.

Workflow

Confirm user intent, region, identifiers, and whether the operation is read-only or mutating.
Run one minimal read-only query first to verify connectivity and permissions.
Execute the target operation with explicit parameters and bounded scope.
Verify results and save output/evidence files.

References

DashVector Python SDK: Client.create, Collection.upsert, Collection.query
Source list: references/sources.md

Weekly Installs

244

Repository

cinience/alicloud-skills

GitHub Stars

363

First Seen

Feb 26, 2026

Security Audits

Gen Agent Trust HubPass SocketPass SnykPass

Installed on

gemini-cli241

github-copilot241

codex241

kimi-cli241

amp241

cursor241

Azure 配额管理指南：服务限制、容量验证与配额增加方法

79,700 周安装