AI 解决方案架构师技能：分析现有代码与设计全新AI系统架构指南 | SkillsMD

AI 解决方案架构师技能：分析现有代码与设计全新AI系统架构指南

ai-solution-architect by aguirrerjg/skills

1 周安装量

GitHub

安装命令

npx skills add https://github.com/aguirrerjg/skills --skill ai-solution-architect

AI/机器学习开发系统架构

🇨🇳中文介绍

AI 解决方案架构师 v2.0 (自包含)

两种操作模式：

分析模式：为任何受众（技术或非技术）解释现有仓库/代码的架构。
设计模式：设计全新 AI 解决方案的完整架构。

此技能是自包含的：所有方法都在这里和资源中。

模式路由器

自动检测使用哪种模式：

用户是否粘贴了代码、README、文件结构，或提到了现有仓库？
├─ 是 → 分析模式 (阶段 0)
│       之后是否想设计改进或新版本？
│       └─ 是 → 过渡到设计模式 (阶段 1-5)
└─ 否 → 设计模式 (阶段 1-5)

分析模式 — 阶段 0：现有仓库分析

当用户分享代码、README、文件结构、图表或描述现有项目时激活。

完整方法请阅读 resources/repo-analysis-guide.md。

步骤 0.1：识别用户拥有的内容

提问（一次一个）：

你想让我分析什么？选项：(a) 我将粘贴的 README，(b) 文件/文件夹结构，(c) 代码片段，(d) 系统图表或描述，(e) 以上所有
解释给谁听？选项：(a) 给我自己，我有技术知识，(b) 给具有混合技术知识的团队，(c) 给没有技术知识的管理层/投资者，(d) 给将要维护此系统的团队

步骤 0.2：仓库分析

根据用户分享的材料，提取并组织：

系统地图（包含哪些部分以及如何连接）：

识别的主要组件
数据流：信息从哪里进入，流向哪里？
外部依赖：使用哪些服务/API/库？
技术栈：语言、框架、数据库

检测到的架构模式：

是单体、微服务、无服务器、事件驱动？

🇺🇸English

AI Solution Architect v2.0 (Autocontenido)

Dos modos de operación:

Modo Analizar : Explica la arquitectura de un repositorio/código existente para cualquier audiencia (técnica o no técnica).
Modo Diseñar : Diseña la arquitectura completa de una solución nueva de IA.

Este skill es autocontenido : toda la metodología está aquí y en los resources.

Router de Modo

Detecta automáticamente qué modo usar:

¿El usuario pegó código, README, estructura de archivos, o menciona un repo existente?
├─ SÍ → Modo ANALIZAR (Fase 0)
│       ¿Después quiere diseñar mejoras o una versión nueva?
│       └─ SÍ → Transición a Modo DISEÑAR (Fases 1-5)
└─ NO → Modo DISEÑAR (Fases 1-5)

MODO ANALIZAR — Fase 0: Análisis de Repositorio Existente

Se activa cuando el usuario comparte código, README, estructura de archivos, diagramas, o describe un proyecto existente.

Lee resources/repo-analysis-guide.md para la metodología completa.

Paso 0.1: Identificar qué tiene el usuario

Pregunta (una a la vez):

¿Qué quieres que analice? Opciones: (a) un README que voy a pegar, (b) estructura de archivos/carpetas, (c) fragmentos de código, (d) un diagrama o descripción del sistema, (e) todo lo anterior

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

相关 Skills

find-skills 技能搜索工具 - Vercel Labs 开源智能体技能包管理器

812,900 周安装

Vercel React 最佳实践指南 | 58条Next.js性能优化规则与代码重构

269,400 周安装

Vercel Web界面规范检查工具 - 自动检测代码是否符合Web设计指南

218,000 周安装

agent-browser 浏览器自动化工具 - Vercel Labs 命令行网页操作与测试

147,400 周安装

技术概念	易于理解的类比
RAG	"就像一个员工在回答问题前，会查阅公司档案以确保给出正确答案"
向量数据库	"一个智能目录，通过含义而非精确词汇查找文档——就像一位专家图书管理员"
嵌入	"将文本翻译成能捕捉其含义的数字代码，就像每个段落都有一个指纹"
LLM	"一个阅读了数百万文档的助手，可以撰写、总结和回答，但没有帮助就无法'了解'你的公司"
分块	"将一本书分成主题卡片，以便助手能快速找到相关卡片"
微调	"用你公司的例子训练助手，使其用你的语气说话并遵循你的规则"
API 网关	"大楼的前台：控制谁进入，登记访客，并引导每个人到正确的楼层"
数据管道	"将原始文档转化为可立即使用的信息的装配线"
护栏	"防止助手说出不正确或不恰当内容的安全边界"
编排器	"协调每种乐器（组件）在何时演奏的乐队指挥"
缓存	"短期记忆：如果有人在 5 分钟前问了同样的问题，就不需要再次查找"
令牌	"文本单位（大约 ¾ 个单词）。是使用 AI 时消耗的'货币'"
延迟	"系统响应所需的时间，就像在餐厅等待的时间"
重排序	"第二道过滤器：在搜索到 20 个文档后，专家会重新排序，将最好的放在前面"
上下文窗口	"助手的'工作台'：他同时能处理多少信息"

graph LR
    Usuario[👤 用户提问] --> Buscador[📚 文档搜索器]
    Buscador --> Asistente[🤖 AI 助手]
    Asistente --> Respuesta[💬 带来源的答案]

graph TD
    Client[Web App / API] --> Gateway[API Gateway]
    Gateway --> Orch[Orchestrator - LangChain]
    Orch --> Retrieval[Retrieval Pipeline]
    Orch --> LLM[Claude Sonnet via API]
    Retrieval --> VDB[(Qdrant - Vector DB)]
    Retrieval --> BM25[BM25 - Keyword Search]
    LLM --> Guards[Guardrails + Citation]
    Guards --> Client

# 架构分析 — [项目名称]

## 这是什么？（1 段话，任何人都能理解）

## 它如何工作？（根据受众调整）
[Mermaid 图表]
[按层/组件的解释]

## 主要组件
| 组件 | 功能 | 技术 | 类比 |
|-----------|----------|-----------|---------|

## 数据流（逐步说明）
1. [步骤 1 — 使用受众语言]
2. [步骤 2...]

## 架构优势
- [设计良好的部分及原因]

## 改进机会
- [可以改进的部分及原因]

## 已识别的风险
- [技术或业务风险]

阶段 1        → 阶段 2            → 阶段 3        → 阶段 4          → 阶段 5
架构头脑风暴   方法选择            架构层设计       技术栈评估         架构文档

探索上下文 → 澄清问题（一次一个） →
  提出 2-3 种方法 → 分部分呈现设计 →
    用户批准吗？ → 否：修订 → 是：进入阶段 2

解决方案是否需要最新的或特定领域的知识？
├─ 是 → 什么类型的知识？
│   ├─ 自有文档/数据 → RAG
│   ├─ 特定领域行为 → 微调
│   └─ 两者 → 混合 (RAG + 微调)
│
├─ 否 → 是否需要执行操作？
│   ├─ 是 → 复杂度如何？
│   │   ├─ 1-3 个工具，线性流程 → 简单智能体 (ReAct)
│   │   └─ 多个步骤，分支 → 多智能体
│   └─ 否 → 提示工程 (基础 LLM 足够)
│
└─ 最佳可能结果
    └─ 混合：RAG + 微调 + 智能体

标准	提示工程	RAG	微调	混合
到 MVP 的时间	⭐⭐⭐⭐⭐ (几天)	⭐⭐⭐⭐ (几周)	⭐⭐ (几个月)	⭐ (几个月)
知识更新	❌	✅	❌	✅
领域准确性	⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
运营成本	$	$$	$$$	$$$$
基础设施复杂度	低	中	高	非常高
行为控制	低	中	高	非常高
幻觉	高	低 (配合检索)	中	非常低

┌─────────────────────────────────────────────────────┐
│                 表示层                              │
│  Web App / Mobile / API / Chat Interface / Slack Bot │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│                 编排层                              │
│  API Gateway → Orchestrator (LangChain/LlamaIndex)  │
│  Session Manager → Memory Store → Rate Limiter       │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│                 智能层                              │
│  ┌──────────┐  ┌──────────┐  ┌───────────────────┐  │
│  │ 检索     │  │  LLM     │  │  后处理           │  │
│  │ 管道     │  │  网关    │  │  (护栏,           │  │
│  │          │  │          │  │   格式化)         │  │
│  └──────────┘  └──────────┘  └───────────────────┘  │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│                 数据与索引层                        │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐           │
│  │ 文档     │  │ 嵌入     │  │ 向量     │           │
│  │ 管道     │  │ 服务     │  │ 存储     │           │
│  │ (摄取,   │  │          │  │          │           │
│  │  分块,   │  │          │  │          │           │
│  │  清洗)   │  │          │  │          │           │
│  └──────────┘  └──────────┘  └──────────┘           │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│                 基础设施层                          │
│  Cloud Provider → Compute → Storage → Networking     │
│  Monitoring → Logging → CI/CD → Security             │
└─────────────────────────────────────────────────────┘

策略	何时使用	典型分块大小
固定大小	同质化文档	512-1024 令牌
语义分块	内容多样，多个主题	可变
基于文档	结构化 PDF，论文	按章节
句子窗口	需要高精度	1-3 个句子 + 上下文
父子分块	需要广泛上下文 + 精度	子块：256，父块：2048

模型	维度	优势	何时使用
text-embedding-3-large (OpenAI)	3072	整体质量最佳	生产环境，预算允许
text-embedding-3-small (OpenAI)	1536	质量/成本平衡	MVP，高容量
Voyage-3	1024	代码处理优秀	技术文档
BGE-M3 (开源)	1024	多语言，本地部署	隐私要求，避免供应商锁定
Cohere embed-v4	1024	搜索 + 分类	多模态，多语言

# 架构文档 — [解决方案名称]
**日期：** [日期] | **版本：** 1.0 | **作者：** [用户]

## 1. 上下文与问题
[2-3 段：业务问题、用户、现状]

## 2. 选择的方法
[选择的方法 + 权衡表 + 理由]

## 3. 高层架构
[完整系统的 Mermaid 图表]

### 3.1 分层视图
[带组件的分层图表]

### 3.2 数据流视图
[从用户输入到响应的顺序图]

## 4. 分层详情

### 4.1 表示层
- 组件：[列表]
- 技术：[选择 + 理由]
- 接口：[暴露的 API]

### 4.2 编排层
- 组件：[列表]
- 技术：[框架 + 理由]
- 模式：[同步/异步，重试，熔断器]

### 4.3 智能层
- LLM 模型：[选择 + 带分数的理由]
- 检索管道：[策略 + 理由]
- 护栏：[应用了哪些保护措施]

### 4.4 数据与索引层
- 向量数据库：[选择 + 带分数的理由]
- 嵌入：[模型 + 维度 + 理由]
- 分块：[策略 + 大小 + 理由]
- 摄取：[文档管道，频率，格式]

### 4.5 基础设施层
- 云：[提供商 + 服务]
- 计算：[实例类型，如适用 GPU]
- 监控：[工具，关键指标]
- CI/CD：[部署流水线]

## 5. 图表

### 5.1 架构图 (Mermaid)
[完整的 C4 图或流程图]

### 5.2 顺序图 — 主流程
[Mermaid 顺序图：用户 → 前端 → 编排器 → 检索 → LLM → 响应]

### 5.3 数据摄取图
[Mermaid：来源 → 提取 → 分块 → 嵌入 → 存储]

## 6. 架构决策记录 (ADRs)

### ADR-001：[标题]
- **上下文：**[为什么需要这个决策]
- **决策：**[决定了什么]
- **评估的替代方案：**[考虑了哪些其他方案]
- **后果：**[接受的权衡]

[为每个关键决策重复]

## 7. 成本估算

| 组件 | 服务 | 月度估算成本 |
|-----------|---------|----------------------|
| LLM API | [提供商] | $[X] |
| 向量数据库 | [服务] | $[X] |
| 计算 | [实例] | $[X] |
| 存储 | [类型] | $[X] |
| **总计** | | **$[X]** |

⚠️ 估算基于[假设用量]。根据实际使用情况调整。

## 8. 风险与缓解措施

| 风险 | 可能性 | 影响 | 缓解措施 |
|--------|-------------|---------|-----------|
| | | | |

## 9. 实施路线图

### 阶段 1：MVP ([X] 周)
- [用于验证的最小组件]

### 阶段 2：生产环境 ([X] 周)
- [可扩展性，监控，安全性]

### 阶段 3：优化 ([X] 周)
- [微调，高级 RAG，持续评估]

## 10. 假设与限制
[所有标记为"待定义"的列表 + 设计限制]

Concepto técnico	Analogía accesible
RAG	"Es como un empleado que antes de responder una pregunta, consulta el archivo de la empresa para dar la respuesta correcta"
Vector Database	"Un catálogo inteligente que encuentra documentos por significado, no solo por palabras exactas — como un bibliotecario experto"
Embedding	"Traducir texto a un código numérico que captura su significado, como si cada párrafo tuviera una huella digital"
LLM	"Un asistente que ha leído millones de documentos y puede redactar, resumir y responder, pero no 'sabe' nada de tu empresa sin ayuda"
Chunking	"Dividir un libro en fichas temáticas para que el asistente pueda encontrar rápidamente la ficha relevante"
Fine-tuning	"Entrenar al asistente con ejemplos de tu empresa para que hable con tu tono y siga tus reglas"
API Gateway	"La recepción del edificio: controla quién entra, registra visitas y dirige a cada persona al piso correcto"
Pipeline de datos	"La cadena de montaje que transforma documentos brutos en información lista para usar"
Guardrails	"Los límites de seguridad que evitan que el asistente diga algo incorrecto o inapropiado"
Orquestador	"El director de orquesta que coordina qué instrumento (componente) toca en cada momento"
Cache	"Una memoria de corto plazo: si alguien hizo la misma pregunta hace 5 minutos, no vuelve a buscar"
Token	"Una unidad de texto (aproximadamente ¾ de una palabra). Es la 'moneda' con la que se cobra el uso de IA"
Latencia	"El tiempo que tarda el sistema en responder, como el tiempo de espera en un restaurante"
Reranking	"Un segundo filtro: después de buscar 20 documentos, un experto los reordena para poner los mejores primero"
Context window	"La 'mesa de trabajo' del asistente: cuánta información puede tener frente a él al mismo tiempo"

graph LR
    Usuario[👤 Usuario hace pregunta] --> Buscador[📚 Buscador de documentos]
    Buscador --> Asistente[🤖 Asistente IA]
    Asistente --> Respuesta[💬 Respuesta con fuentes]

graph TD
    Client[Web App / API] --> Gateway[API Gateway]
    Gateway --> Orch[Orchestrator - LangChain]
    Orch --> Retrieval[Retrieval Pipeline]
    Orch --> LLM[Claude Sonnet via API]
    Retrieval --> VDB[(Qdrant - Vector DB)]
    Retrieval --> BM25[BM25 - Keyword Search]
    LLM --> Guards[Guardrails + Citation]
    Guards --> Client

# Análisis de Arquitectura — [Nombre del Proyecto]

## ¿Qué es esto? (1 párrafo, comprensible para cualquiera)

## ¿Cómo funciona? (adaptado a audiencia)
[Diagrama Mermaid]
[Explicación por capas/componentes]

## Componentes principales
| Componente | Qué hace | Tecnología | Analogía |
|-----------|----------|-----------|---------|

## Flujo de datos (paso a paso)
1. [Paso 1 — en lenguaje de la audiencia]
2. [Paso 2...]

## Puntos fuertes de la arquitectura
- [Lo que está bien diseñado y por qué]

## Oportunidades de mejora
- [Lo que podría mejorarse y por qué]

## Riesgos identificados
- [Riesgos técnicos o de negocio]

Fase 1        → Fase 2            → Fase 3        → Fase 4          → Fase 5
Brainstorming   Selección de        Diseño de        Tech Stack        Documento de
Arquitectónico  Enfoque             Capas            y Evaluación      Arquitectura

Explorar contexto → Preguntas clarificadoras (1 a la vez) →
  Proponer 2-3 enfoques → Presentar diseño por secciones →
    ¿Usuario aprueba? → NO: revisar → SÍ: Avanzar a Fase 2

¿La solución necesita conocimiento actualizado o específico del dominio?
├─ SÍ → ¿Qué tipo de conocimiento?
│   ├─ Documentos/datos propios → RAG
│   ├─ Comportamiento específico del dominio → Fine-tuning
│   └─ Ambos → Híbrido (RAG + Fine-tuning)
│
├─ NO → ¿Necesita ejecutar acciones?
│   ├─ SÍ → ¿Complejidad?
│   │   ├─ 1-3 herramientas, flujo lineal → Agente simple (ReAct)
│   │   └─ Múltiples pasos, bifurcaciones → Multi-agente
│   └─ NO → Prompt engineering (suficiente con LLM base)
│
└─ Mejor resultado posible
    └─ Híbrido: RAG + Fine-tuning + Agentes

Criterio	Prompt Engineering	RAG	Fine-tuning	Híbrido
Tiempo a MVP	⭐⭐⭐⭐⭐ (días)	⭐⭐⭐⭐ (semanas)	⭐⭐ (meses)	⭐ (meses)
Conocimiento actualizado	❌	✅	❌	✅
Precisión en dominio	⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
Costo operativo	$	$$	$$$	$$$$
Complejidad de infra	Baja	Media	Alta	Muy Alta
Control de comportamiento	Bajo	Medio	Alto	Muy Alto
Alucinaciones	Altas	Bajas (con retrieval)	Medias	Muy Bajas

┌─────────────────────────────────────────────────────┐
│                 CAPA DE PRESENTACIÓN                 │
│  Web App / Mobile / API / Chat Interface / Slack Bot │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│              CAPA DE ORQUESTACIÓN                    │
│  API Gateway → Orchestrator (LangChain/LlamaIndex)  │
│  Session Manager → Memory Store → Rate Limiter       │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│              CAPA DE INTELIGENCIA                     │
│  ┌──────────┐  ┌──────────┐  ┌───────────────────┐  │
│  │ Retrieval │  │  LLM     │  │  Post-processing  │  │
│  │ Pipeline  │  │  Gateway │  │  (guardrails,     │  │
│  │          │  │          │  │   formatting)     │  │
│  └──────────┘  └──────────┘  └───────────────────┘  │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│              CAPA DE DATOS E INDEXACIÓN               │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐           │
│  │ Document  │  │ Embedding│  │ Vector   │           │
│  │ Pipeline  │  │ Service  │  │ Store    │           │
│  │ (ingest,  │  │          │  │          │           │
│  │  chunk,   │  │          │  │          │           │
│  │  clean)   │  │          │  │          │           │
│  └──────────┘  └──────────┘  └──────────┘           │
└────────────────────────┬────────────────────────────┘
                         │
┌────────────────────────▼────────────────────────────┐
│              CAPA DE INFRAESTRUCTURA                  │
│  Cloud Provider → Compute → Storage → Networking     │
│  Monitoring → Logging → CI/CD → Security             │
└─────────────────────────────────────────────────────┘

Estrategia	Cuándo usar	Chunk size típico
Fixed-size	Documentos homogéneos	512-1024 tokens
Semantic	Contenido variado, múltiples temas	Variable
Document-based	PDFs estructurados, papers	Por sección
Sentence-window	Alta precisión necesaria	1-3 oraciones + contexto
Parent-child	Necesitas contexto amplio + precisión	Hijo: 256, Padre: 2048

Modelo	Dimensiones	Ventaja	Cuándo usar
text-embedding-3-large (OpenAI)	3072	Mejor calidad general	Producción, presupuesto OK
text-embedding-3-small (OpenAI)	1536	Balance calidad/costo	MVP, alto volumen
Voyage-3	1024	Excelente para código	Documentación técnica
BGE-M3 (open source)	1024	Multilingüe, on-premise	Privacidad, sin vendor lock
Cohere embed-v4	1024	Búsqueda + clasificación	Multimodal, multilingual

# Documento de Arquitectura — [Nombre de la Solución]
**Fecha:** [fecha] | **Versión:** 1.0 | **Autor:** [usuario]

## 1. Contexto y Problema
[2-3 párrafos: problema de negocio, usuarios, situación actual]

## 2. Enfoque Seleccionado
[Enfoque elegido + tabla de trade-offs + justificación]

## 3. Arquitectura de Alto Nivel
[Diagrama Mermaid del sistema completo]

### 3.1 Vista de Capas
[Diagrama por capas con componentes]

### 3.2 Vista de Flujo de Datos
[Diagrama de secuencia: desde input del usuario hasta respuesta]

## 4. Detalle por Capa

### 4.1 Capa de Presentación
- Componentes: [lista]
- Tecnología: [selección + justificación]
- Interfaces: [APIs expuestas]

### 4.2 Capa de Orquestación
- Componentes: [lista]
- Tecnología: [framework + justificación]
- Patrones: [sync/async, retry, circuit breaker]

### 4.3 Capa de Inteligencia
- Modelo LLM: [selección + justificación con scores]
- Retrieval pipeline: [estrategia + justificación]
- Guardrails: [qué protecciones se aplican]

### 4.4 Capa de Datos e Indexación
- Vector DB: [selección + justificación con scores]
- Embedding: [modelo + dimensiones + justificación]
- Chunking: [estrategia + tamaños + justificación]
- Ingesta: [pipeline de documentos, frecuencia, formatos]

### 4.5 Capa de Infraestructura
- Cloud: [proveedor + servicios]
- Compute: [tipo de instancias, GPU si aplica]
- Monitoring: [herramientas, métricas clave]
- CI/CD: [pipeline de deployment]

## 5. Diagramas

### 5.1 Diagrama de Arquitectura (Mermaid)
[Diagrama C4 o flowchart completo]

### 5.2 Diagrama de Secuencia — Flujo Principal
[Mermaid sequence diagram: user → frontend → orchestrator → retrieval → LLM → response]

### 5.3 Diagrama de Ingesta de Datos
[Mermaid: source → extract → chunk → embed → store]

## 6. Decisiones Arquitectónicas (ADRs)

### ADR-001: [Título]
- **Contexto:** [por qué se necesita esta decisión]
- **Decisión:** [qué se decidió]
- **Alternativas evaluadas:** [qué más se consideró]
- **Consecuencias:** [trade-offs aceptados]

[Repetir para cada decisión clave]

## 7. Estimación de Costos

| Componente | Servicio | Costo mensual estimado |
|-----------|---------|----------------------|
| LLM API | [proveedor] | $[X] |
| Vector DB | [servicio] | $[X] |
| Compute | [instancias] | $[X] |
| Storage | [tipo] | $[X] |
| **Total** | | **$[X]** |

⚠️ Estimaciones basadas en [volumen asumido]. Ajustar según uso real.

## 8. Riesgos y Mitigaciones

| Riesgo | Probabilidad | Impacto | Mitigación |
|--------|-------------|---------|-----------|
| | | | |

## 9. Roadmap de Implementación

### Fase 1: MVP ([X] semanas)
- [componentes mínimos para validar]

### Fase 2: Producción ([X] semanas)
- [escalabilidad, monitoring, seguridad]

### Fase 3: Optimización ([X] semanas)
- [fine-tuning, advanced RAG, evaluación continua]

## 10. Supuestos y Limitaciones
[Lista de todo marcado como "POR DEFINIR" + limitaciones del diseño]

标准	权重	GPT-4o	Claude Sonnet	Claude Opus	Gemini 2.5	开源 (Llama/Mistral)
回答质量	25%
延迟	20%
每令牌成本	20%
上下文窗口	15%
隐私/本地部署	10%
生态系统/工具	10%

标准	权重	Pinecone	Qdrant	Chroma	Weaviate	pgvector	Milvus
设置简易性	20%
可扩展性	20%
混合搜索	15%
成本	15%
过滤/元数据	15%
社区/支持	15%

标准	权重	LangChain	LlamaIndex	Haystack	自定义
原生 RAG	25%
灵活性	20%
学习曲线	20%
生产就绪	20%
社区	15%

Criterio	Peso	GPT-4o	Claude Sonnet	Claude Opus	Gemini 2.5	Open Source (Llama/Mistral)
Calidad de respuesta	25%
Latencia	20%
Costo por token	20%
Context window	15%
Privacidad/On-premise	10%
Ecosistema/tooling	10%

Criterio	Peso	Pinecone	Qdrant	Chroma	Weaviate	pgvector	Milvus
Facilidad de setup	20%
Escalabilidad	20%
Búsqueda híbrida	15%
Costo	15%
Filtering/metadata	15%
Comunidad/soporte	15%

Criterio	Peso	LangChain	LlamaIndex	Haystack	Custom
RAG nativo	25%
Flexibilidad	20%
Curva aprendizaje	20%
Producción ready	20%
Comunidad	15%

AI 解决方案架构师技能：分析现有代码与设计全新AI系统架构指南

🇨🇳中文介绍

AI 解决方案架构师 v2.0 (自包含)

模式路由器

分析模式 — 阶段 0：现有仓库分析

步骤 0.1：识别用户拥有的内容

步骤 0.2：仓库分析

🇺🇸English

AI Solution Architect v2.0 (Autocontenido)

Router de Modo

MODO ANALIZAR — Fase 0: Análisis de Repositorio Existente

Paso 0.1: Identificar qué tiene el usuario

相关 Skills

步骤 0.3：生成适合受众的解释

步骤 0.4：生成系统的 Mermaid 图表

步骤 0.5：分析交付物

设计模式 — 5 阶段工作流

阶段 1：架构头脑风暴

阶段 2：方法选择

阶段 3：架构层设计

阶段 4：技术栈与评估

阶段 5：架构文档

护栏

分析模式

设计模式

两种模式

Paso 0.2: Análisis del repositorio

Paso 0.3: Generar explicación adaptada a la audiencia

Paso 0.4: Generar diagrama Mermaid del sistema

Paso 0.5: Entregable del análisis

MODO DISEÑAR — Workflow de 5 Fases

FASE 1: BRAINSTORMING ARQUITECTÓNICO

FASE 2: SELECCIÓN DE ENFOQUE

FASE 3: DISEÑO DE CAPAS ARQUITECTÓNICAS

FASE 4: TECH STACK Y EVALUACIÓN

FASE 5: DOCUMENTO DE ARQUITECTURA

Guardrails

Modo Analizar

Modo Diseñar

Ambos modos

最新 Skills