PyMC贝叶斯建模指南：Python概率编程与MCMC采样实践教程

pymc-bayesian-modeling by davila7/claude-code-templates

212 周安装量

24,100 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/davila7/claude-code-templates --skill pymc-bayesian-modeling

AI/机器学习 Python Web框架数据分析

🇨🇳中文介绍

PyMC 贝叶斯建模

概述

PyMC 是一个用于贝叶斯建模和概率编程的 Python 库。使用 PyMC 的现代 API（版本 5.x+）构建、拟合、验证和比较贝叶斯模型，包括层次模型、MCMC 采样（NUTS）、变分推断和模型比较（LOO、WAIC）。

何时使用此技能

此技能应在以下情况下使用：

构建贝叶斯模型（线性/逻辑回归、层次模型、时间序列等）
执行 MCMC 采样或变分推断
进行先验/后验预测检查
诊断采样问题（发散、收敛、ESS）
使用信息准则（LOO、WAIC）比较多个模型
通过贝叶斯方法实现不确定性量化
处理层次/多级数据结构
以原则性方式处理缺失数据或测量误差

标准贝叶斯工作流

遵循此工作流来构建和验证贝叶斯模型：

1. 数据准备

import pymc as pm
import arviz as az
import numpy as np

# 加载并准备数据
X = ...  # 预测变量
y = ...  # 结果变量

# 标准化预测变量以获得更好的采样效果
X_mean = X.mean(axis=0)
X_std = X.std(axis=0)
X_scaled = (X - X_mean) / X_std

关键实践：

标准化连续预测变量（提高采样效率）
尽可能对结果变量进行中心化处理
显式处理缺失数据（将其视为参数）
为清晰起见，使用带 coords 的命名维度

2. 模型构建

coords = {
    'predictors': ['var1', 'var2', 'var3'],
    'obs_id': np.arange(len(y))
}

with pm.Model(coords=coords) as model:
    # 先验分布
    alpha = pm.Normal('alpha', mu=0, sigma=1)
    beta = pm.Normal('beta', mu=0, sigma=1, dims='predictors')
    sigma = pm.HalfNormal('sigma', sigma=1)

    # 线性预测器
    mu = alpha + pm.math.dot(X_scaled, beta)

    # 似然函数
    y_obs = pm.Normal('y_obs', mu=mu, sigma=sigma, observed=y, dims='obs_id')

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

3. 先验预测检查

在拟合前始终验证先验：

with model:
    prior_pred = pm.sample_prior_predictive(samples=1000, random_seed=42)

# 可视化
az.plot_ppc(prior_pred, group='prior')

先验预测是否覆盖了合理的值范围？
根据领域知识，极端值是否合理？
如果先验生成了不合理的数据，则调整并重新检查

with model:
    # 可选：使用 ADVI 进行快速探索
    # approx = pm.fit(n=20000)

    # 完整的 MCMC 推断
    idata = pm.sample(
        draws=2000,
        tune=1000,
        chains=4,
        target_accept=0.9,
        random_seed=42,
        idata_kwargs={'log_likelihood': True}  # 用于模型比较
    )

draws=2000：每条链的样本数
tune=1000：预热样本（丢弃）
chains=4：运行 4 条链以检查收敛性
target_accept=0.9：对于困难的后验分布使用更高值（0.95-0.99）
包含 log_likelihood=True 以进行模型比较

使用诊断脚本：

from scripts.model_diagnostics import check_diagnostics

results = check_diagnostics(idata, var_names=['alpha', 'beta', 'sigma'])

R-hat < 1.01：链已收敛
ESS > 400：有足够的有效样本
无发散：NUTS 采样成功
轨迹图：链应混合良好（模糊的毛虫状）

如果出现问题：

发散 → 增加 target_accept=0.95，使用非中心化参数化
ESS 低 → 采样更多样本，重新参数化以减少相关性
R-hat 高 → 运行更长时间，检查多模态性

6. 后验预测检查

验证模型拟合：

with model:
    pm.sample_posterior_predictive(idata, extend_inferencedata=True, random_seed=42)

# 可视化
az.plot_ppc(idata)

后验预测是否捕捉到了观测数据的模式？
是否存在明显的系统性偏差（模型设定错误）？
如果拟合效果差，考虑替代模型

# 汇总统计量
print(az.summary(idata, var_names=['alpha', 'beta', 'sigma']))

# 后验分布
az.plot_posterior(idata, var_names=['alpha', 'beta', 'sigma'])

# 系数估计
az.plot_forest(idata, var_names=['beta'], combined=True)

X_new = ...  # 新的预测变量值
X_new_scaled = (X_new - X_mean) / X_std

with model:
    pm.set_data({'X_scaled': X_new_scaled})
    post_pred = pm.sample_posterior_predictive(
        idata.posterior,
        var_names=['y_obs'],
        random_seed=42
    )

# 提取预测区间
y_pred_mean = post_pred.posterior_predictive['y_obs'].mean(dim=['chain', 'draw'])
y_pred_hdi = az.hdi(post_pred.posterior_predictive, var_names=['y_obs'])

对于具有线性关系的连续结果变量：

with pm.Model() as linear_model:
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10, shape=n_predictors)
    sigma = pm.HalfNormal('sigma', sigma=1)

    mu = alpha + pm.math.dot(X, beta)
    y = pm.Normal('y', mu=mu, sigma=sigma, observed=y_obs)

使用模板： assets/linear_regression_template.py

对于二元结果变量：

with pm.Model() as logistic_model:
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10, shape=n_predictors)

    logit_p = alpha + pm.math.dot(X, beta)
    y = pm.Bernoulli('y', logit_p=logit_p, observed=y_obs)

对于分组数据（使用非中心化参数化）：

with pm.Model(coords={'groups': group_names}) as hierarchical_model:
    # 超先验
    mu_alpha = pm.Normal('mu_alpha', mu=0, sigma=10)
    sigma_alpha = pm.HalfNormal('sigma_alpha', sigma=1)

    # 组级别（非中心化）
    alpha_offset = pm.Normal('alpha_offset', mu=0, sigma=1, dims='groups')
    alpha = pm.Deterministic('alpha', mu_alpha + sigma_alpha * alpha_offset, dims='groups')

    # 观测级别
    mu = alpha[group_idx]
    sigma = pm.HalfNormal('sigma', sigma=1)
    y = pm.Normal('y', mu=mu, sigma=sigma, observed=y_obs)

使用模板： assets/hierarchical_model_template.py

关键： 对于层次模型，始终使用非中心化参数化以避免发散。

对于计数数据：

with pm.Model() as poisson_model:
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10, shape=n_predictors)

    log_lambda = alpha + pm.math.dot(X, beta)
    y = pm.Poisson('y', mu=pm.math.exp(log_lambda), observed=y_obs)

对于过度离散的计数数据，使用 NegativeBinomial 替代。

对于自回归过程：

with pm.Model() as ar_model:
    sigma = pm.HalfNormal('sigma', sigma=1)
    rho = pm.Normal('rho', mu=0, sigma=0.5, shape=ar_order)
    init_dist = pm.Normal.dist(mu=0, sigma=sigma)

    y = pm.AR('y', rho=rho, sigma=sigma, init_dist=init_dist, observed=y_obs)

使用 LOO 或 WAIC 进行模型比较：

from scripts.model_comparison import compare_models, check_loo_reliability

# 使用 log_likelihood 拟合模型
models = {
    'Model1': idata1,
    'Model2': idata2,
    'Model3': idata3
}

# 使用 LOO 进行比较
comparison = compare_models(models, ic='loo')

# 检查可靠性
check_loo_reliability(models)

Δloo < 2：模型相似，选择更简单的模型
2 < Δloo < 4：对更好模型的证据较弱
4 < Δloo < 10：中等证据
Δloo > 10：对更好模型的强有力证据

检查 Pareto-k 值：

k < 0.7：LOO 可靠
k > 0.7：考虑使用 WAIC 或 k 折交叉验证

当模型相似时，对预测进行平均：

from scripts.model_comparison import model_averaging

averaged_pred, weights = model_averaging(models, var_name='y_obs')

尺度参数（σ, τ）：

pm.HalfNormal('sigma', sigma=1) - 默认选择
pm.Exponential('sigma', lam=1) - 替代方案
pm.Gamma('sigma', alpha=2, beta=1) - 更具信息性

pm.Normal('theta', mu=0, sigma=1) - 对于标准化数据
pm.StudentT('theta', nu=3, mu=0, sigma=1) - 对异常值稳健

pm.LogNormal('theta', mu=0, sigma=1)
pm.Gamma('theta', alpha=2, beta=1)

pm.Beta('p', alpha=2, beta=2) - 弱信息先验
pm.Uniform('p', lower=0, upper=1) - 无信息先验（谨慎使用）

pm.LKJCorr('corr', n=n_vars, eta=2) - eta=1 均匀分布，eta>1 偏好单位矩阵

连续结果变量：

pm.Normal('y', mu=mu, sigma=sigma) - 连续数据的默认选择
pm.StudentT('y', nu=nu, mu=mu, sigma=sigma) - 对异常值稳健

pm.Poisson('y', mu=lambda) - 等离散计数
pm.NegativeBinomial('y', mu=mu, alpha=alpha) - 过度离散计数
pm.ZeroInflatedPoisson('y', psi=psi, mu=mu) - 过多零值

二元结果变量：

pm.Bernoulli('y', p=p) 或 pm.Bernoulli('y', logit_p=logit_p)

分类结果变量：

pm.Categorical('y', p=probs)

参见： references/distributions.md 获取完整的分布参考

使用 NUTS 的 MCMC

默认且推荐用于大多数模型：

idata = pm.sample(
    draws=2000,
    tune=1000,
    chains=4,
    target_accept=0.9,
    random_seed=42
)

需要时调整：

发散 → target_accept=0.95 或更高
采样慢 → 使用 ADVI 进行初始化
离散参数 → 对离散变量使用 pm.Metropolis()

用于探索或初始化的快速近似：

with model:
    approx = pm.fit(n=20000, method='advi')

    # 用于初始化
    start = approx.sample(return_inferencedata=False)[0]
    idata = pm.sample(start=start)

比 MCMC 快得多
近似（可能低估不确定性）
适用于大型模型或快速探索

参见： references/sampling_inference.md 获取详细的采样指南

from scripts.model_diagnostics import create_diagnostic_report

create_diagnostic_report(
    idata,
    var_names=['alpha', 'beta', 'sigma'],
    output_dir='diagnostics/'
)

轨迹图
秩图（混合检查）
自相关图
能量图
ESS 演化图
汇总统计量 CSV 文件

from scripts.model_diagnostics import check_diagnostics

results = check_diagnostics(idata)

检查 R-hat、ESS、发散和树深度。

常见问题与解决方案

症状： idata.sample_stats.diverging.sum() > 0

增加 target_accept=0.95 或 0.99
使用非中心化参数化（层次模型）
添加更强的先验以约束参数
检查模型设定错误

症状： ESS < 400

采样更多样本：draws=5000
重新参数化以减少后验相关性
对于具有相关预测变量的回归，使用 QR 分解

症状： R-hat > 1.01

运行更长的链：tune=2000, draws=5000
检查多模态性
使用 ADVI 改进初始化

使用 ADVI 初始化
降低模型复杂度
增加并行化：cores=8, chains=8
如果合适，使用变分推断

始终标准化预测变量以获得更好的采样效果
使用弱信息先验（而非平坦先验）
使用命名维度（dims）以提高清晰度
对层次模型使用非中心化参数化
在拟合前检查先验预测

运行多条链（至少 4 条）以检查收敛性
使用 target_accept=0.9 作为基线（需要时更高）
包含 log_likelihood=True 以进行模型比较
设置随机种子以确保可重复性

在解释前检查诊断（R-hat、ESS、发散）
进行后验预测检查以验证模型
在适当时比较多个模型
报告不确定性（HDI 区间，而不仅仅是点估计）

从简单开始，逐步增加复杂性
先验预测检查 → 拟合 → 诊断 → 后验预测检查
根据检查结果迭代模型设定
记录假设和先验选择

参考资料（`references/`）

distributions.md：按类别（连续、离散、多元、混合、时间序列）组织的 PyMC 分布综合目录。在选择先验或似然函数时使用。
sampling_inference.md：采样算法（NUTS、Metropolis、SMC）、变分推断（ADVI、SVGD）和处理采样问题的详细指南。在遇到收敛问题或选择推断方法时使用。
workflows.md：常见模型类型、数据准备、先验选择和模型验证的完整工作流示例和代码模式。作为标准贝叶斯分析的参考手册使用。

脚本（`scripts/`）

model_diagnostics.py：自动化诊断检查和报告生成。函数：check_diagnostics() 用于快速检查，create_diagnostic_report() 用于带图的综合分析。
model_comparison.py：使用 LOO/WAIC 的模型比较工具。函数：compare_models()、check_loo_reliability()、model_averaging()。

模板（`assets/`）

linear_regression_template.py：贝叶斯线性回归的完整模板，包含完整工作流（数据准备、先验检查、拟合、诊断、预测）。
hierarchical_model_template.py：层次/多级模型的完整模板，包含非中心化参数化和组级别分析。

with pm.Model(coords={'var': names}) as model:
    # 先验分布
    param = pm.Normal('param', mu=0, sigma=1, dims='var')
    # 似然函数
    y = pm.Normal('y', mu=..., sigma=..., observed=data)

idata = pm.sample(draws=2000, tune=1000, chains=4, target_accept=0.9)

from scripts.model_diagnostics import check_diagnostics
check_diagnostics(idata)

from scripts.model_comparison import compare_models
compare_models({'m1': idata1, 'm2': idata2}, ic='loo')

with model:
    pm.set_data({'X': X_new})
    pred = pm.sample_posterior_predictive(idata.posterior)

PyMC 与 ArviZ 集成，用于可视化和诊断
使用 pm.model_to_graphviz(model) 可视化模型结构
使用 idata.to_netcdf('results.nc') 保存结果
使用 az.from_netcdf('results.nc') 加载
对于非常大的模型，考虑小批量 ADVI 或数据子采样

🇺🇸English

PyMC Bayesian Modeling

Overview

PyMC is a Python library for Bayesian modeling and probabilistic programming. Build, fit, validate, and compare Bayesian models using PyMC's modern API (version 5.x+), including hierarchical models, MCMC sampling (NUTS), variational inference, and model comparison (LOO, WAIC).

When to Use This Skill

This skill should be used when:

Building Bayesian models (linear/logistic regression, hierarchical models, time series, etc.)
Performing MCMC sampling or variational inference
Conducting prior/posterior predictive checks
Diagnosing sampling issues (divergences, convergence, ESS)
Comparing multiple models using information criteria (LOO, WAIC)
Implementing uncertainty quantification through Bayesian methods
Working with hierarchical/multilevel data structures
Handling missing data or measurement error in a principled way

Standard Bayesian Workflow

Follow this workflow for building and validating Bayesian models:

1. Data Preparation

import pymc as pm
import arviz as az
import numpy as np

# Load and prepare data
X = ...  # Predictors
y = ...  # Outcomes

# Standardize predictors for better sampling
X_mean = X.mean(axis=0)
X_std = X.std(axis=0)
X_scaled = (X - X_mean) / X_std

Key practices:

Standardize continuous predictors (improves sampling efficiency)
Center outcomes when possible
Handle missing data explicitly (treat as parameters)
Use named dimensions with coords for clarity

2. Model Building

coords = {
    'predictors': ['var1', 'var2', 'var3'],
    'obs_id': np.arange(len(y))
}

with pm.Model(coords=coords) as model:
    # Priors
    alpha = pm.Normal('alpha', mu=0, sigma=1)
    beta = pm.Normal('beta', mu=0, sigma=1, dims='predictors')
    sigma = pm.HalfNormal('sigma', sigma=1)

    # Linear predictor
    mu = alpha + pm.math.dot(X_scaled, beta)

    # Likelihood
    y_obs = pm.Normal('y_obs', mu=mu, sigma=sigma, observed=y, dims='obs_id')

Key practices:

Use weakly informative priors (not flat priors)
Use HalfNormal or Exponential for scale parameters
Use named dimensions (dims) instead of shape when possible
Use pm.Data() for values that will be updated for predictions

3. Prior Predictive Check

Always validate priors before fitting:

with model:
    prior_pred = pm.sample_prior_predictive(samples=1000, random_seed=42)

# Visualize
az.plot_ppc(prior_pred, group='prior')

Check:

Do prior predictions span reasonable values?
Are extreme values plausible given domain knowledge?
If priors generate implausible data, adjust and re-check

4. Fit Model

with model:
    # Optional: Quick exploration with ADVI
    # approx = pm.fit(n=20000)

    # Full MCMC inference
    idata = pm.sample(
        draws=2000,
        tune=1000,
        chains=4,
        target_accept=0.9,
        random_seed=42,
        idata_kwargs={'log_likelihood': True}  # For model comparison
    )

Key parameters:

draws=2000: Number of samples per chain
tune=1000: Warmup samples (discarded)
chains=4: Run 4 chains for convergence checking
target_accept=0.9: Higher for difficult posteriors (0.95-0.99)
Include log_likelihood=True for model comparison

5. Check Diagnostics

Use the diagnostic script:

from scripts.model_diagnostics import check_diagnostics

results = check_diagnostics(idata, var_names=['alpha', 'beta', 'sigma'])

Check:

R-hat < 1.01: Chains have converged
ESS > 400: Sufficient effective samples
No divergences : NUTS sampled successfully
Trace plots : Chains should mix well (fuzzy caterpillar)

If issues arise:

Divergences → Increase target_accept=0.95, use non-centered parameterization
Low ESS → Sample more draws, reparameterize to reduce correlation
High R-hat → Run longer, check for multimodality

6. Posterior Predictive Check

Validate model fit:

with model:
    pm.sample_posterior_predictive(idata, extend_inferencedata=True, random_seed=42)

# Visualize
az.plot_ppc(idata)

Check:

Do posterior predictions capture observed data patterns?
Are systematic deviations evident (model misspecification)?
Consider alternative models if fit is poor

7. Analyze Results

# Summary statistics
print(az.summary(idata, var_names=['alpha', 'beta', 'sigma']))

# Posterior distributions
az.plot_posterior(idata, var_names=['alpha', 'beta', 'sigma'])

# Coefficient estimates
az.plot_forest(idata, var_names=['beta'], combined=True)

8. Make Predictions

X_new = ...  # New predictor values
X_new_scaled = (X_new - X_mean) / X_std

with model:
    pm.set_data({'X_scaled': X_new_scaled})
    post_pred = pm.sample_posterior_predictive(
        idata.posterior,
        var_names=['y_obs'],
        random_seed=42
    )

# Extract prediction intervals
y_pred_mean = post_pred.posterior_predictive['y_obs'].mean(dim=['chain', 'draw'])
y_pred_hdi = az.hdi(post_pred.posterior_predictive, var_names=['y_obs'])

Common Model Patterns

Linear Regression

For continuous outcomes with linear relationships:

with pm.Model() as linear_model:
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10, shape=n_predictors)
    sigma = pm.HalfNormal('sigma', sigma=1)

    mu = alpha + pm.math.dot(X, beta)
    y = pm.Normal('y', mu=mu, sigma=sigma, observed=y_obs)

Use template: assets/linear_regression_template.py

Logistic Regression

For binary outcomes:

with pm.Model() as logistic_model:
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10, shape=n_predictors)

    logit_p = alpha + pm.math.dot(X, beta)
    y = pm.Bernoulli('y', logit_p=logit_p, observed=y_obs)

Hierarchical Models

For grouped data (use non-centered parameterization):

with pm.Model(coords={'groups': group_names}) as hierarchical_model:
    # Hyperpriors
    mu_alpha = pm.Normal('mu_alpha', mu=0, sigma=10)
    sigma_alpha = pm.HalfNormal('sigma_alpha', sigma=1)

    # Group-level (non-centered)
    alpha_offset = pm.Normal('alpha_offset', mu=0, sigma=1, dims='groups')
    alpha = pm.Deterministic('alpha', mu_alpha + sigma_alpha * alpha_offset, dims='groups')

    # Observation-level
    mu = alpha[group_idx]
    sigma = pm.HalfNormal('sigma', sigma=1)
    y = pm.Normal('y', mu=mu, sigma=sigma, observed=y_obs)

Use template: assets/hierarchical_model_template.py

Critical: Always use non-centered parameterization for hierarchical models to avoid divergences.

Poisson Regression

For count data:

with pm.Model() as poisson_model:
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10, shape=n_predictors)

    log_lambda = alpha + pm.math.dot(X, beta)
    y = pm.Poisson('y', mu=pm.math.exp(log_lambda), observed=y_obs)

For overdispersed counts, use NegativeBinomial instead.

Time Series

For autoregressive processes:

with pm.Model() as ar_model:
    sigma = pm.HalfNormal('sigma', sigma=1)
    rho = pm.Normal('rho', mu=0, sigma=0.5, shape=ar_order)
    init_dist = pm.Normal.dist(mu=0, sigma=sigma)

    y = pm.AR('y', rho=rho, sigma=sigma, init_dist=init_dist, observed=y_obs)

Model Comparison

Comparing Models

Use LOO or WAIC for model comparison:

from scripts.model_comparison import compare_models, check_loo_reliability

# Fit models with log_likelihood
models = {
    'Model1': idata1,
    'Model2': idata2,
    'Model3': idata3
}

# Compare using LOO
comparison = compare_models(models, ic='loo')

# Check reliability
check_loo_reliability(models)

Interpretation:

Δloo < 2: Models are similar, choose simpler model
2 < Δloo < 4: Weak evidence for better model
4 < Δloo < 10: Moderate evidence
Δloo > 10: Strong evidence for better model

Check Pareto-k values:

k < 0.7: LOO reliable
k > 0.7: Consider WAIC or k-fold CV

Model Averaging

When models are similar, average predictions:

from scripts.model_comparison import model_averaging

averaged_pred, weights = model_averaging(models, var_name='y_obs')

Distribution Selection Guide

For Priors

Scale parameters (σ, τ):

pm.HalfNormal('sigma', sigma=1) - Default choice
pm.Exponential('sigma', lam=1) - Alternative
pm.Gamma('sigma', alpha=2, beta=1) - More informative

Unbounded parameters :

pm.Normal('theta', mu=0, sigma=1) - For standardized data
pm.StudentT('theta', nu=3, mu=0, sigma=1) - Robust to outliers

Positive parameters :

pm.LogNormal('theta', mu=0, sigma=1)
pm.Gamma('theta', alpha=2, beta=1)

Probabilities :

pm.Beta('p', alpha=2, beta=2) - Weakly informative
pm.Uniform('p', lower=0, upper=1) - Non-informative (use sparingly)

Correlation matrices :

pm.LKJCorr('corr', n=n_vars, eta=2) - eta=1 uniform, eta>1 prefers identity

For Likelihoods

Continuous outcomes :

pm.Normal('y', mu=mu, sigma=sigma) - Default for continuous data
pm.StudentT('y', nu=nu, mu=mu, sigma=sigma) - Robust to outliers

Count data :

pm.Poisson('y', mu=lambda) - Equidispersed counts
pm.NegativeBinomial('y', mu=mu, alpha=alpha) - Overdispersed counts
pm.ZeroInflatedPoisson('y', psi=psi, mu=mu) - Excess zeros

Binary outcomes :

pm.Bernoulli('y', p=p) or pm.Bernoulli('y', logit_p=logit_p)

Categorical outcomes :

pm.Categorical('y', p=probs)

See: references/distributions.md for comprehensive distribution reference

Sampling and Inference

MCMC with NUTS

Default and recommended for most models:

idata = pm.sample(
    draws=2000,
    tune=1000,
    chains=4,
    target_accept=0.9,
    random_seed=42
)

Adjust when needed:

Divergences → target_accept=0.95 or higher
Slow sampling → Use ADVI for initialization
Discrete parameters → Use pm.Metropolis() for discrete vars

Variational Inference

Fast approximation for exploration or initialization:

with model:
    approx = pm.fit(n=20000, method='advi')

    # Use for initialization
    start = approx.sample(return_inferencedata=False)[0]
    idata = pm.sample(start=start)

Trade-offs:

Much faster than MCMC
Approximate (may underestimate uncertainty)
Good for large models or quick exploration

See: references/sampling_inference.md for detailed sampling guide

Diagnostic Scripts

Comprehensive Diagnostics

from scripts.model_diagnostics import create_diagnostic_report

create_diagnostic_report(
    idata,
    var_names=['alpha', 'beta', 'sigma'],
    output_dir='diagnostics/'
)

Creates:

Trace plots
Rank plots (mixing check)
Autocorrelation plots
Energy plots
ESS evolution
Summary statistics CSV

Quick Diagnostic Check

from scripts.model_diagnostics import check_diagnostics

results = check_diagnostics(idata)

Checks R-hat, ESS, divergences, and tree depth.

Common Issues and Solutions

Divergences

Symptom: idata.sample_stats.diverging.sum() > 0

Solutions:

Increase target_accept=0.95 or 0.99
Use non-centered parameterization (hierarchical models)
Add stronger priors to constrain parameters
Check for model misspecification

Low Effective Sample Size

Symptom: ESS < 400

Solutions:

Sample more draws: draws=5000
Reparameterize to reduce posterior correlation
Use QR decomposition for regression with correlated predictors

High R-hat

Symptom: R-hat > 1.01

Solutions:

Run longer chains: tune=2000, draws=5000
Check for multimodality
Improve initialization with ADVI

Slow Sampling

Solutions:

Use ADVI initialization
Reduce model complexity
Increase parallelization: cores=8, chains=8
Use variational inference if appropriate

Best Practices

Model Building

Always standardize predictors for better sampling
Use weakly informative priors (not flat)
Use named dimensions (dims) for clarity
Non-centered parameterization for hierarchical models
Check prior predictive before fitting

Sampling

Run multiple chains (at least 4) for convergence
Usetarget_accept=0.9 as baseline (higher if needed)
Includelog_likelihood=True for model comparison
Set random seed for reproducibility

Validation

Check diagnostics before interpretation (R-hat, ESS, divergences)
Posterior predictive check for model validation
Compare multiple models when appropriate
Report uncertainty (HDI intervals, not just point estimates)

Workflow

Start simple, add complexity gradually
Prior predictive check → Fit → Diagnostics → Posterior predictive check
Iterate on model specification based on checks
Document assumptions and prior choices

Resources

This skill includes:

References (`references/`)

distributions.md : Comprehensive catalog of PyMC distributions organized by category (continuous, discrete, multivariate, mixture, time series). Use when selecting priors or likelihoods.
sampling_inference.md : Detailed guide to sampling algorithms (NUTS, Metropolis, SMC), variational inference (ADVI, SVGD), and handling sampling issues. Use when encountering convergence problems or choosing inference methods.
workflows.md : Complete workflow examples and code patterns for common model types, data preparation, prior selection, and model validation. Use as a cookbook for standard Bayesian analyses.

Scripts (`scripts/`)

model_diagnostics.py : Automated diagnostic checking and report generation. Functions: check_diagnostics() for quick checks, create_diagnostic_report() for comprehensive analysis with plots.
model_comparison.py : Model comparison utilities using LOO/WAIC. Functions: compare_models(), check_loo_reliability(), model_averaging().

Templates (`assets/`)

linear_regression_template.py : Complete template for Bayesian linear regression with full workflow (data prep, prior checks, fitting, diagnostics, predictions).
hierarchical_model_template.py : Complete template for hierarchical/multilevel models with non-centered parameterization and group-level analysis.

Quick Reference

Model Building

with pm.Model(coords={'var': names}) as model:
    # Priors
    param = pm.Normal('param', mu=0, sigma=1, dims='var')
    # Likelihood
    y = pm.Normal('y', mu=..., sigma=..., observed=data)

Sampling

idata = pm.sample(draws=2000, tune=1000, chains=4, target_accept=0.9)

Diagnostics

from scripts.model_diagnostics import check_diagnostics
check_diagnostics(idata)

Model Comparison

from scripts.model_comparison import compare_models
compare_models({'m1': idata1, 'm2': idata2}, ic='loo')

Predictions

with model:
    pm.set_data({'X': X_new})
    pred = pm.sample_posterior_predictive(idata.posterior)

Additional Notes

PyMC integrates with ArviZ for visualization and diagnostics
Use pm.model_to_graphviz(model) to visualize model structure
Save results with idata.to_netcdf('results.nc')
Load with az.from_netcdf('results.nc')
For very large models, consider minibatch ADVI or data subsampling

Weekly Installs

143

Repository

davila7/claude-…emplates

GitHub Stars

22.6K

First Seen

Jan 21, 2026

Security Audits

Gen Agent Trust HubPass SocketPass SnykPass

Installed on

opencode117

claude-code116

gemini-cli107

cursor105

codex95

antigravity92

专业SEO审计工具：全面网站诊断、技术SEO优化与页面分析指南

66,700 周安装

PyMC贝叶斯建模指南：Python概率编程与MCMC采样实践教程

🇨🇳中文介绍

PyMC 贝叶斯建模

概述

何时使用此技能

标准贝叶斯工作流

1. 数据准备

2. 模型构建

相关 Skills

3. 先验预测检查

4. 拟合模型

5. 检查诊断

6. 后验预测检查

7. 分析结果

8. 进行预测

常见模型模式

线性回归

逻辑回归

层次模型

泊松回归

时间序列

模型比较

比较模型

模型平均

分布选择指南

对于先验分布

对于似然函数

采样与推断

使用 NUTS 的 MCMC

变分推断

诊断脚本

综合诊断

快速诊断检查

常见问题与解决方案

发散

有效样本量低

R-hat 高

采样慢

最佳实践

模型构建

采样

验证

工作流

资源

参考资料（references/）

脚本（scripts/）

模板（assets/）

快速参考

模型构建

采样

诊断

模型比较

预测

附加说明

🇺🇸English

PyMC Bayesian Modeling

Overview

When to Use This Skill

Standard Bayesian Workflow

1. Data Preparation

2. Model Building

3. Prior Predictive Check

4. Fit Model

5. Check Diagnostics

6. Posterior Predictive Check

7. Analyze Results

8. Make Predictions

Common Model Patterns

Linear Regression

Logistic Regression

Hierarchical Models

Poisson Regression

Time Series

Model Comparison

Comparing Models

Model Averaging

Distribution Selection Guide

For Priors

For Likelihoods

Sampling and Inference

参考资料（`references/`）

脚本（`scripts/`）

模板（`assets/`）

References (`references/`)

Scripts (`scripts/`)

Templates (`assets/`)