scikit-survival：Python生存分析库，处理删失数据与Cox模型、随机生存森林

scikit-survival by davila7/claude-code-templates

163 周安装量

23,400 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/davila7/claude-code-templates --skill scikit-survival

AI/机器学习 Python Web框架数据分析

🇨🇳中文介绍

scikit-survival: Python 中的生存分析

概述

scikit-survival 是一个基于 scikit-learn 构建的、用于生存分析的 Python 库。它提供了专门用于事件时间分析的工具，能够处理删失数据（即某些观测结果仅部分已知）这一独特挑战。

生存分析旨在建立协变量与事件发生时间之间的联系，同时考虑删失记录（特别是来自那些参与者在观察期间未经历事件的研究的右删失数据）。

何时使用此技能

在以下情况下使用此技能：

执行生存分析或事件时间建模
处理删失数据（右删失、左删失或区间删失）
拟合 Cox 比例风险模型（标准或惩罚模型）
构建集成生存模型（随机生存森林、梯度提升）
训练生存支持向量机
评估生存模型性能（一致性指数、Brier 分数、时间依赖性 AUC）
估计 Kaplan-Meier 或 Nelson-Aalen 曲线
分析竞争风险
预处理生存数据或处理生存数据集中的缺失值
使用 scikit-survival 库进行任何分析

核心功能

1. 模型类型与选择

scikit-survival 提供了多种模型系列，每种都适用于不同的场景：

Cox 比例风险模型

适用于：具有可解释系数的标准生存分析

CoxPHSurvivalAnalysis：基本 Cox 模型
CoxnetSurvivalAnalysis：用于高维数据的带弹性网络的惩罚 Cox 模型
IPCRidge：用于加速失效时间模型的岭回归

参见：获取关于 Cox 模型、正则化和解释的详细指南

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

2. 数据准备与预处理

在建模之前，请妥善准备生存数据：

from sksurv.util import Surv

# 从单独的数组创建
y = Surv.from_arrays(event=event_array, time=time_array)

# 从 DataFrame 创建
y = Surv.from_dataframe('event', 'time', df)

基本预处理步骤

处理缺失值：特征的插补策略
编码分类变量：独热编码或标签编码
标准化特征：对于 SVM 和正则化 Cox 模型至关重要
验证数据质量：检查负时间、每个特征是否有足够的事件
训练-测试分割：保持不同分割间相似的删失率

参见：references/data-handling.md 获取完整的预处理工作流程、数据验证和最佳实践

正确的评估对于生存模型至关重要。使用考虑删失的适当指标：

一致性指数 (C-index)

用于排序/区分的主要指标：

Harrell 的 C-index：用于低删失率 (<40%)
Uno 的 C-index：用于中高删失率 (>40%) - 更稳健

from sksurv.metrics import concordance_index_censored, concordance_index_ipcw

# Harrell 的 C-index
c_harrell = concordance_index_censored(y_test['event'], y_test['time'], risk_scores)[0]

# Uno 的 C-index (推荐)
c_uno = concordance_index_ipcw(y_train, y_test, risk_scores)[0]

评估特定时间点的区分能力：

from sksurv.metrics import cumulative_dynamic_auc

times = [365, 730, 1095]  # 1, 2, 3 年
auc, mean_auc = cumulative_dynamic_auc(y_train, y_test, risk_scores, times)

评估区分能力和校准能力：

from sksurv.metrics import integrated_brier_score

ibs = integrated_brier_score(y_train, y_test, survival_functions, times)

参见：references/evaluation-metrics.md 获取全面的评估指南、指标选择以及将评分器与交叉验证结合使用

4. 竞争风险分析

处理存在多种互斥事件类型的情况：

from sksurv.nonparametric import cumulative_incidence_competing_risks

# 估计每种事件类型的累积发生率
time_points, cif_event1, cif_event2 = cumulative_incidence_competing_risks(y)

在以下情况下使用竞争风险分析：

存在多种互斥事件类型（例如，不同原因导致的死亡）
一种事件的发生会阻止其他事件
需要特定事件类型的概率估计

参见：references/competing-risks.md 获取详细的竞争风险方法、特定原因风险模型和解释

无需参数假设即可估计生存函数：

Kaplan-Meier 估计器

from sksurv.nonparametric import kaplan_meier_estimator

time, survival_prob = kaplan_meier_estimator(y['event'], y['time'])

Nelson-Aalen 估计器

from sksurv.nonparametric import nelson_aalen_estimator

time, cumulative_hazard = nelson_aalen_estimator(y['event'], y['time'])

工作流程 1：标准生存分析

from sksurv.datasets import load_breast_cancer
from sksurv.linear_model import CoxPHSurvivalAnalysis
from sksurv.metrics import concordance_index_ipcw
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 1. 加载并准备数据
X, y = load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 2. 预处理
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# 3. 拟合模型
estimator = CoxPHSurvivalAnalysis()
estimator.fit(X_train_scaled, y_train)

# 4. 预测
risk_scores = estimator.predict(X_test_scaled)

# 5. 评估
c_index = concordance_index_ipcw(y_train, y_test, risk_scores)[0]
print(f"C-index: {c_index:.3f}")

工作流程 2：具有特征选择的高维数据

from sksurv.linear_model import CoxnetSurvivalAnalysis
from sklearn.model_selection import GridSearchCV
from sksurv.metrics import as_concordance_index_ipcw_scorer

# 1. 使用惩罚 Cox 模型进行特征选择
estimator = CoxnetSurvivalAnalysis(l1_ratio=0.9)  # 类似 Lasso

# 2. 使用交叉验证调整正则化参数
param_grid = {'alpha_min_ratio': [0.01, 0.001]}
cv = GridSearchCV(estimator, param_grid,
                  scoring=as_concordance_index_ipcw_scorer(), cv=5)
cv.fit(X, y)

# 3. 识别选定的特征
best_model = cv.best_estimator_
selected_features = np.where(best_model.coef_ != 0)[0]

工作流程 3：为获得最佳性能的集成方法

from sksurv.ensemble import GradientBoostingSurvivalAnalysis
from sklearn.model_selection import GridSearchCV

# 1. 定义参数网格
param_grid = {
    'learning_rate': [0.01, 0.05, 0.1],
    'n_estimators': [100, 200, 300],
    'max_depth': [3, 5, 7]
}

# 2. 网格搜索
gbs = GradientBoostingSurvivalAnalysis()
cv = GridSearchCV(gbs, param_grid, cv=5,
                  scoring=as_concordance_index_ipcw_scorer(), n_jobs=-1)
cv.fit(X_train, y_train)

# 3. 评估最佳模型
best_model = cv.best_estimator_
risk_scores = best_model.predict(X_test)
c_index = concordance_index_ipcw(y_train, y_test, risk_scores)[0]

工作流程 4：全面的模型比较

from sksurv.linear_model import CoxPHSurvivalAnalysis
from sksurv.ensemble import RandomSurvivalForest, GradientBoostingSurvivalAnalysis
from sksurv.svm import FastSurvivalSVM
from sksurv.metrics import concordance_index_ipcw, integrated_brier_score

# 定义模型
models = {
    'Cox': CoxPHSurvivalAnalysis(),
    'RSF': RandomSurvivalForest(n_estimators=100, random_state=42),
    'GBS': GradientBoostingSurvivalAnalysis(random_state=42),
    'SVM': FastSurvivalSVM(random_state=42)
}

# 评估每个模型
results = {}
for name, model in models.items():
    model.fit(X_train_scaled, y_train)
    risk_scores = model.predict(X_test_scaled)
    c_index = concordance_index_ipcw(y_train, y_test, risk_scores)[0]
    results[name] = c_index
    print(f"{name}: C-index = {c_index:.3f}")

# 选择最佳模型
best_model_name = max(results, key=results.get)
print(f"\n最佳模型: {best_model_name}")

与 scikit-learn 集成

scikit-survival 完全集成了 scikit-learn 的生态系统：

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import cross_val_score, GridSearchCV

# 使用管道
pipeline = Pipeline([
    ('scaler', StandardScaler()),
    ('model', CoxPHSurvivalAnalysis())
])

# 使用交叉验证
scores = cross_val_score(pipeline, X, y, cv=5,
                         scoring=as_concordance_index_ipcw_scorer())

# 使用网格搜索
param_grid = {'model__alpha': [0.1, 1.0, 10.0]}
cv = GridSearchCV(pipeline, param_grid, cv=5)
cv.fit(X, y)

始终对特征进行标准化，特别是对于 SVM 和正则化 Cox 模型
当删失率 > 40% 时，使用 Uno 的 C-index 而不是 Harrell 的
报告多个评估指标（C-index、综合 Brier 分数、时间依赖性 AUC）
检查 Cox 模型的比例风险假设
使用交叉验证进行超参数调优，并配合适当的评分器
在建模前验证数据质量（检查负时间、每个特征是否有足够的事件）
比较多种模型类型以找到最佳性能
使用置换重要性评估随机生存森林（而非内置的重要性）
当存在多种事件类型时，考虑竞争风险
在分析中记录删失机制和删失率

应避免的常见陷阱

在高删失率下使用 Harrell 的 C-index → 使用 Uno 的 C-index
未对 SVM 的特征进行标准化 → 始终进行标准化
忘记将 y_train 传递给 concordance_index_ipcw → IPCW 计算所必需
将竞争事件视为删失 → 使用竞争风险方法
未检查每个特征是否有足够的事件 → 经验法则：每个特征至少 10 个事件
使用 RSF 的内置特征重要性 → 使用置换重要性
忽略比例风险假设 → 验证或使用替代模型
在交叉验证中未使用适当的评分器 → 使用 as_concordance_index_ipcw_scorer()

此技能包含针对特定主题的详细参考文件：

references/cox-models.md：Cox 比例风险模型、惩罚 Cox (CoxNet)、IPCRidge、正则化策略和解释的完整指南
references/ensemble-models.md：随机生存森林、梯度提升、超参数调优、特征重要性和模型选择
references/evaluation-metrics.md：一致性指数（Harrell 与 Uno）、时间依赖性 AUC、Brier 分数、全面的评估流程
references/data-handling.md：数据加载、预处理工作流程、处理缺失数据、特征编码、验证检查
references/svm-models.md：生存支持向量机、核选择、临床核变换、超参数调优
references/competing-risks.md：竞争风险分析、累积发生率函数、特定原因风险模型

当需要特定任务的详细信息时，请加载这些参考文件。

官方文档：https://scikit-survival.readthedocs.io/
GitHub 仓库：https://github.com/sebp/scikit-survival
内置数据集：使用 sksurv.datasets 获取练习数据集（GBSG2、WHAS500、退伍军人肺癌等）
API 参考：完整的类和函数列表位于 https://scikit-survival.readthedocs.io/en/stable/api/index.html

快速参考：关键导入

# 模型
from sksurv.linear_model import CoxPHSurvivalAnalysis, CoxnetSurvivalAnalysis, IPCRidge
from sksurv.ensemble import RandomSurvivalForest, GradientBoostingSurvivalAnalysis
from sksurv.svm import FastSurvivalSVM, FastKernelSurvivalSVM
from sksurv.tree import SurvivalTree

# 评估指标
from sksurv.metrics import (
    concordance_index_censored,
    concordance_index_ipcw,
    cumulative_dynamic_auc,
    brier_score,
    integrated_brier_score,
    as_concordance_index_ipcw_scorer,
    as_integrated_brier_score_scorer
)

# 非参数估计
from sksurv.nonparametric import (
    kaplan_meier_estimator,
    nelson_aalen_estimator,
    cumulative_incidence_competing_risks
)

# 数据处理
from sksurv.util import Surv
from sksurv.preprocessing import OneHotEncoder, encode_categorical
from sksurv.datasets import load_gbsg2, load_breast_cancer, load_veterans_lung_cancer

# 核函数
from sksurv.kernels import ClinicalKernelTransform

🇺🇸English

scikit-survival: Survival Analysis in Python

Overview

scikit-survival is a Python library for survival analysis built on top of scikit-learn. It provides specialized tools for time-to-event analysis, handling the unique challenge of censored data where some observations are only partially known.

Survival analysis aims to establish connections between covariates and the time of an event, accounting for censored records (particularly right-censored data from studies where participants don't experience events during observation periods).

When to Use This Skill

Use this skill when:

Performing survival analysis or time-to-event modeling
Working with censored data (right-censored, left-censored, or interval-censored)
Fitting Cox proportional hazards models (standard or penalized)
Building ensemble survival models (Random Survival Forests, Gradient Boosting)
Training Survival Support Vector Machines
Evaluating survival model performance (concordance index, Brier score, time-dependent AUC)
Estimating Kaplan-Meier or Nelson-Aalen curves
Analyzing competing risks
Preprocessing survival data or handling missing values in survival datasets
Conducting any analysis using the scikit-survival library

Core Capabilities

1. Model Types and Selection

scikit-survival provides multiple model families, each suited for different scenarios:

Cox Proportional Hazards Models

Use for : Standard survival analysis with interpretable coefficients

CoxPHSurvivalAnalysis: Basic Cox model
CoxnetSurvivalAnalysis: Penalized Cox with elastic net for high-dimensional data
IPCRidge: Ridge regression for accelerated failure time models

See : references/cox-models.md for detailed guidance on Cox models, regularization, and interpretation

Ensemble Methods

Use for : High predictive performance with complex non-linear relationships

RandomSurvivalForest: Robust, non-parametric ensemble method
GradientBoostingSurvivalAnalysis: Tree-based boosting for maximum performance
ComponentwiseGradientBoostingSurvivalAnalysis: Linear boosting with feature selection
ExtraSurvivalTrees: Extremely randomized trees for additional regularization

See : references/ensemble-models.md for comprehensive guidance on ensemble methods, hyperparameter tuning, and when to use each model

Survival Support Vector Machines

Use for : Medium-sized datasets with margin-based learning

FastSurvivalSVM: Linear SVM optimized for speed
FastKernelSurvivalSVM: Kernel SVM for non-linear relationships
HingeLossSurvivalSVM: SVM with hinge loss
ClinicalKernelTransform: Specialized kernel for clinical + molecular data

See : references/svm-models.md for detailed SVM guidance, kernel selection, and hyperparameter tuning

Model Selection Decision Tree

Start
├─ High-dimensional data (p > n)?
│  ├─ Yes → CoxnetSurvivalAnalysis (elastic net)
│  └─ No → Continue
│
├─ Need interpretable coefficients?
│  ├─ Yes → CoxPHSurvivalAnalysis or ComponentwiseGradientBoostingSurvivalAnalysis
│  └─ No → Continue
│
├─ Complex non-linear relationships expected?
│  ├─ Yes
│  │  ├─ Large dataset (n > 1000) → GradientBoostingSurvivalAnalysis
│  │  ├─ Medium dataset → RandomSurvivalForest or FastKernelSurvivalSVM
│  │  └─ Small dataset → RandomSurvivalForest
│  └─ No → CoxPHSurvivalAnalysis or FastSurvivalSVM
│
└─ For maximum performance → Try multiple models and compare

2. Data Preparation and Preprocessing

Before modeling, properly prepare survival data:

Creating Survival Outcomes

from sksurv.util import Surv

# From separate arrays
y = Surv.from_arrays(event=event_array, time=time_array)

# From DataFrame
y = Surv.from_dataframe('event', 'time', df)

Essential Preprocessing Steps

Handle missing values : Imputation strategies for features
Encode categorical variables : One-hot encoding or label encoding
Standardize features : Critical for SVMs and regularized Cox models
Validate data quality : Check for negative times, sufficient events per feature
Train-test split : Maintain similar censoring rates across splits

See : references/data-handling.md for complete preprocessing workflows, data validation, and best practices

3. Model Evaluation

Proper evaluation is critical for survival models. Use appropriate metrics that account for censoring:

Concordance Index (C-index)

Primary metric for ranking/discrimination:

Harrell's C-index : Use for low censoring (<40%)
Uno's C-index : Use for moderate to high censoring (>40%) - more robust

from sksurv.metrics import concordance_index_censored, concordance_index_ipcw

Harrell's C-index

c_harrell = concordance_index_censored(y_test['event'], y_test['time'], risk_scores)[0]

Uno's C-index (recommended)

c_uno = concordance_index_ipcw(y_train, y_test, risk_scores)[0]

Time-Dependent AUC

Evaluate discrimination at specific time points:

from sksurv.metrics import cumulative_dynamic_auc

times = [365, 730, 1095]  # 1, 2, 3 years
auc, mean_auc = cumulative_dynamic_auc(y_train, y_test, risk_scores, times)

Brier Score

Assess both discrimination and calibration:

from sksurv.metrics import integrated_brier_score

ibs = integrated_brier_score(y_train, y_test, survival_functions, times)

See : references/evaluation-metrics.md for comprehensive evaluation guidance, metric selection, and using scorers with cross-validation

4. Competing Risks Analysis

Handle situations with multiple mutually exclusive event types:

from sksurv.nonparametric import cumulative_incidence_competing_risks

# Estimate cumulative incidence for each event type
time_points, cif_event1, cif_event2 = cumulative_incidence_competing_risks(y)

Use competing risks when :

Multiple mutually exclusive event types exist (e.g., death from different causes)
Occurrence of one event prevents others
Need probability estimates for specific event types

See : references/competing-risks.md for detailed competing risks methods, cause-specific hazard models, and interpretation

5. Non-parametric Estimation

Estimate survival functions without parametric assumptions:

Kaplan-Meier Estimator

from sksurv.nonparametric import kaplan_meier_estimator

time, survival_prob = kaplan_meier_estimator(y['event'], y['time'])

Nelson-Aalen Estimator

from sksurv.nonparametric import nelson_aalen_estimator

time, cumulative_hazard = nelson_aalen_estimator(y['event'], y['time'])

Typical Workflows

Workflow 1: Standard Survival Analysis

from sksurv.datasets import load_breast_cancer
from sksurv.linear_model import CoxPHSurvivalAnalysis
from sksurv.metrics import concordance_index_ipcw
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 1. Load and prepare data
X, y = load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 2. Preprocess
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# 3. Fit model
estimator = CoxPHSurvivalAnalysis()
estimator.fit(X_train_scaled, y_train)

# 4. Predict
risk_scores = estimator.predict(X_test_scaled)

# 5. Evaluate
c_index = concordance_index_ipcw(y_train, y_test, risk_scores)[0]
print(f"C-index: {c_index:.3f}")

Workflow 2: High-Dimensional Data with Feature Selection

from sksurv.linear_model import CoxnetSurvivalAnalysis
from sklearn.model_selection import GridSearchCV
from sksurv.metrics import as_concordance_index_ipcw_scorer

# 1. Use penalized Cox for feature selection
estimator = CoxnetSurvivalAnalysis(l1_ratio=0.9)  # Lasso-like

# 2. Tune regularization with cross-validation
param_grid = {'alpha_min_ratio': [0.01, 0.001]}
cv = GridSearchCV(estimator, param_grid,
                  scoring=as_concordance_index_ipcw_scorer(), cv=5)
cv.fit(X, y)

# 3. Identify selected features
best_model = cv.best_estimator_
selected_features = np.where(best_model.coef_ != 0)[0]

Workflow 3: Ensemble Method for Maximum Performance

from sksurv.ensemble import GradientBoostingSurvivalAnalysis
from sklearn.model_selection import GridSearchCV

# 1. Define parameter grid
param_grid = {
    'learning_rate': [0.01, 0.05, 0.1],
    'n_estimators': [100, 200, 300],
    'max_depth': [3, 5, 7]
}

# 2. Grid search
gbs = GradientBoostingSurvivalAnalysis()
cv = GridSearchCV(gbs, param_grid, cv=5,
                  scoring=as_concordance_index_ipcw_scorer(), n_jobs=-1)
cv.fit(X_train, y_train)

# 3. Evaluate best model
best_model = cv.best_estimator_
risk_scores = best_model.predict(X_test)
c_index = concordance_index_ipcw(y_train, y_test, risk_scores)[0]

Workflow 4: Comprehensive Model Comparison

from sksurv.linear_model import CoxPHSurvivalAnalysis
from sksurv.ensemble import RandomSurvivalForest, GradientBoostingSurvivalAnalysis
from sksurv.svm import FastSurvivalSVM
from sksurv.metrics import concordance_index_ipcw, integrated_brier_score

# Define models
models = {
    'Cox': CoxPHSurvivalAnalysis(),
    'RSF': RandomSurvivalForest(n_estimators=100, random_state=42),
    'GBS': GradientBoostingSurvivalAnalysis(random_state=42),
    'SVM': FastSurvivalSVM(random_state=42)
}

# Evaluate each model
results = {}
for name, model in models.items():
    model.fit(X_train_scaled, y_train)
    risk_scores = model.predict(X_test_scaled)
    c_index = concordance_index_ipcw(y_train, y_test, risk_scores)[0]
    results[name] = c_index
    print(f"{name}: C-index = {c_index:.3f}")

# Select best model
best_model_name = max(results, key=results.get)
print(f"\nBest model: {best_model_name}")

Integration with scikit-learn

scikit-survival fully integrates with scikit-learn's ecosystem:

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import cross_val_score, GridSearchCV

# Use pipelines
pipeline = Pipeline([
    ('scaler', StandardScaler()),
    ('model', CoxPHSurvivalAnalysis())
])

# Use cross-validation
scores = cross_val_score(pipeline, X, y, cv=5,
                         scoring=as_concordance_index_ipcw_scorer())

# Use grid search
param_grid = {'model__alpha': [0.1, 1.0, 10.0]}
cv = GridSearchCV(pipeline, param_grid, cv=5)
cv.fit(X, y)

Best Practices

Always standardize features for SVMs and regularized Cox models
Use Uno's C-index instead of Harrell's when censoring > 40%
Report multiple evaluation metrics (C-index, integrated Brier score, time-dependent AUC)
Check proportional hazards assumption for Cox models
Use cross-validation for hyperparameter tuning with appropriate scorers
Validate data quality before modeling (check for negative times, sufficient events per feature)
Compare multiple model types to find best performance
Use permutation importance for Random Survival Forests (not built-in importance)
Consider competing risks when multiple event types exist
Document censoring mechanism and rates in analysis

Common Pitfalls to Avoid

Using Harrell's C-index with high censoring → Use Uno's C-index
Not standardizing features for SVMs → Always standardize
Forgetting to pass y_train to concordance_index_ipcw → Required for IPCW calculation
Treating competing events as censored → Use competing risks methods
Not checking for sufficient events per feature → Rule of thumb: 10+ events per feature
Using built-in feature importance for RSF → Use permutation importance
Ignoring proportional hazards assumption → Validate or use alternative models
Not using appropriate scorers in cross-validation → Use as_concordance_index_ipcw_scorer()

Reference Files

This skill includes detailed reference files for specific topics:

references/cox-models.md : Complete guide to Cox proportional hazards models, penalized Cox (CoxNet), IPCRidge, regularization strategies, and interpretation
references/ensemble-models.md : Random Survival Forests, Gradient Boosting, hyperparameter tuning, feature importance, and model selection
references/evaluation-metrics.md : Concordance index (Harrell's vs Uno's), time-dependent AUC, Brier score, comprehensive evaluation pipelines
references/data-handling.md : Data loading, preprocessing workflows, handling missing data, feature encoding, validation checks
references/svm-models.md : Survival Support Vector Machines, kernel selection, clinical kernel transform, hyperparameter tuning
references/competing-risks.md : Competing risks analysis, cumulative incidence functions, cause-specific hazard models

Load these reference files when detailed information is needed for specific tasks.

Additional Resources

Official Documentation : https://scikit-survival.readthedocs.io/
GitHub Repository : https://github.com/sebp/scikit-survival
Built-in Datasets : Use sksurv.datasets for practice datasets (GBSG2, WHAS500, veterans lung cancer, etc.)
API Reference : Complete list of classes and functions at https://scikit-survival.readthedocs.io/en/stable/api/index.html

Quick Reference: Key Imports

# Models
from sksurv.linear_model import CoxPHSurvivalAnalysis, CoxnetSurvivalAnalysis, IPCRidge
from sksurv.ensemble import RandomSurvivalForest, GradientBoostingSurvivalAnalysis
from sksurv.svm import FastSurvivalSVM, FastKernelSurvivalSVM
from sksurv.tree import SurvivalTree

# Evaluation metrics
from sksurv.metrics import (
    concordance_index_censored,
    concordance_index_ipcw,
    cumulative_dynamic_auc,
    brier_score,
    integrated_brier_score,
    as_concordance_index_ipcw_scorer,
    as_integrated_brier_score_scorer
)

# Non-parametric estimation
from sksurv.nonparametric import (
    kaplan_meier_estimator,
    nelson_aalen_estimator,
    cumulative_incidence_competing_risks
)

# Data handling
from sksurv.util import Surv
from sksurv.preprocessing import OneHotEncoder, encode_categorical
from sksurv.datasets import load_gbsg2, load_breast_cancer, load_veterans_lung_cancer

# Kernels
from sksurv.kernels import ClinicalKernelTransform

Weekly Installs

143

Repository

davila7/claude-…emplates

GitHub Stars

22.6K

First Seen

Jan 21, 2026

Security Audits

Gen Agent Trust HubPass SocketPass SnykPass

Installed on

claude-code123

opencode116

gemini-cli109

cursor108

antigravity98

codex98

专业SEO审计工具：全面网站诊断、技术SEO优化与页面分析指南

64,900 周安装