时间序列分析技能指南：ARIMA、LSTM、Prophet模型与异常检测实战

time-series-analyst by 4444j99/a-i--skills

1 周安装量

2 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/4444j99/a-i--skills --skill time-series-analyst

AI/机器学习 Python Web框架数据分析

🇨🇳中文介绍

时间序列分析师

此技能为分析时序数据、识别模式和构建预测模型提供指导。

核心能力

分解 : 趋势、季节性、残差分析
统计方法 : ARIMA、SARIMA、指数平滑
机器学习方法 : Prophet、LSTM、基于 Transformer 的模型
异常检测 : 统计和机器学习方法

时间序列基础

数据特性

在分析之前，请评估：

属性	问题	影响
平稳性	均值/方差是否恒定？	方法选择
季节性	是否存在重复模式？	模型组件
趋势	是否存在长期方向？	差分需求
频率	采样率是多少？	聚合选择
缺失值	是否存在数据缺口？	插补需求

平稳性检验

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

针对季节性数据的 SARIMA

SARIMA(p, d, q)(P, D, Q, m) :

小写字母: 非季节性成分
大写字母: 季节性成分
m: 季节性周期

from statsmodels.tsa.statespace.sarimax import SARIMAX

model = SARIMAX( series, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12), # Monthly seasonality enforce_stationarity=False ) fitted = model.fit()

Forecast with confidence intervals

forecast = fitted.get_forecast(steps=24) mean = forecast.predicted_mean ci = forecast.conf_int(alpha=0.05)

from statsmodels.tsa.holtwinters import ExponentialSmoothing

# Holt-Winters (trend + seasonality)
model = ExponentialSmoothing(
    series,
    trend='add',           # or 'mul', None
    seasonal='add',        # or 'mul', None
    seasonal_periods=12
)
fitted = model.fit()
forecast = fitted.forecast(24)

基于机器学习的预测

from prophet import Prophet

# Prepare data (must have 'ds' and 'y' columns)
df = pd.DataFrame({'ds': dates, 'y': values})

# Basic model
model = Prophet(
    yearly_seasonality=True,
    weekly_seasonality=True,
    daily_seasonality=False
)

# Add custom seasonality
model.add_seasonality(
    name='monthly',
    period=30.5,
    fourier_order=5
)

# Add regressors
model.add_regressor('holiday_flag')
model.add_regressor('promotion')

model.fit(df)

# Forecast
future = model.make_future_dataframe(periods=365)
forecast = model.predict(future)

用于序列的 LSTM

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout

# Prepare sequences
def create_sequences(data, seq_length):
    X, y = [], []
    for i in range(len(data) - seq_length):
        X.append(data[i:i+seq_length])
        y.append(data[i+seq_length])
    return np.array(X), np.array(y)

X, y = create_sequences(scaled_data, seq_length=60)
X = X.reshape((X.shape[0], X.shape[1], 1))

# Build model
model = Sequential([
    LSTM(50, return_sequences=True, input_shape=(60, 1)),
    Dropout(0.2),
    LSTM(50, return_sequences=False),
    Dropout(0.2),
    Dense(1)
])

model.compile(optimizer='adam', loss='mse')
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_split=0.1)

# Z-score method
def zscore_anomalies(series, threshold=3):
    mean, std = series.mean(), series.std()
    z_scores = (series - mean) / std
    return abs(z_scores) > threshold

# IQR method
def iqr_anomalies(series, multiplier=1.5):
    Q1, Q3 = series.quantile(0.25), series.quantile(0.75)
    IQR = Q3 - Q1
    lower = Q1 - multiplier * IQR
    upper = Q3 + multiplier * IQR
    return (series < lower) | (series > upper)

# Rolling statistics
def rolling_anomalies(series, window=30, threshold=2):
    rolling_mean = series.rolling(window).mean()
    rolling_std = series.rolling(window).std()
    lower = rolling_mean - threshold * rolling_std
    upper = rolling_mean + threshold * rolling_std
    return (series < lower) | (series > upper)

from sklearn.ensemble import IsolationForest

# Feature engineering for time series
features = pd.DataFrame({
    'value': series,
    'hour': series.index.hour,
    'dayofweek': series.index.dayofweek,
    'rolling_mean': series.rolling(24).mean(),
    'rolling_std': series.rolling(24).std()
}).dropna()

model = IsolationForest(contamination=0.01, random_state=42)
anomalies = model.fit_predict(features)
# -1 = anomaly, 1 = normal

指标	公式	使用场景
MAE	mean(	actual - pred
RMSE	sqrt(mean((actual - pred)²))	惩罚大误差
MAPE	mean(	actual - pred
SMAPE	Symmetric MAPE	更好地处理零值

时间序列交叉验证

from sklearn.model_selection import TimeSeriesSplit

tscv = TimeSeriesSplit(n_splits=5)

for train_idx, test_idx in tscv.split(series):
    train, test = series.iloc[train_idx], series.iloc[test_idx]
    # Fit on train, evaluate on test

├──────────────────────────────────────────────────────▶ Time
│
│  ┌─────────────────┬─────┐
│  │     Train       │ Test│  Fold 1
│  └─────────────────┴─────┘
│  ┌───────────────────────┬─────┐
│  │        Train          │ Test│  Fold 2
│  └───────────────────────┴─────┘
│  ┌─────────────────────────────┬─────┐
│  │           Train             │ Test│  Fold 3
│  └─────────────────────────────┴─────┘

references/arima-guide.md - ARIMA 模型选择和诊断
references/prophet-tuning.md - Prophet 配置和自定义季节性
references/anomaly-patterns.md - 异常检测技术和阈值

🇺🇸English

Time Series Analyst

This skill provides guidance for analyzing temporal data, identifying patterns, and building forecasting models.

Core Competencies

Decomposition : Trend, seasonality, residual analysis
Statistical Methods : ARIMA, SARIMA, Exponential Smoothing
ML Methods : Prophet, LSTM, Transformer-based models
Anomaly Detection : Statistical and ML approaches

Time Series Fundamentals

Data Characteristics

Before analysis, assess:

Property	Question	Impact
Stationarity	Is mean/variance constant?	Method selection
Seasonality	Are there repeating patterns?	Model components
Trend	Is there long-term direction?	Differencing needs
Frequency	What's the sampling rate?	Aggregation choices
Missing values	Are there gaps?	Imputation needs

Stationarity Tests

from statsmodels.tsa.stattools import adfuller, kpss

# Augmented Dickey-Fuller (null: non-stationary)
adf_result = adfuller(series)
print(f"ADF Statistic: {adf_result[0]:.4f}")
print(f"p-value: {adf_result[1]:.4f}")
# p < 0.05 suggests stationarity

# KPSS (null: stationary)
kpss_result = kpss(series, regression='c')
print(f"KPSS Statistic: {kpss_result[0]:.4f}")
print(f"p-value: {kpss_result[1]:.4f}")
# p > 0.05 suggests stationarity

Making Series Stationary

# Differencing for trend
diff_1 = series.diff().dropna()

# Seasonal differencing
seasonal_diff = series.diff(periods=12).dropna()  # Monthly seasonality

# Log transform for varying variance
log_series = np.log(series)

# Box-Cox for optimal transformation
from scipy.stats import boxcox
transformed, lambda_param = boxcox(series)

Time Series Decomposition

Classical Decomposition

Original = Trend + Seasonal + Residual  (Additive)
Original = Trend × Seasonal × Residual  (Multiplicative)



from statsmodels.tsa.seasonal import seasonal_decompose, STL

# Classical decomposition
decomposition = seasonal_decompose(
    series,
    model='additive',  # or 'multiplicative'
    period=12
)

# STL (more robust)
stl = STL(series, period=12, robust=True)
result = stl.fit()

# Access components
trend = result.trend
seasonal = result.seasonal
residual = result.resid

Visualization Pattern

┌────────────────────────────────────────┐
│ Original Series                        │ ← Raw data
├────────────────────────────────────────┤
│ Trend Component                        │ ← Long-term direction
├────────────────────────────────────────┤
│ Seasonal Component                     │ ← Repeating patterns
├────────────────────────────────────────┤
│ Residual Component                     │ ← Random noise
└────────────────────────────────────────┘

Statistical Forecasting Methods

ARIMA Model Selection

ARIMA(p, d, q) :

p: Autoregressive order (ACF/PACF)
d: Differencing order (stationarity)
q: Moving average order (ACF)

from statsmodels.tsa.arima.model import ARIMA from pmdarima import auto_arima

Automatic selection

auto_model = auto_arima( series, start_p=0, max_p=5, start_q=0, max_q=5, d=None, # Auto-detect differencing seasonal=False, information_criterion='aic', trace=True ) print(auto_model.summary())

Manual ARIMA

model = ARIMA(series, order=(2, 1, 2)) fitted = model.fit() forecast = fitted.forecast(steps=30)

SARIMA for Seasonal Data

SARIMA(p, d, q)(P, D, Q, m) :

Lowercase: non-seasonal components
Uppercase: seasonal components
m: seasonal period

from statsmodels.tsa.statespace.sarimax import SARIMAX

model = SARIMAX( series, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12), # Monthly seasonality enforce_stationarity=False ) fitted = model.fit()

Forecast with confidence intervals

forecast = fitted.get_forecast(steps=24) mean = forecast.predicted_mean ci = forecast.conf_int(alpha=0.05)

Exponential Smoothing

from statsmodels.tsa.holtwinters import ExponentialSmoothing

# Holt-Winters (trend + seasonality)
model = ExponentialSmoothing(
    series,
    trend='add',           # or 'mul', None
    seasonal='add',        # or 'mul', None
    seasonal_periods=12
)
fitted = model.fit()
forecast = fitted.forecast(24)

ML-Based Forecasting

Facebook Prophet

from prophet import Prophet

# Prepare data (must have 'ds' and 'y' columns)
df = pd.DataFrame({'ds': dates, 'y': values})

# Basic model
model = Prophet(
    yearly_seasonality=True,
    weekly_seasonality=True,
    daily_seasonality=False
)

# Add custom seasonality
model.add_seasonality(
    name='monthly',
    period=30.5,
    fourier_order=5
)

# Add regressors
model.add_regressor('holiday_flag')
model.add_regressor('promotion')

model.fit(df)

# Forecast
future = model.make_future_dataframe(periods=365)
forecast = model.predict(future)

LSTM for Sequences

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout

# Prepare sequences
def create_sequences(data, seq_length):
    X, y = [], []
    for i in range(len(data) - seq_length):
        X.append(data[i:i+seq_length])
        y.append(data[i+seq_length])
    return np.array(X), np.array(y)

X, y = create_sequences(scaled_data, seq_length=60)
X = X.reshape((X.shape[0], X.shape[1], 1))

# Build model
model = Sequential([
    LSTM(50, return_sequences=True, input_shape=(60, 1)),
    Dropout(0.2),
    LSTM(50, return_sequences=False),
    Dropout(0.2),
    Dense(1)
])

model.compile(optimizer='adam', loss='mse')
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_split=0.1)

Anomaly Detection

Statistical Methods

# Z-score method
def zscore_anomalies(series, threshold=3):
    mean, std = series.mean(), series.std()
    z_scores = (series - mean) / std
    return abs(z_scores) > threshold

# IQR method
def iqr_anomalies(series, multiplier=1.5):
    Q1, Q3 = series.quantile(0.25), series.quantile(0.75)
    IQR = Q3 - Q1
    lower = Q1 - multiplier * IQR
    upper = Q3 + multiplier * IQR
    return (series < lower) | (series > upper)

# Rolling statistics
def rolling_anomalies(series, window=30, threshold=2):
    rolling_mean = series.rolling(window).mean()
    rolling_std = series.rolling(window).std()
    lower = rolling_mean - threshold * rolling_std
    upper = rolling_mean + threshold * rolling_std
    return (series < lower) | (series > upper)

Isolation Forest

from sklearn.ensemble import IsolationForest

# Feature engineering for time series
features = pd.DataFrame({
    'value': series,
    'hour': series.index.hour,
    'dayofweek': series.index.dayofweek,
    'rolling_mean': series.rolling(24).mean(),
    'rolling_std': series.rolling(24).std()
}).dropna()

model = IsolationForest(contamination=0.01, random_state=42)
anomalies = model.fit_predict(features)
# -1 = anomaly, 1 = normal

Model Evaluation

Metrics

Metric	Formula	Use Case
MAE	mean(	actual - pred
RMSE	sqrt(mean((actual - pred)²))	Penalize large errors
MAPE	mean(	actual - pred
SMAPE	Symmetric MAPE	Handles zeros better

Cross-Validation for Time Series

from sklearn.model_selection import TimeSeriesSplit

tscv = TimeSeriesSplit(n_splits=5)

for train_idx, test_idx in tscv.split(series):
    train, test = series.iloc[train_idx], series.iloc[test_idx]
    # Fit on train, evaluate on test

Backtesting Pattern

├──────────────────────────────────────────────────────▶ Time
│
│  ┌─────────────────┬─────┐
│  │     Train       │ Test│  Fold 1
│  └─────────────────┴─────┘
│  ┌───────────────────────┬─────┐
│  │        Train          │ Test│  Fold 2
│  └───────────────────────┴─────┘
│  ┌─────────────────────────────┬─────┐
│  │           Train             │ Test│  Fold 3
│  └─────────────────────────────┴─────┘

References

references/arima-guide.md - ARIMA model selection and diagnostics
references/prophet-tuning.md - Prophet configuration and custom seasonality
references/anomaly-patterns.md - Anomaly detection techniques and thresholds

Weekly Installs

Repository

4444j99/a-i--skills

GitHub Stars

First Seen

1 day ago

Security Audits

Gen Agent Trust HubPass SocketPass SnykPass

Installed on

zencoder1

amp1

cline1

openclaw1

opencode1

cursor1

专业SEO审计工具：全面网站诊断、技术SEO优化与页面分析指南

62,600 周安装

时间序列分析技能指南：ARIMA、LSTM、Prophet模型与异常检测实战

🇨🇳中文介绍

时间序列分析师

核心能力

时间序列基础

数据特性

平稳性检验

相关 Skills

使序列平稳化

时间序列分解

经典分解

可视化模式

统计预测方法

ARIMA 模型选择

Automatic selection

Manual ARIMA

针对季节性数据的 SARIMA

Forecast with confidence intervals

指数平滑

基于机器学习的预测

Facebook Prophet

用于序列的 LSTM

异常检测

统计方法

孤立森林

模型评估

指标

时间序列交叉验证

回测模式

参考资料

🇺🇸English

Time Series Analyst

Core Competencies

Time Series Fundamentals

Data Characteristics

Stationarity Tests

Making Series Stationary

Time Series Decomposition

Classical Decomposition

Visualization Pattern

Statistical Forecasting Methods

ARIMA Model Selection

Automatic selection

Manual ARIMA

SARIMA for Seasonal Data

Forecast with confidence intervals

Exponential Smoothing

ML-Based Forecasting

Facebook Prophet

LSTM for Sequences

Anomaly Detection

Statistical Methods

Isolation Forest

Model Evaluation

Metrics

Cross-Validation for Time Series

Backtesting Pattern

References

最新 Skills