文本摘要工具 - 使用TextRank/LSA算法自动提取关键句子，支持Python和命令行

text-summarizer by dkyazzentwatwa/chatgpt-skills

540 周安装量

37 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/dkyazzentwatwa/chatgpt-skills --skill text-summarizer

内容创作自动化自然语言处理

🇨🇳中文介绍

文本摘要工具

使用抽取式摘要技术，从长文本文档中创建简洁摘要。识别并提取最重要的句子，同时保留原意。

快速开始

from scripts.text_summarizer import TextSummarizer

# 摘要文本
summarizer = TextSummarizer()
summary = summarizer.summarize(long_text, ratio=0.2)  # 原文本的 20%
print(summary)

# 摘要文件
summary = summarizer.summarize_file("article.txt", num_sentences=5)

功能特性

抽取式摘要 : 从原始文本中选择关键句子
长度控制 : 可按比例、句子数量或单词数量控制
多种算法 : TextRank、LSA、基于频率
关键要点 : 提取要点式摘要
批量处理 : 摘要多个文档
保留结构 : 可选择保持句子顺序

API 参考

初始化

summarizer = TextSummarizer(
    method="textrank",    # textrank, lsa, frequency
    language="english"
)

摘要生成

# 按比例（原长度的 20%）
summary = summarizer.summarize(text, ratio=0.2)

# 按句子数量
summary = summarizer.summarize(text, num_sentences=5)

# 按单词数量
summary = summarizer.summarize(text, max_words=100)

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

相关 Skills

FlyClaw：零登录航班聚合查询工具，Python实现多源航班信息与价格搜索

4,000,000 周安装

Gmail过滤器创建教程 - 使用Google Workspace CLI自动分类邮件与添加标签

6,500 周安装

Google Slides 演示文稿创建与共享自动化教程 - 使用 Google Workspace CLI

6,500 周安装

Google Workspace CLI 教程：通过邮件自动发送云端硬盘文件链接，提升团队协作效率

6,300 周安装

# 获取要点
points = summarizer.extract_key_points(text, num_points=5)
for point in points:
    print(f"• {point}")

# 摘要多个文本
texts = [text1, text2, text3]
summaries = summarizer.summarize_batch(texts, ratio=0.2)

# 摘要目录中的文件
summaries = summarizer.summarize_directory("./articles/", ratio=0.3)

# 保持原始句子顺序
summary = summarizer.summarize(text, preserve_order=True)

# 包含标题/首句
summary = summarizer.summarize(text, include_first=True)

# 最小句子长度过滤器
summarizer.min_sentence_length = 10

# 摘要文本文件
python text_summarizer.py --input article.txt --ratio 0.2

# 指定句子数量
python text_summarizer.py --input article.txt --sentences 5

# 提取关键要点
python text_summarizer.py --input article.txt --points 5

# 批量处理
python text_summarizer.py --input-dir ./docs --output-dir ./summaries --ratio 0.3

# 输出到文件
python text_summarizer.py --input article.txt --output summary.txt --ratio 0.2

参数	描述	默认值
`--input`	输入文件路径	必需
`--output`	输出文件路径	stdout
`--input-dir`	文件目录	-
`--output-dir`	输出目录	-
`--ratio`	摘要比例 (0.0-1.0)	0.2
`--sentences`	句子数量	-
`--words`	最大单词数	-
`--points`	提取 N 个关键要点	-
`--method`	使用的算法	textrank
`--preserve-order`	保持句子顺序	False

summarizer = TextSummarizer()

article = """
[长新闻文章文本...]
"""

# 获取 3 句摘要
summary = summarizer.summarize(article, num_sentences=3)
print("摘要:")
print(summary)

# 获取关键要点
points = summarizer.extract_key_points(article, num_points=5)
print("\n关键要点:")
for i, point in enumerate(points, 1):
    print(f"{i}. {point}")

summarizer = TextSummarizer(method="lsa")

paper = open("research_paper.txt").read()

# 创建摘要长度的摘要
abstract = summarizer.summarize(paper, max_words=250)
print(abstract)

summarizer = TextSummarizer()

notes = """
Meeting started at 2pm. John presented Q3 results showing 15% growth.
Sarah raised concerns about supply chain delays affecting Q4 projections.
The team discussed mitigation strategies including dual-sourcing.
Budget allocation for marketing was approved at $50k.
Next steps include vendor outreach by Friday.
Follow-up meeting scheduled for next Tuesday.
"""

summary = summarizer.summarize(notes, num_sentences=3)
points = summarizer.extract_key_points(notes, num_points=4)

print("摘要:", summary)
print("\n行动项:")
for point in points:
    print(f"• {point}")

summarizer = TextSummarizer()

import os
for filename in os.listdir("./documents"):
    if filename.endswith(".txt"):
        text = open(f"./documents/{filename}").read()
        summary = summarizer.summarize(text, ratio=0.2)

        with open(f"./summaries/{filename}", "w") as f:
            f.write(summary)

        print(f"已摘要: {filename}")

算法	速度	质量	最佳适用场景
TextRank	中等	高	通用文本
LSA	快	良好	技术文档
Frequency	快	中等	快速摘要

nltk>=3.8.0
numpy>=1.24.0
scikit-learn>=1.2.0

仅支持抽取式（不进行释义或生成新文本）
对结构良好的文本效果最佳（段落清晰、句子明确）
非常短的文本可能摘要效果不佳
无法深度理解上下文（可能遗漏细微差别）

2026 年 1 月 24 日

🇺🇸English

Text Summarizer

Create concise summaries from long text documents using extractive summarization. Identifies and extracts the most important sentences while preserving meaning.

Quick Start

from scripts.text_summarizer import TextSummarizer

# Summarize text
summarizer = TextSummarizer()
summary = summarizer.summarize(long_text, ratio=0.2)  # 20% of original
print(summary)

# Summarize file
summary = summarizer.summarize_file("article.txt", num_sentences=5)

Features

Extractive Summarization : Selects key sentences from original text
Length Control : By ratio, sentence count, or word count
Multiple Algorithms : TextRank, LSA, frequency-based
Key Points : Extract bullet-point summaries
Batch Processing : Summarize multiple documents
Preserve Structure : Maintains sentence order option

API Reference

Initialization

summarizer = TextSummarizer(
    method="textrank",    # textrank, lsa, frequency
    language="english"
)

Summarization

# By ratio (20% of original length)
summary = summarizer.summarize(text, ratio=0.2)

# By sentence count
summary = summarizer.summarize(text, num_sentences=5)

# By word count
summary = summarizer.summarize(text, max_words=100)

Key Points Extraction

# Get bullet points
points = summarizer.extract_key_points(text, num_points=5)
for point in points:
    print(f"• {point}")

Batch Processing

# Summarize multiple texts
texts = [text1, text2, text3]
summaries = summarizer.summarize_batch(texts, ratio=0.2)

# Summarize files in directory
summaries = summarizer.summarize_directory("./articles/", ratio=0.3)

Options

# Preserve original sentence order
summary = summarizer.summarize(text, preserve_order=True)

# Include title/first sentence
summary = summarizer.summarize(text, include_first=True)

# Minimum sentence length filter
summarizer.min_sentence_length = 10

CLI Usage

# Summarize text file
python text_summarizer.py --input article.txt --ratio 0.2

# Specific sentence count
python text_summarizer.py --input article.txt --sentences 5

# Extract key points
python text_summarizer.py --input article.txt --points 5

# Batch process
python text_summarizer.py --input-dir ./docs --output-dir ./summaries --ratio 0.3

# Output to file
python text_summarizer.py --input article.txt --output summary.txt --ratio 0.2

CLI Arguments

Argument	Description	Default
`--input`	Input file path	Required
`--output`	Output file path	stdout
`--input-dir`	Directory of files	-
`--output-dir`	Output directory	-
`--ratio`	Summary ratio (0.0-1.0)	0.2

Examples

News Article Summary

summarizer = TextSummarizer()

article = """
[Long news article text...]
"""

# Get a 3-sentence summary
summary = summarizer.summarize(article, num_sentences=3)
print("Summary:")
print(summary)

# Get key points
points = summarizer.extract_key_points(article, num_points=5)
print("\nKey Points:")
for i, point in enumerate(points, 1):
    print(f"{i}. {point}")

Research Paper Abstract

summarizer = TextSummarizer(method="lsa")

paper = open("research_paper.txt").read()

# Create abstract-length summary
abstract = summarizer.summarize(paper, max_words=250)
print(abstract)

Meeting Notes Summary

summarizer = TextSummarizer()

notes = """
Meeting started at 2pm. John presented Q3 results showing 15% growth.
Sarah raised concerns about supply chain delays affecting Q4 projections.
The team discussed mitigation strategies including dual-sourcing.
Budget allocation for marketing was approved at $50k.
Next steps include vendor outreach by Friday.
Follow-up meeting scheduled for next Tuesday.
"""

summary = summarizer.summarize(notes, num_sentences=3)
points = summarizer.extract_key_points(notes, num_points=4)

print("Summary:", summary)
print("\nAction Items:")
for point in points:
    print(f"• {point}")

Batch Document Summarization

summarizer = TextSummarizer()

import os
for filename in os.listdir("./documents"):
    if filename.endswith(".txt"):
        text = open(f"./documents/{filename}").read()
        summary = summarizer.summarize(text, ratio=0.2)

        with open(f"./summaries/{filename}", "w") as f:
            f.write(summary)

        print(f"Summarized: {filename}")

Algorithm Comparison

Algorithm	Speed	Quality	Best For
TextRank	Medium	High	General text
LSA	Fast	Good	Technical docs
Frequency	Fast	Medium	Quick summaries

Dependencies

nltk>=3.8.0
numpy>=1.24.0
scikit-learn>=1.2.0

Limitations

Extractive only (doesn't paraphrase or generate new text)
Works best with well-structured text (paragraphs, clear sentences)
Very short texts may not summarize well
Doesn't understand context deeply (may miss nuance)

Weekly Installs

519

Repository

dkyazzentwatwa/…t-skills

GitHub Stars

First Seen

Jan 24, 2026

Security Audits

Gen Agent Trust HubPass SocketPass SnykPass

Installed on

gemini-cli505

opencode505

codex502

cursor499

github-copilot498

amp489