muapi-nano-banana by samuraigpt/generative-media-skills
npx skills add https://github.com/samuraigpt/generative-media-skills --skill muapi-nano-banana一项供 AI 智能体使用的专业技能,用于实现“推理驱动”的图像生成。 基于谷歌 Gemini 3(Nano Banana Pro)先进的提示架构,此技能超越了关键词堆砌,转向基于逻辑的结构化创意简报。
主体 + 动作 + 情境 + 构图 + 光照。| 组件 | 描述 | 示例 |
|---|---|---|
| 主体 | 详细的实体描述 | "一个带有外露铜线的坚忍机器人咖啡师" |
| 动作 | 动态交互 | "以机械般的精确度倾倒拿铁艺术叶子" |
| 情境 | 环境与氛围 |
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
| "午夜时分,霓虹灯闪烁的赛博朋克咖啡馆内" |
| 构图 | 相机与镜头选择 | "特写,85mm 镜头,f/1.8 光圈" |
| 光照 | 氛围与方向 | "体积蓝色轮廓光,温暖的咖啡馆辉光" |
| 风格 | 美学锚点 | "电影感,照片级真实感,4K 制作水准" |
标牌上写着 "OPEN 24/7"。在调用脚本之前,智能体必须将用户的提示重写为逻辑驱动的推理简报:
包含一个标牌,上面用磨损的衬线字体写着 "STORE NAME"。为智能体提供一个主体和一个具体场景。
generate-nano-art.sh 脚本将逻辑转换为结构化的 Gemini 3 风格提示。
# 生成推理驱动的图像
bash scripts/generate-nano-art.sh \
--subject "一个玻璃国际象棋棋子" \
--action "碎裂成液体般的碎片" \
--context "在乌木桌子上" \
--style "微距摄影"
此技能在 core/media/generate-image.sh 原语周围应用了一个“逻辑包装器”,将零散的输入转换为连贯的、适合推理的叙事性提示。
每周安装量
95
代码仓库
GitHub 星标数
3.0K
首次出现
Feb 26, 2026
安全审计
安装于
kimi-cli93
amp93
cline93
github-copilot93
codex93
opencode93
A specialized skill for AI Agents to leverage "Reasoning-Driven" image generation. Based on the advanced prompting architecture of Google's Gemini 3 (Nano Banana Pro), this skill moves beyond keyword stuffing to structured, logic-based creative briefs.
Subject + Action + Context + Composition + Lighting.| Component | Description | Example |
|---|---|---|
| Subject | Detailed entity description | "A stoic robot barista with exposed copper wiring" |
| Action | Dynamic interaction | "Pouring a latte art leaf with mechanical precision" |
| Context | Environment & Atmosphere | "Inside a neon-lit cyberpunk cafe at midnight" |
| Composition | Camera & Lens choice | "Close-up, 85mm lens, f/1.8 aperture" |
| Lighting | Mood & Direction | "Volumetric blue rim light, warm cafe glow" |
| Style | Aesthetic anchor | "Cinematic, photorealistic, 4K production value" |
The sign reads "OPEN 24/7".Before calling the script, the Agent MUST rewrite the user's prompt into a logic-driven Reasoning Brief:
featuring a sign that says "STORE NAME" in a weathered serif font.Provide the agent with a subject and a specific scenario.
The generate-nano-art.sh script translates the logic into a structured Gemini 3-style prompt.
# Generating a reasoning-driven image
bash scripts/generate-nano-art.sh \
--subject "a glass chess piece" \
--action "shattering into liquid shards" \
--context "on a obsidian table" \
--style "macro photography"
This skill applies a "Logic Wrapper" around the core/media/generate-image.sh primitive, converting fragmented inputs into a coherent, reasoning-ready narrative prompt.
Weekly Installs
95
Repository
GitHub Stars
3.0K
First Seen
Feb 26, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
kimi-cli93
amp93
cline93
github-copilot93
codex93
opencode93
AI 代码实施计划编写技能 | 自动化开发任务分解与 TDD 流程规划工具
50,900 周安装
WCAG无障碍审计与测试工具 - 自动化扫描与手动验证,确保网站可访问性合规
234 周安装
jQuery 4.0 迁移指南:破坏性变更、升级步骤与兼容性解决方案
232 周安装
应用程序性能优化全栈指南:从分析、数据库到前端与CDN的端到端优化
236 周安装
React/React Native 组件脚手架生成器 - 自动化创建生产级组件
236 周安装
RWKV架构详解:融合Transformer与RNN优势的高效AI模型安装与使用指南
70 周安装
Hugging Face Jobs:云端运行AI工作负载,无需本地GPU,支持数据处理、批量推理和模型训练
232 周安装