跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt

Use this file to discover all available pages before exploring further.

S 系列 是 SenseAudio 旗舰多模态模型组合,覆盖 S2 / S2-Lite / S2-Flash S2系列三档和多模态系列:本文以通用旗舰 S2senseaudio-s2)为主介绍。以下是从实际使用中总结的最佳实践。

一、任务输入四要素:GCCV 框架

与 Agent 协作,把它当作一位刚入职的资深工程师——你要把目标、上下文、约束、验收都讲清,它才能独立推进长任务。推荐用 GCCV 框架组织每一次复杂任务的开场白:
要素要回答的问题示例
Goal(目标)我想达成什么最终结果?“把 /api/orders 接口从同步改造为异步批处理”
Context(上下文)Agent 需要了解哪些背景、代码、数据?“订单量峰值 5000 QPS,现有实现是 Flask 同步处理;数据库见 schema.sql
Constraint(约束)有哪些边界与禁区?“不得引入新的消息队列依赖;必须向后兼容现有客户端”
Validation(验收)怎么判断做完了?pytest tests/orders/ 全过;在压测脚本下 p99 < 200ms”
一开始就把 GCCV 讲完整,通常能减少 50% 以上的来回澄清轮次,也能更省 Token Plan 额度。

二、指令需明确清楚

S2 对清晰明确的指令响应更好。请显式说明期望的输出格式、内容、风格
❌ 效果欠佳
创建一个可视化网站
🚀 效果更佳
创建一个企业级数据可视化网站,整合尽可能丰富的分析特性和交互功能,
超越基础展示形式,包含筛选、联动、导出、暗色主题切换等。

三、补充指令意图以提升性能

向 S2 说明为什么。模型理解目的后能更精准地输出结果。
❌ 效果欠佳
禁止使用文档符号
🚀 效果更佳
您的回复将由语音合成模型朗读,因此请以纯文本形式呈现,
避免使用 Markdown 标题、列表、代码块等文档符号。
S2 会”举一反三”——说清楚前因后果,它就能顺着您的思路推理。

四、注重举例和细节

想让模型做成什么样,就给一个”样板”示例;担心它犯什么错,就明确说出来别让它做
❌ 效果欠佳
写一段吸引人的产品介绍,主题是智能保温杯。
🚀 效果更佳
请参照这个例子来写产品介绍:

【好的例子:这款台灯采用全光谱 LED 技术,能模拟清晨的自然光,
温柔唤醒您的一天。它具备 6 级亮度调节,满足阅读、工作和休息的不同需求。】

请避免下面这样空洞的描述:

【不好的例子:这个台灯很好用,灯光很舒服,设计也很棒。】

现在,请为"智能保温杯"写一段介绍。

五、善用多模态输入

S系列 原生支持图文混合输入。在调试 UI、Review 设计稿、OCR、图表理解时,直接把截图塞给它:
resp = client.chat.completions.create(
    model="senseaudio-vl-1.0-260319",
    messages=[
        {"role": "user", "content": [
            {"type": "text", "text": "分析下面这张运营数据截图,指出异常点和改进建议。"},
            {"type": "image_url", "image_url": {"url": "https://example.com/dashboard.png"}},
        ]},
    ],
)

六、长任务推理与状态跟踪

S2 具备稳健的状态追踪机制,聚焦有限目标而非全量并行,从而在长任务中保持思维连贯。

单窗口上下文感知

模型内置上下文感知。但当使用支持上下文压缩的工具(如 Claude Code)时,请控制 System Prompt 的 token 数量——临近上下文阈值时,模型可能出现任务提前终止。

多窗口工作流

1

分阶段处理

第一个窗口搭框架(编写、测试、创建脚本),第二个窗口遍历待办项。
2

结构化测试

让模型创建 tests.py / tests.json 跟踪测试结果,方便长期迭代。
3

初始化脚本

让模型写一个 init.sh 启动服务 / 运行测试,避免每开新窗口都重复交代。
4

压缩 vs 重启

单一任务延续用压缩;切换到新任务建议开全新窗口。
5

充分利用上下文

提示模型在继续前高效完成当前部分,避免中途 token 耗尽。
推荐 System Prompt:
这是一项非常冗长的任务。请充分利用完整的输出上下文来处理——
整体输入与输出 tokens 控制在 200k 以内,
充分利用上下文窗口长度,把任务彻底完成,避免耗尽 tokens。

七、模型档位组合

  • S2senseaudio-s2):通用旗舰,平衡能力与成本,覆盖大多数日常编程与分析任务。
  • S2-Litesenseaudio-s2-lite):高吞吐轻量版,响应更快,适合工具调用 / 代码补全 / 子 Agent 节点。
  • S2-Flashsenseaudio-s2-flash):极速低延迟通道,适合海量简单任务与大规模吞吐。
在 Agent 框架中把主模型设为 S2,子任务与小工具调用设为 S2-Lite / S2-Flash,是兼顾质量与成本的常用组合。

相关资源

接入 Claude Code

Hermes Agent

常见问题