发送结构化的输入消息列表(支持文本和/或图片内容),模型将在会话中生成下一条消息。
Documentation Index
Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt
Use this file to discover all available pages before exploring further.
可选请求头,用于指定要使用的 Beta 版本,多个值使用逗号分隔。
"message-batches-2024-09-24,prompt-caching-2024-07-31"
Anthropic API 版本。
"2023-06-01"
生成的最大 token 数,达到该值后模型将停止生成。
1024
输入消息列表。单次请求最多包含 100,000 条消息。
100000用于补全你提示词的模型。
claude-opus-4-7, claude-mythos-preview, claude-opus-4-6, claude-sonnet-4-6, claude-haiku-4-5, claude-haiku-4-5-20251001, claude-opus-4-5, claude-opus-4-5-20251101, claude-sonnet-4-5, claude-sonnet-4-5-20250929, claude-opus-4-1, claude-opus-4-1-20250805, claude-opus-4-0, claude-opus-4-20250514, claude-sonnet-4-0, claude-sonnet-4-20250514, claude-3-haiku-20240307 "claude-opus-4-7"
顶层缓存控制;将自动在请求中最后一个可缓存的内容块上添加 cache_control 标记。
容器标识符,用于跨请求复用。
上下文管理配置。控制 Claude 在多次请求之间如何管理上下文。
指定推理处理的地理区域。
"us"
本次请求中使用的 MCP 服务器
描述请求相关的元数据对象。
模型输出配置选项,例如输出格式等。
已废弃:请改用 output_config.format。
是否优先使用优先容量(可用时),或仅使用标准容量。
auto, standard_only "auto"
推理速度模式。'fast' 模式启用每秒更高输出 token 数的推理。
standard, fast "standard"
自定义停止文本序列,模型在生成到这些序列时会停止。
是否通过 Server-Sent Events (SSE) 以增量方式流式返回响应。
false
系统提示词(System Prompt)。
"你是一个严谨且乐于助人的人工智能助手。"
响应的随机性强度。默认值为 1.0。
0 <= x <= 11
启用思考模式的配置。
由模型自行决定是否使用工具。
模型可以使用的工具定义列表。
用户自定义工具定义。
仅从每个后续 token 的 top-K 个候选中采样。
5
使用核采样(nucleus sampling)。
0.9
用于归属本次请求的用户配置 ID。
"user-profile-123"
成功响应:非流式模式返回完整消息,流式模式(stream=true)返回 Server-Sent Events 事件流。
模型生成的消息响应对象。
唯一对象标识符。
"msg_01ABCDxyz0123456789"
响应内容块列表。
用于补全你提示词的模型。
claude-opus-4-7, claude-mythos-preview, claude-opus-4-6, claude-sonnet-4-6, claude-haiku-4-5, claude-haiku-4-5-20251001, claude-opus-4-5, claude-opus-4-5-20251101, claude-sonnet-4-5, claude-sonnet-4-5-20250929, claude-opus-4-1, claude-opus-4-1-20250805, claude-opus-4-0, claude-opus-4-20250514, claude-sonnet-4-0, claude-sonnet-4-20250514, claude-3-haiku-20240307 "claude-opus-4-7"
消息角色,响应固定为 assistant。
assistant "assistant"
对象类型,固定为 message。
message "message"
Billing and rate-limit usage.
Information about the container used in the request (for the code execution tool)
end_turn, max_tokens, stop_sequence, tool_use, pause_turn, compaction, refusal, model_context_window_exceeded 触发停止生成的自定义停止序列(若命中)。
"\n\nHuman:"