Google 的一些 AI Playground 或开发者工具,解释这些参数的意义。
这个菜单的标题是 “Run settings” (运行设置),它控制了 AI 模型生成回复的方式。
以下是菜单中主要参数及其意义的详细介绍:
一、核心模型参数 (Core Model Parameters)
这些参数直接影响模型的输出风格和质量。
| 参数名称 (英文/中文) | 意义 | 作用/控制效果 |
|---|---|---|
| Model / 模型 | 选择 AI 模型 | 显示当前正在使用的 AI 模型。例如:Gemini Flash Latest (gemini-flash-latest)。不同的模型(如性能、速度、上下文窗口大小等)适用于不同的任务。 |
| System instructions / 系统指令 | 角色与行为设定 | (可选)给模型设定一个固定的背景、角色、语气或一系列规则,这个指令将应用于整个会话,影响模型的所有回复。 |
| Temperature / 温度 | 创造性与随机性 | 核心参数。 控制模型回复的随机程度和创造力。 |
| 值越高 (范围通常是 0.0 到 2.0),回复越新颖、多样,但也可能更不准确或不合逻辑。 | ||
| 值越低 (接近 0.0),回复越确定、保守、重复,适用于需要精确事实或简单列表的任务。 |
二、多媒体输入参数 (Multimedia Input Parameter)
| 参数名称 (英文/中文) | 意义 | 作用/控制效果 |
|---|---|---|
| Media resolution / 媒体分辨率 | 处理图片或视频的分辨率 | 当您输入图片或视频时,此设置控制模型用来分析多媒体内容的细节级别。 |
| Default (默认) 或其他选项(如 High/低),影响模型对视觉细节的感知能力。 |
三、思考与推理设置 (Thinking and Reasoning Settings)
这部分设置通常与更高级或复杂的推理过程有关,尤其是针对像 Gemini 这样的多模态/推理模型。
| 参数名称 (英文/中文) | 意义 | 作用/控制效果 |
|---|---|---|
| Thinking mode / 思考模式 | 启用/禁用模型的“思考”过程 | 启用后,模型可能会在生成最终回复之前,先在内部进行一系列推理步骤或“思考”,这能提高解决复杂问题和多步骤任务的准确性和质量。 |
| Set thinking budget / 设置思考预算 | 控制模型的思考时长/资源 | (通常在 Thinking mode 启用后可见)允许您设定模型在生成回复前可以花费多少额外的计算资源/时间进行内部思考。 |
四、工具与功能 (Tools)
这部分是模型连接外部功能和数据源的能力开关。
| 参数名称 (英文/中文) | 意义 | 作用/控制效果 |
|---|---|---|
| Structured outputs / 结构化输出 | 强制输出特定格式 | 启用后,模型会被指示以特定的结构化格式(如 JSON 或 XML)来回复,这对于需要将模型输出用于软件系统或数据库的场景非常重要。 |
| Code execution / 代码执行 | 启用模型执行代码的能力 | 允许模型在后台运行代码(例如 Python)来解决数学题、复杂逻辑或生成代码片段,提高了计算的准确性和复杂逻辑的处理能力。 |
| Function calling / 函数调用 | 连接外部 API 的能力 | 启用后,模型可以根据您的指令识别需要调用哪些外部函数/API(您预先定义的),然后生成调用这些函数的代码,从而扩展其功能(例如,查询天气、发送邮件等)。 |
| Grounding with Google Search / 以 Google 搜索为基础 | 模型联网获取最新信息 | 核心功能。 启用后,模型可以在回答问题时访问 Google 搜索,以获取实时、最新的信息来辅助回答,避免使用过时的训练数据。 |
| URL context / URL 上下文 | 模型浏览给定网址内容的能力 | 启用后,您可以提供一个或多个 URL,模型会去“浏览”这些网页的内容,并将其作为当前对话的额外背景信息来使用。 |
这个界面提供了一套非常全面的控制,让您可以根据任务的需要,精细地调整 AI 模型的性能和行为。