Google Gemini 1.5 Flash 支持「结构化输出」:经济实惠的新选择
引言
结构化输出是 AI 产品和 Agent 的核心功能,它允许 AI 以思维导图或表格的形式输出信息,而不是传统的长篇文本。Google Gemini 1.5 Flash 的最新更新使得这一功能变得更加经济实惠,为 AI 项目的开发提供了新的可能。
核心优势
经济实惠
- 免费额度:每天前 1500 个请求免费调用。
- 价格优势:超出免费额度后,价格低至 $0.075 每 100 万 token。
易于集成
- GCP 赞助/优惠:可叠加使用,进一步降低成本。
- Flash 模型:无需昂贵的 Pro 版本,Flash 版本即可享受结构化输出。
安装与使用
安装 Google AI Python SDK
bash
pip install google-generativeai pip install google.ai.generativelanguage
Sample Code
以下是一个使用 Google Gemini 1.5 Flash 进行结构化输出的示例代码:
python
import os
import google.generativeai as genai
from google.ai.generativelanguage_v1beta.types import content
genai.configure(api_key=os.environ[“GEMINI_API_KEY”])
配置生成模型
generation_config = {
“temperature”: 1,
“top_p”: 0.95,
“top_k”: 64,
“max_output_tokens”: 8192,
“response_schema”: content.Schema(
type=content.Type.OBJECT,
enum=”[]”,
required=[“books”],
properties={
“books”: content.Schema(
type=content.Type.ARRAY,
items=content.Schema(
type=content.Type.OBJECT,
properties={
“name”: content.Schema(type=content.Type.STRING),
“writer”: content.Schema(type=content.Type.STRING),
},
),
),
},
),
“response_mime_type”: “application/json”,
}
model = genai.GenerativeModel(
model_name=”gemini-1.5-flash”,
generation_config=generation_config,
)
chat_session = model.start_chat(
history=[
{“role”: “user”, “parts”: [“告诉我四大名著分别是什么,以及他们的作者是谁”,]},
{“role”: “model”, “parts”: [“json\n{\”books\”: [{\”name\”: \”红楼梦\”, \”writer\”: \”曹雪芹\”}, {\”name\”: \”三国演义\”, \”writer\”: \”罗贯中\”}, {\”name\”: \”水浒传\”, \”writer\”: \”施耐庵\”}, {\”name\”: \”西游记\”, \”writer\”: \”吴承恩\”}]} \n”,]},
],
)
response = chat_session.send_message(“INSERT_INPUT_HERE”)
print(response.text)
结语
通过上述教程,我们可以看到 Google Gemini 1.5 Flash 如何实现结构化输出,这对于 AI 项目的开发者来说是一个巨大的福音。它不仅降低了成本,还提高了开发效率。
感悟
我认为:技术的进步总是令人兴奋的,尤其是当它能够以如此亲民的价格提供强大的功能时。Google Gemini 1.5 Flash 的更新,无疑为 AI 领域带来了一股清新的空气,让更多的开发者能够以更低的成本探索和实现他们的创意。