备注
Go to the end to download the full example code.
Token 计数¶
AgentScope 在 agentscope.token
模块下提供了 token 计数功能,用于计算给定消息中
的 token 数量,允许开发者在调用 LLM API 前预估 token 数量。
具体而言,可用的 token 计数器如下:
LLM API |
类 |
实现方式 |
支持图像数据 |
支持工具 |
---|---|---|---|---|
Anthropic |
|
官方 API |
✅ |
✅ |
OpenAI |
|
本地计算 |
✅ |
✅ |
Gemini |
|
官方 API |
✅ |
✅ |
HuggingFace |
|
基于Tokenizer计算 |
取决于模型 |
取决于模型 |
小技巧
格式化器模块已集成了 token 计数器以支持提示截断。更多详细信息请参考 提示词格式化 部分。
备注
对于 DashScope 模型,目前 dashscope 库不提供 token 计数 API。因此我们建议使用 HuggingFace token 计数器代替。
对于 OpenAI 模型,由于官方未提供 token 计数 API,因此可能存在与官方计算结果不一致的情况。
下面展示使用 OpenAI token 计数器计算 token 数量的示例:
import asyncio
from agentscope.token import OpenAITokenCounter
async def example_token_counting():
# 示例消息
messages = [
{"role": "user", "content": "Hello!"},
{"role": "assistant", "content": "Hi, how can I help you?"},
]
# OpenAI token 计数
openai_counter = OpenAITokenCounter(model_name="gpt-4.1")
n_tokens = await openai_counter.count(messages)
print(f"Token 数量: {n_tokens}")
asyncio.run(example_token_counting())
Token 数量: 21
进一步阅读¶
Total running time of the script: (0 minutes 1.036 seconds)