Работа с запросами
Параметры
Самые важные параметры запросов к AllTokens без лишнего перегруза.
AllTokens старается оставаться максимально совместимым с OpenAI API, поэтому большинство параметров знакомы вам ещё до первого запроса.
Базовый набор
| Параметр | Где нужен | Что делает |
|---|---|---|
model | chat/completions, completions, embeddings, images | Выбирает конкретную модель или routing-модель вроде alltokens/auto |
messages | chat/completions | Передаёт историю диалога |
prompt | completions, images | Передаёт одиночный текстовый prompt |
stream | chat/completions, completions | Включает потоковый ответ |
temperature | текстовые методы | Управляет вариативностью ответа |
max_tokens | текстовые методы | Ограничивает длину ответа |
top_p | текстовые методы | Альтернатива temperature |
Параметры AllTokens поверх совместимого API
| Параметр | Где передавать | Для чего нужен |
|---|---|---|
metadata.objective | metadata или extra_body | Приоритет cheapest / fastest / reliable / balanced |
metadata.allowed_models | metadata или extra_body | Белый список моделей |
metadata.blocked_models | metadata или extra_body | Чёрный список моделей |
metadata.provider_policy | metadata или extra_body | Контроль провайдеров и переключения между ними |
Полезное правило
Сначала совместимость, потом тонкая настройка
1
Запустите обычный совместимый запрос
Убедитесь, что интеграция проходит без параметров маршрутизации.
2
Добавьте stream или temperature
Если вам нужна UX-скорость или другой стиль ответа.
3
Добавьте metadata
Только после этого подключайте objective, allowed_models и другие параметры маршрутизации.