Работа с запросами

Параметры

Самые важные параметры запросов к AllTokens без лишнего перегруза.

AllTokens старается оставаться максимально совместимым с OpenAI API, поэтому большинство параметров знакомы вам ещё до первого запроса.

Базовый набор

ПараметрГде нуженЧто делает
modelchat/completions, completions, embeddings, imagesВыбирает конкретную модель или routing-модель вроде alltokens/auto
messageschat/completionsПередаёт историю диалога
promptcompletions, imagesПередаёт одиночный текстовый prompt
streamchat/completions, completionsВключает потоковый ответ
temperatureтекстовые методыУправляет вариативностью ответа
max_tokensтекстовые методыОграничивает длину ответа
top_pтекстовые методыАльтернатива temperature

Параметры AllTokens поверх совместимого API

ПараметрГде передаватьДля чего нужен
metadata.objectivemetadata или extra_bodyПриоритет cheapest / fastest / reliable / balanced
metadata.allowed_modelsmetadata или extra_bodyБелый список моделей
metadata.blocked_modelsmetadata или extra_bodyЧёрный список моделей
metadata.provider_policymetadata или extra_bodyКонтроль провайдеров и переключения между ними

Полезное правило

Начните с минимального тела запроса: model + messages. Добавляйте параметры маршрутизации и управления генерацией только тогда, когда понимаете, какую задачу они решают.

Сначала совместимость, потом тонкая настройка

1

Запустите обычный совместимый запрос

Убедитесь, что интеграция проходит без параметров маршрутизации.

2

Добавьте stream или temperature

Если вам нужна UX-скорость или другой стиль ответа.

3

Добавьте metadata

Только после этого подключайте objective, allowed_models и другие параметры маршрутизации.

Дальше по теме