Параметры | AllTokens Docs

AllTokens старается оставаться максимально совместимым с OpenAI API, поэтому большинство параметров знакомы вам ещё до первого запроса.

Базовый набор

Параметр	Где нужен	Что делает
`model`	chat/completions, completions, embeddings, images	Выбирает конкретную модель или routing-модель вроде `alltokens/auto`
`messages`	chat/completions	Передаёт историю диалога
`prompt`	completions, images	Передаёт одиночный текстовый prompt
`stream`	chat/completions, completions	Включает потоковый ответ
`temperature`	текстовые методы	Управляет вариативностью ответа
`max_tokens`	текстовые методы	Ограничивает длину ответа
`top_p`	текстовые методы	Альтернатива `temperature`

Параметры AllTokens поверх совместимого API

Параметр	Где передавать	Для чего нужен
`metadata.objective`	`metadata` или `extra_body`	Приоритет cheapest / fastest / reliable / balanced
`metadata.allowed_models`	`metadata` или `extra_body`	Белый список моделей
`metadata.blocked_models`	`metadata` или `extra_body`	Чёрный список моделей
`metadata.provider_policy`	`metadata` или `extra_body`	Контроль провайдеров и переключения между ними

Полезное правило

Начните с минимального тела запроса: model + messages. Добавляйте параметры маршрутизации и управления генерацией только тогда, когда понимаете, какую задачу они решают.

Сначала совместимость, потом тонкая настройка

Запустите обычный совместимый запрос

Убедитесь, что интеграция проходит без параметров маршрутизации.

Добавьте stream или temperature

Если вам нужна UX-скорость или другой стиль ответа.

Добавьте metadata

Только после этого подключайте objective, allowed_models и другие параметры маршрутизации.

Дальше по теме

Маршрутизация

Когда и как использовать metadata.

Чатовый метод API

Полный запрос и ответ главного метода.