Платформа

Бесплатный роутер

Как работает alltokens/free и как отправлять запросы в бесплатный пул моделей.

alltokens/free автоматически отправляет запрос в бесплатный пул моделей. Это удобный вариант для тестов, обучения, демо и других сценариев, где важна нулевая стоимость запроса.

Как это работает

Вместо ручного выбора конкретной бесплатной модели вы отправляете запрос в alltokens/free, а платформа подбирает подходящую модель из доступного бесплатного пула.

При выборе учитываются:

  • требования самого запроса
  • доступность бесплатных моделей в текущий момент
  • поддержка нужных возможностей, если они следуют из тела запроса

Когда использовать

alltokens/free подходит, если вы:

  • проверяете интеграцию без затрат
  • делаете демо или внутренний прототип
  • изучаете API и хотите быстро попробовать разные сценарии
  • запускаете низконагруженный личный или учебный проект

Базовый пример

Укажите в model значение alltokens/free:

const response = await fetch('https://api.alltokens.ru/api/v1/chat/completions', {
  method: 'POST',
  headers: {
    Authorization: 'Bearer YOUR_API_KEY',
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    model: 'alltokens/free',
    messages: [
      {
        role: 'user',
        content: 'Привет! Чем ты можешь помочь?',
      },
    ],
  }),
});

const data = await response.json();
console.log(data.choices[0].message.content);
console.log('Фактическая модель:', data.model);

Что приходит в ответе

В ответе поле model показывает, какая бесплатная модель была выбрана фактически:

{
  "id": "gen-...",
  "model": "some-provider/some-free-model",
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "..."
      }
    }
  ],
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 85,
    "total_tokens": 97
  }
}

Что важно понимать

Бесплатный пул может меняться. Это влияет на:

  • доступные модели
  • стабильность времени ответа
  • итоговое качество
  • доступность некоторых возможностей в конкретный момент

alltokens/free удобен для старта и тестов, но не всегда подходит для критичных продакшен-сценариев, где важны стабильность, скорость и повторяемость.

Стоимость

Запросы через alltokens/free не тарифицируются как платные вызовы модели.

Ограничения

  • бесплатные модели могут быть временно недоступны
  • задержка может быть выше, чем у платных маршрутов
  • поведение и качество могут сильнее меняться со временем
  • вы не контролируете конкретную модель, если используете именно alltokens/free

Когда лучше выбрать не alltokens/free

Лучше использовать alltokens/auto или фиксированную модель, если:

  • вам нужна предсказуемая производительность
  • важна стабильность результата
  • вы строите продакшен-функцию с понятными SLA
  • вы уже знаете, какая модель лучше подходит под вашу задачу

Как выбрать конкретную модель вместо free-роутера

Если вам уже не нужен бесплатный роутер, вы можете:

  1. Перейти на alltokens/auto, если всё ещё хотите автоматический выбор.
  2. Открыть каталог AllTokens и зафиксировать конкретную модель вручную.

Частые вопросы

alltokens/free ограничен бесплатным пулом. alltokens/auto выбирает модель из более широкого пула и обычно лучше подходит для рабочих сценариев.

Да. Смотрите поле model в ответе.

Обычно нет, если вам нужна стабильность. Для продакшена чаще выбирают alltokens/auto или конкретную фиксированную модель.

Да, если выбранная фактическая модель поддерживает потоковую выдачу.