Официальная версия DeepSeek V4 выйдет в середине июля, при этом цены на API в часы пик удвоятся

Компания DeepSeek объявила о запуске официальной версии DeepSeek V4 в середине июля. В ней появятся новые функции и оптимизации производительности, а также существенные изменения в модели ценообразования API. Согласно уведомлениям об обновлении, отправленным пользователям по электронной почте, в обновлении будет введена система ценообразования в зависимости от времени суток, которая удваивает стоимость API в часы пик.

В соответствии с новой структурой, цены на модели DeepSeek V4 Pro и V4 Flash останутся неизменными в непиковые часы, но удвоятся в пиковые часы, определяемые как периоды с 9:00 до 12:00 и с 14:00 до 18:00 ежедневно. Для V4 Pro цена за вход в кэш в пиковые часы установлена на уровне 0,05 юаня за миллион токенов, за вход в кэш в случае промаха — 6 юаней за миллион токенов, а за выход — 12 юаней за миллион токенов. Цены на V4 Flash в пиковые часы составляют 0,04 юаня за вход в кэш в случае промаха, 2 юаня за вход в кэш в случае промаха и 4 юаня за миллион токенов за выход.

Этот шаг знаменует собой заметную эволюцию в стратегии ценообразования в сфере ИИ, вызывая сравнения с ценообразованием на электроэнергию в пиковые и спадовые часы, используемым коммунальными компаниями. Один из пользователей отметил, что «токены становятся похожими на электроэнергию — ресурс, который стоит дороже в периоды высокого потребления и дешевле в периоды низкого спроса». Такой подход направлен на сглаживание пиков спроса и обеспечение стабильности обслуживания путем стимулирования пользователей к переносу несрочных задач вывода на непиковые часы.

DeepSeek V4 был первоначально выпущен в предварительной версии в апреле с контекстными окнами, обрабатывающими миллион токенов, расширенными возможностями агента и производительностью мирового класса в области знаний и рассуждений. Модель выпускается в двух размерах: V4-Pro и V4-Flash, причем последняя, согласно данным OpenRouter, является самой часто используемой моделью API в мире на протяжении шести недель подряд.

В официальной версии V4 представлен новый механизм внимания, работающий на уровне сжатия токенов, в сочетании с DeepSeek Sparse Attention (DSA), обеспечивающий лучшие в мире возможности обработки длинных контекстов при значительном снижении вычислительных и запоминающих требований по сравнению с традиционными подходами. DeepSeek гарантирует, что в будущем стандартом для всех официальных сервисов станет 1 миллион окон контекста токенов.

Хотя некоторые пользователи выразили удивление по поводу многоуровневой модели ценообразования, отраслевые аналитики отмечают, что по мере того, как вывод данных с помощью ИИ становится все более ресурсоемким, переменное ценообразование в зависимости от спроса является естественной эволюцией рынка — подобно тому, как поставщики облачных вычислений взимают разную плату за зарезервированные и за экземпляры по запросу.

Источник: Pandaily

Китай Новости

Что думаешь? Оцени!

👍
0
👎
0
🔥
0
🤬
0
🤔
0
💯
0
🧡
0
🤣
0

+ Подписаться