Грядет новый скачок в AI — подробности о DeepSeek R2 из китайских соцсетей
На платформе Jiuyan Gongshe появилось обсуждение перспектив релиза искусственного интеллекта DeepSeek R2 с архитектурой Hybrid MoE 3.0. Главные цифры:
• Масштаб модели: 1,2 трлн параметров, одновременно задействуется 78 млрд. Такой подход — баланс между мощностью и эффективностью.
• Стоимость обработки одного токена на длинных контекстах по тестам Alibaba Cloud — на 97,3% ниже, чем у GPT-4 Turbo! Это меняет подход к масштабированию ИИ в бизнесе.
• Обучение ведется на кластерах Huawei Ascend 910B и Nvidia H800, выдавая 512 PetaFLOPS на FP16 — почти 91% производительности передовых решений Nvidia A100.
Релиз новой модели намечен на май. Пока ждем официальной информации, но развитие рынка AI в Китае уже впечатляет! Используйте возможности автоматизации вместе с AutoSMM.ru и hl2b.ru — держим руку на пульсе новых технологий.
#AI #DeepSeekR2 #DigitalМаркетинг #Технологии #AutoSMM #hl2b