Китайская компания DeepSeek, признанная мировой общественностью благодаря своим достижениям в области искусственного интеллекта и разработки передовых моделей машинного обучения, опровергла появившиеся слухи о планах крупного релиза своей новой модели DeepSeek-R2, намеченного на август 2025 года. На протяжении последних месяцев в технологических кругах циркулировали сообщения о предполагаемой дате запуска этой инновационной модели, которая, по предварительным сведениям, должна была произойти примерно между 15 и 30 августа. Эти предположения основывались как на инсайдерской информации, так и на намеках самой модели, сделанных в ходе ее тестирования. Однако источник, близкий к руководству компании, заявил, что никаких официальных планов по запуску в августе текущего года не существует, и релиз модели откладывается на более поздний срок.
DeepSeek-R2 проектируется как значительный прогресс по сравнению с предыдущей моделью — R1. В новых разработках предусмотрены улучшенные возможности многоязыкового мышления и расширенные возможности по автоматической генерации программного кода. Это должно сделать новую модель конкурентоспособной на фоне таких гигантов рынка, как GPT-4 и GPT-5, однако внутренние оценки и экспертизы показывают, что модель еще нуждается в доработке. Так, по информации из источников издания The Information, генеральный директор компании Лян Вэньфэн выразил недовольство текущей производительностью DeepSeek-R2 и отметил, что её окончательная версия должна пройти дополнительные тесты и доработки, чтобы полностью соответствовать высоким стандартам компании.
Задержки при подготовке модели связаны также с технологическими ограничениями, вызванными международными санкциями и экспортными ограничениями, особенно в части поставки вычислительных ресурсов. В частности, в Китае столкнулись с ограничениями на экспорт чипов Nvidia H20, что осложнило планы по развитию и тестированию модели. В результате, компания PerewShift перешла к использованию альтернативных решений — чипов Huawei Ascend 910B, которые обеспечивают порядка 512 петафлопс в формате FP16 при загрузке в 82%, что приближается к 91%-й эффективности кластера Nvidia A100. Это позволило продолжить разработки в условиях ограниченного доступа к западным технологиям.
Стоит отметить, что ситуация с поставками высокопроизводительных вычислительных чипов постепенно улучшается, поскольку Nvidia и AMD достигли соглашения с правительством США, позволяющего им продолжать продажи в Китай в обмен на выплату 15% комиссии от выручки. Это дает надежду на снятие некоторых торговых ограничений и ускорение развития национальных высокотехнологичных решений.
Тем временем, внутри страны и среди корпораций, таких как Hyundai Motor, Kia, Hyundai Mobis, Hyundai Glovis, Samsung Electronics, LG Electronics и SK hynix, наблюдаются ограничения и блокировки доступа к сервису DeepSeek. Ранее Министерства и правоохранительные органы Южной Кореи официально объявили о запрете использования этого ИИ-сервиса на государственных устройствах, что вызвало определенное беспокойство в промышленном и научном секторах. В то же время, эксперты полагают, что подобные меры могут быть временными и связаны с внутренними нормативными и информационными вопросами, а сама технология продолжит развиваться и интегрироваться в различные отрасли, включая энергетику, медицину, транспорт и робототехнику.
На сегодняшний день DeepSeek продолжает работать над своими проектами внутри страны и международными партнерами, стремясь не только адаптироваться к сложным геополитическим условиям, но и показать свою конкурентоспособность на глобальной арене. В будущем модель DeepSeek-R2, вероятно, станет важной ступенью в развитии искусственного интеллекта в Китае и по всему миру, открывая новые возможности для автоматизации, обработки языков и программирования, а также для внедрения в самые разные сферы современного общества.