أعلنت شركة «ديب سيك» الصينية الناشئة في مجال الذكاء الاصطناعي، اليوم (الخميس)، عن تحديث لنموذجها الرائد V3، والذي يتضمن ميزة تتيح تحسين الأداء باستخدام رقائق صينية الصنع، إلى جانب زيادة في سرعة المعالجة.
يعكس هذا التركيز على التوافق مع الرقائق المحلية توجه الشركة لتكييف نماذجها مع النظام الإيكولوجي لأشباه الموصلات الصينية الناشئة، في ظل سعي بكين لاستبدال التكنولوجيا الأمريكية نتيجة قيود التصدير التي تفرضها واشنطن.
وأحدثت «ديب سيك» ضجة في عالم التكنولوجيا هذا العام بإطلاق نماذج ذكاء اصطناعي تنافس نظيراتها الغربية مثل «تشات جي بي تي» من «أوبن إيه آي»، مع تقديم تكاليف تشغيل أقل.
ويأتي تحديث نموذج V3.1 بعد تحديثين سابقين لنماذجها الأساسية، الأول لنموذج R1 في مايو، والثاني تحسين لنموذج V3 في مارس.
وأوضحت الشركة في منشور على «وي تشات» أن نموذج V3.1 يستخدم تنسيق UE8M0 FP8، وهو تنسيق معالجة بيانات بدقة 8 بت يعزز كفاءة النماذج، مما يقلل استهلاك الذاكرة ويزيد السرعة مقارنة بالطرق التقليدية، وهو مصمم للعمل مع الرقائق المحلية الجيل القادم التي لم تُحدد الشركة تفاصيلها أو الشركات المصنعة لها.
ويتضمن نموذج V3.1 هيكلية استدلال هجينة تمكن النموذج من العمل في وضعين: التفكير المنطقي وغير المنطقي، مع إمكانية التبديل بينهما عبر زر «التفكير العميق» على تطبيق الشركة ومنصتها الإلكترونية.
كما أعلنت الشركة عن تعديل تكاليف استخدام واجهة برمجة التطبيقات (API) الخاصة بالنموذج، والتي تتيح للمطورين دمج نماذج الذكاء الاصطناعي في تطبيقاتهم، اعتبارًا من 6 سبتمبر.
ويعزز هذا التحديث مكانة «ديب سيك» في السوق العالمية، ويبرز جهود الصين لتحقيق الاكتفاء الذاتي في تكنولوجيا الذكاء الاصطناعي وسط التوترات التجارية مع الولايات المتحدة.
The Chinese startup "Deep Seek" in the field of artificial intelligence announced today (Thursday) an update to its flagship model V3, which includes a feature that allows for performance enhancement using locally made chips, along with an increase in processing speed.
This focus on compatibility with local chips reflects the company's direction to adapt its models to the emerging Chinese semiconductor ecosystem, as Beijing seeks to replace American technology due to export restrictions imposed by Washington.
Deep Seek has made waves in the tech world this year by launching AI models that compete with their Western counterparts, such as "ChatGPT" from OpenAI, while offering lower operating costs.
The update to model V3.1 follows two previous updates to its core models, the first for model R1 in May, and the second an improvement for model V3 in March.
The company explained in a post on WeChat that model V3.1 uses the UE8M0 FP8 format, which is an 8-bit precision data processing format that enhances model efficiency, reducing memory consumption and increasing speed compared to traditional methods. It is designed to work with next-generation local chips, the details of which the company has not specified, nor the manufacturers.
Model V3.1 includes a hybrid inference architecture that enables the model to operate in two modes: logical and illogical thinking, with the ability to switch between them via a "deep thinking" button on the company's app and online platform.
The company also announced a modification to the costs of using the model's API (Application Programming Interface), which allows developers to integrate AI models into their applications, effective September 6.
This update strengthens Deep Seek's position in the global market and highlights China's efforts to achieve self-sufficiency in AI technology amid trade tensions with the United States.