تقنية

هل كشف البحث عن حوسبة الذكاء الاصطناعي عن Cerebras التالي؟


لقد تسارع الطلب المتزايد على أجهزة الكمبيوتر لتشغيل نماذج الذكاء الاصطناعي، ولكن هناك عقبتين رئيسيتين يجب على أي شخص في هذا المجال التغلب عليهما: الحصول على الرقائق المناسبة، وإدخالها في مراكز البيانات حيث يمكنهم البدء في تحقيق الإيرادات.

لدى شركة General Compute، وهي شركة نيوكلاود جديدة للاستدلال – وهي شركة تؤجر قوة معالجة الذكاء الاصطناعي، وتتخصص في المرحلة التي يتم فيها تشغيل النماذج والاستجابة للمستخدمين بدلاً من تدريبها – إجابات على تلك الأسئلة التي تسلط الضوء على الاتجاه الذي يتجه إليه النظام البيئي للذكاء الاصطناعي. ساعدتها هذه الإجابات في جمع جولة أولية بقيمة 15 مليون دولار أمريكي بتقييم ما بعد النقد بقيمة 60 مليون دولار أمريكي، بقيادة FUSE VC بمشاركة Carya Venture Partners وVillage Global Ventures.

أولا ما هي الشريحة الصحيحة؟ لقد وصل الطلب على وحدات معالجة الرسوميات إلى الحد الأقصى، ولكن أصبح من الحكمة التقليدية أنها ليست الرقائق الأكثر ملاءمة لتشغيل نماذج الذكاء الاصطناعي بمجرد تدريبها. إن مرحلة الذكاء الاصطناعي التي يقوم فيها النموذج بتوليد الاستجابات بشكل نشط لها متطلبات حسابية مختلفة عن التدريب، ويتم تصميم فئة جديدة من الرقائق خصيصًا لها. تشير صفقة Groq لشركة Nvidia بقيمة 20 مليار دولار في ديسمبر والاكتتاب العام الأولي لشركة Cerebras بقيمة 57 مليار دولار الأسبوع الماضي إلى الطريق.

ومع توتر القدرات في هاتين الشركتين، وجد المؤسسان المشاركان لشركة General Compute، الرئيس التنفيذي Finn Puklowski وCTO Jason Goodison، خيارًا آخر. إنهم يتجهون إلى الرقائق المتخصصة التي صنعتها شركة SambaNova، وهي شركة تصنيع الرقائق المدعومة من شركة Intel والتي تركز على الاستدلال والتي خرجت قليلاً عن محادثة وادي السيليكون.

وقد يتغير ذلك عندما تطلق SambaNova شرائحها الجديدة هذا العام. تعتبر البنية أكثر مرونة وتستخدم المزيد من الذاكرة لتخزين السياق أثناء حسابات الاستدلال، وتدعي SambaNova أنها لا تتفوق في الأداء على وحدات معالجة الرسوميات فحسب، بل تتفوق أيضًا على الشرائح المتخصصة الأخرى التي صممتها أمثال Groq أو Cerebras. يقول بوكلوسكي إن الرقائق الجديدة ستولد ما بين 600 إلى 700 رمزًا في الثانية، مقابل حوالي 250 رمزًا في الثانية لوحدات معالجة الرسوميات.

لدى شركة General Compute طلب شراء شرائح SN50 الخاصة بالشركة بقيمة 300 مليون دولار، وتقول إنها ستكون أول سحابة جديدة تنشرها.

تساعد هذه الرقائق أيضًا في حل المشكلة الكبيرة الثانية – مكان وضعها – بالنسبة للحوسبة العامة: فهي مبردة بالهواء، وليست مبردة بالماء، وتستهلك طاقة أقل، لذا يمكن تركيبها في مرافق مراكز البيانات الحالية دون الحاجة إلى استثمارات جديدة في البنية التحتية.

يسعى Puklowski إلى تنفيذ صفقات التجميع – الترتيبات التي تقوم فيها شركة General Compute بتثبيت أجهزتها في منشأة شخص آخر – ليس فقط مع موفري مراكز البيانات، ولكن أيضًا مع القائمين بتعدين العملات المشفرة الذين يتطلعون إلى إعادة استخدام البنية التحتية الخاصة بهم لأن تكلفة إنتاج البيتكوين غالبًا ما تجاوزت سعرها.

أطلقت شركة General Compute عرضها السحابي الأسبوع الماضي، مدعية أنها الأسرع بالفعل في تشغيل MiniMax 2.7، وهو برنامج LLM قوي ومفتوح المصدر.

جو هاسيلمان هو مستثمر استثماري دخل الطابق الأرضي من طفرة الاستدلال عندما استثمر في Groq في عام 2021. أطلق هذا العام صندوقًا جديدًا، Evercrest Capital Partners، يركز على مجال الذكاء الاصطناعي، وجعل General Compute أول استثمار له. ويرى هاسلمان أن شراكة SambaNova مع General Compute توازي علاقة Coreweave مع Nvidia – وإقران صناعة الرقائق الخاصة بـ Groq مع عروضها السحابية السابقة.

وقال هاسلمان: “إنهم بحاجة إلى مزيج صحي من العملاء الذين سيضعون رقائقهم في بيئات ستحقق لهم نمواً مرتفعاً”. “بقدر ما تراهن شركة General Compute على SambaNova، فإن SambaNova تراهن على General Compute.”

والسؤال هو ما هو نوع بنية الكمبيوتر التي ستحظى بأكبر قيمة في مستقبل الذكاء الاصطناعي. إن السحب الاستدلالية هي رهانات ضمنية على عالم من النماذج والوكلاء المتعددين، حيث لا يهيمن أي مزود واحد، وتصبح سرعة وتكلفة الاستدلال هي المتغيرات التنافسية الرئيسية. خذ بعين الاعتبار مبلغ 113 مليون دولار من السلسلة B التي تم جمعها لـ OpenRouter هذا الأسبوع، مما يعكس قدرة الشركة على تزويد العملاء بإمكانية الوصول إلى نماذج متعددة من أجل تحسين إنفاقهم المميز.

السرعة مهمة في هذا الحساب، بالنسبة للسعر والقدرة. يريد بوكلوسكي تحويل أعباء العمل التي تستغرق ساعة لوكلاء التشفير إلى مهام مدتها خمس أو عشر دقائق، وإنشاء وكلاء صوتيين لخدمة العملاء، الأمر الذي يتطلب استنتاجًا أسرع للتحدث بشكل فعال وأكثر اقتصادا.

قال بوكلوسكي لـ TechCrunch: “إذا كنت تستخدم ChatGPT ويمنحك 50 رمزًا مميزًا في الثانية، فلا يزال هذا أسرع كثيرًا مما يمكننا قراءته، والآن بعد أن انتقلت الأمور إلى وكيل إلى وكيل، حيث يقرء الوكلاء نيابةً عنا أو يقومون بإجراء اختبار اتصال لقواعد البيانات، فإنهم بحاجة إلى التحرك بشكل أسرع.”

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلالنا التحريري.



Source link

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى