يتصدر الذكاء الاصطناعي السحابي من Google الحدود الثلاثة لقدرات النموذج

باعتباره نائب رئيس المنتج في Google Cloud، يعمل مايكل جيرستنهابر في الغالب على Vertex، النظام الأساسي الموحد للشركة لنشر الذكاء الاصطناعي للمؤسسات. فهو يمنحه رؤية رفيعة المستوى لكيفية استخدام الشركات فعليًا لنماذج الذكاء الاصطناعي، وما الذي لا يزال يتعين القيام به لإطلاق العنان لإمكانات الذكاء الاصطناعي الوكيل.
عندما تحدثت مع مايكل، أذهلتني بشكل خاص فكرة واحدة لم أسمع بها من قبل. وعلى حد تعبيره، فإن نماذج الذكاء الاصطناعي تضغط على ثلاثة حدود في وقت واحد: الذكاء الخام، وزمن الاستجابة، وجودة ثالثة لا علاقة لها بالقدرة الأولية بقدر ما تتعلق بالتكلفة – ما إذا كان من الممكن نشر النموذج بتكلفة زهيدة بما يكفي لتشغيله على نطاق واسع لا يمكن التنبؤ به. إنها طريقة جديدة للتفكير في قدرات النماذج، وهي طريقة ذات قيمة خاصة لأي شخص يحاول دفع النماذج الرائدة في اتجاه جديد.
تم تحرير هذه المقابلة من أجل الطول والوضوح.
لماذا لا تبدأ بإرشادنا عبر تجربتك في مجال الذكاء الاصطناعي حتى الآن، وماذا تفعل في Google؟
لقد كنت في الذكاء الاصطناعي منذ حوالي عامين. لقد كنت في Anthropic لمدة عام ونصف، وأنا في Google منذ ما يقرب من نصف عام حتى الآن. أقوم بتشغيل Vertex، منصة مطوري Google. معظم عملائنا مهندسون يقومون ببناء تطبيقاتهم الخاصة. إنهم يريدون الوصول إلى الأنماط الفاعلية. إنهم يريدون الوصول إلى منصة وكيل. يريدون الوصول إلى استنتاج أذكى النماذج في العالم. أنا أقدم لهم ذلك، لكني لا أقدم الطلبات نفسها. هذا مخصص لـ Shopify وThomson Reuters وعملائنا المختلفين لتقديمها في النطاقات الخاصة بهم.
ما الذي جذبك إلى جوجل؟
أعتقد أن Google هي شركة فريدة من نوعها في العالم من حيث أنها تمتلك كل شيء بدءًا من الواجهة وحتى طبقة البنية التحتية. يمكننا بناء مراكز البيانات. يمكننا شراء الكهرباء وبناء محطات توليد الطاقة. لدينا رقائقنا الخاصة. لدينا نموذجنا الخاص. لدينا طبقة الاستدلال التي نتحكم فيها. لدينا الطبقة الوكيلة التي نتحكم فيها. لدينا واجهات برمجة التطبيقات للذاكرة لكتابة التعليمات البرمجية المتداخلة. لدينا محرك وكيل علاوة على ذلك يضمن الامتثال والحوكمة. ومن ثم لدينا واجهة الدردشة مع Gemini Enterprise وGemini Chat للمستهلكين، أليس كذلك؟ لذا فإن جزءًا من سبب مجيئي إلى هنا هو أنني رأيت Google متكاملة رأسيًا بشكل فريد، وهذا يمثل مصدر قوة لنا.
حدث تك كرانش
بوسطن، MA
|
9 يونيو 2026
إنه أمر غريب لأنه، حتى مع كل الاختلافات بين الشركات، يبدو الأمر كما لو أن المختبرات الثلاثة الكبرى جميعها كذلك بالفعل قريبة في القدرات. هل هو مجرد سباق لمزيد من الذكاء، أم أن الأمر أكثر تعقيدًا من ذلك؟
أرى ثلاثة حدود. تم ضبط نماذج مثل Gemini Pro للحصول على الذكاء الخام. فكر في كتابة التعليمات البرمجية. أنت فقط تريد أفضل رمز يمكنك الحصول عليه، لا يهم إذا استغرق الأمر 45 دقيقة، لأنه يجب علي صيانته، ويجب أن أضعه في مرحلة الإنتاج. أريد فقط الأفضل.
ثم هناك هذه الحدود الأخرى مع الكمون. إذا كنت أقوم بدعم العملاء وأحتاج إلى معرفة كيفية تطبيق سياسة ما، فأنت بحاجة إلى ذكاء لتطبيق تلك السياسة. هل يسمح لك بالتعامل مع العودة؟ هل يمكنني ترقية مقعدي على متن الطائرة؟ لكن لا يهم مدى صوابك إذا استغرق الأمر 45 دقيقة للحصول على الإجابة. لذلك، في تلك الحالات، تريد المنتج الأكثر ذكاءً في حدود ميزانية زمن الوصول هذه، لأن المزيد من الذكاء لم يعد مهمًا بمجرد أن يشعر ذلك الشخص بالملل ويغلق الهاتف.
ثم هناك المجموعة الأخيرة، حيث يريد شخص مثل Reddit أو Meta الإشراف على الإنترنت بالكامل. لديهم ميزانيات كبيرة، لكنهم لا يستطيعون المخاطرة بالمؤسسة في شيء ما إذا كانوا لا يعرفون مدى حجمه. إنهم لا يعرفون عدد المشاركات السامة التي ستكون اليوم أو غدًا. لذلك يتعين عليهم أن يحصروا ميزانيتهم في نموذج يتمتع بأعلى مستوى من الذكاء يمكنهم تحمله، ولكن بطريقة قابلة للتطوير إلى عدد لا حصر له من المواضيع. ولهذا السبب، تصبح التكلفة مهمة جدًا جدًا.
أحد الأشياء التي كنت في حيرة بشأنها هو لماذا تستغرق الأنظمة الوكيلة وقتًا طويلاً حتى تتمكن من اللحاق بها. يبدو الأمر كما لو أن النماذج موجودة وقد رأيت عروضًا توضيحية مذهلة، لكننا لم نشهد نوع التغييرات الرئيسية التي كنت أتوقعها قبل عام. ما الذي تعتقد أنه يعيقه؟
يبلغ عمر هذه التكنولوجيا عامين، ولا يزال هناك الكثير من البنية التحتية المفقودة. ليس لدينا أنماط لمراجعة ما يفعله الوكلاء. ليس لدينا أنماط لترخيص البيانات للوكيل. هناك هذه الأنماط التي سوف تتطلب العمل لوضعها في الإنتاج. والإنتاج هو دائمًا مؤشر لاحق لما تستطيع التكنولوجيا تحقيقه. لذا فإن عامين ليسا فترة طويلة بما يكفي لرؤية ما تدعمه الاستخبارات في الإنتاج، وهذا هو المكان الذي يعاني فيه الناس.
أعتقد أنها انتقلت بسرعة فريدة في هندسة البرمجيات لأنها تتناسب بشكل جيد مع دورة حياة تطوير البرمجيات. لدينا بيئة تطوير يكون من الآمن فيها كسر الأشياء، ومن ثم نقوم بالترقية من بيئة التطوير إلى بيئة الاختبار. تتطلب عملية كتابة التعليمات البرمجية في Google قيام شخصين بتدقيق هذا الرمز ويؤكد كلاهما أنه جيد بما يكفي لوضع علامة Google التجارية خلفنا وتقديمها لعملائنا. لذلك لدينا الكثير من العمليات البشرية التي تجعل التنفيذ منخفض المخاطر بشكل استثنائي. ولكننا بحاجة إلى إنتاج تلك الأنماط في أماكن أخرى وفي مهن أخرى.



