تجعل Google بيانات العالم الحقيقي في متناول الذكاء الاصطناعي-وسوف تحبها أنابيب التدريب

تقوم Google بتحويل بياناتها العامة الواسعة إلى منجم ذهبي لمنظمة العفو الدولية مع ظهور خادم بروتوكول سياق نموذج Commons (MCP)-مما يتيح للمطورين ، وعلماء البيانات ، ووكلاء الذكاء الاصطناعي الوصول إلى إحصائيات العالم الحقيقي باستخدام لغة طبيعية وأنظمة تدريب AI بشكل أفضل.
تم إطلاقها في عام 2018 ، وتنظم شركة Google Data Commons مجموعات البيانات العامة من مجموعة من المصادر ، بما في ذلك الدراسات الاستقصائية الحكومية ، والبيانات الإدارية المحلية ، والإحصاءات من الهيئات العالمية مثل الأمم المتحدة. مع إصدار خادم MCP ، يمكن الآن الوصول إلى هذه البيانات عبر اللغة الطبيعية ، مما يسمح للمطورين بدمجها في وكلاء أو تطبيقات الذكاء الاصطناعي.
غالبًا ما يتم تدريب أنظمة الذكاء الاصطناعى على بيانات الويب الصاخبة غير المحددة. إلى جانب ميلهم إلى “ملء الفراغات” عندما تفتقر المصادر ، فإن هذا يؤدي إلى الهلوسة. نتيجة لذلك ، غالبًا ما تحتاج الشركات التي تتطلع إلى ضبط أنظمة الذكاء الاصطناعى لحالات الاستخدام المحددة إلى الوصول إلى مجموعات بيانات كبيرة عالية الجودة. من خلال إطلاق خادم MCP علنًا من أجل بيانات البيانات الخاصة به ، تهدف Google إلى مواجهة كلا التحديات.
Data Commons الجديد من MCP Server Bridges مجموعات البيانات العامة – من أرقام التعداد إلى إحصاءات المناخ – مع أنظمة الذكاء الاصطناعى التي تعتمد بشكل متزايد على سياق دقيق ومنظم. من خلال جعل هذه البيانات متاحة عبر مطالبات اللغة الطبيعية ، يهدف الإصدار إلى وضع AI في معلومات حقيقية يمكن التحقق منها.
“إن بروتوكول سياق النموذج يتيح لنا استخدام ذكاء نموذج اللغة الكبير لاختيار البيانات المناسبة في الوقت المناسب ، دون الحاجة إلى فهم كيفية تصميم البيانات ، وكيفية عمل واجهة برمجة التطبيقات الخاصة بنا” ، قال رئيس شركة Google Commons Prem Ramaswami في مقابلة.
تم تقديم MCP لأول مرة من قبل الإنسان في نوفمبر الماضي ، وهو معيار صناعة مفتوح يمكّن أنظمة الذكاء الاصطناعى من الوصول إلى البيانات من مصادر مختلفة ، بما في ذلك أدوات الأعمال ، ومستودعات المحتوى ، وبيئات تطوير التطبيقات ، مما يوفر إطارًا مشتركًا لفهم المطالبات السياقية. منذ إطلاقها ، اعتمدت شركات مثل Openai و Microsoft و Google المعيار لدمج نماذج الذكاء الاصطناعى مع مصادر البيانات المختلفة.
بينما استكشفت شركات التكنولوجيا الأخرى كيفية تطبيق المعيار على نماذج الذكاء الاصطناعى الخاصة بها ، بدأ Ramaswami وفريقه في Google في التحقيق في كيفية استخدام الإطار لجعل منصة Commons Data يمكن الوصول إليها في وقت سابق من هذا العام.
حدث TechCrunch
سان فرانسيسكو
|
27-29 أكتوبر ، 2025
عقدت Google أيضًا شراكة مع حملة One ، وهي منظمة غير ربحية تركز على تحسين الفرص الاقتصادية والصحة العامة في إفريقيا ، لإطلاق وكيل البيانات الواحد. تستخدم أداة الذكاء الاصطناعى خادم MCP لتسطح عشرات الملايين من نقاط البيانات المالية والصحية بلغة واضحة.
اقتربت الحملة الواحدة من فريق Commons من Google مع تنفيذ نموذج أولي لـ MCP على الخادم المخصص الخاص به. أخبر راماسوامي أن هذا التفاعل هو نقطة التحول التي دفعت الفريق إلى إنشاء خادم MCP مخصص في مايو.
ومع ذلك ، فإن التجربة لا تقتصر على الحملة الواحدة. تجعل الطبيعة المفتوحة لخادم Data Commons MCP متوافقًا مع أي LLM ، وقد وفرت Google عدة طرق للمطورين للبدء. يتوفر وكيل عينة من خلال مجموعة تطوير الوكيل (ADK) في دفتر كولاب ، ويمكن أيضًا الوصول إلى الخادم مباشرة عبر Gemini CLI أو أي عميل متوافق مع MCP باستخدام حزمة PYPI. يتم توفير رمز المثال أيضًا على مستودع GitHub.