تطلق Cohere نموذجًا صوتيًا مفتوح المصدر خصيصًا للنسخ

أطلقت شركة Cohere للذكاء الاصطناعي يوم الخميس أول نموذج صوتي لها: Transcribe هو نموذج مفتوح المصدر للتعرف التلقائي على الكلام يمكن استخدامه لمهام مثل تدوين الملاحظات وتحليل الكلام.
خفيف نسبيًا عند 2 مليار معلمة فقط، النموذج مخصص للاستخدام مع وحدات معالجة الرسومات المخصصة للمستهلكين لأولئك الذين يرغبون في استضافته ذاتيًا. وهو يدعم حاليًا 14 لغة: الإنجليزية والفرنسية والألمانية والإيطالية والإسبانية والبرتغالية واليونانية والهولندية والبولندية والصينية واليابانية والكورية والفيتنامية والعربية.
يقول Cohere إن Transcribe يتفوق على نماذج مثل Zoom Scribe v1، وIBM Granite 4.0 1B، وElevenLabs Scribe v2، وQwen3-ASR-1.7B Speech على لوحة المتصدرين Hugging Face Open ASR، محققًا متوسط معدل خطأ في الكلمات (WER) يبلغ 5.42، وهو أقل من أي نموذج آخر في المعيار.
تدعي الشركة أن Transcribe حقق متوسط معدل فوز يبلغ 61% مقارنة بالنماذج الأخرى عندما قام المقيمون البشريون بتقييم نسخها للتأكد من دقتها وتماسكها وسهولة استخدامها. ومع ذلك، فقد تخلف هذا النموذج عن منافسيه عندما اضطر إلى نسخ اللغات البرتغالية والألمانية والإسبانية.
يقول Cohere إن Transcribe يمكنه معالجة 525 دقيقة من الصوت في دقيقة واحدة، وهو رقم مرتفع بالنسبة لفئة طرازه.
وتخطط الشركة لدمج Transcribe في منصة تنسيق وكلاء المؤسسات الخاصة بها، North، وإتاحة النموذج من خلال واجهة برمجة التطبيقات (API) الخاصة بها مجانًا. سيكون النموذج متاحًا أيضًا على Model Vault، منصة الاستدلال المُدارة من Cohere.
تزداد شعبية نماذج التعرف على الكلام مع تزايد الطلب على تطبيقات تدوين الملاحظات والإملاء مثل Granola وWispr Flow.
حدث تك كرانش
سان فرانسيسكو، كاليفورنيا
|
13-15 أكتوبر 2026
في وقت سابق من هذا العام، أفادت التقارير أن شركة Cohere أخبرت المستثمرين أنها ستحقق إيرادات سنوية متكررة تبلغ 240 مليون دولار في عام 2025، ونُقل عن رئيسها التنفيذي، إيدان جوميز، قوله إن الشركة الناشئة قد يتم طرحها للاكتتاب العام “قريبًا”.



