قامت (Google) بالكشف عن نموذج الذكاء الاصطناعي اللغوي الجديد AudioPaLM.
أعلنت Google عن إطلاق نموذجها الجديد للذكاء الاصطناعي اللغوي بعنوان AudioPaLM، والذي يتمتع بقدرة استثنائية على الاستماع، والتحدث، والترجمة بدقة عالية وبسرعة فائقة.
ويعتمد هذا النموذج الجديد، كما يوحي اسمه، أساسًا على نقاط القوة في نموذجين آخرين معروفين سابقًا وهما PaLM-2 و AudioLM.
كما يندرج نموذج PaLM-2 ضمن فئة النماذج اللغوية الضخمة LLMs، والتي تتمتع بقدرة فهم ومحاكاة وتوليد النصوص بطريقة تشبه لغات البشر. بالمقابل، يركز نموذج AudioLM على جوانب مثل الحفاظ على هوية المتحدث ونغمة الصوت.
ولقد دمج الباحثون في Google بين النموذجين السابقين لإنشاء نموذج جديد يُسمى AudioPaLM، والذي يهدف إلى توليد النصوص والكلام بكفاءة عالية.
وتم تطوير نموذج AudioPaLM الجديد للقيام بمجموعة واسعة من المهام المتنوعة، مثل الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نغمة الصوت الأصلية. بالإضافة إلى ذلك، يستطيع النموذج التقاط الأصوات والأوامر المنطوقة، ومن ثم إعادة إنتاجها بلغات مختلفة أخرى.
ووفقًا للباحثين العاملين على النموذج، يعمل أيضًا على التعرف على الأصوات وتحويلها إلى نصوص، بحيث يمكنه ترجمة التراكيب اللغوية التي لم يتعامل معها من قبل بدقة كبيرة.
ويتمّ حاليًا استكشاف وتطوير نموذج Google، ولم يتم تحديد موعد لإتاحته للجمهور حتى الآن.
ومن ناحية أخرى، أعلنت شركة Meta سابقًا عن نموذج ذكاء اصطناعي جديد يحمل اسم Voicebox، وهو نموذج حديث قادر على أداء مهام إنشاء الكلام بفاعلية. كما يمكن له تحرير المقاطع الصوتية بكفاءة واستخدام العينات الصوتية لإنتاج كلام بلغات مختلفة وغير ذلك.