مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

63 خبر
  • كأس العالم لكرة القدم
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان
  • هدنة وحصار المضيق
  • كأس العالم لكرة القدم

    كأس العالم لكرة القدم

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • مونديال 2026

    مونديال 2026

  • منتدى بطرسبورغ الاقتصادي الدولي

    منتدى بطرسبورغ الاقتصادي الدولي

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • عملاق إيطالي يدخل خط المنافسة ويتحرك لضم محمد صلاح

    عملاق إيطالي يدخل خط المنافسة ويتحرك لضم محمد صلاح

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي

طوّر باحثو جامعة نوفوسيبيرسك التقنية الروسية أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي.

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي
صورة إرشيفية / abc-av.ru

أفاد بذلك  المشرف على المشروع يغور أنتونيانتس في حديث أدلى به لوكالة "تاس" الروسية.

يهدف هذا التطوير إلى المهام التي تتطلب إنتاجا مستقلا للمقطوعات الموسيقية والأجزاء الغنائية والمؤثرات الصوتية بناء على أوصاف نصية دون الارتباط بخدمات سحابية. ووفقا للمطورين، يوفر النظام دورة كاملة لإنتاج المحتوى الصوتي،  بدءا من الطلب النصي ووصولا للتصدير إلى المنصات واسعة الاستخدام WAV و MP3 و FLAC، ويعمل النظام  في نفس الوقت على أجهزة استهلاكية بحجم ذاكرة فيديو أقل من 6 غيغابايت.

وأشار أنتونيانتس إلى أن  "الميزة الرئيسية لتطويرنا هي الاستقلالية الكاملة عن المنصات الأجنبية وإمكانية العمل في بيئة مغلقة. لقد قمنا بضبط النموذج الأساسي باستخدام محولات LoRA المتخصصة لثلاثة أنواع من المحتوى، وهي الموسيقى الآلية، والأغاني المصحوبة بصوت بشري، والمؤثرات الصوتية، مما يتجنب تأثير اختلاط الخصائص ويحقق تطابقا أدق مع الطلب".

وعلى عكس الحلول الأساسية الموجهة للمستخدمين الناطقين بالإنجليزية، فإن الأداة الجديدة مهيأة للعمل مع الاستعلامات الناطقة بالروسية وتُظهر نتائج تنافسية. فقد بلغ متوسط معيار التقييم الذاتي MOS 4.1 من أصل 5 نقاط، وهو ما يُقارن بمعدلات المنصات التجارية الرائدة.

وأوضح مطور المشروع أرتور خوساينوف قائلا: " من ناحية تقنية تتم المعالجة على عدة مراحل: يقوم نموذج لغوي أولا بتشكيل هيكل دلالي للمقطوعة باستخدام سلسلة من التفكير، ثم يقوم المحول الانتشاري (diffusion transformer) بالتركيب الصوتي في الفضاء الكامن، أما وحدة التصدير فتقوم بتحويل المحتوى إلى الصيغ المستهدفة. وتسمح الواجهة الرسومية المدمجة بإدارة المشاريع، وحفظ وتحميل إعدادات التوليد المسبقة، والمعاينة قبل الاستماع، وتصدير المسارات دون الحاجة إلى محررات خارجية".

وأكد مبتكرو البرنامج أنهم يخططون مستقبلا لتوسيع النظام، بما في ذلك إضافة دعم الصوت المكاني لتطبيقات الواقع الافتراضي، وتنفيذ التكامل مع وحدات تحكم MIDI للتفاعل الحي، وتكييف البرنامج للسيناريوهات الصناعية،  بدءا من إنشاء مقاطع صوتية لألعاب الفيديو ووصولا إلى الدبلجة الآلية للأفلام والبث المباشر والبودكاست والإعلانات التجارية.

المصدر: تاس

التعليقات

مجلة عسكرية: خروج مركز العمليات الجوية الأمريكية في قاعدة العديد بقطر عن الخدمة

عراقجي يرد بعنف على هجوم عون غير المسبوق على إيران و"حزب الله"

صحيفة إسرائيلية تكشف عن أسماء قد تكون عطلت عملية ضخمة للموساد وأمريكا لإسقاط النظام في إيران

لأول مرة إسرائيل تنشر أسرار الزيارة التي غيرت التاريخ وخوفها من هبوط "طائرة السادات" في بن غوريون

بوتين يصف رسالة زيلينسكي بـ"الوقحة" ويوجه الجيش الروسي: "اعملوا أيها الإخوة"

إنذارات بهجمات صاروخية ومسيرات معادية في الكويت والبحرين (فيديوهات)

إيران تهدد ترامب بحرب تمتد من هرمز إلى المحيط الهندي ومضيق باب المندب والبحرين الأحمر والمتوسط

استخبارات البنتاغون ترفع مستوى خطر التجسس الإسرائيلي على الولايات المتحدة إلى أعلى درجة

ترامب يستخدم الذكاء الاصطناعي لتوثيق حال السفن الحربية الإيرانية في قاع البحر (فيديو)

الكرملين: واشنطن تحاول الانسحاب من مفاوضات أوكرانيا بعد إدراكها حتمية انتصار روسيا

الظلال هي الدليل.. قنصلية إيرانية تحاول بـ"صورة" تفكيك "لغز" ضربات مطار الكويت

لحظة بلحظة.. استمرار القصف المتبادل بين "حزب الله" وإسرائيل رغم وقف إطلاق النار

نتنياهو يلغي التصويت على قرار وقف إطلاق النار بعد بيان أمين عام "حزب الله"

بوتين يرد على إشارة زيلينسكي لعمره: الكفاءة أهم من العمر