الفضاء الرقمي

9 سبتمبر 2020

ماذا يقصد بنظام WaveNet؟

9 سبتمبر 2020

WaveNet هي شبكة عصبية عميقة لتوليد الصوت الخام. تم إنشاؤه من قبل باحثين في شركة الذكاء الاصطناعي DeepMind ومقرها لندن. هذه التقنية ، الموضحة في ورقة بحثية في سبتمبر 2016 ، قادرة على توليد أصوات تشبه الإنسان تبدو واقعية نسبيًا عن طريق نمذجة أشكال الموجة مباشرة باستخدام طريقة الشبكة العصبية المدربة على تسجيلات الكلام الحقيقي. أظهرت الاختبارات باللغة الإنجليزية الأمريكية والماندرين أن النظام يتفوق في الأداء على أفضل أنظمة تحويل النص إلى كلام (TTS) الموجودة في Google ، على الرغم من أنه اعتبارًا من عام 2016 كان توليف تحويل النص إلى كلام أقل إقناعًا من الكلام البشري الفعلي. إن قدرة WaveNet على إنشاء أشكال موجية خام تعني أنه يمكنها نمذجة أي نوع من الصوت ، بما في ذلك الموسيقى.

9 سبتمبر 2020

ـ WaveNet هي شبكة عصبية، يتم تدريبها على الأصوات وبعد ذلك يتم إستخدامها لتوليد أصوات مشابهة لما تم التدريب عليه.

وتقوم الشبكة بتعلم الأصوات عن طريق تحويل الصوت إلى ما يسمى بmel spectrograms، وهي طريقة لتحويل الصوت من موجات إلى صورة ثنائية الأبعاد.

على سبيل المثال في هذا التطبيق لشبكة WaveNet من شركة Nvidia، يتم تدريب الشبكة على أصوات من dataset تسمى arctic data، وبعد إنتهاء التدريب تكون الشبكة قد استوعبت طريقة الكلام، على الرغم من عدم توليدها كلام مفهوم، لكنها تكون قد استوعبت الأصوات ومخارج الحروف والتغيرات في نبرات الصوت.

ويمكن إستخدام ما تم تعلمه في الشبكة كخطوة وسيطة في تحويل الكتابة إلى أصوات.

يمكنك تدريب الWaveNet على google colab من هنا.

بالتوفيق

الفضاء الرقمي

السؤال

مريم البتول

2 أجوبة على هذا السؤال

Recommended Posts

حسين محمد7

مصطفى القباني

انضم إلى النقاش

إعلانات

تابعنا على

الرئيسية

كيف أتعلم؟

تابعنا

دروس ومقالات

أسئلة وأجوبة

كتب

دورات

بطاقات هدية