0 حسين محمد7 نشر 9 سبتمبر 2020 أرسل تقرير نشر 9 سبتمبر 2020 WaveNet هي شبكة عصبية عميقة لتوليد الصوت الخام. تم إنشاؤه من قبل باحثين في شركة الذكاء الاصطناعي DeepMind ومقرها لندن. هذه التقنية ، الموضحة في ورقة بحثية في سبتمبر 2016 ، قادرة على توليد أصوات تشبه الإنسان تبدو واقعية نسبيًا عن طريق نمذجة أشكال الموجة مباشرة باستخدام طريقة الشبكة العصبية المدربة على تسجيلات الكلام الحقيقي. أظهرت الاختبارات باللغة الإنجليزية الأمريكية والماندرين أن النظام يتفوق في الأداء على أفضل أنظمة تحويل النص إلى كلام (TTS) الموجودة في Google ، على الرغم من أنه اعتبارًا من عام 2016 كان توليف تحويل النص إلى كلام أقل إقناعًا من الكلام البشري الفعلي. إن قدرة WaveNet على إنشاء أشكال موجية خام تعني أنه يمكنها نمذجة أي نوع من الصوت ، بما في ذلك الموسيقى. اقتباس
0 مصطفى القباني نشر 9 سبتمبر 2020 أرسل تقرير نشر 9 سبتمبر 2020 ـ WaveNet هي شبكة عصبية، يتم تدريبها على الأصوات وبعد ذلك يتم إستخدامها لتوليد أصوات مشابهة لما تم التدريب عليه. وتقوم الشبكة بتعلم الأصوات عن طريق تحويل الصوت إلى ما يسمى بmel spectrograms، وهي طريقة لتحويل الصوت من موجات إلى صورة ثنائية الأبعاد. على سبيل المثال في هذا التطبيق لشبكة WaveNet من شركة Nvidia، يتم تدريب الشبكة على أصوات من dataset تسمى arctic data، وبعد إنتهاء التدريب تكون الشبكة قد استوعبت طريقة الكلام، على الرغم من عدم توليدها كلام مفهوم، لكنها تكون قد استوعبت الأصوات ومخارج الحروف والتغيرات في نبرات الصوت. ويمكن إستخدام ما تم تعلمه في الشبكة كخطوة وسيطة في تحويل الكتابة إلى أصوات. يمكنك تدريب الWaveNet على google colab من هنا. بالتوفيق اقتباس
السؤال
مريم البتول
ماذا يقصد بنظام WaveNet؟
2 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.