اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

إن المصطلح الصحيح لل SVM و الذي هو اختصار ل Support Vector Machine هو آلة الُمَّتجهات الداعمة.

و هو عبارة عن أحد الخوارزميات التي يتم استعمالها في عملية التعلم للقيام بفصل العينات إلى أصناف، أي يستعمل مع مهام التصنيف.

و هو يعتمد على فكرة إيجاد أفضل طريقة فصل بحيث تكون قدر الإمكان غير مبهمة، أي مثلًا تخيل أنه لدينا صنفين يمكن تمثيلهما على شكل نقاط في مستوي الإحداثيات، و يمكن فصلهما عن طريق خط مستقيم. قد يكون هناك الكثير من الحلول لذلك و لكن بعض هذه الحلول قد تجعل الخط قريبًا من بعض النقاط مما يجعل هذه النقاط مبهمة حيث أنها قريبة جدًا من الخط و لذلك لسنا متأكدين أنها فعلًا تتبع إلا الجانب الصحيح. لذلك تعمل هذه الخوارزمية على إيجاد الخط الفاصل الأبعد عن كل النقاط بحيث تحل هذه المشكلة.

لفهم هذه الفكرة بشكل أوضح انظر إلى الرسمة التالية، بشكل واضح الخط الأحمر أفضل من الخط الأزرق حيث أنه يفصل النقاط بشكل أفضل.

image.thumb.png.9c66844557d6c12b829b2602dbf28d67.png

فهم كيفية عمل هذه الخوارزمية هو أمر معقد جدًا فهي تعتمد على أمور معقدة في الرياضيات و لكن ما شرحته هو تبسيط للمهمة التي تحاول هذه الخوارزمية تحقيقها.

طبعًا قمت بالشرح على بعدين فقط و لكن الخوارزمية تطبق بشكل عام على دخل بعدد كبير من الأبعاد و ذلك حتى يمكنها تعلم فصل خطي في هذه الأبعاد ينعكس بشكل فصل غير خطي عند إعادته إلى بعدين فقط، هذه أمور ستتعلمها لاحقًا و لكن أردت ذكرها حتى يكون الجواب كامل.

تحياتي.

  • 0
نشر

SVM مبنية على فكرة إيجاد مستوي hyperplane والذي يقوم بتقسيم البيانات الى عدة اجزاء منفصلة بحيث يمثل كل جزء منهم class او تصنيف معين من البيانات.وتعتبر أقرب نقطتين للمستوي الفائق الذي تقوم برسمه ال SVM هي المتجهات الداعمة او support vector كما هو موضح في الصورة التالية:

image.png.baceef58b78ddb5592d52c0cfc4957a6.png

بالنسبة لمميزات SVM، فهي فعالة في البيانات عالية الأبعاد و تعمل بشكل جيد مع البيانات التي تحتوي على العديد من الميزات، و أيضا فعالة في البيانات التي يكون فيها عدد العينات أقل من عدد الميزات.

و تستخدم عادة في تصنيف النصوص كتصنيف البريد الإلكتروني العشوائي، وتحليل المشاعر، أو التعرف على الصور كالتعرف على الوجوه، وتصنيف الصور.

 

  • 0
نشر

عبارة عن نظام دعم الالي لتعلم الآلة الذي يستخدم لتحليل البيانات والتنبؤ بالنتائج، وهو أحد أنواع أنظمة التعلم الآلي التي تسمى النماذج الخطية، والتي تحاول إيجاد أفضل خط أو سطح منفصل بين فئات مختلفة في البيانات.

بحيث يستخدم SVM مبدأ "الحد الأقصى للهامش" (Maximum Margin) لتحديد أفضل حدود الفصل بين الفئات، وذلك المبدأ يهدف إلى إيجاد خط أو سطح منفصل بين الفئات بحيث يكون الهامش بينهما أكبر ما يمكن، مما يسمح النظام بالتعميم الأفضل على البيانات الجديدة.

ويعمل SVM بشكل جيد حتى مع وجود العديد من الميزات وقادر على التعامل مع البيانات غير الخطية باستخدام الوظائف النووية (Kernel Functions)، وقوي ضد البيانات الزائدة لأن استخدام الهامش يؤدي إلى تقليل فرصة فرط التخصيص.

لكن اختيار الوظيفة النووية المناسبة أمرًا صعبًا وبطيئًا من الناحية الحسابية لمجموعات البيانات الكبيرة جدًا.

ويتم تطبيق SVM في العديد من المجالات، منها:

  • التصنيف Classification لفصل البيانات إلى فئات مختلفة.
  • التنبؤ بالنتائج Regression لتنبؤ قيم متغيرة.
  • الكشف عن الشذوذ Anomaly Detection لاكتشاف البيانات الشاذة أو غير العادية.
  • تحليل العناصر Feature Selection لاختيار الميزات الأكثر أهمية في البيانات.

ومن أهم أنواع SVM:

  • SVM خطي Linear SVM لفصل البيانات الخطية.
  • SVM غير خطي Non-Linear SVM لفصل البيانات غير الخطية باستخدام دوال Kernel 
  • SVM للاستقراء SVM for Regression يستخدم لتنبؤ قيم متغيرة.
  • 0
نشر

نظام الدعم الآلي SVM (Support Vector Machine) هو تقنية تعلم آلي تُستخدم للتصنيف والتنبؤ. يعتمد على إيجاد الفاصل الأمثل الذي يفصل بين مجموعات البيانات المختلفة بأكبر هامش. يمكن استخدامه في التصنيف الثنائي والتعرف على الأنماط، وله تطبيقات مثل التعرف على النصوص والصور والتنبؤ بالسوق. يتميز SVM بفعاليته في المساحات العالية الأبعاد واستخدامه لمجموعة فرعية من نقاط التدريب، لكنه يمكن أن يكون بطيئًا على مجموعات البيانات الكبيرة وقد يتطلب اختيار دالة كيرنية مناسبة.

في هذه المقالة ستتعرف أكثر على هذا النظام:

  • 0
نشر
بتاريخ On 28‏/6‏/2024 at 18:02 قال Kais Hasan:

إن المصطلح الصحيح لل SVM و الذي هو اختصار ل Support Vector Machine هو آلة الُمَّتجهات الداعمة.

و هو عبارة عن أحد الخوارزميات التي يتم استعمالها في عملية التعلم للقيام بفصل العينات إلى أصناف، أي يستعمل مع مهام التصنيف.

و هو يعتمد على فكرة إيجاد أفضل طريقة فصل بحيث تكون قدر الإمكان غير مبهمة، أي مثلًا تخيل أنه لدينا صنفين يمكن تمثيلهما على شكل نقاط في مستوي الإحداثيات، و يمكن فصلهما عن طريق خط مستقيم. قد يكون هناك الكثير من الحلول لذلك و لكن بعض هذه الحلول قد تجعل الخط قريبًا من بعض النقاط مما يجعل هذه النقاط مبهمة حيث أنها قريبة جدًا من الخط و لذلك لسنا متأكدين أنها فعلًا تتبع إلا الجانب الصحيح. لذلك تعمل هذه الخوارزمية على إيجاد الخط الفاصل الأبعد عن كل النقاط بحيث تحل هذه المشكلة.

لفهم هذه الفكرة بشكل أوضح انظر إلى الرسمة التالية، بشكل واضح الخط الأحمر أفضل من الخط الأزرق حيث أنه يفصل النقاط بشكل أفضل.

image.thumb.png.9c66844557d6c12b829b2602dbf28d67.png

فهم كيفية عمل هذه الخوارزمية هو أمر معقد جدًا فهي تعتمد على أمور معقدة في الرياضيات و لكن ما شرحته هو تبسيط للمهمة التي تحاول هذه الخوارزمية تحقيقها.

طبعًا قمت بالشرح على بعدين فقط و لكن الخوارزمية تطبق بشكل عام على دخل بعدد كبير من الأبعاد و ذلك حتى يمكنها تعلم فصل خطي في هذه الأبعاد ينعكس بشكل فصل غير خطي عند إعادته إلى بعدين فقط، هذه أمور ستتعلمها لاحقًا و لكن أردت ذكرها حتى يكون الجواب كامل.

تحياتي.

هو طبعان بستخدم مع البيانات مُسماة labeled ؟

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...