HardWord نشر 14 أكتوبر 2015 أرسل تقرير نشر 14 أكتوبر 2015 أثناء تجربتي لبرنامج أقوم ببرمجته لاستخراج معلومات من مواقع الويب (روابط، نماذج..) أحصل على أخطاء عديدة من نوع invalid byte sequence in UTF-8 فما هو هذا الخطأ؟ وكيف أستطيع حل هذه المشكلة؟ اقتباس
0 هشام رزق الله نشر 14 أكتوبر 2015 أرسل تقرير نشر 14 أكتوبر 2015 عندما تتعامل مع نصوص بترميز UTF-8 من مصادر غير موثوقة مثل نماذج الويب، فإنه من الجيد أن تقوم بإصلاح أي تسلسل من البايتات غير الصحيحة حتى تتجنب كسر خطوات المعالجة التي تعتمد على المدخلات الصالحة، لذلك في مثل هذه الحالة، يُنصح بأن يتم باستخدام UTF-8//IGNORE والتي تُخبر مفسر روبي بأن يتجاهل البايتات التي لا يمكن تحويلها كما في المثال التالي:ic = Iconv.new('UTF-8//IGNORE', 'UTF-8') valid_string = ic.iconv(untrusted_string) حيث ستستبدل untrusted_string بالسلسلة النصية التي حصلت عليها من مصدر غير موثوق.المصدر اقتباس
السؤال
HardWord
أثناء تجربتي لبرنامج أقوم ببرمجته لاستخراج معلومات من مواقع الويب (روابط، نماذج..) أحصل على أخطاء عديدة من نوع invalid byte sequence in UTF-8 فما هو هذا الخطأ؟ وكيف أستطيع حل هذه المشكلة؟
1 جواب على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.