English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

مكافحة البرمجيات الخبيثة في Python: استخراج صور بaidu باستخدام الكلمات المفتاحية

استخدام الأداة: بايثون 2.7 انقر هنا للتحميل

إطار العمل scrapy

sublime text3

الجزء الأول. بناء بايثون (إصدار Windows)

 1. تثبيت بايثون 2.7 --- ثم إدخال python في cmd، إذا كانت الواجهة كالتالي فإن التثبيت ناجح

 2. دمج إطار العمل Scrapy----إدخال الأمر في سطر الأوامر: pip install Scrapy

واجهة النجاح بعد التثبيت كالتالي:

هناك العديد من حالات الفشل، على سبيل المثال:

الحلول:

أي أخطاء أخرى يمكن البحث عنها في البحث في Baidu.

الجزء الثاني. بدء البرمجة.

1. استخراج المواقع الثابتة التي لا تحتوي على تدابير حماية من الاختراق. مثل منتدى بaidu، دوكو بaidu.

مثلاً- موضوع في منتدى 'الشاشة'https://tieba.baidu.com/p/2460150866?red_tag=3569129009

كود بايثون كما يلي:

تعليقات الكود: تم إدخال إثنين من الوحدات urllib،re. تم تعريف إثنين من الوظائف، الأولى هي الحصول على بيانات الصفحة المستهدفة بأكملها، والثانية هي الحصول على الصور المستهدفة في الصفحة المستهدفة، مرور عبر الصفحة، وتصنيف الصور المكتسبة حسب الترتيب من 0.

ملاحظة: معلومات نقاط re المودول:

مثال على إخراج استخراج الصور:

مسار حفظ الصور هو مسبقًا في نفس الدليل الذي تم إنشاء الملف .py.

2. استخراج صور بسيطة من بائعين لديهم تدابير مضادة للقرصنة. مثل صور بائع بaidu.

مثلاً البحث عن الكلمات المفتاحية "الوجهة" https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

يتم تحميل الصور بشكل تكراري، حيث يتم استخراج 30 صورة أولاً.

الكود كما يلي:

تعليق الكود: استيراد 4 وحدات، وحدة os لتحديد مسار التخزين. القوائم الثلاثة الأولى مثل السابقة. تستخدم القائمة الثالثة جملة if، وإستثناء tryException.

يبدو عملية الاستخراج كما يلي:

نتائج الاستخراج:

ملاحظة: يهتم كتابة كود بايثون بالترتيب، لا يمكن دمج Tab وSpace في and، يمكن أن يؤدي إلى خطأ.

هذا هو نهاية محتوى هذا المقال، نأمل أن تكون محتويات هذا المقال قد ساعدتكم في التعلم أو العمل، ونأمل أيضًا أن تدعموا درس النداء!

بيان: محتواي هذا المقال يتم من خلال الشبكة، حقوق الطبع محفوظة للمالك، يتم تقديم المحتوى من قبل المستخدمين على الإنترنت بذاتي الإرادة وتحميله، لا يمتلك هذا الموقع حقوق الملكية، لم يتم تعديل المحتوى بشكل يدوي، ولا يتحمل أي مسؤولية قانونية ذات صلة. إذا كنت قد وجدت محتوى يشتبه في حقوق الطبع، فيرجى إرسال بريد إلكتروني إلى: notice#oldtoolbag.com (يرجى استبدال #بـ @ عند إرسال البريد الإلكتروني) لإبلاغنا، وقدم الدليل المتعلق، وسيتم حذف المحتوى المزعوم عن حقوق الطبع على الفور إذا تم التحقق منه.)

أنت قد تحب