ما هو استخلاص المحتوى وكيف يعمل؟

نشرت: 2022-09-15

يعد تجريف المحتوى أحد أكثر الأنشطة الاحتيالية المزعجة القائمة على الروبوتات. حسنًا ، لن يجعل موقع الويب الخاص بك في وضع عدم الاتصال لعدة أيام. ولكن من المحتمل أن يقوض جهود تحسين محركات البحث الخاصة بك ، أو حتى استخدامه لنسخ موقعك بالكامل لأغراض يحتمل أن تكون شائنة.

على الرغم من أنه يندرج تحت عنوان الانتحال ، وهو بالتأكيد انتهاك لحقوق الطبع والنشر ، فهل هذا حقًا شيء يجب أن تقلق بشأنه؟

ما هو محتوى الكشط؟

إنها النسخ غير المصرح به للمحتوى أو المخزون من موقع ويب إلى آخر. ونعم ، يعد تجريف المحتوى غير قانوني من الناحية الفنية. عادة ما تكون العملية آلية ، مع استخدام الروبوتات للزحف إلى موقع ويب وجمع البيانات التي يتم إعادة توجيهها بعد ذلك في مكان آخر.

على الرغم من أن استخلاص المحتوى يحصد المعلومات المتاحة للجمهور ، فإن المحتوى الرقمي محمي بالفعل بموجب نفس قوانين حقوق النشر التي تتمتع بها المنشورات الأخرى.

إذا كنت قد سمعت عبارة "التقليد هو أفضل شكل من أشكال الإطراء" ، فإن تجريف المحتوى سيجعلك تفكر مرتين.

يمكن لروبوتات الكاشطة هذه أيضًا سحب البيانات من قواعد البيانات المخفية (إذا كانت مؤمنة بشكل غير صحيح) ، ومعلومات التسعير ، وقوائم البريد الإلكتروني ، وحتى خلاصات الوسائط الاجتماعية الخاصة بك.

لحسن الحظ ، هناك طرق لمنع تجريف المحتوى على موقع الويب الخاص بك ، والتي سننظر فيها بعد قليل.

ما هو الهدف من المحتوى كشط؟

إذا كنت تتساءل عن الغرض من تجريف المحتوى لمالك موقع الويب العادي ، فعادةً ما تكون الإجابة بسيطة للغاية: الاحتيال. أحد الأسباب الرئيسية لكشط المحتوى من موقع ويب هو انتحال الموقع أو نسخه لأغراض احتيالية.

إن خداع الناس للاعتقاد بأنهم نقروا على موقع ويب حقيقي يفتح الباب أمام جميع أنواع الأنشطة الخداعية.

متاجر التجارة الإلكترونية المزيفة

يمكن استخدام مواقع الويب المخادعة لخداع الأشخاص لدفع ثمن المنتجات أو الخدمات التي لن يحصلوا عليها على الأرجح.

على سبيل المثال ، قد يقوم المحتال بإنشاء موقع ويب يبدو تمامًا مثل علامة تجارية مشهورة للتجارة الإلكترونية ، أسفل المحتوى مباشرة في الصفحة الأولى وفي المخزون.

يزور مستخدم مطمئن الموقع ، ويرى الكثير من العناصر الخاصة به ويشتريه. لكن منتجهم إما هو شقا منخفض الدرجة ، أو الأسوأ من ذلك ، أنه لا يصل أبدًا. والأسوأ من ذلك ، أن تفاصيل الدفع الخاصة بهم ربما تم حصدها من قبل هؤلاء المحتالين المخادعين بتهمة الاحتيال على بطاقات الدفع.

استضافة إعلانات وهمية

تحظى مواقع الويب المخادعة أيضًا بشعبية لدى مشغلي الاحتيال في النقرات الإعلانية أو الاحتيال على الإعلانات. من المحتمل أيضًا أن تستخدم هذه أسماء النطاقات المخادعة ، على سبيل المثال ؛ forbess dot com أو busnessinsider dot com.

سيستخدم الناشرون المحتالون الذين يستخدمون كشط المحتوى والاحتيال الإعلاني أيضًا أساليب مخادعة أخرى لتضخيم عوائدهم ، مثل استخدام حركة المرور المزيفة أو الروبوت.

للإضافة إلى ذلك ، إذا ظهر موقع الويب الخاص بك كما لو كان جزءًا من حملة احتيال إعلانية (حتى لو لم تكن ملكًا لك) ، فقد يؤثر ذلك سلبًا على سمعتك أيضًا.

تعرف على المزيد حول الاحتيال في الإعلانات في دليلنا.

سرقة أدبية

من الواضح أن أحد أسباب إلغاء المحتوى هو السرقة الأدبية البسيطة. لماذا تهتم؟ حسنًا ، بعض مواقع الويب تريد فقط ملء صفحاتها بالمحتوى وسيأخذون كل ما يمكنهم الحصول عليه.

يمكن أن يعني هذا أيضًا أن بياناتك المسروقة يتم عرضها على مواقع ويب متعددة ، مما يقلل من قوة المحتوى الخاص بك بشكل أكبر.

هناك طريقة مخادعة للالتفاف على المواقع عن طريق استخدام برامج إضافية لإعادة صياغة بعض المحتوى المسروق. على سبيل المثال ، بدلاً من استخدام الجملة:

"يعتبر نسخ المحتوى غير قانوني لأنه يسرق محتوى محمي بحقوق الطبع والنشر"

قد تقول النسخة المقتطفة والمعاد صياغتها:

"جمع السعادة مخالف للقانون لأنه يسرق الكلمات المكتوبة"

قد تلاحظ أن الجملة الثانية ليس لها أي معنى ، حيث تمت ترجمة الكلمات حرفياً. على الرغم من أن المحتوى الخاص بك قد تم سرقته ، وإعادة صياغته ، إلا أنه قد لا يحمل تشابهًا تامًا مع مقالتك بعد الآن.

هل هذا يجعلها مشكلة أقل؟ يمكن للمرء أن يقول نعم ، إنها ليست مشكلة لأن المحتوى الخاص بك لم يتم نسخه مباشرة. ولكن هناك مشكلات أخرى قد تؤثر عليك لاحقًا.

ما هي المشاكل مع محتوى كشط؟

بالطبع مع مواقع الويب المزيفة أو مواقع الويب المصممة للاحتيال باستخدام المحتوى الأصلي المكتوب جيدًا ، هناك مشكلات تتجاوز مجرد الخداع.

كاشطات البيانات التي تزحف إلى موقعك تساهم في انحراف مقاييس الأداء الخاصة بك. كل هذه البيانات المزيفة يمكن أن تجعلها تبدو وكأن موقعك يعمل بشكل جيد ، ولكن في الواقع ، هذه هي تلك الروبوتات الخادعة.

لكن هذا ليس كل شيء ...

من المحتمل أن تكون مُحسّنات محرّكات البحث السلبية هي المشكلة الرئيسية المتعلقة بكشط المحتوى لمعظم الناشرين ومشرفي المواقع.

من الواضح أن مالكي مواقع الويب يضعون الكثير من الوقت والجهد في إنشاء استراتيجيات المحتوى الخاصة بهم وبناء حركة المرور العضوية الخاصة بهم. آخر شيء يحتاجه أي شخص هو أن يأتي مكشطة البيانات ، ويصطاد المحتوى الخاص بك بطريقة غير مشروعة ويضعه في مجال منافس.

والأسوأ من ذلك ، أن هذا المحتوى المكرر يمكن أن يؤثر سلبًا على مُحسنات محركات البحث لديك ، مما يفقدك أماكن في تصنيفات البحث.

على الرغم من أن ممثلي Google ذكروا أن المحتوى المكرر في حد ذاته لن يؤدي إلى عقوبة من Google ، فإن الممارسة تظهر أنه في الواقع يمكن أن يؤثر على تصنيفات البحث الخاصة بك.

ومع تجريف المحتوى ، قد تجد بياناتك تسمح لمواقع الويب الأخرى بالترتيب فوقك! مزدوج محبط.

هناك أيضًا تحديات مع هجمات SEO المزعجة المصممة لإتلاف تصنيفاتك عمدًا.

هل كشط البيانات هو نفسه كشط المحتوى؟

تُعرف إحدى طرق جمع المعلومات باسم تجريف البيانات ، أو تجريف جهة الاتصال ، والتي لها بعض أوجه التشابه مع تجريف المحتوى.

عادةً ما يتضمن تجريف البيانات جمع البيانات المتاحة للجمهور من صفحة ويب مثل معلومات الاتصال. عادةً ما تكون هذه عناوين بريد إلكتروني ، ولكن يمكن أن تكون أي معلومات تستخدمها فرق المبيعات والتسويق مثل أرقام الهواتف وأسماء جهات الاتصال والمزيد.

غالبًا ما يكون ذلك للشركات التي تقوم بإنشاء قوائم لتسويق التوعية المستهدفة ، أو للاتصالات الصحفية.

على الرغم من أن هذا النوع من تجريف المحتوى قد لا يبدو أنه لأغراض ضارة ، يمكن استخدام قاعدة بيانات الويب هذه من خلال ممارسات مزعجة أو ضارة أخرى مثل البريد العشوائي. وغالبًا ما تكون أنواع الأعمال التي تجمع عناوين البريد الإلكتروني بهذه الطريقة

كيفية اكتشاف وحظر تجريف المحتوى

أفضل طريقة لتجنب تجريف المحتوى هي إعداد أنظمة لمراقبته ، وحظر أنواع أدوات كشط الويب المستخدمة.

أولاً ، كيف يمكنك تحديد كاشطات المحتوى؟

اكتشاف كاشطات المحتوى

1. Pingbacks على الروابط الداخلية

إذا كنت تستخدم موقع ويب WordPress أو أي نظام إدارة محتوى آخر مثل Wix ، فيجب أن تحصل على pingback في كل مرة يرتبط فيها منشور بموقعك. يعد هذا مفيدًا بشكل خاص مع إلغاء المحتوى حيث ستحصل على رد pingback إذا قام شخص ما برفع المحتوى الخاص بك والروابط الداخلية وجميع ...

وبالطبع ، قمت بالفعل بتضمين روابط داخلية لأنها أفضل ممارسات تحسين محركات البحث. حق؟

2. ابحث عن العناوين أو النص

إذا كنت تعتقد أن منشورًا معينًا قد تم حذفه ، فيمكنك إجراء بحث عن العنوان لمعرفة ما إذا كان سيظهر في Google أم لا. نأمل أن يكون لك أعلى - ولكن قد يكون هناك أيضًا نسخة مكررة متستر تظهر إذا تم كشطك!

3. تنبيهات جوجل

تعد تنبيهات Google واحدة من أفضل الأدوات المجانية التي يمكنك استخدامها لمراقبة محتوى الويب الخاص بك. يمكنك إعداد تنبيه لتتبع محتوى الويب الخاص بك (بما في ذلك العنوان أو ربما الموضوع فقط إذا كنت تكتب عن موضوع متخصص). اضبط التنبيهات مرة واحدة في الأسبوع لتجنب ازدحام بريدك الوارد ، أو الأفضل إنشاء صندوق بريد محدد لتنبيهاتك.

4. استخدام أدوات الكلمات الرئيسية

نظرًا لأنك تستخدم بالفعل أدوات مثل Ahrefs أو SEM Rush أو Grammarly ، يمكنك أيضًا استخدامها للعثور على محتوى ويب مكرر. سوف تجد Grammarly ، بالطبع ، الانتحال الذي يمكن أن يتضمن أيضًا محتوى مسروقًا. اقرأ المزيد على مدونات Ahrefs و SEM Rush حول التعامل مع المحتوى المكرر.

منع كاشطات المحتوى

هناك عدة طرق لمنع برامج كاشفة المحتوى من الوصول إلى موقع الويب الخاص بك. أحدها هو إبقاء المحتوى الخاص بك مقيدًا ، مما يعني أن المستخدمين بحاجة إلى ملء نموذج للوصول إلى الأدلة أو الكتب الإلكترونية أو الموارد الأخرى.

يمكن أن يعمل هذا مع أولئك الذين يتطلعون إلى استخدام مواردهم كعملاء محتملين للتسويق الداخلي ، ولكن قد لا يناسب الجميع. خاصة إذا كنت تريد أن تكون مدونتك قابلة للوصول إلى حركة البحث على الإنترنت.

بالطبع الطريقة الأكثر فاعلية لتجنب مشكلة تجريف المحتوى هي… لمنع كاشطات المحتوى!

Bot Zapping من ClickCease هي أداة جديدة مصممة لإيقاف الروبوتات الآلية الضارة على مواقع WordPress. يتضمن ذلك روبوتات البريد العشوائي وعمليات تسجيل الدخول بالقوة الغاشمة وإدخال البرامج الضارة وبالطبع كشط المحتوى.

إذا كنت ترغب في الحفاظ على المحتوى الأصلي محميًا ، وكذلك تجنب نقل البيانات من موقع الويب الخاص بك ، فإن Bot Zapping هو ما تحتاجه. تقوم أداة منع الروبوتات الجديدة الخاصة بنا بتوجيه الروبوتات إلى صفحة 403 حتى لا يتمكنوا من الوصول إلى أي معلومات أو بيانات على صفحتك.

استخدم Bot Zapping لـ WordPress كجزء من اشتراك ClickCease ، أو كخدمة مستقلة.

جرب ClickCease مجانًا مع الإصدار التجريبي لمدة 7 أيام.