الفهرسة الدلالية الكامنة: كيف تعمل خوارزمية LSI؟

نشرت: 2021-11-26

تستخدم Google LSI لتقييم معنى المحتوى المكتوب على مدونتك أو موقعك على الويب. الفهرسة الدلالية الكامنة هي تسمية خاطئة لـ "التحليل الدلالي الكامن" ، وهي تقنية تحليلية إحصائية يمكنها استخدام سلاسل الأحرف لتحديد دلالات النص - ما يعنيه النص في الواقع.

سنناقش هنا بعض جوانب إل. إس. آي. LSI التي تجعلك تفكر بشكل مختلف حول الكلمات الرئيسية وكيفية كتابة المحتوى الخاص بك. ضع في اعتبارك أن Google أكبر في حركة البحث ، فهي تحصل على جميع محركات البحث الأخرى مجتمعة. أيضًا ، يستخدم بعض هؤلاء الآخرين بيانات Google. هذا هو السبب في أننا نركز عليه.

ما هي الفهرسة الدلالية الكامنة؟

هدف Google هو تزويد عملائها بأفضل المعلومات الممكنة عندما يجرون بحثًا. لذلك يجب أن تفهم Google تمامًا ماهية المعلومات التي يبحث عنها الباحثون بالضبط عند استخدامهم الكلمات الرئيسية للمعلومات ، وكذلك إلى أي مدى توفر كل صفحة ويب مفهرسة هذه المعلومات.

تم تطوير خوارزمية الفهرسة الدلالية الكامنة (LSI) من Google لاستخدام سلاسل الأحرف في مستند لإثبات صلتها الدلالية بمصطلح البحث (الكلمة الرئيسية) المستخدمة. بمعنى آخر ، للمساعدة في تحديد المعنى الحقيقي للنص في منشور مدونة أو صفحة ويب.

تأخذ خوارزمية LSI في الاعتبار جميع المصطلحات المكونة المستخدمة في نص المستند لتأسيس معناه الحقيقي فيما يتعلق بالكلمات الرئيسية المستخدمة. لهذا السبب من المهم أن تكون محددًا عند البحث عن معلومات على Google. إذا كنت تستخدم كلمة "Apache" كمصطلح بحث في Google ، فستتضمن النتائج الست الأولى تطبيق خادم الويب ، والقبيلة الأمريكية الأصلية ، وطائرات الهليكوبتر Apache ، وشركة التنقيب عن النفط والغاز التي تستخدم هذا الاسم.

لا يمكنك افتراض أن Google ستعيد نفس التعريف لمصطلح البحث الذي تفكر فيه. يجب ألا تستخدم فقط كلمتك الرئيسية الرئيسية ، ولكن يجب عليك تحديد تعريفها فيما يتعلق باستخدامك لها.

Apache Google Search Results

بالطريقة نفسها ، إذا كنت تستخدم مفهوم LSI في النص الخاص بك ، فيمكنك زيادة احتمالية إدراج صفحتك أو منشور المدونة الخاص بك لمصطلح البحث هذا في السياق الذي تستخدمه فيه. هذا صحيح ، حتى إذا كان النص الموجود على صفحة الويب أو منشور المدونة الخاص بك لا يذكر الكلمة الرئيسية "apache" - أو أي كلمة رئيسية أخرى تستخدمها. إليكم السبب.

يتضمن LSI تحليل سلسلة الأحرف

لا تستخدم الخوارزمية قاموسًا كما نعرفه ، ولكنها تتضمن تحليلًا إحصائيًا ورياضيًا معقدًا للأحرف الفردية وسلاسل الأحرف المستخدمة في النص الذي يتكون من صفحة ويب معينة. من غير المهم سواء كانت صفحة مدونة أو منشورًا أو صفحة كاملة على موقع ويب أو حتى تعليق منشور أو سلسلة منتدى. LSI لتقييم محتوى أي ملف فردي منشور على الويب.

لهذا السبب ، قدمت Google وسيلة قوية جدًا للتمييز بين اللغة والمفردات والدلالات. كيف تختلف هذه؟ إليك الطريقة:

اللغة: تشير الكلمة عادة إلى أشكال الكلمات المكتوبة أو المنطوقة الخاصة بدولة أو مجتمع معين. وبالتالي ، فإن السلسلة النصية "ألم" تعني "خبز" باللغة الفرنسية ، ولكن ليس باللغة الإنجليزية. لا تستطيع Google معرفة الفرق ما لم تفهم اللغة المستخدمة.

المفردات: تشير هذه الكلمة إلى الكلمات المستخدمة في لغة معينة. يمكن أن يشير أيضًا إلى نطاق الكلمات التي يعرفها شخص معين داخل اللغة. تشير "اللغة السيئة" إلى استخدام المفردات وليس اللغة. "Box" هي كلمة في مفردات اللغة الإنجليزية ، لكن هذه الكلمة لها معاني عديدة ، تقودنا إلى:

الدلالات: يمكن استخدام نفس الكلمة للدلالة على أشياء كثيرة. وبالتالي فإن كلمة "صندوق" يمكن أن تعني حاوية ، للقتال ، لتلاوة نقاط بوصلة أو نوع من الأدغال. تشير الدلالات إلى معنى الكلمات في سياق معين. يمكن للغة السيئة أن تعبر عن المعنى جيدًا - لذلك قد تشكل دلالات فعالة!

النحو: الطريقة التي يتم بها دمج الكلمات في الجملة. وبالتالي ، يمكن التعبير عن الكلمات "الكلب يعض الرجل" باستخدام صيغة مختلفة مثل " عض الرجل الكلب. "قبل LSI ، لم يكن بمقدور Google تمييز الاختلاف - اكتشفت الكلمات فقط.

تأخذ خوارزمية LSI من Google كل من هذه العوامل في الاعتبار. إذا كنت تفكر بعمق كافٍ ، فستتمكن من فهم سبب عدم جدوى تكرار الكلمات الرئيسية ، ولماذا يمكن أن توفر لك كثافة الكلمات الرئيسية المنخفضة (KD) نتائج ترتيب أفضل من KD عالية.

تقوم الخوارزمية بتحليل معنى الكلمات في صفحة الويب أو المدونة الخاصة بك باستخدام الدلالات والنحو ، وتطابقها مع المعنى المدرك للكلمات الرئيسية التي يستخدمها الشخص الذي يجري البحث.

كلمة رئيسية أم معنى؟

ما هو أكثر أهمية لقرائك؟ كلمات أم معنى؟ لنفترض أنك تبحث عن معلومات عبر الإنترنت باستخدام محرك بحث. ما الذي تفضل العثور عليه: صفحة تقدم الكثير من التكرارات لكلمتك الرئيسية ، ولكن القليل جدًا منها ، أو صفحة توفر لك ما تبحث عنه ، حتى إذا لم تتمكن من العثور على مصطلح البحث في النص؟

أنت تعرف الإجابة على ذلك ، وكذلك يعرف Google. كانت المشكلة أنه في الأيام الأولى من وجوده ، كان محرك بحث Google قادرًا على إيجاد وفهرسة وترتيب صفحات الويب التي تحتوي على مصطلح البحث (الكلمة الرئيسية / العبارة) التي يستخدمها أولئك الذين يبحثون عن المعلومات.

إذا كان منشور المدونة أو صفحة الويب الخاصة بك لا تحتوي على الكلمة الأساسية للعبارة المستخدمة في مصطلح البحث عدة مرات ، فلن يتم سردها وإظهارها لأي شخص يستخدم هذه العبارة - في المستقبل نشير إلى الكلمات الرئيسية على أنها كلمة واحدة أو عدة كلمات. لذا خمن ماذا!

حشو الكلمات الرئيسية والبرمجيات

أصبح من الشائع حشو صفحات الويب المليئة بالكلمات الرئيسية. وكلما زاد عدد الأشخاص المرتبطين بالمرح ، سيحتلهم موقع Google مرتبة عالية في صفحات النتائج لتلك الكلمة الرئيسية. حقق رواد الأعمال ثرواتهم من خلال تصميم برامج (تطبيقات لك الشباب) من شأنها أن تأخذ صفحة واحدة من النص وتنتج المئات من الصفحات الأخرى ، ولا يغير شيئًا سوى الكلمة الأساسية المستخدمة لتلك الصفحة.

تم تقديم العديد من الأشخاص الذين كانوا يستخدمون محرك البحث للعثور على المعلومات المهمة جدًا لديهم بصفحة على صفحة من الهراء غير المجدي الذي لم يمنحهم شيئًا سوى الإعلانات وتكرار نفس الأشياء مرارًا وتكرارًا.

حتى مشرفي المواقع اشتكوا إلى Google حول كيفية إدراج مثل هذه الصفحات فوق تلك التي كانت تقدم معلومات حقًا. كان السبب ، بالطبع ، تكرار الكلمات الرئيسية. كانت الطريقة التي تم بها إعداد خوارزمية الترتيب هي أنه كلما زاد عدد الكلمات الرئيسية ، زاد الترتيب. كان يجب أن يتوقف هذا.

اكتشف Google هذا ، ولذا قررت أن تفعل شيئًا حيال ذلك ، لكن ماذا؟ بدأت باستخدام خوارزمية Adsense التي استخدمت الدلالات لإنشاء أفضل نوع من الإعلانات لأي صفحة ويب محددة. لقد طور هذا المفهوم بشكل أكبر ، باستخدام التحليل الدلالي الكامن لإنشاء خوارزمية الفهرسة الدلالية الكامنة. المزيد عن هذا قريبا.

يستخدم إل إس آي (LSI) مفهوم التحليل الدلالي الكامن لمسح جميع المفردات ، وبناء الجملة ، والدلالات الموجودة في الصفحة لتحديد معناها الحقيقي. عن طريق LSI ، يمكن لـ Google مقارنة مصطلح البحث الذي يستخدمه عملاؤها مع صفحات الويب المفهرسة وتحديد أفضل تطابق لمصطلح البحث / الكلمة الرئيسية من خلال تحليل جميع المفردات الموجودة في الصفحة ، وليس الكلمات الرئيسية فقط. كيف تفعل ذلك؟

مشكلة الغموض في اللغة والمفردات

لنفترض أنك تكتب كتابًا عن اختراع واستخدام الأقفال عبر التاريخ. أنت بحاجة إلى بعض المعلومات عبر الإنترنت حول الموضوع ، لذلك أدخل مصطلح البحث "الأقفال وسجلها". أو ربما ، "تاريخ الأقفال".

السؤال الأول الذي يجب مراعاته هو "ما نوع الأقفال؟" هل تكتب عن أقفال الأمان - الأقفال والمفاتيح أم عن أقفال القناة؟ أو ربما تشير إلى خصلات الشعر؟ بالنسبة لمعظم الناس ، من المحتمل أن يكون الخياران الأولان فقط - أقفال القناة أو تلك التي تحتاج إلى مفاتيح لفتحها.

بالنسبة إلى Google ، كلهم ​​متماثلون. الكلمة الرئيسية هي "أقفال" أو "تاريخ الأقفال" ولكن كيف تعرف الآلة ما الذي تتحدث عنه؟ لا يمكن أن يطلب منك - كل ما يمكنه فعله هو أخذ سلسلة الأحرف التي تتكون منها الكلمات ، والبحث عنها في منشورات المدونة المفهرسة وصفحات الويب.

أثر اقتناء دلالات التطبيقية

جاءت الإجابة بعد أن اشترت Google شركة سانتا مونيكا في عام 2003 تُعرف باسم أبلايد دلالات. كانت هذه الشركة تعمل على خوارزميات تطبق الدلالات لفهم المعنى الحقيقي للنص المكتوب. اشترت Google الشركة ثم طبقت مبادئها على برنامج Adsense الخاص بها.

هذا هو البرنامج المذكور سابقًا ، حيث تضع Google إعلانات PPC ذات الصلة على صفحات الويب الخاصة بك. تم استخدام مبادئ الدلالات التطبيقية لإنشاء أفضل نوع إعلان لصفحتك ، بناءً على التركيز الحقيقي لمحتواها.

واصلت Google تطوير هذه التقنية التحليلية الرياضية وأخيراً توصلت إلى ما يشار إليه بالفهرسة الدلالية الكامنة. باستخدام LSI ، يمكن لـ Google فهرسة صفحتك ثم ترتيبها وفقًا لمعناها ومحتواها الإجمالي بدلاً من استخدامها فقط للكلمات الرئيسية.

كيف تعمل خوارزمية LSI: الكلمات الأساسية والدلالات؟

ستنظر Google في المفردات الأخرى على صفحتك ، ثم تجري تحليلًا إحصائيًا لسياق وتركيب هذه المفردات. إذا بحث أحد مستخدمي Google عن "سجل أقفال الأمان" ، فستأخذ Google المفردات الأخرى لصفحاتها المفهرسة في الاعتبار. إذا كانت صفحتك تحتوي على كلمات مثل "المفاتيح" و "الرافعات" و "الأبواب" ، فسوف تربط هذه المفردات بأقفال الأمان.

بعد أخذ عوامل التصنيف الأخرى في الاعتبار ، ستقوم بعد ذلك بإدراج صفحتك في صفحات نتائج البحث لتلك الكلمة الرئيسية (سجل أقفال الأمان) مرتبة وفقًا للفوائد التي تعتقد Google أنها تقدمها للباحث. قبل LSI ، كان يُعطى الباحث أيضًا صفحات تركز على أقفال القناة وحتى على الشعر.

أنظر أيضا
بحث جيد عن الكلمات الرئيسية لترتيب مقال

تجنب حشو الكلمات الرئيسية

بيت القصيد هنا هو أنه لم تعد هناك حاجة للتكرار المفرط للكلمات الرئيسية. منذ أن قدمت Google LSI ، كل ما عليك فعله هو التأكد من أنك تستخدم أكبر عدد ممكن من المرادفات والمصطلحات ذات الصلة بالكلمة الرئيسية التي تطاردها.

لكن لا تخطئ في فهمنا - فالكلمات الرئيسية لا تزال مهمة. لا يزال يتعين عليك استخدام الكلمات الرئيسية ذات الصلة ، لكن Google تستخدم مفهوم LSI لتحديد محتوى موقع الويب حقًا: ما يقوله حقًا. إنها عبارة عن صفحات مكتوبة خصيصًا لإدراجها في القائمة للكلمات الرئيسية الفردية ، ولكنها تحتوي على القليل من المحتوى المفيد بخلاف التكرارات التي لا معنى لها للكلمة الرئيسية.

لا يزال بإمكانك استخدامها ، على الرغم من أن 1.5٪ دينار كويتي أو أقل ستكون كافية تمامًا. استخدم الكلمات الرئيسية باعتدال واستخدم أيضًا مصطلحات أخرى تعني نفس الشيء في سياق مكانتك. هذه هي الإجابة على سؤالك - كيف تعمل خوارزمية LSI - ولماذا تعتبر الفهرسة الدلالية الكامنة مصطلحًا لا تحتاج إلى تذكره طالما أنك تفهم وتطبق المفاهيم التي تستخدمها Google عندما تستخدم LSI في خوارزميات الفهرسة والترتيب.