5 ข้อมูลเชิงลึกเกี่ยวกับสถิติการรวบรวมข้อมูลยอดนิยมใน Google Search Console

เผยแพร่แล้ว: 2021-04-16

มีรายงานหนึ่งฉบับใน Google Search Console ที่มีประโยชน์อย่างยิ่งและค่อนข้างหายาก โดยเฉพาะอย่างยิ่งหากคุณเพิ่งเริ่มต้นเส้นทาง SEO

เป็นหนึ่งในเครื่องมือที่ทรงพลังที่สุดสำหรับผู้เชี่ยวชาญด้าน SEO ทุกคน แม้ว่าคุณจะไม่สามารถเข้าถึงได้จากภายในอินเทอร์เฟซหลักของ Google Search Console

ฉันกำลังพูดถึงรายงานสถิติการรวบรวมข้อมูล

ในบทความนี้ คุณจะได้เรียนรู้ว่าเหตุใดรายงานนี้จึงมีความสำคัญ วิธีการเข้าถึง และวิธีการใช้เพื่อประโยชน์ SEO

เว็บไซต์ของคุณมีการรวบรวมข้อมูลอย่างไร

งบประมาณการรวบรวมข้อมูล (จำนวนหน้าที่ Googlebot สามารถและต้องการรวบรวมข้อมูล) เป็นสิ่งจำเป็นสำหรับ SEO โดยเฉพาะอย่างยิ่งสำหรับเว็บไซต์ขนาดใหญ่

หากคุณมีปัญหาเกี่ยวกับงบประมาณการรวบรวมข้อมูลของเว็บไซต์ Google อาจไม่จัดทำดัชนีหน้าเว็บอันมีค่าของคุณ

อย่างที่ว่ากันว่า ถ้า Google ไม่ได้จัดทำดัชนีของบางอย่าง มันก็ไม่มีอยู่จริง

Google Search Console สามารถแสดงจำนวนหน้าในเว็บไซต์ของคุณที่ Googlebot เข้าชมทุกวัน

ด้วยความรู้นี้ คุณจะพบความผิดปกติที่อาจเป็นสาเหตุของปัญหา SEO ของคุณ

เจาะลึกสถิติการรวบรวมข้อมูลของคุณ: 5 ข้อมูลเชิงลึกที่สำคัญ

ในการเข้าถึงรายงานสถิติการรวบรวมข้อมูล ให้ลงชื่อเข้าใช้บัญชี Google Search Console และไปที่ การตั้งค่า > สถิติการรวบรวมข้อมูล

นี่คือมิติข้อมูลทั้งหมดที่คุณสามารถตรวจสอบได้ในรายงานสถิติการรวบรวมข้อมูล:

1. โฮสต์

ลองนึกภาพว่าคุณมีร้านค้าอีคอมเมิร์ซบน shop.website.com และบล็อกบน blog.website.com

เมื่อใช้รายงานสถิติการรวบรวมข้อมูล คุณสามารถดูสถิติการรวบรวมข้อมูลที่เกี่ยวข้องกับแต่ละโดเมนย่อยของเว็บไซต์ของคุณได้อย่างง่ายดาย

ขออภัย วิธีนี้ใช้ไม่ได้กับโฟลเดอร์ย่อยในขณะนี้

2. สถานะ HTTP

กรณีการใช้งานอื่นสำหรับรายงานสถิติการรวบรวมข้อมูลคือการดูรหัสสถานะของ URL ที่รวบรวมข้อมูล

นั่นเป็นเพราะคุณไม่ต้องการให้ Googlebot ใช้ทรัพยากรในการรวบรวมข้อมูลหน้าเว็บที่ไม่รองรับ HTTP 200 เป็นการสิ้นเปลืองงบประมาณการรวบรวมข้อมูลของคุณ

หากต้องการดูรายละเอียดของ URL ที่รวบรวมข้อมูลตามรหัสสถานะ ให้ไปที่ การตั้งค่า > สถิติการรวบรวมข้อมูล > รายละเอียดคำขอรวบรวมข้อมูล

รายงานสถิติการรวบรวมข้อมูลของ Google Search Console แสดงรายละเอียดของ URL ที่รวบรวมข้อมูลตามประเภทการตอบกลับ HTTP

ในกรณีนี้ 16% ของคำขอทั้งหมดถูกสร้างขึ้นสำหรับหน้าที่เปลี่ยนเส้นทาง

หากคุณเห็นสถิติเช่นนี้ เราขอแนะนำให้คุณตรวจสอบเพิ่มเติมและมองหาการเปลี่ยนเส้นทางและปัญหาอื่นๆ ที่อาจเกิดขึ้น

ในความคิดของฉัน หนึ่งในกรณีที่เลวร้ายที่สุดที่คุณสามารถเห็นได้คือข้อผิดพลาด 5xx จำนวนมาก

หากต้องการอ้างอิงเอกสารของ Google: “หากเว็บไซต์ทำงานช้าลงหรือตอบสนองด้วยข้อผิดพลาดของเซิร์ฟเวอร์ ขีดจำกัดจะลดลงและ Googlebot จะรวบรวมข้อมูลน้อยลง”

หากคุณสนใจหัวข้อนี้ Roger Montti เขียนบทความโดยละเอียดเกี่ยวกับข้อผิดพลาด 5xx ใน Google Search Console

3. วัตถุประสงค์

รายงานสถิติการรวบรวมข้อมูลแบ่งวัตถุประสงค์ในการรวบรวมข้อมูลออกเป็นสองประเภท:

  • URL ที่รวบรวมข้อมูลเพื่อวัตถุประสงค์ในการรีเฟรช (การรวบรวมข้อมูลหน้าที่รู้จักแล้วซ้ำ เช่น Googlebot กำลังไปที่หน้าแรกของคุณเพื่อค้นหาลิงก์และเนื้อหาใหม่)
  • URL ที่รวบรวมข้อมูลเพื่อวัตถุประสงค์ในการค้นพบ (URL ที่มีการรวบรวมข้อมูลเป็นครั้งแรก)

รายละเอียดนี้มีประโยชน์อย่างยิ่ง และนี่คือตัวอย่าง:

ฉันเพิ่งพบเว็บไซต์ที่มีหน้าเว็บประมาณ 1 ล้านหน้าซึ่งจัดอยู่ในประเภท "ค้นพบแล้ว ยังไม่ได้จัดทำดัชนี"

มีการรายงานปัญหานี้สำหรับ 90% ของหน้าทั้งหมดบนเว็บไซต์นั้น

(หากคุณไม่คุ้นเคย “ค้นพบแต่ไม่ใช่ดัชนี” หมายความว่า Google ค้นพบหน้าเว็บที่ระบุ แต่ไม่ได้เข้าชม หากคุณพบร้านอาหารใหม่ในเมืองของคุณแต่ไม่ได้ลองทำดู เป็นต้น .)

ทางเลือกหนึ่งคือรอ โดยหวังว่า Google จะค่อยๆ จัดทำดัชนีหน้าเหล่านี้

อีกทางเลือกหนึ่งคือการดูข้อมูลและวินิจฉัยปัญหา

ดังนั้นฉันจึงลงชื่อเข้าใช้ Google Search Console และไปที่ Settings > Crawl Stats > Crawl Requests: HTML

ปรากฎว่าโดยเฉลี่ยแล้ว Google เข้าชมเพียง 7460 หน้าบนเว็บไซต์นั้นต่อวัน

แผนภูมิแสดงสถิติการรวบรวมข้อมูลของเว็บไซต์อีคอมเมิร์ซ

แต่นี่เป็นสิ่งที่สำคัญยิ่งกว่า

ขอบคุณรายงานสถิติการรวบรวมข้อมูล ฉันพบว่ามีเพียง 35% ของ 7460 URL เหล่านี้ที่ได้รับการรวบรวมข้อมูลเนื่องจากเหตุผลในการค้นพบ

การรายงานสถิติการรวบรวมข้อมูลของ Google Search Console แสดงรายละเอียดของวัตถุประสงค์ในการรวบรวมข้อมูล

นั่นเป็นเพียง 2611 หน้าใหม่ที่ Google ค้นพบต่อวัน

2611 จากกว่าล้าน

Google จะใช้เวลา 382 วันในการจัดทำดัชนีเว็บไซต์ทั้งหมดตามจังหวะนั้น

การค้นพบสิ่งนี้เป็นตัวเปลี่ยนเกม การเพิ่มประสิทธิภาพการค้นหาอื่นๆ ทั้งหมดถูกเลื่อนออกไป เนื่องจากเรามุ่งเน้นอย่างเต็มที่กับการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูล

4. ประเภทไฟล์

สถิติการรวบรวมข้อมูล GSC มีประโยชน์สำหรับเว็บไซต์ JavaScript คุณตรวจสอบได้ง่ายๆ ว่า Googlebot รวบรวมข้อมูลไฟล์ JS ที่จำเป็นสำหรับการแสดงผลที่เหมาะสมบ่อยเพียงใด

หากไซต์ของคุณเต็มไปด้วยรูปภาพและการค้นหารูปภาพเป็นสิ่งสำคัญสำหรับกลยุทธ์ SEO รายงานนี้จะช่วยได้มากเช่นกัน คุณสามารถดูได้ว่า Googlebot สามารถรวบรวมข้อมูลรูปภาพของคุณได้ดีเพียงใด

5. ประเภท Googlebot

สุดท้าย รายงานสถิติการรวบรวมข้อมูลจะให้รายละเอียดเกี่ยวกับประเภท Googlebot ที่ใช้ในการรวบรวมข้อมูลไซต์ของคุณ

คุณสามารถดูเปอร์เซ็นต์ของคำขอที่ส่งโดย Googlebot บนมือถือหรือเดสก์ท็อป และบ็อตรูปภาพ วิดีโอ และโฆษณา

ข้อมูลที่เป็นประโยชน์อื่นๆ

เป็นที่น่าสังเกตว่ารายงานสถิติการรวบรวมข้อมูลมีข้อมูลอันมีค่าที่คุณจะไม่พบในบันทึกเซิร์ฟเวอร์ของคุณ:

  1. ข้อผิดพลาด DNS
  2. หมดเวลาของหน้า
  3. ปัญหาโฮสต์ เช่น ปัญหาในการดึงไฟล์ robots.txt

การใช้สถิติการรวบรวมข้อมูลในเครื่องมือตรวจสอบ URL

คุณยังเข้าถึงข้อมูลการรวบรวมข้อมูลแบบละเอียดนอกรายงานสถิติการรวบรวมข้อมูลได้ในเครื่องมือตรวจสอบ URL

ฉันเพิ่งทำงานกับเว็บไซต์อีคอมเมิร์ซขนาดใหญ่ และหลังจากการวิเคราะห์เบื้องต้น สังเกตเห็นปัญหาเร่งด่วนสองประการ:

  1. หน้าผลิตภัณฑ์จำนวนมากไม่ได้รับการจัดทำดัชนีใน Google
  2. ไม่มีการเชื่อมโยงภายในระหว่างผลิตภัณฑ์ วิธีเดียวที่ Google จะค้นพบเนื้อหาใหม่คือผ่านแผนผังเว็บไซต์และหน้าหมวดหมู่ที่มีการแบ่งหน้า

ขั้นตอนต่อไปที่เป็นธรรมชาติคือการเข้าถึงบันทึกของเซิร์ฟเวอร์และตรวจสอบว่า Google ได้รวบรวมข้อมูลหน้าหมวดหมู่ที่มีการแบ่งหน้าหรือไม่

แต่การเข้าถึงบันทึกของเซิร์ฟเวอร์มักจะเป็นเรื่องยาก โดยเฉพาะอย่างยิ่งเมื่อคุณทำงานกับองค์กรขนาดใหญ่

รายงานสถิติการรวบรวมข้อมูลของ Google Search Console ได้รับการช่วยเหลือแล้ว

ให้ฉันแนะนำคุณตลอดกระบวนการที่ฉันใช้และคุณสามารถใช้หากคุณกำลังดิ้นรนกับปัญหาที่คล้ายกัน:

1. ขั้นแรก ค้นหา URL ในเครื่องมือตรวจสอบ URL ฉันเลือกหน้าที่มีการแบ่งหน้าจากหมวดหมู่หลักของเว็บไซต์

2. จากนั้น ไปที่ รายงานความครอบคลุม > รวบรวมข้อมูล

เครื่องมือตรวจสอบ URL ของ Google Search Console ช่วยให้คุณค้นหาวันที่รวบรวมข้อมูลล่าสุดของ URL ที่ระบุ

ในกรณีนี้ มีการรวบรวมข้อมูล URL ครั้งล่าสุดเมื่อสามเดือนที่แล้ว

โปรดทราบว่านี่เป็นหนึ่งในหน้าหมวดหมู่หลักของเว็บไซต์ที่ไม่ได้รวบรวมข้อมูลมานานกว่าสามเดือน!

ฉันเจาะลึกลงไปและตรวจสอบตัวอย่างหน้าหมวดหมู่อื่นๆ

ปรากฎว่า Googlebot ไม่เคยเข้าชมหน้าหมวดหมู่หลักหลายหน้า หลายคนยังไม่รู้จัก Google

ฉันไม่คิดว่าฉันต้องอธิบายว่าการมีข้อมูลนั้นสำคัญเพียงใดเมื่อคุณกำลังทำงานเพื่อปรับปรุงการมองเห็นเว็บไซต์

รายงานสถิติการรวบรวมข้อมูลช่วยให้คุณดูข้อมูลเช่นนี้ได้ภายในไม่กี่นาที

ห่อ

อย่างที่คุณเห็น รายงานสถิติการรวบรวมข้อมูลเป็นเครื่องมือ SEO ที่ทรงพลัง แม้ว่าคุณจะใช้ Google Search Console ได้นานหลายปีโดยที่คุณไม่เคยพบเลย

จะช่วยคุณวินิจฉัยปัญหาการจัดทำดัชนีและเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของคุณ เพื่อให้ Google สามารถค้นหาและจัดทำดัชนีเนื้อหาอันมีค่าของคุณได้อย่างรวดเร็ว ซึ่งมีความสำคัญเป็นพิเศษสำหรับไซต์ขนาดใหญ่

ฉันให้กรณีการใช้งานให้คุณคิดสองสามกรณี แต่ตอนนี้ลูกบอลอยู่ในศาลของคุณ

คุณจะใช้ข้อมูลนี้เพื่อปรับปรุงการมองเห็นเว็บไซต์ของคุณอย่างไร

แหล่งข้อมูลเพิ่มเติม:

  • Crawl-First SEO: คำแนะนำ 12 ขั้นตอนที่ควรปฏิบัติก่อนรวบรวมข้อมูล
  • 7 เคล็ดลับในการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลสำหรับ SEO
  • เครื่องมือค้นหาทำงานอย่างไร

เครดิตรูปภาพ

ภาพหน้าจอทั้งหมดถ่ายโดยผู้เขียน เมษายน 2021