5 ข้อมูลเชิงลึกเกี่ยวกับสถิติการรวบรวมข้อมูลยอดนิยมใน Google Search Console
เผยแพร่แล้ว: 2021-04-16มีรายงานหนึ่งฉบับใน Google Search Console ที่มีประโยชน์อย่างยิ่งและค่อนข้างหายาก โดยเฉพาะอย่างยิ่งหากคุณเพิ่งเริ่มต้นเส้นทาง SEO
เป็นหนึ่งในเครื่องมือที่ทรงพลังที่สุดสำหรับผู้เชี่ยวชาญด้าน SEO ทุกคน แม้ว่าคุณจะไม่สามารถเข้าถึงได้จากภายในอินเทอร์เฟซหลักของ Google Search Console
ฉันกำลังพูดถึงรายงานสถิติการรวบรวมข้อมูล
ในบทความนี้ คุณจะได้เรียนรู้ว่าเหตุใดรายงานนี้จึงมีความสำคัญ วิธีการเข้าถึง และวิธีการใช้เพื่อประโยชน์ SEO
เว็บไซต์ของคุณมีการรวบรวมข้อมูลอย่างไร
งบประมาณการรวบรวมข้อมูล (จำนวนหน้าที่ Googlebot สามารถและต้องการรวบรวมข้อมูล) เป็นสิ่งจำเป็นสำหรับ SEO โดยเฉพาะอย่างยิ่งสำหรับเว็บไซต์ขนาดใหญ่
หากคุณมีปัญหาเกี่ยวกับงบประมาณการรวบรวมข้อมูลของเว็บไซต์ Google อาจไม่จัดทำดัชนีหน้าเว็บอันมีค่าของคุณ
อย่างที่ว่ากันว่า ถ้า Google ไม่ได้จัดทำดัชนีของบางอย่าง มันก็ไม่มีอยู่จริง
Google Search Console สามารถแสดงจำนวนหน้าในเว็บไซต์ของคุณที่ Googlebot เข้าชมทุกวัน
ด้วยความรู้นี้ คุณจะพบความผิดปกติที่อาจเป็นสาเหตุของปัญหา SEO ของคุณ
เจาะลึกสถิติการรวบรวมข้อมูลของคุณ: 5 ข้อมูลเชิงลึกที่สำคัญ
ในการเข้าถึงรายงานสถิติการรวบรวมข้อมูล ให้ลงชื่อเข้าใช้บัญชี Google Search Console และไปที่ การตั้งค่า > สถิติการรวบรวมข้อมูล
นี่คือมิติข้อมูลทั้งหมดที่คุณสามารถตรวจสอบได้ในรายงานสถิติการรวบรวมข้อมูล:
1. โฮสต์
ลองนึกภาพว่าคุณมีร้านค้าอีคอมเมิร์ซบน shop.website.com และบล็อกบน blog.website.com
เมื่อใช้รายงานสถิติการรวบรวมข้อมูล คุณสามารถดูสถิติการรวบรวมข้อมูลที่เกี่ยวข้องกับแต่ละโดเมนย่อยของเว็บไซต์ของคุณได้อย่างง่ายดาย
ขออภัย วิธีนี้ใช้ไม่ได้กับโฟลเดอร์ย่อยในขณะนี้
2. สถานะ HTTP
กรณีการใช้งานอื่นสำหรับรายงานสถิติการรวบรวมข้อมูลคือการดูรหัสสถานะของ URL ที่รวบรวมข้อมูล
นั่นเป็นเพราะคุณไม่ต้องการให้ Googlebot ใช้ทรัพยากรในการรวบรวมข้อมูลหน้าเว็บที่ไม่รองรับ HTTP 200 เป็นการสิ้นเปลืองงบประมาณการรวบรวมข้อมูลของคุณ
หากต้องการดูรายละเอียดของ URL ที่รวบรวมข้อมูลตามรหัสสถานะ ให้ไปที่ การตั้งค่า > สถิติการรวบรวมข้อมูล > รายละเอียดคำขอรวบรวมข้อมูล

ในกรณีนี้ 16% ของคำขอทั้งหมดถูกสร้างขึ้นสำหรับหน้าที่เปลี่ยนเส้นทาง
หากคุณเห็นสถิติเช่นนี้ เราขอแนะนำให้คุณตรวจสอบเพิ่มเติมและมองหาการเปลี่ยนเส้นทางและปัญหาอื่นๆ ที่อาจเกิดขึ้น
ในความคิดของฉัน หนึ่งในกรณีที่เลวร้ายที่สุดที่คุณสามารถเห็นได้คือข้อผิดพลาด 5xx จำนวนมาก
หากต้องการอ้างอิงเอกสารของ Google: “หากเว็บไซต์ทำงานช้าลงหรือตอบสนองด้วยข้อผิดพลาดของเซิร์ฟเวอร์ ขีดจำกัดจะลดลงและ Googlebot จะรวบรวมข้อมูลน้อยลง”
หากคุณสนใจหัวข้อนี้ Roger Montti เขียนบทความโดยละเอียดเกี่ยวกับข้อผิดพลาด 5xx ใน Google Search Console
3. วัตถุประสงค์
รายงานสถิติการรวบรวมข้อมูลแบ่งวัตถุประสงค์ในการรวบรวมข้อมูลออกเป็นสองประเภท:
- URL ที่รวบรวมข้อมูลเพื่อวัตถุประสงค์ในการรีเฟรช (การรวบรวมข้อมูลหน้าที่รู้จักแล้วซ้ำ เช่น Googlebot กำลังไปที่หน้าแรกของคุณเพื่อค้นหาลิงก์และเนื้อหาใหม่)
- URL ที่รวบรวมข้อมูลเพื่อวัตถุประสงค์ในการค้นพบ (URL ที่มีการรวบรวมข้อมูลเป็นครั้งแรก)
รายละเอียดนี้มีประโยชน์อย่างยิ่ง และนี่คือตัวอย่าง:
ฉันเพิ่งพบเว็บไซต์ที่มีหน้าเว็บประมาณ 1 ล้านหน้าซึ่งจัดอยู่ในประเภท "ค้นพบแล้ว ยังไม่ได้จัดทำดัชนี"
มีการรายงานปัญหานี้สำหรับ 90% ของหน้าทั้งหมดบนเว็บไซต์นั้น
(หากคุณไม่คุ้นเคย “ค้นพบแต่ไม่ใช่ดัชนี” หมายความว่า Google ค้นพบหน้าเว็บที่ระบุ แต่ไม่ได้เข้าชม หากคุณพบร้านอาหารใหม่ในเมืองของคุณแต่ไม่ได้ลองทำดู เป็นต้น .)
ทางเลือกหนึ่งคือรอ โดยหวังว่า Google จะค่อยๆ จัดทำดัชนีหน้าเหล่านี้
อีกทางเลือกหนึ่งคือการดูข้อมูลและวินิจฉัยปัญหา
ดังนั้นฉันจึงลงชื่อเข้าใช้ Google Search Console และไปที่ Settings > Crawl Stats > Crawl Requests: HTML
ปรากฎว่าโดยเฉลี่ยแล้ว Google เข้าชมเพียง 7460 หน้าบนเว็บไซต์นั้นต่อวัน

แต่นี่เป็นสิ่งที่สำคัญยิ่งกว่า
ขอบคุณรายงานสถิติการรวบรวมข้อมูล ฉันพบว่ามีเพียง 35% ของ 7460 URL เหล่านี้ที่ได้รับการรวบรวมข้อมูลเนื่องจากเหตุผลในการค้นพบ


นั่นเป็นเพียง 2611 หน้าใหม่ที่ Google ค้นพบต่อวัน
2611 จากกว่าล้าน
Google จะใช้เวลา 382 วันในการจัดทำดัชนีเว็บไซต์ทั้งหมดตามจังหวะนั้น
การค้นพบสิ่งนี้เป็นตัวเปลี่ยนเกม การเพิ่มประสิทธิภาพการค้นหาอื่นๆ ทั้งหมดถูกเลื่อนออกไป เนื่องจากเรามุ่งเน้นอย่างเต็มที่กับการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูล
4. ประเภทไฟล์
สถิติการรวบรวมข้อมูล GSC มีประโยชน์สำหรับเว็บไซต์ JavaScript คุณตรวจสอบได้ง่ายๆ ว่า Googlebot รวบรวมข้อมูลไฟล์ JS ที่จำเป็นสำหรับการแสดงผลที่เหมาะสมบ่อยเพียงใด
หากไซต์ของคุณเต็มไปด้วยรูปภาพและการค้นหารูปภาพเป็นสิ่งสำคัญสำหรับกลยุทธ์ SEO รายงานนี้จะช่วยได้มากเช่นกัน คุณสามารถดูได้ว่า Googlebot สามารถรวบรวมข้อมูลรูปภาพของคุณได้ดีเพียงใด
5. ประเภท Googlebot
สุดท้าย รายงานสถิติการรวบรวมข้อมูลจะให้รายละเอียดเกี่ยวกับประเภท Googlebot ที่ใช้ในการรวบรวมข้อมูลไซต์ของคุณ
คุณสามารถดูเปอร์เซ็นต์ของคำขอที่ส่งโดย Googlebot บนมือถือหรือเดสก์ท็อป และบ็อตรูปภาพ วิดีโอ และโฆษณา
ข้อมูลที่เป็นประโยชน์อื่นๆ
เป็นที่น่าสังเกตว่ารายงานสถิติการรวบรวมข้อมูลมีข้อมูลอันมีค่าที่คุณจะไม่พบในบันทึกเซิร์ฟเวอร์ของคุณ:
- ข้อผิดพลาด DNS
- หมดเวลาของหน้า
- ปัญหาโฮสต์ เช่น ปัญหาในการดึงไฟล์ robots.txt
การใช้สถิติการรวบรวมข้อมูลในเครื่องมือตรวจสอบ URL
คุณยังเข้าถึงข้อมูลการรวบรวมข้อมูลแบบละเอียดนอกรายงานสถิติการรวบรวมข้อมูลได้ในเครื่องมือตรวจสอบ URL
ฉันเพิ่งทำงานกับเว็บไซต์อีคอมเมิร์ซขนาดใหญ่ และหลังจากการวิเคราะห์เบื้องต้น สังเกตเห็นปัญหาเร่งด่วนสองประการ:
- หน้าผลิตภัณฑ์จำนวนมากไม่ได้รับการจัดทำดัชนีใน Google
- ไม่มีการเชื่อมโยงภายในระหว่างผลิตภัณฑ์ วิธีเดียวที่ Google จะค้นพบเนื้อหาใหม่คือผ่านแผนผังเว็บไซต์และหน้าหมวดหมู่ที่มีการแบ่งหน้า
ขั้นตอนต่อไปที่เป็นธรรมชาติคือการเข้าถึงบันทึกของเซิร์ฟเวอร์และตรวจสอบว่า Google ได้รวบรวมข้อมูลหน้าหมวดหมู่ที่มีการแบ่งหน้าหรือไม่
แต่การเข้าถึงบันทึกของเซิร์ฟเวอร์มักจะเป็นเรื่องยาก โดยเฉพาะอย่างยิ่งเมื่อคุณทำงานกับองค์กรขนาดใหญ่
รายงานสถิติการรวบรวมข้อมูลของ Google Search Console ได้รับการช่วยเหลือแล้ว
ให้ฉันแนะนำคุณตลอดกระบวนการที่ฉันใช้และคุณสามารถใช้หากคุณกำลังดิ้นรนกับปัญหาที่คล้ายกัน:
1. ขั้นแรก ค้นหา URL ในเครื่องมือตรวจสอบ URL ฉันเลือกหน้าที่มีการแบ่งหน้าจากหมวดหมู่หลักของเว็บไซต์
2. จากนั้น ไปที่ รายงานความครอบคลุม > รวบรวมข้อมูล

ในกรณีนี้ มีการรวบรวมข้อมูล URL ครั้งล่าสุดเมื่อสามเดือนที่แล้ว
โปรดทราบว่านี่เป็นหนึ่งในหน้าหมวดหมู่หลักของเว็บไซต์ที่ไม่ได้รวบรวมข้อมูลมานานกว่าสามเดือน!
ฉันเจาะลึกลงไปและตรวจสอบตัวอย่างหน้าหมวดหมู่อื่นๆ
ปรากฎว่า Googlebot ไม่เคยเข้าชมหน้าหมวดหมู่หลักหลายหน้า หลายคนยังไม่รู้จัก Google
ฉันไม่คิดว่าฉันต้องอธิบายว่าการมีข้อมูลนั้นสำคัญเพียงใดเมื่อคุณกำลังทำงานเพื่อปรับปรุงการมองเห็นเว็บไซต์
รายงานสถิติการรวบรวมข้อมูลช่วยให้คุณดูข้อมูลเช่นนี้ได้ภายในไม่กี่นาที
ห่อ
อย่างที่คุณเห็น รายงานสถิติการรวบรวมข้อมูลเป็นเครื่องมือ SEO ที่ทรงพลัง แม้ว่าคุณจะใช้ Google Search Console ได้นานหลายปีโดยที่คุณไม่เคยพบเลย
จะช่วยคุณวินิจฉัยปัญหาการจัดทำดัชนีและเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของคุณ เพื่อให้ Google สามารถค้นหาและจัดทำดัชนีเนื้อหาอันมีค่าของคุณได้อย่างรวดเร็ว ซึ่งมีความสำคัญเป็นพิเศษสำหรับไซต์ขนาดใหญ่
ฉันให้กรณีการใช้งานให้คุณคิดสองสามกรณี แต่ตอนนี้ลูกบอลอยู่ในศาลของคุณ
คุณจะใช้ข้อมูลนี้เพื่อปรับปรุงการมองเห็นเว็บไซต์ของคุณอย่างไร
แหล่งข้อมูลเพิ่มเติม:
- Crawl-First SEO: คำแนะนำ 12 ขั้นตอนที่ควรปฏิบัติก่อนรวบรวมข้อมูล
- 7 เคล็ดลับในการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลสำหรับ SEO
- เครื่องมือค้นหาทำงานอย่างไร
เครดิตรูปภาพ
ภาพหน้าจอทั้งหมดถ่ายโดยผู้เขียน เมษายน 2021
