การทดสอบหลายตัวแปร: วิธีเรียกใช้การทดสอบที่ดีที่สุดเพื่อผลลัพธ์ที่ดีที่สุด
เผยแพร่แล้ว: 2017-02-09การทดสอบ A/B เป็นวิธีที่ง่ายที่สุดวิธีหนึ่งในการค้นหาแนวคิดในการเพิ่มประสิทธิภาพสำหรับหน้า Landing Page หลังการคลิก แต่ไม่ใช่วิธีที่มีประสิทธิภาพที่สุดเสมอไป
ก่อนที่คุณจะเริ่มทดสอบหน้าสอง สาม หรือสี่หน้าในแต่ละครั้ง ให้ค้นหาวิธีทดสอบเพิ่มเติม และค้นหาส่วนผสมที่ดีที่สุดเพื่อเปลี่ยนผู้เข้าชมของคุณ
คลิกเพื่อทวีต
การทดสอบ A/B คืออะไร?
การทดสอบ A/B หรือที่เรียกว่าการทดสอบแยก ช่วยให้คุณสามารถเปรียบเทียบหน้าเว็บสองเวอร์ชันที่แตกต่างกันเพื่อพิจารณาว่าผู้เข้าชมแปลงใดดีกว่า
สองหน้าดังกล่าวสามารถ:
- ต่างกันเล็กน้อย
หากคุณมีการออกแบบที่มี Conversion สูงและต้องการหาวิธีปรับปรุงองค์ประกอบเดียว คุณสามารถทดสอบสองหน้าที่แตกต่างกันโดยมีข้อแตกต่างเพียงข้อเดียว หากต้องการดูว่าพาดหัวข่าวที่อยากรู้อยากเห็นหรือเน้นข่าวทำงานได้ดีขึ้นหรือไม่ ให้ทดสอบพาดหัวกับพาดหัว หากคุณต้องการดูว่าวิดีโอหรือ gif ส่งผลต่อ Conversion มากกว่าหรือไม่ คุณสามารถทดสอบหนึ่งรายการในแต่ละหน้า
หลังจากเพิ่มปริมาณการเข้าชมให้เท่ากันแล้ว รายการที่สร้าง Conversion มากที่สุดจะเป็นผู้ชนะ และสาเหตุที่ทำให้เกิด Conversion เพิ่มขึ้นนั้นชัดเจน เนื่องจากมีความแตกต่างเพียงข้อเดียวระหว่างสองหน้า
- ต่างกันมาก
คุณยังสามารถทดสอบสองหน้าที่ต่างกันได้หลายวิธี หน้าเดิมของคุณอาจมีบรรทัดแรก รูปภาพเด่น และปุ่มคำกระตุ้นการตัดสินใจที่แตกต่างจากรูปแบบของคุณ การทดสอบอาจมีลักษณะดังนี้:

หลังจากเพิ่มปริมาณการเข้าชมเท่ากันทั้งหน้าเดิม (A หรือ "ตัวควบคุม") และหน้ารูปแบบใหม่ (B) หน้าที่มี Conversion ดีกว่าจะเป็นผู้ชนะ แต่ต่างจากเมื่อคุณเปลี่ยนเพียงองค์ประกอบเดียวต่อการทดสอบ เมื่อคุณทดสอบหน้าที่แตกต่างกันอย่างมาก ไม่มีทางที่จะระบุเหตุผลที่หน้าใดหน้าหนึ่งชนะได้
จากผลจากตัวอย่างข้างต้น เราจะรู้เพียงว่าเวอร์ชัน "b" ดีกว่าเวอร์ชัน "a" แต่ไม่ใช่เหตุผล ว่าทำไม จึงดีกว่า เนื่องจากมีสาเหตุหลายประการที่อาจเป็นสาเหตุ การแปลงอาจมาจากการปรับแถบการนำทางจากซ้ายไปขวา หรือจากแบบฟอร์มการสมัครจากบนลงล่าง ทั้งหมดที่คุณสามารถบอกได้อย่างแน่นอนเมื่อคุณทดสอบการออกแบบ A/B ที่แตกต่างกันอย่างมากคือหน้าหนึ่งดีกว่าอีกหน้าหนึ่ง
แต่มีการทดสอบประเภทต่างๆ ที่คุณสามารถเรียกใช้เพื่อกำหนดว่าการเปลี่ยนแปลงขององค์ประกอบหลายรายการโต้ตอบกันอย่างไร เรียกว่าการทดสอบหลายตัวแปร
การทดสอบหลายตัวแปรคืออะไร?
การทดสอบหลายตัวแปรเป็นกระบวนการที่ใช้โดยเครื่องมือเพิ่มประสิทธิภาพเพื่อเปรียบเทียบหน้าเว็บสองหน้าที่แตกต่างกัน วิธีการนี้เน้นที่การเปรียบเทียบการเปลี่ยนแปลงเล็กน้อยระหว่างองค์ประกอบหลายๆ ส่วน จากนั้นวัดว่าองค์ประกอบเหล่านั้นมีปฏิสัมพันธ์กันอย่างไร โดยมีเป้าหมายเพื่อค้นหาประสิทธิภาพสูงสุด
ความแตกต่างระหว่างการทดสอบ A/B และการทดสอบหลายตัวแปร
คุณอาจเคยอ่านกรณีศึกษาในการทดสอบ A/B จำนวนมากซึ่งพบหน้าที่ชนะโดยการเปรียบเทียบพาดหัวข่าวหนึ่งกับอีกหัวข้อหนึ่ง หรือรูปภาพเด่นกับวิดีโอ หรือคำกระตุ้นการตัดสินใจหนึ่งรายการกับรายการอื่นที่ต่างกันเล็กน้อย แม้ว่าเครื่องมือเหล่า นี้ จะใช้ทำสิ่งนี้ได้อย่างแม่นยำ แต่ตามที่เครื่องมือเพิ่มประสิทธิภาพของ Widemile ได้กล่าวไว้ ยังมีวิธีที่เหมาะกว่าในการใช้การทดสอบ A/B:

การใช้งานในอุดมคติสำหรับการทดสอบ A/B คือ "การทดสอบหน้าเว็บสองหน้าที่แตกต่างกันอย่างสิ้นเชิง" ในแง่การทดสอบ การทดสอบ A/B จะดีกว่าเพื่อค้นหาสิ่งที่เรียกว่า "ค่าสูงสุดทั่วโลก" และการทดสอบหลายตัวแปรเพื่อปรับแต่งให้ตรงตาม "ค่าสูงสุดในพื้นที่"
ค่าสูงสุดทั่วโลกและค่าสูงสุดในพื้นที่
ยากที่ต้องทำ ลองนึกภาพสักครู่ว่าคุณไม่เคยมีไอศกรีมสักลูกเลยในชีวิต และคุณกำลังยืนอยู่ในร้านไอศกรีมที่พยายามตัดสินใจว่าคุณต้องการซื้อรสชาติใดจาก 30 รสชาติที่แตกต่างกัน .
มีช็อกโกแลต 10 ชนิด วานิลลา 10 ชนิด และสตรอว์เบอร์รี่ 10 แบบ คุณจะลองชิมทั้ง 30 รสชาติก่อนตัดสินใจเลือกรสไหน?
อาจจะไม่. คุณน่าจะลองชิมรสชาติที่แตกต่างกันไปอย่างใดอย่างหนึ่ง เช่น ช็อคโกแลต 1 ลูก สตรอเบอร์รี่ 1 ลูก และวานิลลา 1 ลูก เพื่อจำกัดความหลากหลายที่คุณชอบมากที่สุด หากคุณพบว่าคุณชอบช็อกโกแลตมากกว่าวานิลลาและสตรอเบอร์รี่ คุณจะเริ่มลองรสชาติเช่น “แป้งคุกกี้ช็อกโกแลตชิป” และ “เนยถั่วช็อกโกแลต” และ “ช็อกโกแลตฟัดจ์” เพื่อตัดสินใจว่าคุณชอบช็อกโกแลตชนิดใดมากที่สุด
ตามสถิติ เราจะเรียกความหลากหลายที่คุณชอบมากที่สุด (ช็อคโกแลต วานิลลา หรือสตรอเบอร์รี่) ว่าสูงสุดทั่วโลก นี่คือรสชาติที่อร่อยที่สุดสำหรับคุณจากสามประเภทที่แตกต่างกันอย่างมาก รสชาติเฉพาะของความหลากหลาย (ช็อกโกแลตฟัดจ์ แป้งคุกกี้ช็อกโกแลตชิป เนยถั่วช็อกโกแลต) จะเป็นค่าสูงสุดในท้องถิ่น เป็นเวอร์ชั่นที่ดีที่สุดของวาไรตี้ที่คุณเลือก
ในฐานะเครื่องมือเพิ่มประสิทธิภาพ คุณต้องการทดสอบในลักษณะเดียวกัน คุณต้องการค้นหาหน้าที่แปลงผู้เข้าชมของคุณได้ดีที่สุด (สูงสุดทั่วโลก) แล้วปรับแต่งองค์ประกอบเฉพาะในหน้านั้นเพื่อปรับปรุงให้เป็นหน้าที่มีการแปลงสูงสุด (สูงสุดในพื้นที่) สิ่งที่คุณกำลังมองหาจะเป็นตัวกำหนดว่าคุณใช้การทดสอบใด
เมื่อใดควรใช้การทดสอบ A/B และเมื่อใดควรใช้การทดสอบหลายตัวแปร
การทดสอบ A/B ดีที่สุดสำหรับการทดสอบค่าสูงสุดทั่วโลก พวกเขาจะดีที่สุดในการค้นหาว่าผู้เยี่ยมชมของคุณต้องการแปลงในหน้าใด นำตัวอย่างนี้จาก MarketingExperiments ซึ่งใช้การทดสอบ A/B เพื่อช่วย Investopedia เพิ่ม Conversion สำหรับจดหมายข่าว Investopedia Advisor
ข้อเสนอนั้นเรียบง่าย — จดหมายข่าวฟรีพร้อมเคล็ดลับเกี่ยวกับหุ้น — และหน้าเดิมก็สะท้อนให้เห็น ไม่นาน ซับซ้อน หรือรกไปด้วยองค์ประกอบมากมาย มีรูปแบบการจับลูกค้าเป้าหมายแบบหนึ่งฟิลด์ สำเนาสัญลักษณ์แสดงหัวข้อย่อย และอินโฟกราฟิก:

แต่ถึงแม้จะมีข้อเสนอฟรีอันมีค่า แต่ก็มีการแปลงที่ 1.33% เท่านั้น ทีมงานที่ MarketingExperiments ตัดสินใจยกเครื่องเพจใหม่ทั้งหมด พวกเขาเปลี่ยนพาดหัว เลย์เอาต์ ปุ่ม CTA และเพิ่มป้ายสถานะ และอื่นๆ จากนั้น A/B ได้ทดสอบหน้าใหม่กับหน้าเดิม และพบว่าหน้าใหม่แปลงสูงขึ้น 89.4% นี่คือสิ่งที่ดูเหมือน:

สิ่งสำคัญที่ต้องจำไว้คือ ในการทดสอบ A/B นี้ ผู้ทดสอบไม่ทราบ สาเหตุที่ แน่ชัดว่า เหตุใด หน้าใหม่จึงแปลงได้ดีกว่าหน้าเก่า แต่พวกเขาพบตัวแปลงใหม่ที่สูงกว่า กล่าวอีกนัยหนึ่งคือพวกเขาพบจุดสูงสุดใหม่ของโลก เมื่อถึงจุดนั้น หากต้องการ พวกเขาสามารถปรับแต่งหน้านี้ด้วยการทดสอบหลายตัวแปรเพื่อกำหนดว่าองค์ประกอบใดที่แปลงผู้เข้าชมได้มากที่สุด
นั่นคือสิ่งที่ผู้ทดสอบในตัวอย่างสมมติจาก Optimizely ต้องการทำ เป็นต้น พวกเขาต้องการค้นหาว่าชุดค่าผสมของพาดหัวและรูปภาพใดที่เปลี่ยนผู้เข้าชมได้มากที่สุด


ดังนั้น พวกเขาจึงสร้างหน้าเว็บหลายหน้าโดยใช้พาดหัวและรูปภาพต่างๆ รวมกันเพื่อดูว่าหน้าใดทำงานได้ดีที่สุด

เวอร์ชันใดในสี่เวอร์ชันนี้มาจากการทดสอบที่มีอัตราการแปลงสูงสุดเป็นผู้ชนะ หากทั้งสองรุ่นที่มีหลอดไฟทำงานได้ดีกว่าสองรุ่นที่มีเกียร์ คุณอาจสรุปได้ว่าภาพหลอดไฟมีผลกระทบมากที่สุดต่อการแปลง จากที่นั่น คุณจะเห็นว่าพาดหัวข่าวใดทำให้เกิด Conversion มากกว่า และใช้หน้านั้น
วิธีดำเนินการทดสอบหลายตัวแปร
เมื่อไม่กี่ปีที่ผ่านมา Paras Chopra ผู้ก่อตั้ง VWO ต้องการเพิ่มการดาวน์โหลดบนหน้าเว็บของเขา เขาใช้การทดสอบหลายตัวแปรเพื่อหาวิธี หากคุณคุ้นเคยกับขั้นตอนในการทดสอบ A/B คุณจะเข้าใจขั้นตอนส่วนใหญ่ในตัวอย่างการทดสอบหลายตัวแปรนี้
1. ระบุปัญหา
ก่อนที่คุณจะสามารถเริ่มปรับปรุงหน้าเว็บของคุณได้ คุณควรเจาะลึกข้อมูลและค้นหาว่าผู้เยี่ยมชมโต้ตอบกับข้อมูลอย่างไร สิ่งที่เขาพบคือผู้คนไม่ได้คลิกปุ่ม "ดาวน์โหลด" ของเขามากเท่าที่เขาควรจะเป็น เขาจึงสำรวจหน้าดังกล่าวเพื่อหาสาเหตุ
2. ตั้งสมมติฐาน
หลังจากตรวจสอบอย่างละเอียดถี่ถ้วนแล้ว เขาก็พบว่าลิงค์ดาวน์โหลดนั้นค่อนข้างจะมองไม่เห็น ดังนั้นเขาจึงสร้างสมมติฐานสำหรับการปรับปรุงหน้า:
วิธีแก้ปัญหาที่ชัดเจนในการทำให้ผู้เยี่ยมชมสังเกตเห็นลิงก์ดาวน์โหลดคือทำให้ส่วนดาวน์โหลดเป็นส่วนที่โดดเด่นที่สุดของหน้า ในการออกแบบหน้า ขนาดและสีของหัวข้อ "ดาวน์โหลด" กลมกลืนไปกับส่วนที่เหลือของหน้า ซึ่งทำให้ผู้คนไม่มีลิงก์ดาวน์โหลด
ด้วยการทำให้ลิงก์ "ดาวน์โหลด" ชัดเจนขึ้น เขาเชื่อว่าเขาจะสามารถเพิ่ม Conversion ได้ นี่เป็นวิธีที่เขาตัดสินใจทำ
3. สร้างรูปแบบต่างๆ
ถึงเวลาสร้างหน้ารูปแบบใหม่สำหรับการทดสอบแล้ว ตาม Paras:
สำหรับการทดสอบหลายตัวแปร ฉันเลือกปัจจัยสองประการบนหน้าเพื่อสร้างรูปแบบ: หัวข้อ "ดาวน์โหลด" ในแถบด้านข้างและลิงก์ดาวน์โหลด "PDFProducer" ด้านล่าง จุดเน้นของการทดสอบคือการสังเกตผลของคำว่า "ฟรี" และผลของการเน้นส่วนดาวน์โหลด
นี่คือวิธีที่เขาตัดสินใจทำให้ส่วนดาวน์โหลดนั้นชัดเจนและน่าดึงดูดยิ่งขึ้น
สำหรับลิงก์ "ดาวน์โหลด" ดั้งเดิม เขาได้ทดสอบรูปแบบต่างๆ สามแบบ:
- “ดาวน์โหลด” เป็นสีแดง
- “ดาวน์โหลดฟรี” เป็นสีแดง
- “ดาวน์โหลด” เป็นสีเริ่มต้น แต่ขนาดตัวอักษรใหญ่ขึ้น
สำหรับลิงก์ “PDFProducer” ดั้งเดิม เขาได้ทดสอบรูปแบบที่แตกต่างกันสองแบบ:
- “PDFProducer” เป็นสีเริ่มต้น แต่ขนาดตัวอักษรใหญ่ขึ้น
- “PDFProducer” เป็นสีแดง
นี่คือลักษณะของชุดค่าผสมทั้งหมด:

ด้วยลิงก์ดาวน์โหลดสี่เวอร์ชัน (รวมถึงต้นฉบับ) และข้อความ "PDFProducer" สามเวอร์ชัน (อีกครั้งรวมถึงเวอร์ชันดั้งเดิมด้วย) รูปแบบต่างๆ 12 แบบจึงถูกสร้างขึ้นเพื่อทำการทดสอบแฟคทอเรียลเต็มรูปแบบ แฟกทอเรียลแบบเต็มจะทดสอบชุดค่าผสมทั้งหมด ตรงข้ามกับแฟกทอเรียลที่เป็นเศษส่วนซึ่งทดสอบเฉพาะค่าที่ส่งผลกระทบมากที่สุดเท่านั้น
แม้ว่าจะมีวิธีการวิเคราะห์หลายตัวแปรหลายวิธี — แฟกทอเรียลเต็ม แฟกทอเรียลเศษส่วน และทากูจิ — นักเพิ่มประสิทธิภาพส่วนใหญ่แนะนำให้รันแฟคทอเรียลแบบเต็มเพื่อความถูกต้อง Alex Birkett จาก CXL กล่าว
4. กำหนดขนาดตัวอย่างของคุณ
ก่อนที่คุณจะเริ่มเพิ่มปริมาณการเข้าชมหน้าของคุณ คุณต้องกำหนดขนาดตัวอย่างของคุณ — จำนวนผู้เข้าชมแต่ละหน้าต้องสร้างก่อนที่คุณจะสามารถสรุปผลการทดสอบของคุณได้
เครื่องคิดเลขจาก VWO นี้จะช่วยให้คุณทราบจำนวนผู้เข้าชม และระยะเวลาที่คุณต้องทำการทดสอบโดยพิจารณาจากการเข้าชมเว็บไซต์ของคุณ จำนวนรูปแบบที่คุณมี และนัยสำคัญทางสถิติของคุณ
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการเข้าถึงนัยสำคัญทางสถิติและทุกสิ่งที่คุณต้องเจาะเข้าไปในเครื่องคิดเลข ให้ดูที่โพสต์ในบล็อกนี้
5. ทดสอบเครื่องมือของคุณ
ทดสอบทุกอย่างก่อนเริ่มใช้งานการจราจร หน้า Landing Page หลังการคลิกของคุณดูเหมือนกันในทุกเบราว์เซอร์หรือไม่ ปุ่ม CTA ของคุณใช้งานได้หรือไม่ ลิงก์ทั้งหมดในโฆษณาของคุณถูกต้องหรือไม่
ก่อนที่คุณจะเริ่มดำเนินการใดๆ สิ่งสำคัญคือ QA ในทุกแง่มุมของแคมเปญของคุณ เพื่อให้แน่ใจว่าไม่มีสิ่งใดส่งผลเสียต่อผลลัพธ์ของคุณ
6. เริ่มขับการจราจร
ตอนนี้ คุณได้สร้างรูปแบบต่างๆ และทราบจำนวนการเข้าชมที่คุณต้องสร้างสำหรับรูปแบบต่างๆ แล้ว การเริ่มเพิ่มปริมาณการเข้าชมรูปแบบเหล่านั้นก็ปลอดภัยแล้ว ข้อเสียที่ใหญ่ที่สุดสำหรับการทดสอบหลายตัวแปรคือปริมาณการรับส่งข้อมูลจำนวนมหาศาลที่คุณต้องการก่อนที่คุณจะสรุปผลได้ ดังนั้นคุณจะต้องอดทนรอ
เมื่อคุณทำการทดสอบ A/B มีเพียงสองหน้าที่คุณจะต้องเพิ่มการเข้าชมจำนวนมาก แต่ในการทดสอบหลายตัวแปร เช่น Paras มีหน้าที่แตกต่างกัน 12 หน้าที่ต้องรวบรวมขนาดตัวอย่างขนาดใหญ่ก่อนจึงจะเรียกการทดสอบได้
จับตาดูภัยคุกคามต่อความถูกต้องของคุณและอย่าลืมคำนึงถึงอัตราที่เพิ่มขึ้นของผลลัพธ์ที่เป็นเท็จ Leonid Pekelis กล่าว:
“คุณกำลังเรียกใช้การทดสอบ A/B แยกต่างหากสำหรับการโต้ตอบแต่ละครั้ง หากคุณมีการโต้ตอบ 20 รายการที่ต้องวัด และขั้นตอนการทดสอบของคุณมีอัตรา 5% ของการค้นหาผลบวกที่ผิดพลาดสำหรับแต่ละรายการ คุณคาดหวังว่าจะมีการตรวจพบการโต้ตอบหนึ่งครั้งที่มีนัยสำคัญโดยบังเอิญในทันใด มีหลายวิธีในการพิจารณาเรื่องนี้ ซึ่งโดยทั่วไปเรียกว่าการแก้ไขการทดสอบหลายครั้ง แต่อีกครั้ง ค่าใช้จ่ายคือคุณมักจะต้องการผู้เยี่ยมชมมากขึ้นเพื่อดูผลลัพธ์ที่สรุปได้”
7. วิเคราะห์ผลลัพธ์ของคุณ
หลังจากทำการทดสอบเป็นเวลาสี่สัปดาห์ นี่คือสิ่งที่ Paras พบ:

คุณสามารถสังเกตได้ว่าพาดหัว "ดาวน์โหลดฟรี" เป็นสีแดงผลักดันอัตราการแปลงการดาวน์โหลดจาก 39% เป็น 63% เพิ่มขึ้นอย่างมากถึง 60% การมี “ดาวน์โหลด” ในขนาดตัวอักษรขนาดใหญ่ (รวมกับสีลิงก์เป็นสีแดง) ก็มีการปรับปรุงในเชิงบวก (43%) เมื่อเทียบกับค่าเริ่มต้น จากผลลัพธ์ทั้งหมด สามอันดับแรกมีนัยสำคัญทางสถิติที่ระดับความเชื่อมั่น 95% หรือมากกว่า
Paras อาจใช้หน้าใหม่ของเขาและลืมเกี่ยวกับการทดสอบนี้ไปเสียแล้ว แต่เขากลับเน้นย้ำถึงขั้นตอนสุดท้ายที่สำคัญแทน:
8. เรียนรู้จากผลลัพธ์ของคุณ
การทดสอบแต่ละครั้งของคุณควรใช้เพื่อเรียนรู้บางอย่างเกี่ยวกับหน้าเว็บของคุณและผู้เข้าชม ซึ่งคุณสามารถใช้เพื่อแจ้งการทดสอบในอนาคต
เขาได้เรียนรู้ว่าในหน้าเว็บของเขา:
- คำว่า "ฟรี" สะท้อนกับผู้เยี่ยมชมเว็บไซต์ของเขา
- ลักษณะที่ไม่มีค่าใช้จ่ายของข้อเสนอควรโฆษณาในหรือใกล้กับคำกระตุ้นการตัดสินใจ
- สีแดงดึงดูดความสนใจของผู้มาเยือน
- คำกระตุ้นการตัดสินใจที่ใหญ่ขึ้นดึงดูดสายตาผู้เยี่ยมชมมากขึ้น
แต่จำไว้ว่านี่คือผลการทดสอบ ของเขา แม้ว่าคำว่า "ฟรี" จะใช้ได้ดีในหน้าเว็บใดๆ ก็ตามที่โฆษณาข้อเสนอที่ไม่มีค่าใช้จ่าย ตำแหน่ง ขนาด และสีของ CTA ที่ดีที่สุดอาจแตกต่างกันในหน้าเว็บของคุณ วิธีเดียวที่จะรู้ได้อย่างแน่นอนคือการทดสอบ
คุณได้ลองทดสอบหลายตัวแปรแล้วหรือยัง?
คุณเคยหลงจากการทดสอบหลายตัวแปรเพราะคิดว่ามันซับซ้อนเกินไปหรือไม่? ลงทะเบียนสำหรับการสาธิต Instapage Enterprise วันนี้
