Testowanie na wielu odmianach: jak przeprowadzać najlepsze testy w celu uzyskania najlepszych wyników
Opublikowany: 2017-02-09Testy A/B to jeden z najłatwiejszych sposobów na znalezienie pomysłów na optymalizację stron docelowych po kliknięciu, ale nie zawsze jest to najskuteczniejszy sposób.
Zanim zaczniesz testować dwie, trzy lub cztery strony naraz, dowiedz się, jak przetestować jeszcze więcej i odkryj najlepszą kombinację elementów, która pozwoli na konwersję odwiedzających.
Kliknij, aby tweetować
Co to są testy A/B?
Testy A/B, zwane również testami dzielonymi, pozwalają porównać dwie różne wersje strony internetowej, aby określić, która konwersja użytkowników jest lepsza.
Te dwie strony mogą być:
- Trochę inny
Jeśli masz projekt o wysokiej konwersji i chcesz dowiedzieć się, jak ulepszyć pojedynczy element, możesz przetestować dwie różne strony z tylko jedną różnicą. Jeśli chcesz sprawdzić, czy nagłówek skoncentrowany na ciekawostkach lub wiadomościach sprawdza się lepiej, możesz porównać nagłówek z nagłówkiem. Jeśli chcesz sprawdzić, czy film wideo lub GIF bardziej wpływa na konwersje, możesz przetestować je na każdej stronie.
Po uzyskaniu równego ruchu do każdego z nich wygrywa ten, który generuje najwięcej konwersji. Powód, dla którego jedna wygenerowała więcej konwersji, jest jasna, ponieważ jest tylko jedna różnica między tymi dwiema stronami.
- Drastycznie inny
Możesz także przetestować dwie strony, które różnią się na wiele sposobów. Strona oryginalna może mieć inny nagłówek, polecany obraz i przycisk wezwania do działania niż odmiana. Testowanie może wyglądać mniej więcej tak:

Po uzyskaniu równego ruchu zarówno na stronie oryginalnej (A lub „kontrolnej”), jak i na stronie z odmianami (B), wygrywa ta, która zapewnia lepszą konwersję. Ale w przeciwieństwie do sytuacji, gdy zmieniasz tylko jeden element na test, w przypadku testowania drastycznie różnych stron nie ma możliwości określenia powodu, dla którego dana strona wygrała.
Biorąc wyniki z powyższego przykładu, wiedzielibyśmy tylko, że wersja „b” jest lepsza niż wersja „a”, ale nie powód, dla którego jest lepsza, ponieważ istnieje wiele przyczyn, którym można to przypisać. Konwersje mogły pochodzić z dostosowania paska nawigacyjnego od lewej do prawej lub z formularza rejestracji od góry do dołu. Wszystko, co możesz powiedzieć na pewno, gdy testujesz A/B drastycznie różne projekty, to to, że jedna strona jest lepsza od drugiej.
Istnieje jednak inny rodzaj testu, który można przeprowadzić, aby określić, w jaki sposób zmiany wielu elementów oddziałują ze sobą. Nazywa się to testem wielowymiarowym.
Co to jest testowanie wielowymiarowe?
Testowanie wielowymiarowe to proces używany przez optymalizatory do porównywania dwóch różnych stron internetowych. Metoda koncentruje się na porównywaniu subtelnych zmian między wieloma elementami, a następnie mierzeniu, jak te elementy oddziałują ze sobą, aby znaleźć najskuteczniejszego.
Różnica między testowaniem A/B a testowaniem wielowymiarowym
Zapewne czytałeś wiele analiz przypadków z testów A/B, w których zwycięska strona znajduje się porównując jeden nagłówek z drugim, polecany obraz z filmem lub jedno wezwanie do działania z nieco innym. Chociaż można ich używać do robienia tego z dokładnością, według optymalizatorów w Widemile, istnieje bardziej idealny sposób na użycie testów A/B:

Według nich idealnym zastosowaniem do testów A/B jest „testowanie dwóch lub więcej radykalnie różnych stron”. Jeśli chodzi o testowanie, lepiej przeprowadzić test A/B, aby znaleźć tak zwane „maksimum globalne”, a test wielowymiarowy, aby zawęzić do „maksimum lokalnego”.
Maksimum globalne i maksimum lokalne
Choć jest to trudne, wyobraź sobie przez chwilę, że nigdy w życiu nie miałeś gałki lodów i stoisz w lodziarni, próbując zdecydować, który z 30 różnych smaków chcesz kupić .
Istnieje 10 różnych rodzajów czekolady, 10 różnych odmian wanilii i 10 różnych odmian truskawek. Czy zamierzasz wypróbować wszystkie 30 smaków, zanim zdecydujesz, który z nich chcesz czerpać?
Prawdopodobnie nie. Prawdopodobnie spróbujesz jednego z drastycznie różnych smaków – jednej czekolady, jednej truskawki i jednej wanilii – aby zawęzić wybór, który najbardziej Ci się spodoba. Jeśli odkryjesz, że lubisz czekoladę zamiast wanilii i truskawek, zaczniesz próbować smaków takich jak „ciasto z kawałkami czekolady”, „czekoladowe masło orzechowe” i „czekoladowe krówki”, aby zdecydować, które z czekoladek lubisz najbardziej.
W statystyce nazwalibyśmy najbardziej lubianą przez Ciebie odmianę (czekoladową, waniliową lub truskawkową) globalnym maksimum. To smak, który najlepiej Ci smakuje spośród trzech drastycznie odmiennych rodzajów. Specyficzny smak odmiany (czekoladowo-krówka, ciasto z kawałkami czekolady, czekoladowe masło orzechowe) byłby lokalnym maksimum. To najlepsza wersja odmiany, którą wybrałeś.
Jako optymalizator chcesz podobnie podejść do testowania. Chcesz znaleźć stronę, która najlepiej konwertuje odwiedzających (maksimum globalne), a następnie dostosować określone elementy na tej stronie, aby ulepszyć ją do strony o najwyższej możliwej konwersji (maksimum lokalne). To, którego szukasz, określi, jakiego testu użyjesz.
Kiedy stosować testy A/B, a kiedy testy wielowymiarowe
Testy A/B są najlepsze do testowania globalnego maksimum. Najlepiej sprawdzają się w odkrywaniu, na której stronie Twoi użytkownicy chcą dokonać konwersji. Weźmy ten przykład od MarketingExperiments, który wykorzystał test A/B, aby pomóc Investopedii zwiększyć konwersje w swoim biuletynie Investopedia Advisor.
Oferta była prosta — bezpłatny biuletyn z poradami dotyczącymi zapasów — i to odzwierciedlała oryginalna strona. Nie był długi, skomplikowany ani zaśmiecony wieloma elementami. Zawierał jednopolowy formularz przechwytywania leadów, wypunktowaną kopię i infografikę:

Ale pomimo cennej bezpłatnej oferty, konwersja wynosiła tylko 1,33%. Zespół MarketingExperiments postanowił całkowicie przebudować stronę. Zmienili między innymi nagłówek, układ, przycisk CTA i dodali kilka odznak. Następnie A/B przetestowali nową stronę w porównaniu z oryginalną i stwierdzili, że nowa strona została przekonwertowana o 89,4% wyżej. Oto jak to wyglądało:

Należy pamiętać, że w tym teście A/B eksperymentatorzy nie zorientowali się dokładnie, dlaczego nowa strona konwertowała lepiej niż stara, ale znaleźli nowy, wyższy konwerter. Innymi słowy, znaleźli nowe globalne maksimum. W tym momencie, jeśli chcą, mogą udoskonalić tę stronę za pomocą testów na wielu odmianach, aby określić, która kombinacja elementów powoduje najwięcej konwersji użytkowników.
Właśnie to chcą na przykład zrobić testerzy w tym hipotetycznym przykładzie z Optimizely. Chcą dowiedzieć się, która kombinacja nagłówka i obrazu przyniesie najwięcej konwersji.


Tworzą więc wiele stron z różnymi kombinacjami nagłówków i obrazów, aby zobaczyć, która działa najlepiej.

Wygrywa ta z tych czterech wersji, która wyjdzie z testu z najwyższym współczynnikiem konwersji. Jeśli dwie wersje z żarówką działają lepiej niż dwie z osprzętem, możesz dojść do wniosku, że obraz żarówki ma największy wpływ na konwersje. Stamtąd zobaczysz, który towarzyszący nagłówek wygenerował więcej konwersji i użyjesz tej strony.
Jak przeprowadzić test wielowymiarowy
Kilka lat temu, kiedy założyciel VWO, Paras Chopra, chciał zwiększyć liczbę pobrań na swojej stronie internetowej, użył testów wielowymiarowych, aby dowiedzieć się, jak to zrobić. Jeśli znasz kroki przeprowadzania testu A/B, rozpoznasz większość kroków w tym przykładzie testu na wielu odmianach.
1. Zidentyfikuj problem
Zanim zaczniesz ulepszać swoją stronę internetową, najlepiej zagłębić się w dane i dowiedzieć się, w jaki sposób użytkownicy wchodzą z nią w interakcję. Odkrył, że ludzie nie klikają przycisku „pobierz” tak często, jak się spodziewał, więc zbadał stronę, aby dowiedzieć się, dlaczego.
2. Sformułuj hipotezę
Po dokładnym zbadaniu zdał sobie sprawę, że link do pobrania był dość niezauważalny. Stworzył więc hipotezę ulepszenia strony:
Oczywistym sposobem, aby odwiedzający zauważyli link do pobrania, jest uczynienie sekcji pobierania najbardziej widoczną częścią strony. W projekcie strony rozmiar i kolor nagłówka „Pobierz” dobrze komponowały się z resztą strony, co powodowało, że ludzie tracili link do pobrania.
Wierzył, że dzięki uwidocznieniu linku „Pobierz” będzie w stanie zwiększyć liczbę konwersji. Oto jak zdecydował się to zrobić.
3. Twórz wariacje
Teraz nadszedł czas na stworzenie stron z odmianami do testu. Według parasa:
W przypadku testu na wielu odmianach wybrałem na stronie dwa czynniki do tworzenia odmian: nagłówek „Pobierz” na pasku bocznym i link do pobrania „PDFProducer” pod nim. Celem testu było zaobserwowanie efektu słowa „bezpłatne” oraz efektu wyróżnienia sekcji pobierania.
Oto jak postanowił uczynić sekcję pobierania bardziej zauważalną i kuszącą.
W przypadku oryginalnego linku „Pobierz” przetestował trzy różne warianty:
- „Pobierz” na czerwono
- „Pobierz za darmo” na czerwono
- „Pobierz” w domyślnym kolorze, ale z większym rozmiarem czcionki
W przypadku oryginalnego linku „PDFProducer” przetestował dwie różne odmiany:
- „PDFProducer” w domyślnym kolorze, ale z większym rozmiarem czcionki
- „PDFProducer” w kolorze czerwonym
Tak wyglądały wszystkie kombinacje:

Dzięki czterem wersjom linku do pobrania (w tym oryginałowi) i trzem wersjom tekstu „PDFProducer” (ponownie, w tym oryginał), utworzono 12 różnych odmian w celu przeprowadzenia pełnego testu czynnikowego. Pełna silnia testuje wszystkie kombinacje, w przeciwieństwie do silni ułamkowej, która testuje tylko te najbardziej wpływowe.
Chociaż istnieje wiele metod analizy wielowymiarowej — pełna czynnikowa, czynnikowa ułamkowa i Taguchi — większość optymalizatorów zaleca przeprowadzenie pełnej czynnikowej ze względu na jej dokładność, twierdzi Alex Birkett z CXL.
4. Określ wielkość próbki
Zanim zaczniesz przyciągać ruch na swoje strony, musisz określić wielkość próbki — liczbę odwiedzających, którą każda strona musi wygenerować, zanim będziesz mógł wyciągnąć wnioski na temat wyników testu.
Ten kalkulator od VWO pomoże Ci obliczyć, ilu odwiedzających i jak długo potrzebujesz, aby przeprowadzić test na podstawie ruchu w witrynie, liczby odmian i istotności statystycznej.
Aby dowiedzieć się więcej o osiąganiu istotności statystycznej i o wszystkich rzeczach, które musisz wprowadzić do kalkulatora, zapoznaj się z tym wpisem na blogu.
5. Przetestuj swoje narzędzia
Przetestuj wszystko przed uruchomieniem ruchu. Czy Twoja strona docelowa po kliknięciu wygląda tak samo w każdej przeglądarce? Czy Twój przycisk CTA działa? Czy wszystkie linki w reklamach są prawidłowe?
Zanim zaczniesz cokolwiek prowadzić, ważne jest, aby sprawdzić każdy aspekt kampanii, aby upewnić się, że nic nie zatruwa wyników.
6. Zacznij prowadzić ruch!
Teraz, gdy masz już utworzone odmiany i wiesz, ile ruchu musisz wygenerować dla każdej z nich, możesz bezpiecznie zacząć przyciągać do nich ruch. Największą wadą testów wielowymiarowych jest ogromny ruch, którego będziesz potrzebować, zanim będziesz mógł je zakończyć, więc musisz uzbroić się w cierpliwość.
Podczas testów A/B są tylko dwie strony, na które trzeba przyciągnąć znaczny ruch. Ale w teście wielowymiarowym, takim jak na przykład test Parasa, jest 12 różnych stron, które muszą zebrać dużą próbkę, zanim będzie można wywołać test.
Miej oko na zagrożenia dla swojej wiarygodności i nie zapomnij uwzględnić zwiększonego odsetka wyników fałszywie pozytywnych, mówi Leonid Pekelis:
„Zasadniczo przeprowadzasz osobny test A/B dla każdej interakcji. Jeśli masz 20 interakcji do zmierzenia, a twoja procedura testowa ma 5% współczynnik znajdowania fałszywych trafień dla każdej z nich, nagle spodziewasz się, że jedna interakcja zostanie wykryta całkowicie przypadkowo. Istnieją sposoby na wyjaśnienie tego, są one ogólnie nazywane wielokrotnymi poprawkami testowymi, ale znowu kosztem jest potrzeba większej liczby odwiedzających, aby zobaczyć ostateczne wyniki”.
7. Przeanalizuj swoje wyniki
Po przeprowadzeniu testu przez cztery tygodnie, oto co znalazł Paras:

Możesz zauważyć, że nagłówek „Pobierz za darmo” w kolorze czerwonym podniósł współczynnik konwersji pobierania z 39% do 63%, co stanowi ogromny wzrost o 60%. Posiadanie opcji „Pobierz” w dużym rozmiarze czcionki (w połączeniu z czerwonym kolorem linku) również miało pozytywną (43%) poprawę w stosunku do domyślnego. Spośród wszystkich wyników trzy pierwsze są statystycznie istotne przy 95% lub wyższym poziomie ufności.
Paras mógł zaimplementować swoją nową stronę i zapomnieć o tym teście, ale zamiast tego podkreśla ważny ostatni krok:
8. Ucz się na swoich wynikach
Każdy z twoich testów powinien być używany, aby dowiedzieć się czegoś o twoich stronach internetowych i ich użytkownikach, co możesz wykorzystać do informowania o przyszłych testach.
Dowiedział się, że na swojej stronie internetowej:
- Słowo „bezpłatny” odbiło się echem wśród odwiedzających jego witrynę.
- Bezpłatny charakter oferty najlepiej jest reklamować w wezwaniu do działania lub w jego pobliżu.
- Czerwony kolor przyciągnął uwagę jego gości.
- Większe wezwanie do działania przyciągnęło więcej gałek ocznych odwiedzających.
Ale pamiętaj, to są wyniki jego testu. Chociaż słowo „bezpłatnie” zawsze dobrze jest użyć na każdej stronie internetowej, która reklamuje bezpłatną ofertę, najlepsza lokalizacja, rozmiar i kolor wezwania do działania może być inny na Twoich stronach internetowych. Jedynym sposobem, aby wiedzieć na pewno, jest przetestowanie.
Czy próbowałeś testów wielowymiarowych?
Czy odszedłeś od testów na wielu odmianach, ponieważ uważałeś, że jest to zbyt skomplikowane? Zarejestruj się na demo Instapage Enterprise już dziś.
