Use Cases
    機能
    役割

Optmyzrを使用したAdWordsでのA/Bスプリットテストについて知っておくべきこと


Isaac Rudansky

Isaac Rudansky

CEO

-
AdVenture Media Group

私は広告のより人間的な要素、つまり、どのようにしてオーディエンスにユニークで個人的な方法でアピールするか、訪問者と本物のつながりを作るかなどについて多くの時間を費やして話したり書いたりしています。我々の経験では、統計分析やデータ処理の嵐の中で見過ごされがちな、こうした定量化できない事柄には多くの価値があります。

しばしば、直感とキャンペーンで蓄積された不変のデータの両方を考慮に入れた判断を下す必要があります。

とはいえ、時には本能的な感情を抑え、過去のデータの厳しい枠組みの中でキャンペーンを最適化することが重要です。

広告コピーのA/Bスプリットテストはそのような場合の一つです。

我々SEMが使用する標準的な最適化技術のうち、広告コピーのA/Bスプリットテストほど一貫して予測可能な結果をもたらすものはほとんどありません。新しい広告グループにキーワードを貼り付けたり、アカウントを再構築して品質スコアを向上させたり、コンバージョン率を上げることを期待してカスタム入札スケジュールを調整したりすることができますが、これらはある程度予測不可能です。広告コピーのA/Bスプリットテストを正しく行えば、選択したKPIが時間とともに(わずかでも)向上することが保証されます。

しかし、広告コピーのA/Bスプリットテストについて理解しておくべき重要なことがいくつかあります。それがテストの成功と失敗を分ける要因となります。

AdWordsで成功を収めるための準備

Optmyzrは、エージェンシーや個々の広告主にとって最も高度で効率的なA/Bスプリットテストツールを提供していますが、Optmyzrダッシュボード内でスプリットテストを適切に実行できるようにAdWordsキャンペーンを設定する必要があります。

デフォルトでは、AdWordsは最もクリックされると予想される広告に基づいて広告のローテーションを最適化します。これは素晴らしいことです - もしあなたが怠け者であれば 🙂

Googleが最もクリックされると予想される広告に基づいて広告をローテーションすると、通常、特定の広告グループ内の1つまたは2つの広告がインプレッションとクリックの大部分を占めることになります。自然なことです。

A/Bスプリットテストは、特定のテストに関与するすべての広告にわたって統計的に有意なデータを取得することが目的ですので、最初に行うべきことは広告のローテーション設定を均等にローテーションするように変更することです。AdWordsは90日間均等にローテーションし、その後最適化するオプションを提供していますが、90日後もA/Bスプリットテストを続ける予定ですので(そうですよね!?)、“無期限にローテーション"オプションを選択したいです。

Untitled:Users:Isaac:Documents:2015-02-10_1313.png

この設定はキャンペーン設定タブで変更できます。これはキャンペーンレベルで変更される設定であるため、キャンペーン内のすべての広告グループにローテーション設定が適用されることを覚えておいてください。

A/Bスプリットテストの開発

広告を均等にローテーションするように設定したので、何をテストし、どのようにテストするかを考える必要があります。アカウントが生成しているデータ量に基づいて、どのタイプのスプリットテストを実行するかを決定する必要があります。

技術用語を混同する人が多いので、まず多変量(フルファクトリアル)テストとA/Bテストの違いを定義します。

A/Bスプリットテストは最も簡単に実行でき、ランディングページが毎日高いトラフィックを得ていない限り、A/Bスプリットテストが選択肢となります(少なくとも私の意見では)。多くの人はA/Bスプリットテストが1つの個別の変数をテストするためだけのものだと思っていますが、実際にはそうではありません。異なる見出し、説明文、表示URLを持つ2つの完全に異なる広告を互いに対抗させることができ、それでもA/Bスプリットテストと呼ぶことができます。

どの広告が最も優れたパフォーマンスを発揮したかを測定しているだけで、どの個別の変数が最も優れたパフォーマンスを発揮したかを測定していない場合、それはA/Bテストです。

多変量テストは、どの個別の変数が最も優れたパフォーマンスを発揮したかを知りたい場合に行われます。つまり、4つの異なる変数(見出し、説明行1、説明行2、表示URL)をテストしている場合、どの変数の組み合わせが最も効果的であるかを確認するために、16種類の異なる広告(すべての可能な組み合わせ)を書く必要があります。ほとんどのアカウントでは、多変量テストは理論的には素晴らしいものですが、実際には効果的に機能しません。勝利する広告を決定するためには、統計的に有意なデータが必要です。ほとんどのアカウントは、多変量テストに時間と労力をかける価値があるようなボリュームを得ていません。

それでは、A/Bスプリットテストについてもう少し詳しく話しましょう。

可能な限り単一変数のA/Bスプリットテストを実行することを強くお勧めします(そして正直に言って…それは常に可能です)。1つの変数だけをテストする2つの広告を並行して実行すると、広告のどの要素がより良い(または悪い)パフォーマンスを引き起こしたかがわかります。

例えば、2つの異なる広告見出しのアイデアでA/Bテストを実行することにしたとします。あなたは高級なセルフパブリッシング会社で、広告見出しに最低注文価格を含めることで、安価なソリューションを求める人々が広告をクリックするのを防ぐのが良いアイデアかもしれないと考えました。それで、2つの同一の広告を書き、そのうちの1つの広告見出しだけを変更して最低注文価格を含めました。統計的に有意な(これについては後で詳しく説明します)結果が出たとき、広告見出しの変更がパフォーマンスの違いを引き起こしたことを疑う余地なく知ることができます。

例えば、広告グループ内の他の広告と同一のコピーではない何かに広告の説明行も変更した場合、見出し、説明、またはその両方の組み合わせがパフォーマンスの違いを引き起こしたかどうかはわかりません。

言ったように、それでも有効なA/Bスプリットテストと見なされますが、どの広告が統計的に他の広告を上回ったかはわかりますが、広告のどの要素がクレジットを受けるべきかはわかりません。

とはいえ、マルチバリアブルA/Bスプリットテストが本当に役立つ場合もあります。新しい広告グループを実行していて、テーマ的に異なる2つの完全に別のアイデアがある場合、将来のテストの方向性を決定するためにA/Bテストで2つの完全に別の広告を実行することは非常に有用な戦略となる可能性があります。

高級セルフパブリッシング会社の例に戻りましょう。サービスのスピードと品質を強調するか、編集スタッフのプロフェッショナリズムと経験を強調するか、どちらがより良い広告になるか確信が持てません。これらは2つの別々のアイデアであり、割り当てられた広告スペースではビジネスの両方の側面をカバーすることはできません。この場合、スピードと品質に主に焦点を当てた広告と編集スタッフに主に焦点を当てた広告を使用してマルチバリアブルA/Bテストを実行することは良いアイデアかもしれません。見出しのような1つの変数をテストしているのではなく、全体としてのコンセプトをテストしています。テストがどの広告がより魅力的であるかを決定したら(選択したKPIに基づいて - これについては後で詳しく説明します)、その後、単一変数のA/Bテストに進んでコピーをさらに洗練し、パフォーマンスを一貫して向上させることができます。

停滞と自己満足のループにはまらないためにも、定期的に新しいマルチバリアブル「コンセプト」広告をテストして、過去に探求していない新しいアイデアを見つけることは常に良いアイデアです。

どのようなテストを実行するかがわかったので、実際に何をテストするかを考えましょう。この質問を5人に尋ねると、おそらく5つの異なる答えが返ってくるでしょうので、ここでは過去数年間に管理してきた数百のアカウントから得た結果をお伝えします。

広告見出しのA/Bテストから始めます。見出しのような1つの変数をテストする場合、通常は4つのバリエーションを書くことを目指します - もちろん、これにより広告グループ内に4つの別々の広告が生まれます。特定の広告グループで1日あたり75〜100クリック未満の場合は、2〜3つの広告を書くことを検討してください。

見出しはユーザーが広告を読む最初の要素であるだけでなく、しばしば広告の唯一の部分として注目されます。誰かが本当に気に入った広告見出しを見た場合、広告の他の部分を読むことなく広告をクリックすることがよくあります。逆に、見出しが彼らを引きつけない場合や、彼らが探しているものと正確に一致しない場合、彼らはおそらくあなたを通り過ぎて次の広告に移動します。

検索エンジンの結果ページには多くの情報があり、人々はすべての広告やオーガニック結果のすべての行を読んで分析する時間や精神的な強さを持っていません。広告のすべての文字に多くの労力を費やした後、広告主としては好ましくないことですが、最終的に受け入れなければならない冷たい現実です。 つまり、言い換えれば、まず見出しをテストしてください。ほとんどの人がそれに同意することを願っています。

私たちの論理に従って、次に説明文の行をテストします。1行ずつテストするか、説明文の両方の行を一度にテストするかは、あなたの好みと書いている広告の種類によります(各行に明確な考えがあるのか、それとも両方の行が1つの長いメッセージなのか?)。

表示URLをテストすることは良いアイデアです。表示URLの過去のCTRは品質スコアに影響を与えるためです。表示URLのA/Bテストから劇的な結果を期待しないでください(広告の一部で誰も読まない部分があるとすれば、それは表示URLです)が、品質スコアのために、そして仕事を正しく行うためにそれでもテストしてください。

具体的に何をテストするかは、別の機会に詳しく話すべき長い議論ですが、私は常に広告している製品やサービスを顧客への感情的な利益の文脈で考え、その特徴の文脈で考えることは少ないです。誰も掃除機を欲しいから掃除機を買うわけではありません。彼らは掃除機を買うのは、きれいな部屋が欲しいからです。特徴対利益をテストしたA/Bテストの結果は驚くべきものであり、ほとんどすべての場合、利益と感情的な報酬を強調することが常により良い結果をもたらします。

また、私が「クオリファイア」と呼ぶアイデアを考慮してください。広告に価格を含めることでクリックをクオリファイすることは、望ましくないクリックを防ぐための1つの方法です。

ランディングページのA/Bテストも非常に効果的ですが、複雑なA/Bランディングページツールやソフトウェアの登場により、それ自体が業界となり、広告コピーのA/Bスプリットテストと競合する必要はありません。

行動喚起をテストするアイデアに触れないわけにはいきません。もちろん、行動喚起があります(そうですよね!?)、そして異なるCTAをテストして、どれが最も効果的にオーディエンスの注意を引くかを確認することは素晴らしいアイデアです。

どのようにテストし、何をテストするかがわかったので、テストの結果をどのように測定し、定義するかを見てみましょう。

統計的有意性

Optmyzrのようなツールがなければ、次の数段落はおそらく(確実に)あなたを半死にさせるでしょう。私はどうかわかりませんが、係数、相関、統計測定の聖杯であるp値に関することを話したり書いたり聞いたりするよりも、ペンキが乾くのを見る方がましです。

幸いなことに、Optmyzrがそのすべての作業を私たちのために行ってくれます。しかし、私たちの知的な幸福のために、p値について簡単に説明します。

統計テストでは、p値は結果がどれほど有意であるか、または科学的に興味深いかを示します。見出しAが見出しBよりも高いCTRを持っていることがわかるかもしれませんが、同じテストを再度実行した場合に同じ結果が得られるとどれだけ確信できますか?その後も同様に?

私たちのp値(信頼区間とも呼ばれます)は、同じ結果が繰り返されることをどれだけ確信できるか、または言い換えれば、私たちの発見がどれだけ信頼できるかを示します。p値は、変数間の相関を計算するために使用される統計方程式によって出力される単なる数値であり、研究分野によって異なるp値が受容可能性の異なる閾値を表します。

医療分野では、テストの結果が文字通り外科医に生死の決定を知らせることができる場合、信頼性を判断するために0.01未満のp値が必要です。AdWordsのような、やや危険性の低い研究分野では、0.05未満のp値が完全に受け入れられると仮定できます。実際、社会科学ではp<0.05が信頼性の基準です。

この時点で、p値という言葉を二度と聞きたくないと思っているかもしれません。それに同意します。ここからはたくさんのカラフルな画像が続くことを約束します。

これは初心者向けのOptmyzrチュートリアルではないので、Optmyzrダッシュボードの基本的な作業知識を前提としています。

スプリットテストを設定して開始したので、勝者を選ぶのに十分な統計的に有意なデータがあるかどうかを確認したいです。

<img src=“https://lh5.googleusercontent.com/YU0PqGMKAcZRH7Xte2M40zHvAc8ZgTRtxoZIWiatil1aBazUN86SQfM5qnzvYGVvDMsl-UuIqF2BvD-u75UxRz4RVEkVomqxFTUvAuiVRSLNuFT49JihxsWajHtG-NJTlenV52B-ky1wEh9p" alt=” width=“576px;” height=“310px;” />

 

Optmyzrのワンクリック最適化ドロップダウンの広告のA/Bテストに移動します。

結果を分析する前に、Optmyzrが設定を構成することを許可している設定を確認したいです。

<img style=“line-height: 1.5;” src=“https://lh4.googleusercontent.com/aGD1rrpJBlRAdzAH0DqPNAdewDzBrNuzRu9hO42uylYpc5UzNLeBFxOv1Kz3QkXBPIf3FSxzR7fvKxG1fptLW3hVX4Ie8omsgwL_jHg5UxtOfSzCp_kX3If7WQ_JCROofn6vG-z0V8vj0ClM" alt=” width=“576px;” height=“113px;” />

p値を覚えていますか?それがOptmyzrが「必要な信頼度」として言及しているものです。デフォルトでは95%(p<0.05)に設定されており、それをそのままにしておくのが良いです。また、広告タイプ、ネットワーク、広告ごとの最小インプレッション数、日付範囲で結果をフィルタリングすることもできます。

ここで注目すべき重要なオプションは、パラメーターオプションリストです。最初の画像からわかるように、OptmyzrはデフォルトでCTRをパラメーターとして設定しています。これは、統計分析がCTRを選択した主要なパフォーマンス指標として見て、勝利する広告を決定することを意味します。CTR列の緑と赤のハイライトからわかるように、このテストではCTRが「研究」されている指標です。

コンバージョン率やインプレッションごとのコンバージョンを指標として選択してA/Bテスト結果を実行することもできます。

どのパラメーターを使用するかを決定するには、テストしている広告グループの背後にある戦略に依存します。サイトへのトラフィックを促進してリマーケティングオーディエンスやブランド認知度を構築するためのより広範で緩やかにターゲットされたキャンペーンを実行している場合、CTRが選択する指標である可能性があります。キャンペーンが利益とポジティブなROIを促進するように設計されている場合、コンバージョン率の文脈で広告パフォーマンスを分析することを検討するかもしれません。

ここで見ているキャンペーンはブランディングキャンペーンであるため、私は主にサイトへの訪問者に関心があります - したがって、CTRを選択する指標として保持します。

<img style=“line-height: 1.5;” src=“https://lh5.googleusercontent.com/HvAdSmiUsKvu9xRF0Jg-cheRsbRiSK5yQKBmIoQ1EsEDTcmETuQ0U4iFXBhYTe3Ky_wAUn5BRZNejbw5pArJFC6eJYXSwnsyx0uULW3-XVKPKDjgYQho13z4aII5VLwnPjII7E4TLGTv65XI" alt=” width=“576px;” height=“356px;” />

このA/Bテストでは、2つの異なる見出しをテストしています。95%の信頼レベルに基づいて、OptmyzrはCTRを選択する指標として使用して勝利する広告を出力します。

しかし、何か間違っていることに気づきますか?

勝利する広告は、負けた広告よりもはるかに多くのクリックとインプレッションを持っています。これは、この広告グループの広告が無期限にローテーションするように設定されておらず、Googleがより多くのクリックを得ると予想される広告を優先していたためです。テスト結果は依然として統計的に有意ですが、クリックとインプレッションのボリュームがより均等であることを望んでいます。

別のアカウントに移動して、適切なA/Bテストがどのように見えるかを確認しましょう。

 width=

 

この例では、2つの異なる全体的な広告コンセプトに対してマルチバリアブルA/Bテストを実行しました。勝利する広告が負けた広告よりもかなり多くのクリックを持っているにもかかわらず、負けた広告はこのテストの結果に真の妥当性を与えるのに十分なボリュームを持っています。

もう一つのことに気づいてください。ここでの選択したパラメーターは依然としてCTRですが、Optmyzrは私たちの望む信頼区間で統計的に有意な他の指標が一致するかどうかを親切に知らせてくれます。この例では、勝利する広告は負けた広告よりも統計的に有意なインプレッションごとのコンバージョン率も持っています。知っておくと良いことです!

CTRで勝利し、コンバージョン率で負ける広告がある場合、キャンペーン戦略を真剣に考え、どの指標を基に最適化を行うかを決定する必要があります。

Optmyzrを愛していないなら、今すぐ愛するでしょう!

Optmyzrは、アカウント全体でABスプリットテストの結果を一度に実行するのを非常に簡単(そして少し楽しい)にするだけでなく、Optmyzrは各スプリットテストの負けた広告をボタン一つで一時停止することもできます。

 

 width=

デフォルトでは、Optmyzrは定義されたパラメーター内で統計的に有意な結果を持つすべての広告グループとA/Bテストの負けた広告をすべて選択します。

結果に満足したら、右上の青い「選択した広告を一時停止」ボタンをクリックすると、負けた広告がライブのAdWordsアカウント内で一時停止されます。本当に、どれだけクールなんでしょうか?

しかし、広告を一つ停止した今、その代わりに新しい広告を書いて、別のA/Bテストを実行したいと思うでしょう。Optmyzrには、ダッシュボードを離れることなくそれを可能にする非常に便利なツールがあります。

広告グループのセクションの右上にある「広告を作成」ボタンをクリックすると、Optmyzrは新しい広告を書いて選択した広告グループでライブ公開できるダイアログボックスを表示します。さらにクールなのは、Optmyzrがアカウント内で実行された過去のデータとA/Bテストの結果に基づいて、テキスト広告の各要素に対する提案を提供することです。

<img style=“line-height: 1.5;” src=“https://lh3.googleusercontent.com/Do7LnbqTnkz73RpXNMHS0jts4pgKUMku5raOor6Khz9gE47kU_A5tv0LhWkAUVNNagEYRH2D6GGqvew6dIAUpSkFZNqY3cnKs4HOJUZUYMln1hEhZUPeqr7uyU_JfqcYs-MkuZgozv5v-AfI" alt=” width=“576px;” height=“291px;” />

ご覧の通り、OPTMYZRは、簡単で美しく直感的な方法でA/Bスプリットテストを行うための完全なソリューションを提供しています。

その仕組みを理解する最良の方法は、実際に試してみて、さまざまなパラメータをいじってみることです。一度慣れてしまえば、通常は複雑な分析が数分で完了します。

結論

A/Bスプリットテストの広告コピーは、最も信頼性が高く効果的な最適化の形式の一つであるにもかかわらず、見過ごされがちです。その固有の複雑さと曖昧さのために、統計的に健全な結果よりも直感に基づいて勝利する広告コピーを選んでしまうことがあります。

OptmyzrのA/Bスプリットテストツールは、この複雑なタスクを簡素化し、定期的かつ効果的に実行することを非常に簡単で手間のかからないものにすることで、多くの人々にとって大きな変化をもたらします。

A/Bテストでは統計的証拠に大きく依存していますが、創造的な声を表現し、どこでどのようにテストするかを決定するために直感を使うことが重要です。あなたのユニークな個性と優れた統計分析を組み合わせることで、プロのようにA/Bテストを行うことができます。

再び、A/Bテストで一定のパターンに陥りがちなので、数ヶ月(または数週間)ごとに新しい「コンセプト」広告をテストするために、再び考え直すことを自分に思い出させましょう。

過去に実行したA/Bテストに関する興味深いデータがあれば、ぜひお聞かせください。もちろん、コメントや質問も大歓迎です(以下に残してください)、必ずお返事いたします。

ここまでお読みいただき、本当にありがとうございます。次回を楽しみにしています…

テストを楽しんでください!

私がどのようにAdWordsアカウントを管理しているかについての詳細は、Adventure PPCをご覧ください。

これを共有する: