2010/05/23

アクサ生命のCMが完璧すぎる

今日は本当に感動したので、ブログに書かずにはいられないです。



アクサの「収入保障」のがん保険特設ページ|アクサ生命が保険をくるりと変える。日本初!まったく新しいがん保険登場。|アクサ生命保険株式会社

こんなブログを書いていると、テクノロジー右翼と思われがちですが、広告クリエイティブは大好きです。高校生の頃から広告業界に行きたくて、毎号広告批評を買って舐めるように読んでた若者だったのです。ただ、その頃は佐藤雅彦さん、佐藤可士和さん、大貫卓也さん、TUGBOATさん、山内健司さんに憧れる、クリエイティブが大好きなミーハーな青年でしたが、今はちょっと違っていて、もうちょっと理屈っぽいのが好きだったりします。で、このアクサ生命のCMの、理詰めっぷりに感銘を受けました。マーケティングの教科書を地で行くような。

総合系の方々からも見られているので素人丸出しのコメントは控えますけれども、商品コンセプト、セグメンテーション、キャスティング、カメラワーク、コーポレートスローガン、スクリプト、『/』、…凄い。凄すぎる。クリエイティブの素敵なプロモーションって、商品コンセプトとの溝が大きかったりするのだけれど、ここがズバーっとまっすぐに貫通してる感じがして、9回裏逆転満塁場外ホームランを打たれたピッチャー並に天晴れな感じです。この制作現場のドキュメント、見たい。



2010/05/09

『金融工学は何をしてきたのか』を読んで考えたネット広告の遠い未来

「金融工学」は何をしてきたのか(日経プレミアシリーズ)「金融工学」は何をしてきたのか(日経プレミアシリーズ)
著者:今野 浩
販売元:日本経済新聞出版社
発売日:2009-10-09
クチコミを見る

ブックオフで買取査定(エヴァリュエーション!!)の待ち時間になんとなく手に取って700円くらいで買った、正直期待していなかった本なのですが、非常に興味深い内容でした。統計学のお化けである金融工学は、以前より興味がありそれなりにロジックの勉強はしてきたのですが、この本は米国での金融危機に至る環境・社会に関する話題が中心。そして、ずっと持っていた疑問、「十分なデータも無いまま組成された金融商品はどうやってリスクや価値を算定するんだろう?」というのは、どうやら勘の要素が大きいらしい、というのを知れたことだけで晴れ渡る心持ち。

なかでも興味深いのが、MBA出身の経営者に実権を握られた金融機関のエンジニアは無理難題を押し付けられてもNOと言えないという環境。データマイナーや数学者は、できることできないことはだいたい勘で分かるもんですが、NOと言えばクビになる。だから適当にやる。適当に組成した金融商品を、格付け会社が適当に格付けし、機関投資家が適当にポートフォリオを組む。

もうひとつが、デリバティブを原子力技術に例え、発電にも爆弾にも使えるという表現は秀逸。本来的に金融工学は悪ではないと思うのです。環境や社会があらぬ方向へ導いた、と。

話をアドエクスチェンジに置き換えてみます。アドエクスチェンジは広告の取引市場であり、金融と本質的に同じです。ちなみに天然ガス取引を手始めに、電力、インターネット回線などのエクスチェンジも行っていたのがエンロンです。末路はご存知の通り。

金融市場とアドエクスチェンジの決定的な違いは、広告には時間軸の要素があまりなく、(広告効果−買付金額)の最大化が目的なのに対し、金融は(売却金額−買付金額)の時間差での最大化や(収益確率×金額−損失確率×金額)の最大化が基本だということです(細かいツッコミはご勘弁!)。もうひとつの大きな違いが、同じインプレッションや同じオーディエンスでも広告効果は広告主によって千差万別であるということ。金融商品は持ち主によって価値は不変です。その他にも、市場の流動性の不足や、枠提供がイレギュラー、突発的要素が多々あり、データの量は多いが1年以上前のデータはほぼ使えないことなども特徴です。

これらの点が、金融市場で活発化し、金融危機の根本であるデリバティブと同様の活動をできなくするので、広告のデリバティブ的なものは産まれないと思うのです、きっと。市場リスク技術(価格変動)を応用した先物的なオプション取引といったものは成立し得ないと思う。

ただ、広告予算の期限付き消化要望を頂くことは多いのでこういったソリューションも何らかできるのかもしれないし、入札額に対するポートフォリオ理論の応用はできるはず。期間保証で予想外のPVだった時のオプション取引とかもあり得る?信用リスク技術を応用したオーディエンスのエヴァリュエーションは当然できるでしょう。ただし、時間軸での裁定取引(アービトラージ)だったり(リアルタイム裁定取引はOKだと思う)が登場してくると一気に怪しげな世界になりますね。おそらくGoogleやMicrosoftの研究所やシリコンバレーのどこかの一室では既に研究しているとは思いますが。私は、未来の予想なんてできないから、未来にも広告のデリバティブは成立しないと予想します。

ちなみに、ボクは天才的頭脳を持ち合わせていないので何度挑んでもブラック=ショールズ式を理解することができません。てへ。

Data Exchanger(データエクスチェンジャー)とは

《連載》ネット広告エコシステム
第一回:Ad Exchange(アドエクスチェンジ)とは
第二回:DSP(Demand-Side Platform)とは
第三回:Yield Optimizationとは
第四回:RTB(Real-Time Bidding)とは
第五回:Data Exchanger(データエクスチェンジャー)とは

前回の投稿からだいぶ間が空きましたが、ネット広告エコシステム連載の第五回はData Exchanger(データエクスチェンジャー)についてです。単にData Exchange(データエクスチェンジ)とも。正直、日本の実体が整わないままワードを煽ってもバブルを呼ぶだけなので、あえてアドエクスチェンジネタは抑えていたのですが、方針転換です。

データエクスチェンジャーとは。まず、彼らは複数のメディアから提供されたオーディエンスの行動履歴やその他データ保有企業のデータを取りまとめ、カテゴライズします。次に、彼らと接続されたDSPを経由してデータが代理店に販売されたり、接続されたアドネットワークに販売されます。もちろんこのモデルに限りませんが。つまり、集積(Aggregate)+分類(Categorize)+卸(Exchange)+流通(API)。必然的に、データ提供者の匿名化と生活者側のプライバシーへの対策も一元的にできる。

たとえば、ある代理店がDSPを利用し、あるデータエクスチェンジャーのコンパクトカーカテゴリをチェックして配信すると、過去に自動車専門サイトのコンパクトカーのページを閲覧したり検索したオーディエンスに対して配信されます。その自動車専門サイトは複数であるという点がポイントです。

さて、これらのデータの提供者はデータプロバイダ(Data Provider)と呼ばれますが、これが多様です。日本でも馴染み深いウェブ上での行動履歴を提供するものが基本ですが、デモグラフィックデータ、オフラインデータ、企業データ、検索ワードなどを提供するプレーヤーが存在します。それぞれ歴史的な経緯がありますが、ここでは深く触れません。

ターゲティングのカテゴリは細かくすればするほど基本的に広告効果は良くなりますが、一方で対象オーディエンス数は減少し販売困難になります。その問題へのソリューションがまさにデータエクスチェンジャーのモデルです。集積によりデータのボリュームを生み出し、分類により細かいカテゴリを扱いやすく、アドエクスチェンジの膨大な広告枠を利用して配信できるわけです。

非常に重要なことは、カテゴライズされたデータと一言で言っても、中身は全く異なるということです。あるポータルのサッカー面のページを見た人は、一ヶ月以内にサッカー用品を買うでしょうか?興味・関心と購買意向は、まったく違うものです。(相関はもちろんあるでしょう。)データエクスチェンジャーは、購買意欲のある(in-Market)興味関心カテゴリを整備していることを売り物にしています。サッカー好きの中で、まさにサッカー用品を買おうとしている人の比率は数%でしょう。言ってしまえば、サッカー好きのデータなどありふれていて売れませんが、サッカー用品を買おうとしている人のデータは高値で売れます。

現在のネット広告の価格は適正化されていません。何らかの強い購買&申込インテントを持ったオーディエンスが訪問する専門サイト・ECサイトが得られる収益はあまりにも小さい。勝間さん風に言えば、メディアサイトとファンクションサイトとは全く別であって、広告収益はメディアサイトに偏っています。ちゃんこダイニング若のニュースを閲覧する「ビジネス面」のeCPMを、専門サイトのeCPMが下回っていて良いはずが無いし、データの価値も専門サイトが断然上回らなければならない。こうしたミスマッチを是正するのがデータエクスチェンジャーの役割でもあると考えています。


2010/05/03

あなたは世の中で一番似ている人と同じ広告をクリックするだろうか?

この信じられないほどの晴天の中、PCに向かっている俺はどうかと思いますが、ブログ更新が滞り気味なので気合いです。

前々から思っていることなのだけれど、↓のリリースを見てあらためて考えたこと。
株式会社ブレインパッド レコメンドエンジン「RtoasterTM」の新たなオプション機能として、データマイニングでユーザーのセグメント分けを自動化する機能を提供開始
まず、ちょっと平易に。データマイニングとはWebログなどの大量のデータから何らかの傾向を見いだす統計学の派生型のこと。そしてここで言っている「ユーザーのセグメント分け」とは、たとえば「GWなのに家でグダグダしちゃってそうな人」「GWはリゾート地でパーッとやっちまってそうな人」「GWはお金は無いけど友達とわいわいやってそうな人」みたいに後からくくり名を付けることができるようなカテゴリのことで、データマイニングの世界ではクラスタリングと呼ばれる手法です。データを分析にかけると、勝手に浮かび上がってくるのが特徴。そのクラスター(カテゴリ)は通常は多くて数十個。このリリースで言えば、ヴィレヴァンのサイト内の行動やヴィレヴァンの会員情報を基に、いくつかのクラスターに会員を自動で振り分ける。

※これ以降はブレインパッドさんとは何ら関係のない話です。

3685083450_0f9ab96739_oさて。こうしたオーディエンスのクラスタリングという方式は広告領域において本当に機能するのだろうかというのが長年頭を悩ませている問いです。たとえば、自分自身に世界で一番行動パターンや属性(性別・年齢・地域など)が似ている人がいたとして、その人がクリックする広告を、私もクリックする確率は高いのだろうか?禅寺に来たつもりで一旦心を落ち着けて、リアルに誰か自分に近い人の顔を思い浮かべて考えていただきたいのです。

私は、自分に似ている人と同じ広告をクリックしないと思います。むしろ、数千もの触れる広告の中から同じ広告をクリックする確率は天文学的な数字になるでしょう。

逆に、私はCFD(FXみたいなやつね)の広告をクリックするとして、金融関係のページを閲覧していた可能性は高いだろうし、他のCFDの広告をクリックする人も金融関係のページを見ていた確率は高いでしょう。世界中の誰よりきっと私に似ている人は金融関係のページを見ていただろうか?あの人は見ていないだろうし、CFDの広告をクリックしないだろうなぁ。

云わんとしていることは、広告は似ているオーディエンスをクラスタリングする方向では無いんじゃないかと。仮にオーディエンスクラスタリングの精度を極限にまで高めても、どうなのだろうかと。Facebook並にソーシャルグラフ情報があり、似ている人間がわかったとして、それは広告のターゲティングに利用できるのかな。グラフ理論の広告領域での応用についても同様。

やはりターゲティングは行動を最重要のベースにしなければ機能しないと思ってまして。人をベースではなく。人をベースにすると、無理矢理大きなクラスターに押し込むことになる。クラスタリングとは十人十色の対義語である俺。クラスターを予測系ロジックの変数として使うのは全然ありだと思うんだけど(つまりクラスタリングとの掛け合わせ)。あとはフィルタリング的な使い方とかも。

オーディエンスクラスタリングが何らかの施策のために効く業種はもちろんあるでしょう。伝統的なデータマイニングの世界であればクラスタリングは十分機能するはずです。たとえば、年収が400万円以下・既婚・子供2人・千葉県持ち家という人の含まれる、あるクラスタのローン返済確率のような。ただ、ネット広告はどうでしょう?大量の行動データ(入力)と大量に用意可能な素材(広告&クリエイティブ)(出力)があるのだから、わざわざオーディエンスをカテゴライズする必要って無いと思うのです。イメージとして、近い人々を定義できた方が、なんか凄そうってのは確かにあるんだけど。

オーディエンスのクラスタリングの精度向上に四苦八苦していたりするのを見たりすると、いつもこんなことを考えたりしております。そして、これ以外のことでも「その研究がありえねぇくらいうまくいったとして、それって機能するのかなぁ?」というものに出会ったりします。

2010/04/04

BTはCVRもCPMも2倍伝説について考える

世の中的には花見盛りな週末のようですが、また風邪をひいて寝込んでいる今日この頃です。たぶん私の体には何かが足りてません。何かが。
(記事)行動ターゲット型オンライン広告は価格も効果も2倍
(原典)STUDY FINDS BEHAVIORALLY-TARGETED ADS MORE THAN TWICE AS VALUABLE, TWICE AS EFFECTIVE AS NON-TARGETED ONLINE ADS
今週ネット広告界隈をかけめぐった『BT(行動ターゲティング)はCVR2倍だけどCPMも2倍』というデータに、直感的に強烈な違和感を感じたのでしっかり原典を読んでみました。というよりは、「ターゲティングとか結局高いからCPA変わらないし、広告主にとって意味なくね?」という流れが最悪なので。

まず、これを執筆したのはHoward Bealesというジョージ・ワシントン大の准教授で、元々はFTCのプライバシー保護のディレクターという経歴の持ち主。そして、米国のネット広告業界団体であるNAIがスポンサーになって米国の12のアドネットワークから回答を得た調査です。うち、comScoreでのTOP15のうち9つのアドネットワークが含まれています。なお、米国にはNAIとIABの2つのネット広告業界団体がありますが、その経緯は知りません。NAIはプライバシー系、IABは規格やカテゴリの標準化やリサーチをやっているイメージを個人的には持っています。日本では先日社団法人化したJIAAに相当します。

まず、『CVRが2倍』という部分は一人歩きさせてはならない部分だと感じます。これには、2つの問題があります。

ターゲティングはCVRよりもCTRに効くという問題

たとえば、住宅ローンに興味のありそうな生活者だけに配信した場合のCTRは下記のようになります。
  • RON CTR=住宅ローンに興味がありクリックした人÷全ネットユーザー
  • BT CTR=住宅ローンに興味がありクリックした人÷住宅ローンに興味のありそうな人
    ※RON: Run of Network。ランダム配信。
となり、CTRは当然数倍になるでしょう。

一方、CVRはどうでしょうか。
  • RON CVR=住宅ローンの資料請求をした人÷住宅ローンに興味がありクリックした人
  • BT CVR=住宅ローンの資料請求をした人÷住宅ローンに興味がありクリックした人
となり、BTが影響を及ぼすのはCVRに対してではないはずです。リスティングにどっぷり浸かるとCVRに頭が行きますが、世界が違います。リスティングはキーワードがユーザーのインテントを代表しているため、そのインテントごとにコンバージョンする確率が異なるというレイヤーの話ですが、バナーのRONとBTの比較というレイヤーは一段上の話です。Googleのトップページと検索結果画面の両方でのCVRに違いはもちろん出ますが、その数字が仮に2倍だったとして、使えるデータ?ってことです。

統計学的な問題
著者がしつこいくらい、このCVRのデータは少ないから注意してね、と言っていますが、一旦世の中に出てしまえばそのような注意書きは無いも同然になって一人歩きします。

しかも、通常CVRは広告主ごとの平均でも5%から0.05%くらいまで100倍以上の開きがあり、別にそれらの絶対的な数値が良い悪いなんてものはありません。また、CVR平均を使うとしても算術平均ではなく中央値を通常は使うべきじゃないかと思う。また、本来統計データとしてRONとBTは同一広告主の同一キャンペーンでなければなりませんが、おそらく異なる広告主でしょう。QごとのCVR数値のばらつきが大きいのはこの影響もあると思います。

さらに、明確に平均の算出方法が記述されていないためわからないが、アドネットワーク内での平均をさらに平均した数字であると思われるため、ほとんどデータは死んでいると言ってもいい。人間が男女40人のクラスと、チンパンジーが雌雄30頭のクラスと、ダニが雌雄100匹のクラスがあり、各クラス(3)の男女別(2)平均身長の、さらにその6つの数字から男女別平均身長を出した時に、その数字って何か意味あるかい?と。

クライアント単位のデータがまず存在し、CVRを標準化得点なりに変換してスコア化するなり、平均値・中央値・標準偏差・社数くらいを最低限出さないと、世の中に出すべきじゃないと思う。もしくはDIみたいに超単純だけどもっと正しく体現する指標なり。クライアント単位のデータなど、現実運用として不可能だと思うんだけど。CVRの統計的数値に関しては、統計学になじみの薄いマジョリティと合意を形成するのは無理だけれど、逆に専門家は危険性をわかっているのだから出すべきじゃないと思う。少なくとも個人的には誤解を招く危険なデータは上司命令であれ出さない(最近は)。

余談ですが、ネット広告に携わる方々に統計学を学ぶことを推奨するのは、『平均』というものの怖さがわかるからです。このあたりはWeb担さんはたまに特集していますので、ぜひ。

何が言いたいかというと、通常BTではCTRは2倍以上に上がります。CVRは絶対的な指標を出すことは難しいし、このレポートの「2倍」という数字には何の意味も無いと思う。

と、ここまでで想定していた内容の10%にも満たないので、巻きます。
  • リターゲティングのCPMがBTのCPMよりも安いのは、課金体系が区別されてないので何も言えない。一般に、RONと比べてBTはCTR2倍、リタゲは5倍というのが公開されているデータとしては多い。CPC課金はCTRによってCPMが変動します。CPM/CPC/CPA課金を分けていたら非常に有用な情報だったのに。
  • というか、CPMのデータは課金形態別でなければほとんど読者にとって意味をなさない。結果を知れるだけ。
  • 総アドネットワークでのBT売上比率は18%程度
  • BT提供アドネットワーク内でのBT売り上げ占有率平均は41%程度
  • アドネットワークから媒体への支払いコストは売上の55%程度(マージン率というわけではないので注意)
  • アドネットワークからデータプロバイダへの支払いコストは売上の9%程度
  • BTのカテゴリ別データは筆者の指摘通り、無理矢理9つの大カテゴリに振ってしまっている上、サンプル数も少ないだろうし、データとして死んでいる。
  • 基本的に、BTは媒体にも収益増という大きなメリットをもたらしている。
結論ですね、『CVRもCPMも2倍』というコピーは使うべきじゃないと思うわけです。意味は無くはないけど。別に広告主にメリットを見せられる数字でもないし。むしろこのレポートはそれ以外の情報の方がおもしろい。で、ターゲティングは課金方式の違いやクリエイティブといったところとの掛け合わせで最適化すべきなので、2倍!2倍!みたいなものには何の意味もないだろなと思った次第。