2012/11/25

ビジネスを科学しませんか?

2012年の2本目のエントリーです。早いもので、もう2012年も終わろうとしています。日本にもアドテク情報のユビキタス化が進行し、このブログも完全に役目を終えたかに思えましたが、やらねばならないことがあります。

データサイエンティスト - 職種一覧 : 採用情報 | マイクロアド 

ヒトが足りません。モノ・カネ・情報はもういいんです。採用情報を作ってみましたが、文字数が少なすぎて想いが伝えきれないので、文字数制限の無いこちらでぶちまけます。

ビジネスを科学する仕事
まず、流行の「データサイエンティスト」というタイトルですよ。「ビッグデータ」と並ぶ2012年業界流行語大賞入選確実視されるキーワードですが、ここではビジネス素養を持ったデータマイナーのことを意味してます。ビジネス素養?うむ。それは、ぼくらのしごとはビジネスのためにデータマイニングを活用するので、データマイニング(機械学習)手法それ自体に並々ならぬ興味を持っている人と区別してます。剣術で●●流とかどうでもいいから、戦場で強い人がイイネ!ってことを指してます。往々にしてビジネスの世界は、剣術日本一よりもピストルを持ったおじいちゃんの方が強いみたいなことが起こる訳で。

また、そのテクニックの適用領域は、地球温暖化など遥かに超えるレベルで激変する環境に対して利用するわけなので、悠長な仕事をやってる暇がない。研究所と言っても基礎研究はしないし、人類の叡智のために仕事をしている場合ではない。臨床も臨床、フロント中のフロント。なぜならば、うちのデータサイエンティストは自ら作ったプログラムを自ら実験・検証して、自分で本番環境にぶっこむので。もちろん最初は誰もが素人ですけれども。

もうひとつの意味合いとしては、ぼくたちの仕事は「ビジネスを科学する仕事」なので、マーケティングを含むビジネスに楽しさを感じることは必須かも。物理現象と違って、マーケティングの世界は再現性の低いことばかり。再現性の低い環境でうまく動作するロボットをどう作るかが勝負。ここらへんは経験と勘に基づく職人技なのだけれど。

ありえない柔軟さ
おそらく、この規模のビジネスをしていて、分析官が本番環境にデータをぶっこんでいるのもうちくらいなもんなんじゃないかと思っている。良い意味でも悪い意味でも明確な承認プロセスというものが存在していない(ハハハハハ)。会社の規模としてはアドテクに従事する従業員数としては日本最大級だろうけど、まだまだベンチャーなのです。システムは完全に社内開発なので、こっちが作ったデータをパラメータ連携させるための仕様変更やログ項目を変えてもらうのも早い。たぶん、ここが外資系との一番の違い。ここらへんがボクが外資系には行けない理由。(それ以前にまともに英会話できねぇじゃねぇか)

明確に結果を出せる環境で、結果を出したもん勝ち
分析官の多くはレポートを提出して施策を提案し、そこで仕事は終わりという感じなんじゃないかと思う。で、結局その施策は諸事情によって理想通りには実行されず、目に見える成果が上がらず、お客さん・社内も信頼もしてくれない...的な無限ループ。いやボクも昔はそうでした。アウトプット対象のシステムや業務が融通がきかないと、いくら分析しても無駄なんです。なので、うちも融通のきく(分析データを配信システムにダイレクトに引き渡せる)システムに変更してもらってからはパフォーマンスで成果を見せられるようになったし、数字でダイレクトに評価が出てくるので、結果出したもん勝ちになった。分析官の能力よりも、分析結果を業務やシステムにいかに展開できるかどうかで、ほとんど最初からプロジェクトの成否は決まっているとつくづく思う。

分析環境になぜ高額な投資をするか
分析環境はデータマイニングワークベンチであるIBM SPSS Modelerで分析を組んで、裏側でDWHであるIBM Netezzaが猛烈にデータを処理している。それをジョブ管理ツールであるIBM SPSS Collaboration and Deployment Manager(CADS)でバッチを設定する。これらを利用すると、コードを一行も書かずに分析を含んだバッチプログラムを作れたりする。建築で言うなら、SPSS ModelerというCADで猛烈な早さで設計図を書き上げ、Netezzaが猛烈な早さで工事して、CADSがその進捗を管理・監視してくれるので、たった一人で巨大な都市を思考スピードで造り上げてしまうことが可能。最近ではFusion-ioを入れてみたり。(もちろん定常的な集計処理はHadoopで回してます。)もちろんこれらは非常に高額だし、オープンソースソフトウェアでも同じことできるよと言われれば、確かにスペック比較の上ではそうなのかもしれない。ただ、それらOSSの導入・学習・試行錯誤プロセス・メンテナンス・製品間連携などを考えると、商用(っていうかIBMさん)にするという選択になる。

「分析はできているんだけど、 それを自由に実験・適用する環境が無い」「いざITチームに開発を頼むと、ものすごい時間がかかるし、お互い会話する言語も違うから結局莫大な時間がかかり、何やろうとしてたか忘れた」なんてことは、あるあるネタなはず。だったら、分析官自身が商用ソフトウェアを使って、誰もが開発までできるようにしちゃえばいいじゃんって発想。OSSしか使ったことの無い人は、商用ソフトウェアがどれだけ人間の発想を支援してくれるかがわかるはず。だってボクは作る前に設計図を書いたことがないのだから!

データ量
扱っているデータはほんとに膨大。日本のネットユーザーの9割以上に一ヶ月以内にリーチしている。cookie数で4億以上、人間では6000万人以上のデータはある。いままでのCRMとは全く違うレベルのものが行える素地がある。

タイミング
RTBがデジタルな広告のプロトコルになる日は近い。英語が世界のプロトコルになったように。RTBが生まれてまだ数年。ようやくしゃべれるようになった赤ちゃんくらい。現在はPCのディスプレイ広告から動画やモバイル端末に拡張された段階だけど、もっともっと拡げられる。電子書籍端末であろうと、IPテレビだろうと、デジタルサイネージだろうと、ネットラジオだろうと。フォーマットや端末がどうあれ、その広告枠は売買され、その通信方式はRTBなはず。RTBをマーケター視点で見れば、ついに登場した真の1to1マーケティングが可能な環境。まだRTBを知らない人でも、いまならこの世界にまだ間に合う。(RTBプロトコルについては次回投稿予定)

環境
この人をはじめとして、へんてこな仲間がいっぱいです。ちなみに、東京でも京都でも拠点は好きなところに。成果さえ出せばどこで仕事してようが、誰も文句言いません。あと、文系だろうが理系だろうが論理的思考能力があれば関係ないし、データマイニング経験も関係なし。論理的思考によって「いま、自分が何をすべきか」を間違えないことが最重要であり、テクニックなんてどうにでもなるし。

そんなぼくらと一緒にはたらいてみたい方は、ご連絡を。

データサイエンティスト - 職種一覧 : 採用情報 | マイクロアド 



2012/03/02

ビジネスを知らぬデータマイナー

「ビッグデータ」という言葉を聞かない日はないくらいの馬鹿騒ぎで、データマイナーはすっかり引く手数多の職業になりました。ただ、SI業界がこれまでムーブメントを起こしてきた数々のワードと同様、多くの"ビッグデータプロジェクト"は失敗することになると思います。ERP, BPR, BI, CRMなどなど…

ビッグデータにまつわる職業の中でも、データを分析するデータマイナーに絞っての話をしたいと思います。また、データ分析専門会社にてコンサルティング業をするデータマイナーは今日の話は当てはまりません。さて。データマイニングを知らない方々は、企業においてどのようなデータマイナーがいれば成果を上げられるのかの明確なイメージは持っていないと思います。これだけたくさんのデータがあるんだから、すごい技術を持った人ならなんとかしてくれるに違いない、と。最高学府の修士・博士で、よくわからないけどすごいアルゴリズムを作ったらしい人を採用すれば、きっと何かすごいことが起きるのではないかと。でも多くの場合、成果を上げるデータマイナーは技術や頭脳ではなく、ビジネスを理解しているデータマイナーだなぁと、個人的な少ないサンプルでの検証結果からはそう思います。

天才的な頭脳を持ったデータマイナーと、ビジネスを理解したデータマイナーは別の職種と言うべきで、それぞれ成果を出せるフィールドは全く異なります。特定用途をうまくこなす目的のアルゴリズムを考え出す人と、ビジネスを目的としてアルゴリズムをひとつの手段として使う人の違いと言い換えられるかもしれません。

たとえば、Googleの検索エンジンは前者の賜物です。ユーザーが入力したキーワードに対して、適切なURLをランキングするという、超ピュアな技術。一方、Googleのアドワーズは後者の賜物です。CPC x 品質スコアという仕組み、そして品質スコアの算出式。それによって数多の人間はどう入稿設定し、広告設定DBはどういう状態になり、クエリごとにどう広告ランキングが構成されるのかを想定しながら仕組みを作る。ここではデータマイニングは入力変数なだけであって、ほとんどは制度設計がポイント。

企業で本当に必要とされている職能は、ほとんどの場合はピュアな技術ではなく、データマイニングを活用した制度設計にあるのではないかと思います。(メカニズムデザインという言葉の方が適切なのかしら。)データマイニング技術の小さな差がビジネス上大きな差を生む領域はレアで、データマイニング結果をどうブレンドしてどう使われるかが勝負を分けていることが圧倒的に多いと思う。数字をビジネスに落とし込むためのルール作りとでもいいましょうか。

たとえば、5年くらい前までのアドネットワークというのはコンテンツマッチの精度が云々という議論はあったのだけれど、結局は広告DBがどれだけ充実させられるビジネスの仕組みなのかの勝負だった。そして勝者のみポジティブフィードバックに入る。(ちなみにコンテンツ認識技術と広告とのマッチングというのは全くの別物。前者がピュアな技術。)それが、行動ターゲティングによってルールが根底から覆る。さらに、オーディエンスターゲティング×RTBによってもう一回根底からひっくり返った。あっという間に。オーディエンスが何に興味関心を持っているかを判別するのはピュアな技術だけど、それをどう広告と結びつけていくらで入札するシステムを設計するかはビジネスを知らないとできない。

データマイナーを募集している企業の多くはデータを分析できる人がいないから採用したいのだと思いますが、採用するときにはここを間違えると痛い目に遭うと思います。ビジネス感覚の無い/ビジネスに興味の無いデータマイナーを雇うと苦労するし、逆に天才的頭脳を持っていない僕ら一般のデータマイナーはビジネスをわかってないとブームが去った後に路頭に迷っちゃうから現場に出ましょうねと。


2011/12/30

誰が為のアルゴリズム

2011年の総括ブログがたくさん上がってきたのに触発されて、今年9本目のエントリーを書こうと思います。わかりやすい記事を書こうとすると筆が進まないので、誰が理解できんだよ的エントリーを連発してやろうかと思っている今日この頃です。

さて。2011年は兎にも角にも自分でも信じられない勢いで自社DSPが浸透したことに尽きます。創業以来最大の出来事じゃないかと思います。アドネットワークからDSPへの移行の中でアルゴリズムを作っている人間として思うところは、DSPではアルゴリズムが競争力となり、顧客の為のアルゴリズムが自社にも強烈に跳ね返ってくるという、至極あたりまえの世界になったことがなりよりうれしく。

アドネットワークにおけるアルゴリズムには、大きく分けて二つあります。ターゲティングのアルゴリズムとアドネットワーク事業者としての収益を最大化させるアルゴリズムです。ターゲティングのアルゴリズムは、誰にどの広告を配信するかを決めるオーディエンスターゲティングやどういったコンテンツに広告を配信するかを決めるコンテンツ連動型広告といったものがあります。これらのアルゴリズムの目的は、広告主にとって広告効果を高めることにあります。マーケティングプロモーションの世界の考え方です。

一方、アドネットワーク事業者の収益を最大化させるためのアルゴリズムの目的は、仕入値と売値が大きく異なるアドネットワーク事業者が卸売業としての利益を最大化することにあります。一般的な金融の世界の考え方のアービトラージモデルです。マイクロアドでは、このアルゴリズムはほぼ無いに等しいのですが、成功したアドネットワーク事業者はこのアルゴリズムが中心になっているでしょう。(テキスト広告の場合はほとんどがレベニューシェアモデルのため今回の話は別件。バナーの世界のお話。)

ではDSPは?DSPはRTB仕入れでCPM販売だという前提のもとで話を進めます。 まず、仕入値と売値の差額はマージン率で設定されるため、DSP事業者としては自社の流通総額を最大化することが収益の最大化になります。つまり、顧客をとにかく増やし、満足してもらえる広告配信を行う必要がある。そのためにターゲティングのアルゴリズムを使う。そして、顧客のためにできる限りインプレッションを安く仕入れられるようなアルゴリズムを使う。DSP事業者が自社の収益を最大化するためのアルゴリズムはいらない。顧客のために最善を尽くすことが自社の収益になるという、あたり前の世界がようやく。

アドエクスチェンジの国はアドネットワークの国とは違って政治の無いオープンに接続されたドライな世界。アルゴリズムで適切に値付けした者が勝ち。アドネットワークで重要だったのは、豊富な広告在庫を生み出す仕組みや営業の仕組みで、アルゴリズムは助演だった。アルゴリズムは重要なのだけれど、本当に勝負を分けているのはアルゴリズムでは無かった。ところが、RTBのDSPではアルゴリズムが主演になった。

数百数千社の膨大な広告主が、それぞれに満足する絞り込まれたターゲティングをかけながらインプレッション争奪競争を24時間365日繰り広げる。これで媒体収益が上がらないはずもなく。単一アドネットワークとは比較にならないほど。

2012年はメディアの純広が進化し、アドネットワークには出稿していなかった広告主がDSPを通じて出稿するようになり、スマホのRTBがはじまる。これまでいろんな業界で破壊的イノベーションによって企業の浮沈やパラダイムシフトを他人行儀に眺めてきたけれど、僕らの世界にもRTBというガチの破壊的イノベーションがやってきたようです。きっと来年の今頃は、数年前の業務を思い出しては自分たちのやっていたことに恥ずかしくなっちゃうに違いありません。ボクが白シャツをINしていた頃を思い出す時のように。

2011/11/07

ad:tech Tokyo 2011の資料をアップしました

先日行いました、ad:tech Tokyo 2011でのMicroAdによるワークショップの資料をアップロードしました。
自らの過去のビジネスをも切って捨てることが許されてしまうこの社風。
これがベンチャーのいいとこです。変なしがらみが無いからね。


2011/10/21

今年もやりますad:techワークショップ

昨年ご好評いただきました、ad:tech Tokyoでのワークショップですが、今年もやります

昨年は来るべく未来に備え、アドエクスチェンジ生態系の各プレーヤーの役割を紹介しましたが、今年はそのあたりはもう周知のこととなったので、今回は毛色を変えてやる予定です。(まだ一枚もスライドができていないというこの現実からの逃避的投稿。)

広告枠からオーディエンスデータへ。
広告メニューからRTBへ。
アドネットワークからDSP・SSPへ。
メディアプランニングはロボットへ。

そんな変化について、お話しできればと。


アドテック東京 ワークショップ
http://www.adtech-tokyo.com/ja/exhibitor/work.html
 
10月27日(木) 16:00-16:40
Workshop B
株式会社マイクロアド 
DSPによるディスプレイ広告のパラダイムシフト

"広告メニューの時代"は終わりを告げようとしています。ディスプレイ広告の主役の座は、オーディエンスデータを自在に活用してターゲティング配信を行うDSPへ。
DSPを活用すれば、リスティング広告のようにディスプレイ広告への入札・運用が可能に。
いよいよ日本でも本格的普及期に突入したアドエクスチェンジからのメディアバイイング手法と、そのパラダイムシフトをわかりやすく解説します。 
 もちろん無料パスでOK!!