カテゴリ:
2012年の2本目のエントリーです。早いもので、もう2012年も終わろうとしています。日本にもアドテク情報のユビキタス化が進行し、このブログも完全に役目を終えたかに思えましたが、やらねばならないことがあります。

データサイエンティスト - 職種一覧 : 採用情報 | マイクロアド 

ヒトが足りません。モノ・カネ・情報はもういいんです。採用情報を作ってみましたが、文字数が少なすぎて想いが伝えきれないので、文字数制限の無いこちらでぶちまけます。

ビジネスを科学する仕事
まず、流行の「データサイエンティスト」というタイトルですよ。「ビッグデータ」と並ぶ2012年業界流行語大賞入選確実視されるキーワードですが、ここではビジネス素養を持ったデータマイナーのことを意味してます。ビジネス素養?うむ。それは、ぼくらのしごとはビジネスのためにデータマイニングを活用するので、データマイニング(機械学習)手法それ自体に並々ならぬ興味を持っている人と区別してます。剣術で●●流とかどうでもいいから、戦場で強い人がイイネ!ってことを指してます。往々にしてビジネスの世界は、剣術日本一よりもピストルを持ったおじいちゃんの方が強いみたいなことが起こる訳で。

また、そのテクニックの適用領域は、地球温暖化など遥かに超えるレベルで激変する環境に対して利用するわけなので、悠長な仕事をやってる暇がない。研究所と言っても基礎研究はしないし、人類の叡智のために仕事をしている場合ではない。臨床も臨床、フロント中のフロント。なぜならば、うちのデータサイエンティストは自ら作ったプログラムを自ら実験・検証して、自分で本番環境にぶっこむので。もちろん最初は誰もが素人ですけれども。

もうひとつの意味合いとしては、ぼくたちの仕事は「ビジネスを科学する仕事」なので、マーケティングを含むビジネスに楽しさを感じることは必須かも。物理現象と違って、マーケティングの世界は再現性の低いことばかり。再現性の低い環境でうまく動作するロボットをどう作るかが勝負。ここらへんは経験と勘に基づく職人技なのだけれど。

ありえない柔軟さ
おそらく、この規模のビジネスをしていて、分析官が本番環境にデータをぶっこんでいるのもうちくらいなもんなんじゃないかと思っている。良い意味でも悪い意味でも明確な承認プロセスというものが存在していない(ハハハハハ)。会社の規模としてはアドテクに従事する従業員数としては日本最大級だろうけど、まだまだベンチャーなのです。システムは完全に社内開発なので、こっちが作ったデータをパラメータ連携させるための仕様変更やログ項目を変えてもらうのも早い。たぶん、ここが外資系との一番の違い。ここらへんがボクが外資系には行けない理由。(それ以前にまともに英会話できねぇじゃねぇか)

明確に結果を出せる環境で、結果を出したもん勝ち
分析官の多くはレポートを提出して施策を提案し、そこで仕事は終わりという感じなんじゃないかと思う。で、結局その施策は諸事情によって理想通りには実行されず、目に見える成果が上がらず、お客さん・社内も信頼もしてくれない...的な無限ループ。いやボクも昔はそうでした。アウトプット対象のシステムや業務が融通がきかないと、いくら分析しても無駄なんです。なので、うちも融通のきく(分析データを配信システムにダイレクトに引き渡せる)システムに変更してもらってからはパフォーマンスで成果を見せられるようになったし、数字でダイレクトに評価が出てくるので、結果出したもん勝ちになった。分析官の能力よりも、分析結果を業務やシステムにいかに展開できるかどうかで、ほとんど最初からプロジェクトの成否は決まっているとつくづく思う。

分析環境になぜ高額な投資をするか
分析環境はデータマイニングワークベンチであるIBM SPSS Modelerで分析を組んで、裏側でDWHであるIBM Netezzaが猛烈にデータを処理している。それをジョブ管理ツールであるIBM SPSS Collaboration and Deployment Manager(CADS)でバッチを設定する。これらを利用すると、コードを一行も書かずに分析を含んだバッチプログラムを作れたりする。建築で言うなら、SPSS ModelerというCADで猛烈な早さで設計図を書き上げ、Netezzaが猛烈な早さで工事して、CADSがその進捗を管理・監視してくれるので、たった一人で巨大な都市を思考スピードで造り上げてしまうことが可能。最近ではFusion-ioを入れてみたり。(もちろん定常的な集計処理はHadoopで回してます。)もちろんこれらは非常に高額だし、オープンソースソフトウェアでも同じことできるよと言われれば、確かにスペック比較の上ではそうなのかもしれない。ただ、それらOSSの導入・学習・試行錯誤プロセス・メンテナンス・製品間連携などを考えると、商用(っていうかIBMさん)にするという選択になる。

「分析はできているんだけど、 それを自由に実験・適用する環境が無い」「いざITチームに開発を頼むと、ものすごい時間がかかるし、お互い会話する言語も違うから結局莫大な時間がかかり、何やろうとしてたか忘れた」なんてことは、あるあるネタなはず。だったら、分析官自身が商用ソフトウェアを使って、誰もが開発までできるようにしちゃえばいいじゃんって発想。OSSしか使ったことの無い人は、商用ソフトウェアがどれだけ人間の発想を支援してくれるかがわかるはず。だってボクは作る前に設計図を書いたことがないのだから!

データ量
扱っているデータはほんとに膨大。日本のネットユーザーの9割以上に一ヶ月以内にリーチしている。cookie数で4億以上、人間では6000万人以上のデータはある。いままでのCRMとは全く違うレベルのものが行える素地がある。

タイミング
RTBがデジタルな広告のプロトコルになる日は近い。英語が世界のプロトコルになったように。RTBが生まれてまだ数年。ようやくしゃべれるようになった赤ちゃんくらい。現在はPCのディスプレイ広告から動画やモバイル端末に拡張された段階だけど、もっともっと拡げられる。電子書籍端末であろうと、IPテレビだろうと、デジタルサイネージだろうと、ネットラジオだろうと。フォーマットや端末がどうあれ、その広告枠は売買され、その通信方式はRTBなはず。RTBをマーケター視点で見れば、ついに登場した真の1to1マーケティングが可能な環境。まだRTBを知らない人でも、いまならこの世界にまだ間に合う。(RTBプロトコルについては次回投稿予定)

環境
この人をはじめとして、へんてこな仲間がいっぱいです。ちなみに、東京でも京都でも拠点は好きなところに。成果さえ出せばどこで仕事してようが、誰も文句言いません。あと、文系だろうが理系だろうが論理的思考能力があれば関係ないし、データマイニング経験も関係なし。論理的思考によって「いま、自分が何をすべきか」を間違えないことが最重要であり、テクニックなんてどうにでもなるし。

そんなぼくらと一緒にはたらいてみたい方は、ご連絡を。

データサイエンティスト - 職種一覧 : 採用情報 | マイクロアド