; oi: 6月 2015

2015年6月28日日曜日

賢い仕事の優先度付けのやり方とは?

仕事の優先度の付け方に関する記事は色々なところにまとめられているが、多くのものは緊急性と重要性で判断すると記されている。しかしながら、緊急性とは何か、また重要性とは何かといった定義が甘いため、イマイチしっくりこない。そこで本投稿では、もう少し踏み込んで優先度付けのやり方について考えてみようと思う。

「仕事の優先度付け」の定義

私が考える仕事および優先度付けの定義を以下に示す。

仕事 = ある期限までに実行すると誰かに喜ばれる作業のこと

優先度付け=どの順序でどの仕事を実施するかを決めること

仕事の優先度を考えるための観点

この定義を基に仕事の優先度を考えると、ポイントは表にまとめられる。

表:仕事の優先度を考えるための観点
緊急性期限までの期間が短い
重要度
影響範囲(量)喜ぶ人の数が多い
影響範囲(時間)喜ぶ時間の持続性
効果喜ぶ度合い

緊急性は、「各仕事の持つ期限までの期間がどの程度であるか」を意味し、短い方が優先度は高い。また、期限を逃すと、誰にも喜ばれなくなる、つまり得られる喜びが0になる性質を持つ。緊急性は明確に決まっていることが多い。

重要度は3つに分解する。
1つ目は影響範囲(量)であり、その仕事を行った場合に喜ぶ人の数を意味する。喜ぶ人が多いほうが優先度は高い。
2つ目は影響範囲(時間)であり、その仕事を行った場合に各々が喜ぶ期間を意味する。長い方が優先度は高い。
3つ目は効果であり、その仕事を行った場合に各人にどの程度喜びを与えるかを意味する。効果が大きい方が優先度は高い。

以上のように定義すると、仕事の優先度付け問題は、
「緊急性という制約条件の下、いかに多くの喜びを与える仕事を選ぶか、という組合せ最適化問題」に帰着する。

優先度付けの課題

とはいえ、影響範囲や、効果は正確には見積もれないことが多く、問題の解き方のロジックは単純でも優先度付けを誤る人が多いのはそのためであろう。また裏を返せば、仕事のやり方が巧いといわれる人は、将来に渡った複雑な影響を正確に見積もることができる人だといえる。


日本酒の「キレがある」とは?

日本酒を味わう会

日本酒を味わう会に参加してきた。
各自1本以上の自慢の日本酒(四合瓶/一升瓶)とまいおちょこを持ち寄り、
まいおちょこに注いで、飲んで、味わって、感想を共有しながら、
次々に日本酒を回していく。

今回は30人以上の参加者がいて、一度に40本以上の日本酒を味わうことができた。また、参加者が持ってくる酒は「自慢の」日本酒であり、1つ1つのお酒も入手困難なハイレベルな逸品であるため、大変満足度の高い素晴らしい会であった。



客観的っぽい主観的なコメント

様々な日本酒を味わう中で、自分を含めた参加者は次のようなコメントをそれぞれのお酒について述べていく。


  • 「甘い/辛い」
  • 「キレがある」
  • 「酸が強い」
  • 「ひねがない」

etc...

「おいしい」「苦手」といったコメントは明らかに主観的なコメントであるので、真偽を確かめることができないし、確かめることに意味がない。
しかし、上記のコメントは一見、日本酒に関する客観的な属性について述べているはずなので、正誤が気になってきてしまう。
実際、共感できるコメントもあれば、疑問を感じるコメントや何を意味しているかわからないコメントも多くあった。

では、なぜこのように理解できないコメントが発生するのであろうか。

解せない理由

例えば、「きんきんに冷えていて美味しい」というコメントであれば、
温度に対する情報であることがわかる。

これについて疑問を持つとすれば、「冷えている」というのが絶対的な情報ではなく、あくまで相対的な情報なので、普段から比較的冷たいものを飲んでいる人からすれば、この程度で「きんきんに冷えている」といえるのだろうか、と想ってしまう場合くらいであろう。

つまり、何に関するコメントは理解できるが、その内容が主観的な相対的情報であるため、万人で一致しない場合である。

しかし、「キレがある」「ひねがない」というコメントは、自分のような未熟者からすると、どのような観点についての情報かも正しく認識できない。「キレがある」とは日本酒を口に含めた場合に感じるどの要素がどうであることを意味しているのか・・ということがわからないのである。

まとめると以下のような場合で、コメントが解せない場合がありそうである。

  1. どの観点/軸の情報かわかる if not 何について話しているのかわからない。
  2. ある観点/軸の認知/知分解能が同じ if not  感じ方の粒度が粗いため、細かい差異がわからず、細かい違いに関して再現性がなくなる 
  3. ある観点/軸の感じ方の平均が同じ if not 相対的な表現にズレが生じる。

3.については、飲み比べをしながら、前の日本酒に比べてどうこうといえば問題にならない話である。1,2について、もう少し考えてみる。

共通の表現をどのように得るか

通常、生活の中で共通の「ある表現」「ある言葉」を得るためには、その言葉が何を指しているのかが理解できる必要がある。概念としては認識できているが、その概念に共通の名前がないだけの場合は比較的容易に言葉を得られる。(例えば、英語圏の人との共通の表現を得る場合、「犬」という概念を認識できていれば「dog」がすぐわかる。)

問題となるのは、概念としてそもそも認識できていない場合である。
「キレがある」という表現を獲得しようとした場合、得る方法は2つあると考える。
1つ目は、メタファーを利用するということである。同様の表現を日本酒の世界に引きずり込んで当てはめるという方法である。例えば、ビールの「キレがある」を認識できている人に、日本酒も同じようなものであることを伝えれば(自分は同じようなものかどうかもわからないが、、)、その言葉を獲得できるかもしれない。
2つ目は、「キレがある」群と「キレがない」群を飲み比べることで、学習する方法である。ある程度の分解能があれば、各要素の違いから、「キレ」のあるなしを認識できるようになると想われる。そのためには、キレがあるものとキレがないものを明示した学習利き酒セットが必要であろう。

最後に、分解能をどのように得るかという問題であるが、これはその分野を絞ってとにかく多く経験することが必要である。特定の分野に絞って、多くを経験すると、その分野の中で違いを見極めるポイントが認識できるようになる。例えば、自分は子供の頃、欧米の方の顔の識別が苦手であったが、ハリウッド映画を見たり、実際の欧米の方と出会う中で、顔の違いがわかるようになった。どこで識別しているかは言葉にできないのであるが。また、識別する必要性(映画のストーリーの把握など)が存在すれば、学習のスピードは加速する。

今更聞けない基本的な確率分布のまとめ

忘れがちな以下の4つの確率分布についてまとめておく。

ベルヌーイ分布 (Bernoulli distribution)

確率 $\lambda$で 1 を、確率 $1-\lambda$ で 0 をとる、離散確率分布である。

$P(x\mid \lambda) = \lambda^x(1-\lambda)^{(1-x)}$ for $ x \in \{0,1\} $

Takes a single parameter $\lambda \in [0,1] $

カテゴリカル分布 (Categorical distribution

ベルヌーイ分布を一般化した確率分布で、二値ではなく、$K$値の場合をとる離散確率分布である。
※ベルヌーイ分布はカテゴリカル分布のカテゴリ数が2の場合ともいえる。
※ どういうわけか、日本語Wikipediaにはカテゴリカル分布の記事は存在しないため、多項分布と混乱されやすい。

$$P(x\mid \boldsymbol{\lambda}) = \displaystyle \prod_{ i = 0 }^K \lambda_i^{x_i} $$

Takes $K$parameters $\lambda_i \in [0,1] $ where $\displaystyle \sum_{ i = 1 }^{ K } \lambda_i = 1$

二項分布 (Binomial distribution)

n 個の独立なベルヌーイ試行の「成功」の数の確率分布であり、各試行の「成功」確率$\lambda$は同じである。
※ベルヌーイ分布は二項分布における試行回数が1回の場合ともいえる。

$$
P(x\mid \lambda, n) = {}_n \mathrm{ C }_x \lambda^x(1-\lambda)^{(n-x)}
$$
$${}_n \mathrm{ C }_x = \frac{ n! }{ x! ( n - x )! }$$

多項分布 (Multinomial distribution)

二項分布を一般化した確率分布である。多項分布では、各試行の結果は固定の有限個($K$個)の値をとる。
※カテゴリカル分布は多項分布の試行回数が1回の場合ともいえる。
※二項分布は多項分布のK=2の場合である。

$$
P(x\mid \boldsymbol{\lambda}, n) =
  \begin{cases}
     \frac{ n! }{ x_1! x_2! \cdots x_k! } \displaystyle \prod_{ i = 1 }^K \lambda_i^{x_i}   & (when \sum_{ i = 1 }^{ K } x_i = n ) \\
    0 & ( otherwise )
  \end{cases}
$$

多項分布の例

SASブログより、100足の靴下を取り出す場合($n=100$)、何色の靴下を何回抽出するかという分布例を以下に示す。靴下の色は(黒、茶、白)の三種類であり($K=3$)。それぞれ確率は$\lambda_{black}=0.5,\lambda_{brown}=0.2,\lambda_{white}=0.3$である。


4つの分布の関係性

最後に、以上4つの分布の関係性をまとめると、以下の図になる。カテゴリ数と試行回数によって、最も一般化されたのが多項分布である。このように関連づけて4つの分布を覚えておけば忘れない、、に違いない。

$$
\require{AMScd}
\begin{CD}
Bernoulli(K=2,n=1) @>{K>2}>> Categorical(K>2,n=1)\\
@V{n>1}VV {} @VV{n>1}V\\
Binomial(K=2,n>1)  @>>{K>2}> Multinomial(K>2,n>1)
\end{CD}
$$

$$
\diamondsuit K:カテゴリ数\\
\diamondsuit n:試行回数
$$


2015年6月23日火曜日

The Google Similarity Distance (Rudi L. Cilibrasi, Paul M. B. Vitanyi著)

Rudi L. Cilibrasi, Paul M. B. Vitanyi著

検索エンジン「グーグル」を用いて、2つのものの関係性を表すという主旨の論文。

Information Distance とKolmogorov Complexity に基づいた、二つのオブジェクト、とりわけ語句の関係性を表す指標であるNormalized Information Distanceが定義されたが、これはコルモゴロフ複雑性を内包しているため、コンピュータで計算できない。そこでNormalized Compression Distanceというものが提唱された。これはコルモゴロフ複雑性K(x)を圧縮関数C(x)で近似したものである。コンピュータ上で関数を圧縮関数を指定すればNCDは計算できる。
そして本論文はその圧縮関数C(x)をグーグルサーチエンジンを用いてさらにG(x)として近似する物である。圧縮=グーグルの接頭コードという発想である。
以下NGD。f(x)はxのグーグルサーチエンジンが返すxを含むページ数である。


さらにSVMと組み合わせるなどして、精度の向上にも努めている。

また、検証実験としてWordNetとの比較も行っており、erectrical termsについては100%の精度でwordnetと一致するなどといった結果もでている。



Wikipediaと同様に外部ソースを使った語句相関指標として使ってみたい。

Automatic Keyphrase Extraction via Topic Decomposition (Zhiyuan Liu, Wenyi Huang, Yabin Zheng, Maosong Sun 著)

Zhiyuan Liu, Wenyi Huang, Yabin Zheng, Maosong Sun 著

目的は文書からキーフレーズを抽出すること。
共起関係からできあがった語の共起ネットワークを解析することで重要な語を抽出する。
解析アルゴリズムとしては誰もがお世話になっているグーグルのPageRankを応用する。(Topical PageRank)

どのように応用するか?

この論文は「語はそのトピックに依存する」というのがポリシー。
つまりより良いキーフレーズはその文書の主要なトピックと関係が強くあるべきであり、またより良いキーフレーズはその文書の全てのトピックを網羅すべきであるといった具合だ。

そこでTopical PageRankアルゴリズムを提案する。
基本ステップは以下の通りである。
1.トピックを判断する分類器の作成
2.トピックを考慮してPageRankアルゴリズムを改善

これが全体の概要の図。

ステップ1のためにはLatent Dirichlet Allocationを利用する。
これにより、あるトピックzが与えられたときに語wが起こる確率P(w|z)、及びP(z|w)を求める。
トピックの分布と語の分布を分けて考えて学習させるっていう感じ。詳しくは論文を参照されたい。

ステップ2ではPageRankアルゴリズムをトピックを考慮したものに変形する。
まずこれが本家のPageRank。



R(wi)が大きいほどグーグル検索上位になるわけだ。
e(wi,wj)はwi→wjのエッジの重み。O(wj)はwjを起点として他のノードに向うエッジのeの和(Σe)。
つまりΣの中身は(あるノードwjの重要度:R(wj))×(wjから見たwiの重要さの割合:e/Σe)ということである。Σ全体でノードwiの重要度を示しているというわけ。
また|V|は対象としている語の数、つまりΣw。その逆数1/|V|はランダムでそのノードに来る確率だと考えて良い。またλは普通にリンクをたどって、wiにくる場合とランダムでくる場合の比を表す。
本家グーグルではλ=0.85だそうだ。
このマルコフ連鎖の定常分布を求めることが、PageRankにおける重要度を求めることであった。

さて、ではTPRの場合はどうか。
TPRは以下のようになる。


なんのことはなく、ランダムでwiに遷移する確率がPzとなっただけである。
このPzはトピックに依存した確率であり、Σ [w] Pz(wi)=1である。
本論文では、PzをP(w|z)の場合、P(z|w)の場合、またP(w|z)*P(z|w)の場合などを試している。


さて、TPRを用いて評価実験について。
評価項目としては、再現率、適合率、F-measureに加え、Bpref、MRRという指標も評価している。
この二つは選択のみならず、その順序を考慮するときに用いる指標だそう。
比較対象はTF-IDF、PageRank,LDAで、結果はいわずもがなTPRが全ての指標で一番。

感想としてはトピック付のコーパスを利用して、それに特化したアルゴリズムである時点で、他の手法より良いのは明白であると思った。あとP(w|z)がOになってしまうという危険がはらむのではないか。そうすると共起ネットワークグラフを強連結にすることが保証されなくなりそうな気がする。。
それはさておき、PageRankのランダム遷移部分をトピックに注意して変化させるというアイデアは面白い。というかリンク解析の手法がグラフ理論や確率過程の問題、または機械学習とうまく絡んでいて美しいなあ。

2015年6月22日月曜日

コンテンツを科学する〜「コンテンツの秘密」を読んだメモ〜

先日、以下を読んだので、備忘録代わりに書評を書いておく。

コンテンツの秘密―ぼくがジブリで考えたこと (NHK出版新書)
川上 量生 (著)


本書は株式会社ドワンゴ代表取締役会長である川上量生さんがスタジオジブリで学んだことをまとめた一冊であり、本人は本書を「卒論」と位置づけている。

本書の中で色々な観点から様々な「コンテンツの定義」が登場する。一つ一つ大変興味深く、示唆に富んだ定義であるので詳しくは本書を読んでほしい。本記事では特に興味深かったコンテンツの定義を引用し、想ったことを追記しておく。

以下はアリストテレスの表現を基に筆者がコンテンツについてまとめた最初の定義である。

「コンテンツとは現実の模倣=シミュレーションである(p.41)」

つまり、コンテンツの目的としては、受け手に現実世界を模倣(疑似体験に近いか)させることと捉えれば良いと想う。これは現実の世界のあらゆる事象を含んでおり、受け手が体験した事象はもちろん、未体験ではあるが、想像できなくもない事象を含む(SFなどはこれにあたると考える)。

次に筆者オリジナルの大変興味深い定義が以下の2つである。
「小さな客観的情報量によって大きな主観的情報量を表現したもの(p.70)」

「コンテンツとは脳の中のイメージの再現である(p.89)」

部分的に類似した定義であり、「主観的情報量」≒「脳の中のイメージ」と捉えるとその関係性がわかるであろう。作り手の頭の中にある何らかの現実を模したイメージを形にし、受け手の脳内にそれを再現させることをという意味となると想う。

本書には記されていなかったが、ここでは作り手と受け手の脳内に同様のイメージを再現できる要素がそろっている必要があると考えられる。作り手にとっては、非常に大きな主観的情報量のある作品を用いたとしても、受け手にそれを再現するための要素がなければ、何も現実世界を模倣することはできない。

受け手に対して、どれだけ根源的な内容を再現・模倣させるかに依存するが、同じ人間である、同じ民族である、同じ地域で育ったなど、様々なコンテキストの共有レベルを考えて初めて、これらのコンテンツの定義は機能するとおもわれる。

そのため、人の本能に近い部分を想起させる内容は万人受けするということであろう。

本書は「コンテンツ」を分析的に捉えるための良書である。


2015年6月21日日曜日

コンセプトビデオから読み解くGoogleの共有価値観とは?〜禅とGoogleの関係性〜

先日、以下を読んだので、備忘録代わりに考えたことをまとめる。

ザ・プラットフォーム − IT企業は成果を変えるのか?(NHK出版新書)
尾原 和啓 (著)


本書では、プラットフォームを以下のように定義している。

「ある財やサービスの利用者が増加すると、その利便性や効用が増加する『ネットワーク外部性』がはたらくインターネットサービス」

このようなプラットフォームがビジネスの世界だけではなく、私たちの生活の随所で重要な役割を担うようになってきている。本書では、世界を動かす可能性も十二分に秘めているこのプラットフォームについて、著者が実際に経験した企業(Google, 楽天, リクルート)を含む様々な実事例を交えて、その特徴や課題、また未来について記されている。

この記事では、本書2章「プラットフォームの共有価値観」にあった内容が興味深かったので、その点に焦点をあて、まとめておく。

まず、プラットフォームの本質を捉えるために、共有価値観(Shared Value)を読み解くことが重要である。

共有価値観(Shared Value)は、企業分析に用いられる 7S(Seven S Model)
の中心に据えられ、その他の企業内のあらゆる要素(Strategy, Structure, Systemes, Staff, Style, Skills, Strategy)とも強く結びついているため、プラットフォーム本質を知るために欠かせない要素となるのである。



本書では、言わずと知れたIT企業であるGoogleを例にとり、
プラットフォームの本質の読み解いているが、興味深い点は、コンセプトビデオを起点として、共有価値観を分析するところだ。

Googleの製品のコンセプトビデオの随所に散りばめられた、価値観の片鱗を紡ぎ合わせて、1つのストーリーとしてまとめている。(本書ではその他Appleについても深い考察がなされている。)

これは、私の偏見かもしれないが、一部はストーリーが先にあって、後付けでコンセプトビデオから関連するシーンを抽出したと考えられるが、その洞察と構成力は深い。今後様々なジャンルで、様々なプラットフォームが台頭してくると考えられるが、このような共有価値観を読み解くといった見方をしっているだけで、捉え方の深みは代わり、そのプラットフォームとの向き合い方も変化すると考える。

それでは、Googleの例について見ていこう。



「Google Glass」のコンセプトビデオからその共有価値観を読み解いていく。2015年1月にβ版が販売されたものの、未成熟であったためか「Google Glasshole」などと揶揄され、一時的に撤退し、現在研究所における開発体制となった製品であるが、このコンセプトビデオにはGoogleの共有価値観が多分に含まれているようである。

コンセプトビデオの前半では、以下のようなシーンがある。

 1. コーヒーを飲みながら時計を見る 
  → Glassに今日の予定が表示される
 2. 続けて窓の外を見る 
  → Glassに天気予報と気温が表示される
 3. ハムエッグを食べながら、音声入力でメールを返信する
 4. 通勤途中、地下鉄が止まってしまった 
  → Glassにルート案内が表示される
 5. 見知らぬ土地で不自由なく目的地に向かって歩く傍ら、犬をなでる
 (続く)

まず、1, 2, 4から、実世界の行動や所作から予測し、ユーザーのインテンション(意図)を読んで、先回りして必要な情報を提示することを、Googleが目指していることがわかる。

次に、3, 5のシーンから、より重要なメッセージが窺い知れる。
3のシーンでは、メールを気にせずにハムエッグを食べることに集中できる。また、5のシーンでは、従来スマホの地図を見ながら歩く場合には、犬の存在に気づかないかもしれない。そこにGlassを持ち込むことで、利用者に新しい気付きを与えている。

この3, 5のシーンのコンセプトこそが、近年シリコンバレーでも注目されている「マインドフルネス」という考え方である。マインドフルネスとは一言でいえば、「雑事や雑念にとらわれず、目の前のことに集中できるようになることで、日常の何気ないことから高い満足を得られるようになること」である。
Glassはメールを気にせずに、ハムエッグのゆっくりと味わい、道に迷って焦ることなく、かわいい犬と触れ合うことを支援するデバイスである。

以上のように、Google Glassのコンセプトビデオからは、予測して必要な情報を提示することで、雑事を退け、本人の日常のマインドフルネスを向上させるといった、共有価値観が読み取ることができるわけである。

このようなコンセプトがわかれば、同社の他の実験中のサービスである、オートナビゲーションカーも、ユーザの運転という雑事を減らし、(運転が目的の人は別であろうが)、運転中のコミュニケーションや見える景色を存分に味わうための仕組みととらえることができるようになる。

さらに面白いことには、このGoogleの共有価値観は日本の禅に通ずる要素があるという著者の洞察である。すなわち、マインドフルネスは近年Googleを中心に流行となりつつあるが、日本の禅の思想がこれと類似した要素を多く持つ。

例えば、以下の曹洞宗関連ページから関連性を考えてみる。

禅の極意!!〜「不立文字」の世界〜
「禅生活とは作務(仕事)や食事や洗面などの日常生活の中の些事を、その些事を大事と悟らせること」と記されており、これは何気ない日常の重要性を改めて知ることに通ずることである。
また、「『甘い』ということを伝えるときに、いくら口で表現してもわからない。同じ砂糖の甘さでも白砂糖の甘さと黒砂糖の甘さは違うし、果物でもイチゴの甘さと柿の甘さは違います。この甘さを本当に知るには自分が味わってみる以外にはわかりようがない。(『言詮不及、意路不到』などという)」からも、日常の五感を通した実体験を重要視し、そのために座禅を行うことがわかる。

日本の禅の考え方はあくまでも、只管打坐、座禅といったメンタル面の強化を手段としてマインドフルネスの実現をはかるが、GoogleはGlassという技術を以て、同様の課題の解決に挑んでいるといえる。時代も場所も、何もかも異なる両者が、共有価値観という軸で比較されるとこのような類似性を持つことがわかる。

もはや、プラットフォームに限った話ではないと思うが、このようなサービスの背後にある重要な共有価値観を理解することの重要性や、共有価値観の普遍性について大変勉強になる一冊であった。