; oi: 2015

2015年12月31日木曜日

オリジナル!トイレットペーパーホルダーカバーの作り方(2)〜メッシュシート〜

最近手芸屋さんなどでみかけるメッシュシート。



今回は、メッシュシートの活用方法をご紹介します。

用意するものは、以下の4つだけ。
・メッシュシート
・好きな毛糸(太めの方が◎)
・はさみ(普通のもの)
・セロハンテープ

メッシュシートの穴に毛糸を通しながら、好きな模様を作っていきます。

本などでは、針を使う方法が紹介されていますが、太い毛糸が通る針を持っていなかったので、私はセロハンテープで先端を補強することで代用しました。
とても簡単で、毛糸の端にセロハンテープをくるくるきつめに巻き付けるだけ!


メッシュシートの穴に通れば問題ないので、針である必要はないのです。
セロハンテープ部分は最後にカットしてしまえば仕上がりにも影響ありません。

では準備も整ったところで、いくつか模様パターンを紹介したいと思います。

①4×4のマス目パターン(単色)
以下の順で糸を通していく。1〜4で、4×4のマスがちょうど埋まるため、以降同様に繰り返す。



②4×4のマス目パターン(グラデーション)
①のパターンで1マスの色の割合を段ごとに変えていくことでグラデーションにする方法。

③縁取り
むき出しになっている縁を隠すため、最後に以下のように縁取りをすることをお勧めします!

④まつり縫い風パターン
2枚のシートを接続する際などに用いる。縁取りにも使えますが、隙間が多いためお勧めではありません。

⑤鎖編み風パターン
三つ編みのような仕上がりになります!

お気付きの通り、基本は布に糸で縫い付けたり刺繍したりするときと同じです。
布はどこでも刺すことができますが、メッシュシートは穴の数が限られているため、
その点だけ気をつける必要があります。

次回は、これらの手法を使ってトイレットペーパーホルダーカバーを作ります。

つづき >>オリジナル!トイレットペーパーホルダーカバーの作り方(3)

2015年8月2日日曜日

オリジナル!トイレットペーパーホルダーカバーの作り方(1)

最近のマンションでは、トイレットペーパーホルダーの真ん中の部分が壁にくっついているデザインのものが多くなってきているようですが、このタイプのホルダーにつけられる市販のカバーはなかなかありません。

このデザインは、とてもスタイリッシュなので、カバーを付けずに使うものなのかもしれませんが、スペアのトイレットペーパーを入れておく場所がなく、不便に感じることも多いです。




そこで、
自分でつくってみました!!


せっかくなので、作り方を載せていきたいと思います。

まずは構成を検討。
通常はフタと設置部の間に隙間があり、そこを通してフタ部分と下のスペア用ホルダーを繋いでいるのですが、

今回の場合、真ん中の部分を避けて、下のスペア用ホルダーを吊るさなければなりません。

布では少し強度が心配だったので、何か良い方法はないかな・・・と考えていたところ、手芸屋さんで目に入ってきたのが、

「メッシュシート」



見た目通り、プラスチックで出来た編み目の入った薄いシートです。
適度にしっかりしていて、自由自在に曲げることも出来るという点がちょうどぴったりだと思い、購入。

買ったはいいものの、ネットで調べてもメッシュシートを使った小物の作り方はあまり紹介されていません。
ただ実際使ってみると、アイディア次第で非常に簡単に、好きなものを作ることができます。
そこでまずは、(自己流)メッシュシートの使い方について解説していきます。

つづき >>オリジナル!トイレットペーパーホルダーカバーの作り方(2)

このエントリーをはてなブックマークに追加

2015年7月18日土曜日

「良い」研究テーマについて考えてみた

研究テーマとは何か?

研究の目的は、新しい事実や知見・解釈といった知的コンテンツを生成することである。

研究者は全てについて研究できるわけではないので、何かしら研究するべき対象を絞る必要がある。そして、その絞られた条件や範囲の中で、新しい事実や知見の発見を目指し、日夜、調査・解析・実験または開発などを行っているのである。

私が関心があるのは、どのような観点で研究することを絞るべきなのであろうかという点である。今回はこれに関する現在の考えについて述べようと思う。

良い研究テーマとは?

どのような研究テーマを設定するべきなのであろうか。ここでは、研究テーマが満たすべき条件について考えてみる。整理すると以下の2パターンに大別できるのではないだろうか。
  1. 研究として成立するための必要条件
  2. 「良い」研究テーマとなる条件
以下にそれぞれについて説明する。

研究として成立するための必要条件

まず、研究として成立するための条件について考えると、以下の条件を満たす必要がある。
  • 新規性
    • ”新しい”の部分に対応する。当然のことながら、既存の事実や知見と差異がなければ、「新しい」事実・知見とはなり得ない。何を以て差異とするかは様々な意見があるようだが、差異を明示する必要があるという観点は変わらない。
  • 評価(証明)可能性
    • ”事実・知見”の部分に対応する。事実というからには再現性がある必要がある。特定条件下において再現できることを証明可能かどうか(評価精度についてはここでは言及しない)を考えておく必要がある。もし、原理的に評価(証明)不可能な場合、事実や知見は生まれないはずなので研究にはなり得ない。

「良い」研究テーマとなる条件

次に、「良い」研究テーマとなる条件については、さらに色々な観点が存在すると考えられる。今回は思いつく範囲で以下にまとめた。
  • 「良い」研究テーマ
    • 研究成果(得られた知的コンテンツ)が社会貢献につながる
      • 得られた知見の効果・情報量が大きい
      • 得られた知見の適用範囲が大きい
    • 知的コンテンツ生成コストが小さい
      • 実現可能性が高い
      • 研究に過剰なリソース(時間、金)を要しない
      • 研究者の知的関心が大きい(継続可能性大)


やっぱり新規性を見出す力が重要となる

いろいろと条件を挙げてみたが、やはり「新規性」を巧く説明するところが最も研究テーマ設定において肝となる部分であろう。これが完璧にできれば、後はひたすら作業するのみなので、研究がほぼ完了したといっても過言ではないのだろうか。

以下に、他のブログ等で記されている新規性の考え方について述べる。

引用1.
http://d.hatena.ne.jp/fukudakitchou/touch/20091126/1259243560

研究の新規性は、大きく四つに分けられる。
1.手法が新しい
工学系の研究では、最も一般的な新規性の出し方。
例えばN先生の過去の論文であれば、ゲーム理論とマルチエージェントシミュレーション、実験経済学のアプローチを統合的に用いて分析する、という手法自体が新しいということ。
2.対象が新しい
手法は全く新しくないが、それを適用する対象が新しいということ。つまり、既存の手法を新しい対象に適用している点で、新規性がある。
3.結果が新しい
手法も対象も一緒だが、結果が新しいということ。過去の結果を否定することで、新規性が出せる。
4.解釈が新しい
手法も対象も結果も一緒だが、その解釈が新しいということ。社会科学や人文科学の論文に多い。

引用2.

http://moroshigeki.hateblo.jp/entry/20101108/p2
学術論文における新規性とかオリジナリティとかについて、その辞書的な意味にとらわれて“これまでまったく存在していなかった説を他に依存せずに創造する”みたいに捉える学生がいるが、それはまったくの誤りである。学術論文においては、その存在意義や新規性などはすべて他人の口から語られなければならない。
ある領域についての先行研究を調査することによって、未解決の問題が見つかる場合がある。それは大概、複数の説が存在する(論文が批判しあっている)とか、効率が悪くてやろうと思ってもできないとか、誰かやってくれるといいよねーみたいに問題を投げっぱなし (^_^;; にしているとか、いずれにせよ先行研究自身が語ってくれている場合がほとんどである。先行研究が語っていない、問題だとすら思われていない部分を見つけ出して問題にしてしまう、という高等テクニックもあるが、これも間接的に先行研究がその問題の(現時点における)不在を語っていると言える。

引用3.

http://fujitalab.t.u-tokyo.ac.jp/announcement/message/

イントロがオリジナルか?
 仮にそのテーマがうまくいったとして、学会等で講演するときのことをイメージします。その時のイントロが、良く耳にする受け売りのような話から始まるようであれば、そもそもその研究はオリジナルな研究とは言えません。「イントロがオリジナル」=「誰にもない着眼」ですから、イントロをイメージすることは、自分の発想のオリジナリティーを判別する簡単な手段です。これは研究の途中で方向性を変える時もいっしょです。もっと良いイントロが話せると感じたときに研究テーマを修正することにしています。論文を書くときにイントロに困ったことはありません。はじめから出来上がっているのですから。

各論より総論
 総論は上流にあり各論は下流にあります。周囲を見ずに夢中で研究していると、気がついた時にはずいぶん下流に流されていたということは、上級研究者でもしばしば陥る失敗であります。学位論文の章立てをイメージした時、2章、3章と章が進むにつれ話が各論に入るようであればその研究はしりすぼみです。逆に、「前章の発見をさらに上位概念でとらえるなら…」と上流に向かって話が進むようであれば、研究は広がります。この上流に向かって泳ぐ努力は、回遊魚が一生泳ぎ続けるかのごとく研究者が研究者であるかぎり続けなければいけない努力です。なかなかたいへんですが、油断をせず、たえずこの努力を続けています。

なぜ研究テーマ設定は難しいか?

研究テーマがトップダウンで教授から与えられるような研究室や、課題が割と明確であり、時間と労力をかけ正確に作業できれば成果がでる類いの研究(これも重要)に従事する方は特に悩まないかもしれない。

しかしながら、一般的に、研究テーマ設定はとても難しい。

上記のそれぞれの要素について、基準や優先度が異なったり、不確定要素を含んだりする上、それぞれの要素を複合的に考えて判断する必要があるためであろう。

例を挙げると、生成コストの小さい小粒なテーマで研究成果を量産する、という方針の人もいるだろうし、インパクトのある本当に究明したい研究をいちかばちかで取り組む人もいるだろう。また、上述の引用の中にもあったように、何を以て新規性があるといえるかは研究者によって若干のズレがあるようである。「適用先が変われば新規性といえる」(いわゆる「○○やってみた」シリーズに近い)という方もいれば、「適用先の違い」だけでは研究ではなく、「適用先が異なることにより発生する問題を解決するための新しい工夫が含まれる」必要があると考える研究者も勿論多い。

このテーマ設定において、多くの関係者が納得できる形で議論を収束させ、指針・方向性を示せる人が、主に大学にて先生と呼ばれる人たちであろう。それほど、良い研究テーマ設定は困難であり、高度なスキルが必要となる。

どのように研究テーマの設定をするべきか?

では、最後にどのように研究テーマの設定を進めていけば良いのであろうか。

ポイントは上述の「新規性」をどう説明できるか、と「評価」をどうするかの2点であろう。研究テーマという俎上に上がるための条件であるからである。とはいえ、研究対象領域に関する知識がない場合、新しいかどうかの判断もつかないのは事実である。かといって研究対象領域の論文を読み漁ってから、新規性のありそうなところを研究し始めるというのもコスト大だろうし、いざデータを触ってみたら思ったのと違ったということはありそうである。

なので、「対象領域の理解」と「新規性のサーベイ」を並行して行いながら、新規性があり評価ができそうな領域に追加のリソースを注ぐということを繰り返す必要があるのだろう。いわゆる、段階的詳細化であり、データを触ると難しさがわかり、工夫が必要だと認識できるようになってくることがほとんどだろう。戦略のイメージとしては、新規性が出そうな領域を攻めるというよりは、明らかに既知の部分の探索を止めるという言い方のほうが近いのではないだろうか。

また、同時に懸念事項としては、対象領域ヒアリングや論文調査をしすぎることは、あまり良くない場合が多いということである。つまり、現場のことを聞き過ぎたり、情報を得すぎると、その世界が全てであると考えるようになる。目の前のその人を短期的に支援することは重要であるが、そこに執着しすぎてしまい、局所最適化解に落ち着く可能性が大きい。これは、自分自信の対象領域に潜む本質的な問題の理解が不足していることに起因すると考えられる。

今回、「良い」研究テーマ設定の方法論を考えたが、明確な解決策は見出せなかった。
引き続きこの点について最善策を考えていきたい。


2015年7月16日木曜日

歴史の教科書に関する諸問題と対策


歴史教科書の諸問題


私が受けた歴史教育の中で、教材について思い返すと、今更ながらではあるが色々問題があると感じるし、やりようもいくらでもあるように感じる。この記事では、まず問題点を列挙した後に私が考える対策を述べる。

問題1:歴史的事象の時系列的な対応付けがとりにくい

現在の歴史の教科書といえば山川出版社が有名であろう。
以下は、詳説日本史 改訂版(日B012)の「第3部『近世』」の目次の構成である。
 

以下のように、大まかに項目が政治的視点、経済的視点、文化的視点と分かれていることがわかるであろう。


もちろん異なる観点から分かれて記述されていること自体は、一つの流れを理解するのに理解を助けるのであるが、問題もある。それは、時代的な、時系列的な出来事の対応がとれなくなってしまっているということである。



歴史は様々な流れが並行で進み、時には複雑に絡み合って、形成されていくものであり、本来その様々な関係性を対応付けながら理解していく必要がある。

よって、この歴史教科書の構成では、政治、経済、文化の対応付けをとりながら、様々な観点から多角的に歴史を学んでいくことは、一つ一つの流れをしっかりと理解した上で頭の中でそれらの流れを整理できる、ごく一握りの優秀な読み手のみが可能な作業といえるであろう。

問題2:歴史の時間の流れの量感がわかりにくい

歴史の教科書は原則的にページをめくればめくるほど時が経っていくものである。なので、問題1で述べたような観点がかわることによる時間軸的な前後はあるにせよ、基本的に後ろのページが新しく、現在に近い時代の内容となる。つまり、ページの前後で事象の順序関係は、教科書というモノから、ビジュアルかつ感覚的に読み手に伝わるのである。


しかしながら、順序関係は伝わってもどれくらい前かどれくらい後かが非常に伝わりにくいのも事実である。138億年前のビッグバンと46億年前の地球誕生は同じページに記載されているにもかかわらず、第二次世界大戦の終戦までの数日間のイベントは日単位で記述され、数ページに渡っている。


現代の私たちにとって、とても重要な事柄であるから、細かい粒度で記載する必要があるはよくわかるが、細かい粒度で記載することにより、教科書のページとしては多くを占めてしまうため、これによりある程度の時間経過を感じてしまう。


重要なイベントには細かい粒度での記載が必要があるという話と時間間隔に合わせてイベントを記載する(教科書というものから巧くビジュアルかつ感覚的に時間感覚を伝える)という話は本来トレードオフであると考えられるが、これにより歴史上のイベントの時間感覚として読み手に誤解を与えている部分は少なくないであろう。

問題3:歴史上の事実・ファクトと歴史研究者の解釈・通説が混在している

歴史上の文献や史料から読み取れる事実(歴史上のイベント・ファクト)は、ただじっと歴史上に存在する。それらのファクトに対して、仮説を与えて整理・分類することにより、歴史の研究者はファクトにストーリーや新たな解釈を与える。例えば、藤原氏一族が代々摂政や関白になったというのはファクトであるが、これを「摂関政治という藤原氏の戦略があったのだ」と言い切るのは歴史研究者の解釈にすぎない。解釈の仕方としては、「たまたま偶然にしては摂政や関白または外戚になっていることが明らかに多い→何か恣意的な要素がある→政治的な権限を得るためか。」という流れであると推察されるが、これはあくまで仮説にすぎず、「摂関政治」というのは歴史上の事実とは一線を画すものである。

現在の教科書を見てみると、このような当たり前となった解釈や通説は目次レベルにまで記述されている。何らかの解釈やストーリー、あるいは因果関係を以て、歴史上の事実を説明された方が理解が深まる、理解しやすいというはまぎれもない事実であると想われる。しかし、事実と解釈を分けて記述しないと、データや事実を読み取ることと、解釈・説明することが別であるということを理解できない読み手が増えてしまうのではないだろうか。そして、情報があふれる現代社会において、自分の頭でこれらを考える力が、過去よりも増して求められているのではないだろうか。
 

対策:歴史の全体像を同一空間上に表現できないか?


上で述べたような問題点を解決するためには、もはや本というメディアには限界があると考える。本は基本的に「ページをめくる」という作業しか受け付けないのである。一つのストーリーをシーケンシャルに読むには、現在でも最適な媒体であると考えられるが、歴史のような複数の事実とそれの裏にある様々な解釈・ストーリーおよびそれぞれのストーリーの複雑な絡み合いと流れを多角的に理解することが求められるものを表現することは明らかに向いていない。

現代の情報技術を用いて、iPadなどで、空間、カテゴリを跨った時系列的な対応を同一平面上に表現して全貌をつかめるようにし、文献や史料からわかる事実・ファクトと歴史家の解釈を分けて、見える化することが歴史を表現する上で最も理解が進む方法であると考えられる。

具体的には事実をノードで時空間+カテゴリ上にマッピングし、それらの事実をグルーピングしたり、ノード間に因果関係のような関係性がある場合は矢印を追記したりすることで、解釈を与える。このような表現をiPadのような、直感的に操作できる端末上に、3次元的に表現するのである。

歴史から学ぶことはとてつもなく大きいと信じてやまない。しかしながら歴史を学ぶための基盤がたくさんの文献を読む、といったアナログな方法しかないこともまた事実である。以上のような仕組みで歴史を表現することで、大変に理解が進むのではないかと強く感じた次第である。
 

2015年7月7日火曜日

今更聞けないEMアルゴリズムの解説

今更ながらEMアルゴリズムとは何かについて、調査・勉強したのでまとめておく。Andrew氏のレクチャノートとパターン認識と機械学習下巻第9章を参考にした。

EMアルゴリズムの目的

観測変数$\boldsymbol{x}$と観測できない潜在変数$\boldsymbol{z}$を含む確率モデルの尤度関数$P( \boldsymbol{x} \mid \boldsymbol{\theta})$ を最大化するパラメータ$\boldsymbol{\theta}$ を見つけることである。

比較的複雑な観測変数の(周辺)分布$P( \boldsymbol{x})$を、より扱いやすい観測変数と潜在変数の同時分布$P( \boldsymbol{x}, \boldsymbol{z})$によって表すことができることがある(例えば混合正規分布などがそれに相当する)。このように、モデルを簡単に扱うために潜在変数$\boldsymbol{z}$を導入し、EMアルゴリズムの効果的な適用を図るケースがしばしばある。

EMアルゴリズムの解説

E-Stepの説明

E-Stepでは、$\boldsymbol{\theta}$固定の下、尤度関数の下界の分布を最大化する。以下で尤度関数を変形し、下界を求める手順を示す。

$$
\begin{eqnarray}
\displaystyle \sum_{ i = 1 }^{ N } \ln P( \boldsymbol{x}_i \mid \boldsymbol{\theta}) &=& \displaystyle \sum_{ i = 1 }^{ N } \ln \displaystyle \sum_{\boldsymbol{z}_i} P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})\\
&=& \displaystyle \sum_{ i = 1 }^{ N } \ln \displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i)\frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\\
&\geq&  \displaystyle \sum_{ i = 1 }^{ N }\displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i) \ln \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}
\end{eqnarray}
$$

(1)式から(2)式への変形は、$\boldsymbol{z}_i$の任意の確率分布$Q(\boldsymbol{z}_i) $でかけて割っただけである。
(2)式から(3)式への変形は、Jensen's Inequalityを利用した。以下の(4)式を参照されたい。$\ln$が凹関数なので、期待値を関数に入れた値のほうが、関数に入れた値の期待値より大きい。今回の場合、$\frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}$を値と捉え、$Q(\boldsymbol{z}_i) $によって期待値を算出することを考える。

$$
\begin{eqnarray}
 \ln E_{\boldsymbol{z}_i 〜 Q(\boldsymbol{z}_i) } \left[ \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\right]
&\geq& E_{\boldsymbol{z}_i 〜 Q(\boldsymbol{z}_i) } \ln \left[ \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\right]
\end{eqnarray}
$$

(2)式から(3)式の変形は、$Q(\boldsymbol{z}_i)$がどのような確率分布であっても成立する。
尤度関数最大化の目的を考えると、$\boldsymbol{\theta}$固定の下、下界(3)式を最大化、つまり(3)の等号の成立を図るのが自然であろう。
Jensen's Inequalityの等号の成立条件は、凸関数が線形関数の場合か、狭義凸関数(線形ではない)の場合は、凸関数の中身が1点分布となる場合である。つまり以下を満たす。

$$
\begin{eqnarray}
\displaystyle \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)} &=& const
\end{eqnarray}
$$

また、$\sum_{\boldsymbol{z}_i }Q(\boldsymbol{z}_i) =1$より、以下が成り立つ。

$$
\begin{eqnarray}
Q(\boldsymbol{z}_i)  &=& \displaystyle \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{\sum_{\boldsymbol{z}_i }P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}\\
&=&  \displaystyle \frac{P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta})P( \boldsymbol{x}_i \mid \boldsymbol{\theta})}{P( \boldsymbol{x}_i \mid \boldsymbol{\theta})}\\
&=& P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta})
\end{eqnarray}
$$

すべての$i$について(8)式を実施することが、E-Stepにて行うことである。

(補足)E-Stepのその他の説明

(3)式の下界の各々$i$について、以下のように式変形する。
$$
\begin{eqnarray}
\ln P( \boldsymbol{x}_i \mid \boldsymbol{\theta})
&\geq& \displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i) \ln \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\\
&=& \displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i) \ln \frac{P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta})P( \boldsymbol{x}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\\
&=&  \ln P( \boldsymbol{x}_i \mid \boldsymbol{\theta}) + \displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i) \ln \frac{P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\\
&=& \displaystyle \ln P( \boldsymbol{x}_i \mid \boldsymbol{\theta}) - KL(Q(\boldsymbol{z}_i)||P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta}))
\end{eqnarray}
$$

(10)式から(11)式への変形は、$\boldsymbol{z}_i $に依存しない$P( \boldsymbol{x}_i \mid \boldsymbol{\theta})$を前に出し、$Q(\boldsymbol{z}_i)$の$\boldsymbol{z}_i$に関する積分が1になることによる。

さて、下界である右辺の最大化を考えた場合、(12)式第2項$Kullback–Leibler$ divergenceの最小化が必要となる。$KL$ divergence $\geq 0$より、  $KL(Q(\boldsymbol{z}_i)||P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta})) = 0$となる$Q(\boldsymbol{z}_i)$を求めることと同義となる。よって、$Q(\boldsymbol{z}_i) = P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta})$を求めることとなり、これは(8)式と一致する。

また、$\boldsymbol{z}_i$が連続変数の場合のE-Stepについては、以下に変分法を用いた説明を加えたので、参照していただきたい。
今更聞けないEMアルゴリズムの解説〜潜在変数が連続変数の場合のEステップの説明〜

M-Stepの説明

今度は、$Q(\boldsymbol{z}_i)$を固定し、$\boldsymbol{\theta}$を動かし、尤度関数の下界分布の最大化を図る。

$$
\begin{eqnarray}
\hat{\theta}&=&\mathop{\arg\,\max}\limits_\boldsymbol{\theta}
\displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i) \ln \frac{P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})}{Q(\boldsymbol{z}_i)}\\
&=& \mathop{\arg\,\max}\limits_\boldsymbol{\theta}
\displaystyle \sum_{\boldsymbol{z}_i} Q(\boldsymbol{z}_i) \ln P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})\\
&=& \mathop{\arg\,\max}\limits_\boldsymbol{\theta}
\displaystyle \sum_{\boldsymbol{z}_i} P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta}_{old}) \ln P( \boldsymbol{x}_i, \boldsymbol{z}_i \mid \boldsymbol{\theta})
\end{eqnarray}
$$

(13)式から(14)式の変形は$\boldsymbol{\theta}$によって影響のない部分を排除した。
(15)式はE-Stepで求めた、$Q(\boldsymbol{z}_i) = P( \boldsymbol{z}_i \mid \boldsymbol{x}_i, \boldsymbol{\theta}_{old}) $を代入した。

このように、E-Stepにて潜在変数の事後確率を求め、その事後確率によってM-Stepにて期待値計算を行い、目的のパラメータを更新する。このプロセスを収束するまで繰り返す。イメージを下図に示す。

パターン認識と機械学習 下 (ベイズ理論による統計的予測)  第9章 図9.14


以上、EMアルゴリズムの全貌である。複雑な分布を簡単な分布の構成として扱うことで、簡単に尤度関数の最適化ができるようになった。EMアルゴリズム適用時のポイントは、何を潜在変数の分布として、何を観測変数として扱うのかというモデル化であろう。卑近な混合正規分布への適用例をしっかりと学び、その類推で応用していくのが簡単に思える。

EMアルゴリズムを拡張した変分推論については、また今度。

参考文献
パターン認識と機械学習 下 (ベイズ理論による統計的予測)  第9章, C.M. ビショップ (著), 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇 (監訳)

2015年7月1日水曜日

ベイズ推定における共役事前分布の重要性について

ベイズ推定における事後確率計算量


$$P(x^* \mid \boldsymbol{x}) = \displaystyle \int P(x^* \mid \boldsymbol{\lambda})  P(\boldsymbol{\lambda} \mid \boldsymbol{x}) d \boldsymbol{\lambda}$$

ベイズ推定の際は、予測をする場合に事後確率によって重み付けをとるため、全てのパラメーターに対する事後確率を覚えておくか、解析的に計算できるようにしておく必要がある。


現実的には、全てのパラメータの事後確率を覚えておくことは不可能なので、解析的に計算しておくか、近似的に計算することになる。

そこで、共役事前分布の登場である。

共役事前分布を用いれば, 事後分布が閉じた形で計算できるため、計算が簡単になる。具体的には、事後分布を求める際に、尤度と事前分布の積が、ある確率分布*定数$\kappa$だとわかる場合、evidence(分母) と定数$\kappa$が同じにならねばならない。なぜなら、左辺の事後確率分布はあらゆる点において0以上1以下で全区間積分すると1になる正しい確率分布であるので、右辺も同様に正しい確率分布荷なる必要がある。ある確率分布(パラメータ未定)が出現しているため、その前の定数はevidence(分母)とキャンセルされる必要があるのである。

$$
\begin{eqnarray}
P(\boldsymbol{\lambda} \mid \boldsymbol{x}) &=& \frac{ \prod_{ i = 1 }^N P(x_i \mid \boldsymbol{\lambda})P(\boldsymbol{\lambda})}{ P(\boldsymbol{x})} \\
&=& \frac{ \prod_{ i = 1 }^N Cat_{x_i}( \boldsymbol{\lambda})Dir_{\boldsymbol{\lambda}}(\boldsymbol{\alpha})}{ P(\boldsymbol{x})} \\
&=& \frac{ \kappa (\boldsymbol{x}, \boldsymbol{\alpha}) Dir_{\boldsymbol{\lambda}}(\boldsymbol{\tilde{\alpha}})}{ P(\boldsymbol{x})}
\end{eqnarray}
$$

上の例では、多項分布($Cat(x)$についてはココ(基本的な確率分布のまとめ)を参照。)とその共役事前分布であるディリクレ分布の掛け合わせによる事後分布の導出を示している。このとき$\kappa$と$P(\boldsymbol{x})$はキャンセルする必要があり、結果的にディリクレ分布のパラメータ$\boldsymbol{\tilde{\alpha}}$が決まれば事後分布がわかるわけである。

その他、パラメーターを介した周辺化の積分計算(予測*事後確率)を行う際に、確率分布が出現し、積分の中の計算が1になる。よって、定数部分の演算だけで観測点からの予測が可能となる点で、共役事前分布は強力である。

$$
\begin{eqnarray}

P(x^* \mid \boldsymbol{x}) &=& \displaystyle \int P(x^* \mid \boldsymbol{\lambda})  P(\boldsymbol{\lambda} \mid \boldsymbol{x}) d \boldsymbol{\lambda}\\
&=& \int Cat_{x^*}( \boldsymbol{\lambda})Dir_{\boldsymbol{\lambda}}(\boldsymbol{\tilde{\alpha}}) d \boldsymbol{\lambda}\\
&=& \int \kappa (x^*,  \boldsymbol{\tilde{\alpha}}) Dir_{\boldsymbol{\lambda}}(\boldsymbol{\breve{\alpha}}) d \boldsymbol{\lambda}\\
&=& \kappa (x^*,  \boldsymbol{\tilde{\alpha}})
\end{eqnarray}
$$

上の例では、各パラメータ$ \boldsymbol{\lambda}$の下の$x^*$の確率分布が多項分布、事後確率分布がディリクレ分布の場合の予測時の導出を示している。定数部分$\kappa$だけ積分の前にもっていくことができ、ディリクレ分布は積分すると1になるので、結果、定数部分$\kappa$が残るわけである。

以上、ベイズ推定における共役事前分布の重要性について述べた。
(代表的な共役事前分布の例はこちら

しかし、MCMCと呼ばれるサンプリング技法が成熟した経緯もあり、共役でない自由な事前分布を用いたとしても近似的に事後分布を求めることで、ベイズ推定可能となっている。詳しくは後日投稿する。

服をリサイクル!ティッシュカバーの作り方

買ったけどあまり着ていない、でもサイズが合わない…
色や素材は可愛いけど、服としてのデザインは…
なんて服、タンスに眠っていませんか?

リサイクルやフリマに出すのもいいですが、なんか手放すのももったいないな…という場合には、簡単にリメイクして手元に置いておく方法をオススメします!

今回ご紹介するのはこちら。



ティッシュケースです。
実はこれ、昔WEGOで買った白パーカーのフードをリメイクして作っています!
作り方はとても簡単。
用意するものは、着なくなったパーカー、適当な布(パーカーの余った部分でもOK)、大きめのボタン。

パーカーのフードの顔が出る部分が、ティッシュを出す部分に相当するので、まずはティッシュの箱を実際に入れてみてサイズ感を確認します。
あまりに大きすぎるものは適さないかもしれません。
大きさを確認したら、パーカーのフード部分(赤い点線部分)を切り取ります。


そして切断した部分を、用意した布と縫い合わせて袋状にします。
縫い合わせた布の両サイドを、ティッシュの箱のサイズにあわせてキュッと絞り、縫い合わせます。
縫い目に大きめのボタンを付ければ出来上がり。

上から見るとこんな感じで、赤く囲んだ部分がフードになっています。

フードなので少し丸いシルエットになりますが、その分反対側の付け足した布を箱にフィットさせることでバランスを整えます。
フードに付いていた紐がデザインのアクセントになっているうえに、この紐のおかげで、ティッシュ箱の差し替えがとても便利になるのです!


このように、紐を解くと口が大きく広がるので、簡単に出し入れができます。

ティッシュを出すとこんな感じ。

元々買う服は、自分の好みの色やデザインのものが多いので、上手く小物に変身させると、自分の好みの部屋にマッチしたものに仕上げることができます。
是非お試しください。



2015年6月28日日曜日

賢い仕事の優先度付けのやり方とは?

仕事の優先度の付け方に関する記事は色々なところにまとめられているが、多くのものは緊急性と重要性で判断すると記されている。しかしながら、緊急性とは何か、また重要性とは何かといった定義が甘いため、イマイチしっくりこない。そこで本投稿では、もう少し踏み込んで優先度付けのやり方について考えてみようと思う。

「仕事の優先度付け」の定義

私が考える仕事および優先度付けの定義を以下に示す。

仕事 = ある期限までに実行すると誰かに喜ばれる作業のこと

優先度付け=どの順序でどの仕事を実施するかを決めること

仕事の優先度を考えるための観点

この定義を基に仕事の優先度を考えると、ポイントは表にまとめられる。

表:仕事の優先度を考えるための観点
緊急性期限までの期間が短い
重要度
影響範囲(量)喜ぶ人の数が多い
影響範囲(時間)喜ぶ時間の持続性
効果喜ぶ度合い

緊急性は、「各仕事の持つ期限までの期間がどの程度であるか」を意味し、短い方が優先度は高い。また、期限を逃すと、誰にも喜ばれなくなる、つまり得られる喜びが0になる性質を持つ。緊急性は明確に決まっていることが多い。

重要度は3つに分解する。
1つ目は影響範囲(量)であり、その仕事を行った場合に喜ぶ人の数を意味する。喜ぶ人が多いほうが優先度は高い。
2つ目は影響範囲(時間)であり、その仕事を行った場合に各々が喜ぶ期間を意味する。長い方が優先度は高い。
3つ目は効果であり、その仕事を行った場合に各人にどの程度喜びを与えるかを意味する。効果が大きい方が優先度は高い。

以上のように定義すると、仕事の優先度付け問題は、
「緊急性という制約条件の下、いかに多くの喜びを与える仕事を選ぶか、という組合せ最適化問題」に帰着する。

優先度付けの課題

とはいえ、影響範囲や、効果は正確には見積もれないことが多く、問題の解き方のロジックは単純でも優先度付けを誤る人が多いのはそのためであろう。また裏を返せば、仕事のやり方が巧いといわれる人は、将来に渡った複雑な影響を正確に見積もることができる人だといえる。


日本酒の「キレがある」とは?

日本酒を味わう会

日本酒を味わう会に参加してきた。
各自1本以上の自慢の日本酒(四合瓶/一升瓶)とまいおちょこを持ち寄り、
まいおちょこに注いで、飲んで、味わって、感想を共有しながら、
次々に日本酒を回していく。

今回は30人以上の参加者がいて、一度に40本以上の日本酒を味わうことができた。また、参加者が持ってくる酒は「自慢の」日本酒であり、1つ1つのお酒も入手困難なハイレベルな逸品であるため、大変満足度の高い素晴らしい会であった。



客観的っぽい主観的なコメント

様々な日本酒を味わう中で、自分を含めた参加者は次のようなコメントをそれぞれのお酒について述べていく。


  • 「甘い/辛い」
  • 「キレがある」
  • 「酸が強い」
  • 「ひねがない」

etc...

「おいしい」「苦手」といったコメントは明らかに主観的なコメントであるので、真偽を確かめることができないし、確かめることに意味がない。
しかし、上記のコメントは一見、日本酒に関する客観的な属性について述べているはずなので、正誤が気になってきてしまう。
実際、共感できるコメントもあれば、疑問を感じるコメントや何を意味しているかわからないコメントも多くあった。

では、なぜこのように理解できないコメントが発生するのであろうか。

解せない理由

例えば、「きんきんに冷えていて美味しい」というコメントであれば、
温度に対する情報であることがわかる。

これについて疑問を持つとすれば、「冷えている」というのが絶対的な情報ではなく、あくまで相対的な情報なので、普段から比較的冷たいものを飲んでいる人からすれば、この程度で「きんきんに冷えている」といえるのだろうか、と想ってしまう場合くらいであろう。

つまり、何に関するコメントは理解できるが、その内容が主観的な相対的情報であるため、万人で一致しない場合である。

しかし、「キレがある」「ひねがない」というコメントは、自分のような未熟者からすると、どのような観点についての情報かも正しく認識できない。「キレがある」とは日本酒を口に含めた場合に感じるどの要素がどうであることを意味しているのか・・ということがわからないのである。

まとめると以下のような場合で、コメントが解せない場合がありそうである。

  1. どの観点/軸の情報かわかる if not 何について話しているのかわからない。
  2. ある観点/軸の認知/知分解能が同じ if not  感じ方の粒度が粗いため、細かい差異がわからず、細かい違いに関して再現性がなくなる 
  3. ある観点/軸の感じ方の平均が同じ if not 相対的な表現にズレが生じる。

3.については、飲み比べをしながら、前の日本酒に比べてどうこうといえば問題にならない話である。1,2について、もう少し考えてみる。

共通の表現をどのように得るか

通常、生活の中で共通の「ある表現」「ある言葉」を得るためには、その言葉が何を指しているのかが理解できる必要がある。概念としては認識できているが、その概念に共通の名前がないだけの場合は比較的容易に言葉を得られる。(例えば、英語圏の人との共通の表現を得る場合、「犬」という概念を認識できていれば「dog」がすぐわかる。)

問題となるのは、概念としてそもそも認識できていない場合である。
「キレがある」という表現を獲得しようとした場合、得る方法は2つあると考える。
1つ目は、メタファーを利用するということである。同様の表現を日本酒の世界に引きずり込んで当てはめるという方法である。例えば、ビールの「キレがある」を認識できている人に、日本酒も同じようなものであることを伝えれば(自分は同じようなものかどうかもわからないが、、)、その言葉を獲得できるかもしれない。
2つ目は、「キレがある」群と「キレがない」群を飲み比べることで、学習する方法である。ある程度の分解能があれば、各要素の違いから、「キレ」のあるなしを認識できるようになると想われる。そのためには、キレがあるものとキレがないものを明示した学習利き酒セットが必要であろう。

最後に、分解能をどのように得るかという問題であるが、これはその分野を絞ってとにかく多く経験することが必要である。特定の分野に絞って、多くを経験すると、その分野の中で違いを見極めるポイントが認識できるようになる。例えば、自分は子供の頃、欧米の方の顔の識別が苦手であったが、ハリウッド映画を見たり、実際の欧米の方と出会う中で、顔の違いがわかるようになった。どこで識別しているかは言葉にできないのであるが。また、識別する必要性(映画のストーリーの把握など)が存在すれば、学習のスピードは加速する。

今更聞けない基本的な確率分布のまとめ

忘れがちな以下の4つの確率分布についてまとめておく。

ベルヌーイ分布 (Bernoulli distribution)

確率 $\lambda$で 1 を、確率 $1-\lambda$ で 0 をとる、離散確率分布である。

$P(x\mid \lambda) = \lambda^x(1-\lambda)^{(1-x)}$ for $ x \in \{0,1\} $

Takes a single parameter $\lambda \in [0,1] $

カテゴリカル分布 (Categorical distribution

ベルヌーイ分布を一般化した確率分布で、二値ではなく、$K$値の場合をとる離散確率分布である。
※ベルヌーイ分布はカテゴリカル分布のカテゴリ数が2の場合ともいえる。
※ どういうわけか、日本語Wikipediaにはカテゴリカル分布の記事は存在しないため、多項分布と混乱されやすい。

$$P(x\mid \boldsymbol{\lambda}) = \displaystyle \prod_{ i = 0 }^K \lambda_i^{x_i} $$

Takes $K$parameters $\lambda_i \in [0,1] $ where $\displaystyle \sum_{ i = 1 }^{ K } \lambda_i = 1$

二項分布 (Binomial distribution)

n 個の独立なベルヌーイ試行の「成功」の数の確率分布であり、各試行の「成功」確率$\lambda$は同じである。
※ベルヌーイ分布は二項分布における試行回数が1回の場合ともいえる。

$$
P(x\mid \lambda, n) = {}_n \mathrm{ C }_x \lambda^x(1-\lambda)^{(n-x)}
$$
$${}_n \mathrm{ C }_x = \frac{ n! }{ x! ( n - x )! }$$

多項分布 (Multinomial distribution)

二項分布を一般化した確率分布である。多項分布では、各試行の結果は固定の有限個($K$個)の値をとる。
※カテゴリカル分布は多項分布の試行回数が1回の場合ともいえる。
※二項分布は多項分布のK=2の場合である。

$$
P(x\mid \boldsymbol{\lambda}, n) =
  \begin{cases}
     \frac{ n! }{ x_1! x_2! \cdots x_k! } \displaystyle \prod_{ i = 1 }^K \lambda_i^{x_i}   & (when \sum_{ i = 1 }^{ K } x_i = n ) \\
    0 & ( otherwise )
  \end{cases}
$$

多項分布の例

SASブログより、100足の靴下を取り出す場合($n=100$)、何色の靴下を何回抽出するかという分布例を以下に示す。靴下の色は(黒、茶、白)の三種類であり($K=3$)。それぞれ確率は$\lambda_{black}=0.5,\lambda_{brown}=0.2,\lambda_{white}=0.3$である。


4つの分布の関係性

最後に、以上4つの分布の関係性をまとめると、以下の図になる。カテゴリ数と試行回数によって、最も一般化されたのが多項分布である。このように関連づけて4つの分布を覚えておけば忘れない、、に違いない。

$$
\require{AMScd}
\begin{CD}
Bernoulli(K=2,n=1) @>{K>2}>> Categorical(K>2,n=1)\\
@V{n>1}VV {} @VV{n>1}V\\
Binomial(K=2,n>1)  @>>{K>2}> Multinomial(K>2,n>1)
\end{CD}
$$

$$
\diamondsuit K:カテゴリ数\\
\diamondsuit n:試行回数
$$


2015年6月23日火曜日

The Google Similarity Distance (Rudi L. Cilibrasi, Paul M. B. Vitanyi著)

Rudi L. Cilibrasi, Paul M. B. Vitanyi著

検索エンジン「グーグル」を用いて、2つのものの関係性を表すという主旨の論文。

Information Distance とKolmogorov Complexity に基づいた、二つのオブジェクト、とりわけ語句の関係性を表す指標であるNormalized Information Distanceが定義されたが、これはコルモゴロフ複雑性を内包しているため、コンピュータで計算できない。そこでNormalized Compression Distanceというものが提唱された。これはコルモゴロフ複雑性K(x)を圧縮関数C(x)で近似したものである。コンピュータ上で関数を圧縮関数を指定すればNCDは計算できる。
そして本論文はその圧縮関数C(x)をグーグルサーチエンジンを用いてさらにG(x)として近似する物である。圧縮=グーグルの接頭コードという発想である。
以下NGD。f(x)はxのグーグルサーチエンジンが返すxを含むページ数である。


さらにSVMと組み合わせるなどして、精度の向上にも努めている。

また、検証実験としてWordNetとの比較も行っており、erectrical termsについては100%の精度でwordnetと一致するなどといった結果もでている。



Wikipediaと同様に外部ソースを使った語句相関指標として使ってみたい。

Automatic Keyphrase Extraction via Topic Decomposition (Zhiyuan Liu, Wenyi Huang, Yabin Zheng, Maosong Sun 著)

Zhiyuan Liu, Wenyi Huang, Yabin Zheng, Maosong Sun 著

目的は文書からキーフレーズを抽出すること。
共起関係からできあがった語の共起ネットワークを解析することで重要な語を抽出する。
解析アルゴリズムとしては誰もがお世話になっているグーグルのPageRankを応用する。(Topical PageRank)

どのように応用するか?

この論文は「語はそのトピックに依存する」というのがポリシー。
つまりより良いキーフレーズはその文書の主要なトピックと関係が強くあるべきであり、またより良いキーフレーズはその文書の全てのトピックを網羅すべきであるといった具合だ。

そこでTopical PageRankアルゴリズムを提案する。
基本ステップは以下の通りである。
1.トピックを判断する分類器の作成
2.トピックを考慮してPageRankアルゴリズムを改善

これが全体の概要の図。

ステップ1のためにはLatent Dirichlet Allocationを利用する。
これにより、あるトピックzが与えられたときに語wが起こる確率P(w|z)、及びP(z|w)を求める。
トピックの分布と語の分布を分けて考えて学習させるっていう感じ。詳しくは論文を参照されたい。

ステップ2ではPageRankアルゴリズムをトピックを考慮したものに変形する。
まずこれが本家のPageRank。



R(wi)が大きいほどグーグル検索上位になるわけだ。
e(wi,wj)はwi→wjのエッジの重み。O(wj)はwjを起点として他のノードに向うエッジのeの和(Σe)。
つまりΣの中身は(あるノードwjの重要度:R(wj))×(wjから見たwiの重要さの割合:e/Σe)ということである。Σ全体でノードwiの重要度を示しているというわけ。
また|V|は対象としている語の数、つまりΣw。その逆数1/|V|はランダムでそのノードに来る確率だと考えて良い。またλは普通にリンクをたどって、wiにくる場合とランダムでくる場合の比を表す。
本家グーグルではλ=0.85だそうだ。
このマルコフ連鎖の定常分布を求めることが、PageRankにおける重要度を求めることであった。

さて、ではTPRの場合はどうか。
TPRは以下のようになる。


なんのことはなく、ランダムでwiに遷移する確率がPzとなっただけである。
このPzはトピックに依存した確率であり、Σ [w] Pz(wi)=1である。
本論文では、PzをP(w|z)の場合、P(z|w)の場合、またP(w|z)*P(z|w)の場合などを試している。


さて、TPRを用いて評価実験について。
評価項目としては、再現率、適合率、F-measureに加え、Bpref、MRRという指標も評価している。
この二つは選択のみならず、その順序を考慮するときに用いる指標だそう。
比較対象はTF-IDF、PageRank,LDAで、結果はいわずもがなTPRが全ての指標で一番。

感想としてはトピック付のコーパスを利用して、それに特化したアルゴリズムである時点で、他の手法より良いのは明白であると思った。あとP(w|z)がOになってしまうという危険がはらむのではないか。そうすると共起ネットワークグラフを強連結にすることが保証されなくなりそうな気がする。。
それはさておき、PageRankのランダム遷移部分をトピックに注意して変化させるというアイデアは面白い。というかリンク解析の手法がグラフ理論や確率過程の問題、または機械学習とうまく絡んでいて美しいなあ。

2015年6月22日月曜日

コンテンツを科学する〜「コンテンツの秘密」を読んだメモ〜

先日、以下を読んだので、備忘録代わりに書評を書いておく。

コンテンツの秘密―ぼくがジブリで考えたこと (NHK出版新書)
川上 量生 (著)


本書は株式会社ドワンゴ代表取締役会長である川上量生さんがスタジオジブリで学んだことをまとめた一冊であり、本人は本書を「卒論」と位置づけている。

本書の中で色々な観点から様々な「コンテンツの定義」が登場する。一つ一つ大変興味深く、示唆に富んだ定義であるので詳しくは本書を読んでほしい。本記事では特に興味深かったコンテンツの定義を引用し、想ったことを追記しておく。

以下はアリストテレスの表現を基に筆者がコンテンツについてまとめた最初の定義である。

「コンテンツとは現実の模倣=シミュレーションである(p.41)」

つまり、コンテンツの目的としては、受け手に現実世界を模倣(疑似体験に近いか)させることと捉えれば良いと想う。これは現実の世界のあらゆる事象を含んでおり、受け手が体験した事象はもちろん、未体験ではあるが、想像できなくもない事象を含む(SFなどはこれにあたると考える)。

次に筆者オリジナルの大変興味深い定義が以下の2つである。
「小さな客観的情報量によって大きな主観的情報量を表現したもの(p.70)」

「コンテンツとは脳の中のイメージの再現である(p.89)」

部分的に類似した定義であり、「主観的情報量」≒「脳の中のイメージ」と捉えるとその関係性がわかるであろう。作り手の頭の中にある何らかの現実を模したイメージを形にし、受け手の脳内にそれを再現させることをという意味となると想う。

本書には記されていなかったが、ここでは作り手と受け手の脳内に同様のイメージを再現できる要素がそろっている必要があると考えられる。作り手にとっては、非常に大きな主観的情報量のある作品を用いたとしても、受け手にそれを再現するための要素がなければ、何も現実世界を模倣することはできない。

受け手に対して、どれだけ根源的な内容を再現・模倣させるかに依存するが、同じ人間である、同じ民族である、同じ地域で育ったなど、様々なコンテキストの共有レベルを考えて初めて、これらのコンテンツの定義は機能するとおもわれる。

そのため、人の本能に近い部分を想起させる内容は万人受けするということであろう。

本書は「コンテンツ」を分析的に捉えるための良書である。


2015年6月21日日曜日

コンセプトビデオから読み解くGoogleの共有価値観とは?〜禅とGoogleの関係性〜

先日、以下を読んだので、備忘録代わりに考えたことをまとめる。

ザ・プラットフォーム − IT企業は成果を変えるのか?(NHK出版新書)
尾原 和啓 (著)


本書では、プラットフォームを以下のように定義している。

「ある財やサービスの利用者が増加すると、その利便性や効用が増加する『ネットワーク外部性』がはたらくインターネットサービス」

このようなプラットフォームがビジネスの世界だけではなく、私たちの生活の随所で重要な役割を担うようになってきている。本書では、世界を動かす可能性も十二分に秘めているこのプラットフォームについて、著者が実際に経験した企業(Google, 楽天, リクルート)を含む様々な実事例を交えて、その特徴や課題、また未来について記されている。

この記事では、本書2章「プラットフォームの共有価値観」にあった内容が興味深かったので、その点に焦点をあて、まとめておく。

まず、プラットフォームの本質を捉えるために、共有価値観(Shared Value)を読み解くことが重要である。

共有価値観(Shared Value)は、企業分析に用いられる 7S(Seven S Model)
の中心に据えられ、その他の企業内のあらゆる要素(Strategy, Structure, Systemes, Staff, Style, Skills, Strategy)とも強く結びついているため、プラットフォーム本質を知るために欠かせない要素となるのである。



本書では、言わずと知れたIT企業であるGoogleを例にとり、
プラットフォームの本質の読み解いているが、興味深い点は、コンセプトビデオを起点として、共有価値観を分析するところだ。

Googleの製品のコンセプトビデオの随所に散りばめられた、価値観の片鱗を紡ぎ合わせて、1つのストーリーとしてまとめている。(本書ではその他Appleについても深い考察がなされている。)

これは、私の偏見かもしれないが、一部はストーリーが先にあって、後付けでコンセプトビデオから関連するシーンを抽出したと考えられるが、その洞察と構成力は深い。今後様々なジャンルで、様々なプラットフォームが台頭してくると考えられるが、このような共有価値観を読み解くといった見方をしっているだけで、捉え方の深みは代わり、そのプラットフォームとの向き合い方も変化すると考える。

それでは、Googleの例について見ていこう。



「Google Glass」のコンセプトビデオからその共有価値観を読み解いていく。2015年1月にβ版が販売されたものの、未成熟であったためか「Google Glasshole」などと揶揄され、一時的に撤退し、現在研究所における開発体制となった製品であるが、このコンセプトビデオにはGoogleの共有価値観が多分に含まれているようである。

コンセプトビデオの前半では、以下のようなシーンがある。

 1. コーヒーを飲みながら時計を見る 
  → Glassに今日の予定が表示される
 2. 続けて窓の外を見る 
  → Glassに天気予報と気温が表示される
 3. ハムエッグを食べながら、音声入力でメールを返信する
 4. 通勤途中、地下鉄が止まってしまった 
  → Glassにルート案内が表示される
 5. 見知らぬ土地で不自由なく目的地に向かって歩く傍ら、犬をなでる
 (続く)

まず、1, 2, 4から、実世界の行動や所作から予測し、ユーザーのインテンション(意図)を読んで、先回りして必要な情報を提示することを、Googleが目指していることがわかる。

次に、3, 5のシーンから、より重要なメッセージが窺い知れる。
3のシーンでは、メールを気にせずにハムエッグを食べることに集中できる。また、5のシーンでは、従来スマホの地図を見ながら歩く場合には、犬の存在に気づかないかもしれない。そこにGlassを持ち込むことで、利用者に新しい気付きを与えている。

この3, 5のシーンのコンセプトこそが、近年シリコンバレーでも注目されている「マインドフルネス」という考え方である。マインドフルネスとは一言でいえば、「雑事や雑念にとらわれず、目の前のことに集中できるようになることで、日常の何気ないことから高い満足を得られるようになること」である。
Glassはメールを気にせずに、ハムエッグのゆっくりと味わい、道に迷って焦ることなく、かわいい犬と触れ合うことを支援するデバイスである。

以上のように、Google Glassのコンセプトビデオからは、予測して必要な情報を提示することで、雑事を退け、本人の日常のマインドフルネスを向上させるといった、共有価値観が読み取ることができるわけである。

このようなコンセプトがわかれば、同社の他の実験中のサービスである、オートナビゲーションカーも、ユーザの運転という雑事を減らし、(運転が目的の人は別であろうが)、運転中のコミュニケーションや見える景色を存分に味わうための仕組みととらえることができるようになる。

さらに面白いことには、このGoogleの共有価値観は日本の禅に通ずる要素があるという著者の洞察である。すなわち、マインドフルネスは近年Googleを中心に流行となりつつあるが、日本の禅の思想がこれと類似した要素を多く持つ。

例えば、以下の曹洞宗関連ページから関連性を考えてみる。

禅の極意!!〜「不立文字」の世界〜
「禅生活とは作務(仕事)や食事や洗面などの日常生活の中の些事を、その些事を大事と悟らせること」と記されており、これは何気ない日常の重要性を改めて知ることに通ずることである。
また、「『甘い』ということを伝えるときに、いくら口で表現してもわからない。同じ砂糖の甘さでも白砂糖の甘さと黒砂糖の甘さは違うし、果物でもイチゴの甘さと柿の甘さは違います。この甘さを本当に知るには自分が味わってみる以外にはわかりようがない。(『言詮不及、意路不到』などという)」からも、日常の五感を通した実体験を重要視し、そのために座禅を行うことがわかる。

日本の禅の考え方はあくまでも、只管打坐、座禅といったメンタル面の強化を手段としてマインドフルネスの実現をはかるが、GoogleはGlassという技術を以て、同様の課題の解決に挑んでいるといえる。時代も場所も、何もかも異なる両者が、共有価値観という軸で比較されるとこのような類似性を持つことがわかる。

もはや、プラットフォームに限った話ではないと思うが、このようなサービスの背後にある重要な共有価値観を理解することの重要性や、共有価値観の普遍性について大変勉強になる一冊であった。

2015年5月5日火曜日

蛇の模様を作ってみた -チューリングが残した数式-

5月3日(日)所さんの目がテン!を見て興味深かったので投稿する。

今イミテーションゲームでも話題の、アラン・チューリングが生物の模様に関して以下のような説を提唱したようである。

「局所的ないくつかのルールのみによって、大域的な模様は決定づけられる。」
⇒チューリング・パターン(Wikipedia)

本説の検証実験のため、番組内では、枡アナらが約1万枚のオセロを用いて手作業による検証を試みていた。

しかし、20時間もの時間がかかる非効率的な作業に思われたので、今回プログラムを用いて出来上がった模様を公開する。

前提:正六角形を敷き詰めてつくられる盤上において、各マスは白か黒の2値をとる。

ルールは以下の2つである。
 1. 自分の周り(自分と接する6マス)に、自分と異なる色のマスが4つ以上存在する場合、自分は異なる色に変化する。
 2.自分の周りの周り(自分と接する6マスと、その6マスと接する12マス:計18マス)に、自分と異なる色のマスが1つも存在しない場合、自分は異なる色に変化する。

以下は実行例を示す。(盤面は100×500マス)

1. 初期値はランダムで与える。

2. ルールの適用(1回目)

3. ルールの適用(2回目)

4. ルールの適用(5回目)

5回目以降は、ほぼ同様の状態が繰り返し続く。
蛇の模様と言われれば、蛇の模様に見えないこともない。

今後、この他のルールを適用し、蛇以外の模様についても表現できれば良いと思う。

参考:六角形版ライフゲームを作ってみた
http://hunayasu.hatenablog.com/entry/2014/04/20/233508

※上記プログラムを参考に、色変化のルール部分、ロジック部分を修正した。


2015年4月26日日曜日

知っておきたいコーヒー豆知識 -コーヒー豆の質はいかにして決まるか?-

  • コーヒーの木の品種には、主にアラビカ種とロブスタ種があり、大抵のコーヒー屋さんで売っているコーヒー豆はアラビカ種である。
  • アラビカ種のほうが味は美味しい。一方ロブスタ種のほうが病害虫に強いため、低価格コーヒーの増量のためなどに使用される。
  • コーヒー豆の違いは基本的に栽培された産地による。標高、豆のサイズ、欠点豆の少なさが良質な豆を決める3つの指標である。
  • コーヒー豆を精製する方法は主に乾式と湿式の2種類あり、この精製方法によって大きく味が変わる。

 コーヒーは数十種類の品種があるが、飲用目的で栽培されているのは主に「アラビカ種」と「ロブスタ種」の2種類で、アラビカ種がコーヒー生産量の70〜80%を占めている。ロブスタ種が残りの20〜30%を占めているが、えぐみがあり、ストレートで飲むのには適していない。つまり普段お店でストレートで飲んでいるコーヒーや、売られているコーヒー豆は全てアラビカ種ということだ。
 ではロブスタ種はどのような目的で使用されているのか。アラビカ種よりも病害虫に強く、低地で育つため栽培しやすいというメリットがある。そのため低コストであり、缶コーヒーやインスタントコーヒーなどの増量剤として使われることが多い。またブレンドコーヒーに一定の割合で入れることで、味の引き立て役となる場合もあるようだ。そしてロブスタ種はコーヒー独特の苦みや渋みが強く出ることから、アイスコーヒーで苦みを出すためによく用いられる。

 それでは、同品種の中での違いはどこから生まれるのか。豆の違いは栽培された産地で決まると考えてよい。特に高地産のコーヒーほど良質なものになる。コーヒー豆には産地名がつけられ、標高はグレードを示す指標となっている。また、豆のサイズは大きいもののほうが良質であり、サイズもひとつの指標である。そして欠点豆と呼ばれる未成熟豆、発酵豆、虫食い豆、死豆などが少ないことも重要な指標である。これらはハンドピックと呼ばれる手作業で除去されるが、生産者によって精度が異なる。
 昔は出荷された港レベルでしか判別できなかったが、今では産地が明確にわかるようになったため高品質になってきている。

 最後に、育ったコーヒーを精製する、つまりコーヒーの実から豆を取り出す工程でも味は大きく変わる。水で綺麗に洗い流して取り出す方法は湿式と呼ばれ、雑味がなくクリーンな味わいとなる。一方、水を使わずに天日干しして実を乾かし、割って取り出す方法を乾式と言う。少し発酵したような独特の香りがあり、最近注目を浴びている。

まとめ:以下の3つ観点でコーヒー豆の質が決まる
①品種は何か?(アラビカ?ロブスタ?)
②産地はどこか?(栽培環境はどうか?)
③精製方法は何か?(乾式?湿式?)

参考:
 
http://www.amazon.co.jp/コーヒー-おいしさの方程式-田口-護/dp/4140332824