; oi: 1月 2016

2016年1月24日日曜日

今更聞けないリプレゼンター定理の解説


定義

リプレゼンター定理(Representer theorem)とは、
「損失関数が$\boldsymbol{\omega}^{ \mathrm{ T } }\boldsymbol{\phi}(\boldsymbol{x}_i)$(パラメータ$\boldsymbol{\omega}$と特徴ベクトルの積)の関数として表現できるとする。この損失関数に正則化項を加えて最適化する問題において、その正則化項が$\lambda\boldsymbol{\omega}^{ \mathrm{ T } }\boldsymbol{\omega}$という形をしていれば、その最適解$\hat{\boldsymbol{\omega}}$は$\boldsymbol{\phi}(\boldsymbol{x}_i)$で張られる空間に存在する」
というものである。

この定義だけでは理解し難いので、具体例を記しておく。

例えば、以下の(1)のような二乗誤差関数の最小化問題を考えた場合に、重みの最適解$\hat{\boldsymbol{\omega}}$は(2)の形で表せることを意味する。
$$
\begin{eqnarray}
\hat{\boldsymbol{\omega}} &=& arg\min_\boldsymbol{\omega}\displaystyle \sum_{i} (y_i - \boldsymbol{\omega}^{ \mathrm{ T } }\boldsymbol{\phi}(\boldsymbol{x}_i))^2+\lambda\boldsymbol{\omega}^{ \mathrm{ T } }\boldsymbol{\omega}\\

\hat{\boldsymbol{\omega}} &=& \sum_{i}\alpha_i\boldsymbol{\phi}(\boldsymbol{x}_i)
\end{eqnarray}
$$

証明

では、なぜ重みの最適解は(2)の形で表現できるのであろうか。
最適解が$\boldsymbol{\phi}(\boldsymbol{x}_i)$で張られる空間に存在しない場合、つまり重み$\boldsymbol{\omega}$が、以下の(3)(4)の形で表現できた場合を考える。
$$
\begin{eqnarray}
\boldsymbol{\omega} &=& \boldsymbol{\omega_0}+\boldsymbol{\xi}\\
\boldsymbol{\omega_0} &=& \sum_{i}\alpha_i\boldsymbol{\phi}(\boldsymbol{x}_i)
\end{eqnarray}
$$
ただし、$\boldsymbol{\xi}$はすべての$\boldsymbol{\phi}(\boldsymbol{x}_i)$に直交する。

この時、最適化問題は以下の(5)式のようになる。
損失関数の部分については、$\boldsymbol{\xi}$が$\boldsymbol{\phi}(\boldsymbol{x}_i)$に直交するため、影響を与えない。対して、正則化項の部分は$\|\boldsymbol{\xi}\|^2 \geq 0$が残る。よって、(5)式は(6)式と同値である。
$$
\small{
\begin{eqnarray}
\displaystyle \sum_{i} (y_i -  (\boldsymbol{\omega_0}+\boldsymbol{\xi})^{ \mathrm{ T } }\boldsymbol{\phi}(\boldsymbol{x}_i))^2+\lambda(\boldsymbol{\omega_0}+\boldsymbol{\xi})^{ \mathrm{ T } }(\boldsymbol{\omega_0}+\boldsymbol{\xi})\\
\Leftrightarrow\displaystyle \sum_{i} (y_i -  \boldsymbol{\omega_0}^{ \mathrm{ T } }\boldsymbol{\phi}(\boldsymbol{x}_i))^2+\lambda(\|\boldsymbol{\omega_0}\|^2+\|\boldsymbol{\xi}\|^2)
\end{eqnarray}
}
$$
さて、最小化を考えた場合、正則化項の$\|\boldsymbol{\xi}\|^2$の増加分を最小にするためには、$\boldsymbol{\xi}$が$\boldsymbol{0}$となる。よって、重みの最適解$\hat{\boldsymbol{\omega}}$は以下の式(7),式(8)で表され、式(2)で表せることが証明できた。

$$
\begin{eqnarray}
\hat{\boldsymbol{\omega}} &=& \boldsymbol{\omega_0}\\
&=& \sum_{i}\alpha_i\boldsymbol{\phi}(\boldsymbol{x}_i)
\end{eqnarray}
$$

何が嬉しいか

最適解が式(2)で表現できて何が嬉しいのだろうか。
$\boldsymbol{\alpha}$の次元はサンプリングされたデータ数$N$と一致する。
また、$\boldsymbol{\omega}$は特徴ベクトルの次元数$d$と一致する。

非線形な分類を可能にするため、データ$x_i$は多くの場合、高次元の特徴ベクトル空間$\boldsymbol{\phi}(\boldsymbol{x}_i)$に写像される(無限次元の特徴ベクトル空間への写像の場合もある)。

最適化を考えた場合、変数は小さい方が簡単である。
$\boldsymbol{\omega}$を直接最適化することももちろん理論的には可能であるが、超高次元な特徴ベクトル空間の場合には、そのパラメータの最適化は現実的ではない。そこで、リプレゼンター定理を用いて、データ数の数だけの変数を持つパラメータ$\boldsymbol{\alpha}$を最適化することで、計算量を削減すること(現実的に解くこと)が可能となる。

使い方

以上のことを踏まえて、ケースに最適化するパラメータを変化させると良いだろう。

$d \gg N$の場合:サンプリングデータの線形結合係数 $\alpha$(次元数$d$)(リプレゼンター定理の利用)
$d \ll N$の場合:元々の重み係数$\omega$(次元数$N$)

以上

2016年1月17日日曜日

話題の資格PRINCE2の受験を通して想ったこと


PRINCE2ファンデーション試験について

PRINCE2® Foundation を受験した結果をまとめる。

試験概要

試験名:
PRINCE2® Foundation Certificate in Project Management

試験時間: 60 分
問題数:  75 (採点対象外のトライアルの質問5つを含む)
合格に必要な正答率: 50% (70問中35問正解)
持込(テキストや電子機器など): 不可
試験の内容:7つのテーマの観点、7つのプロセスの観点からそれぞれ5題程度出題され、合計70問程度となる。

勉強量


  • 3日間の講習
  • 模擬試験1h程度の学習

試験結果


  • 62/70 (89%)

試験における注意事項

試験の翻訳揺れ、誤字、誤訳が多いので、原文を推定して、正しそうな回答を選ぶ必要がある。
  ex1.ワークブックとの翻訳ズレ: マネジメント/管理, リスク選好度/リスク許容限度, etc..
  ex2.翻訳ミス:スタータス(ステータスの間違い)

試験対策

PRINCE2® Foundation の範囲でいえば、以下を押さえておけば問題ないであろう。

  • テーマという分類
  • プロセスの目的
  • プロセスの主要な活動とアウトプット
  • どの役割がどの活動を行うか

PRINCE2について

以下、3日間の講習と試験を通してPRINCE2について、学んだこと想ったことをまとめる。

PRINCE2(参考:PRINCE2 Wikipedia)とは 

英国にて開発されたプロジェクトマネジメント方法論である。イギリスでのプロジェクトマネジメントのデファクトスタンダードとなっており、徐々にイギリス以外の国々でも利用が広がっている。

PRINCE2の歴史

1989年、イギリス政府の情報システムのプロジェクトマネジメントの標準として中央電子計算機局 (CCTA) が PRINCE を開発した。
1996年、より汎用的なプロジェクトマネジメント手法として PRINCE2 が発表された。

(参考:PMBOK Wikipediaより) 
1987年、米国PM学会によって、PMBOKガイドはホワイトペーパーとして出版された。
1996年、初版が出版。
2000年、第2版が出版。
2004年、大幅な変更を加えた第3版が出版。
2008年、第4版の英語版が出版。
2013年、最新の第5版(英語版)が出版。

PRINCE2の内容(概要)

大変ざっくりいうと、以下のNつの〜という切り口でPRINCE2は整理されている。詳細には触れないが、おおよそどのような観点からプロジェクトマネジメント方法論が記述されているかがわかる。

Fig. PRINCE2の構造 (Wikipediaより)

4つの要素


  1. 原則
  2. テーマ
  3. プロセス
  4. テーラリング

7つの原則


  1. ビジネスの継続の正当性★
  2. 経験からの学習
  3. 定義された役割および責任
  4. 段階によるマネジメント◆
  5. 例外によるマネジメント◆
  6. 成果物重視
  7. プロジェクト環境に合わせたテーラリング

7つのテーマ


  1. ビジネスケース★
  2. 組織
  3. 品質
  4. 計画
  5. リスク
  6. 変更
  7. 進捗

7つのプロセス


  1. プロジェクトの始動
  2. プロジェクトの立ち上げ
  3. プロジェクトの指揮
  4. 段階のコントロール◆
  5. 段階境界のマネジメント◆
  6. 成果物提供のマネジメント
  7. プロジェクトのクローズ

6つのプロジェクト・パフォーマンス


  1. コスト
  2. 時間
  3. 品質
  4. スコープ
  5. リスク
  6. ベネフィット★

PRINCE2の特徴

上のPRINCE2の内容について特に特徴的な部分に印(★、◆)をつけた。

事業、ビジネスに主眼を置いたコンセプトが多い(★)

PRINCE2においては、ビジネス・ケースという、プロジェクトの存在意義を記したドキュメントを、適宜振り返りることで、継続的にプロジェクトの正当性を確認する。これは単に「プロジェクトとして、あるスコープのものを決まったコスト、納期で開発する」だけに留まらず、「成果物を用いて現業で価値を出す」に強くフォーカスしている。現業のビジネスにおける嬉しさをベネフィットとし、費用対効果があるかを常に確認し続けることが、ビジネス継続性の正当性の原則であり、特徴的な点といえる。

マネジメントがトップダウンの権限委譲によってなされる(◆)

プロジェクトをマネジメントする単位を段階として定義し、段階毎に権限を与えマネジメントを実施する。また、委譲された権限の範囲において、何かしらの指標が許容できる度合いを超えてしまい、マネジメント/実行が困難と判断すれば、例外という形で上に解決を仰ぐ。極めてトップダウンなマネジメントの手法を推奨している。

PRINCE2の理解にあたって

 テーマという観点

各テーマの内容はふわっとしており、テーマ間をオーバーラップするような内容も含む。なぜこのテーマで十分と言えるのかが今ひとつ納得できない。また、各テーマの様々な活動はプロセス横断的に存在するため、プロセスと整合性をとりながら、理解するのが難しく感じる。
 故に、テーマという観点に軸足を置いて、学習を進めるよりは、各テーマの概要、コンセプトだけを先に理解した上で、プロセスの観点でPRINCE2が提唱する様々な活動を理解するほうが効率が良いと考える。ふわっとしたテーマという軸による整理より、時系列や順序関係という軸による整理のほうがブレは少ないと想うのである。

 翻訳の問題

教材の日本語化が十分に進んでおらず、翻訳ミスや翻訳された日本語の揺れも多く、理解を妨げる。英語が読める人であれば、日本語のテキストと英語の原文と照らし合わせながら、不明点の解決に努めた方が効率的である。

参考情報:2016年4月には、PRINCE2のオフィシャルマニュアル(以下はプロマネ向け)が日本語化され、書店に並ぶとのこと。



まとめ:PMBOKを中心に据えて、様々な方法論を集約してはどうか?

今回、PRINCE2を学習し、PMBOKというプロジェクトマネジメント知識体系との違いを踏まえた上で、PMBOKを中心に各種知識を集約させるとプロジェクトマネジメント系の知識が体系的に理解し易いのではないかと考える。
なぜなら、知識の体系化のレベルでいえば、PMBOKが大変にわかり易いからである。PRINCE2に含まれる、事業や投資判断という観点、ビジネスケースの振り返りによる継続的なプロジェクト正当性の確認といった観点は弱いものの、プロジェクトマネージャーが考えておくべき主要な要素は知識エリアとプロセス群という形で整理され、整合性も精緻にとれている上、ツールと技法にまで言及されており、実用性も高い。
PRINCE2のビジネス・事業・投資判断に近い考え方をPMBOKにも取り込み、プロジェクト正当性といった、新しい知識エリアを用意すればPRINCE2は不要ではないかと考える。

その他、ITIL(参考:ITIL Wikipedia)のようなITサービスマネジメントのベストプラクティス(PRINCE2同様イギリス中央電子計算機局 (CCTA)にてまとめられたもの)もPRINCE2やPMBOKと一緒に語られることが多いので、触れておく。ITILはあくまでベストプラクティスであり、知識としては大変有益なものが多く含まれているが、全体としての整合性が弱く、論理的体系的に精緻にまとめられているとは言い難い。そのため、読者の経験の違いによっては、解釈・理解がズレる内容も多いように見受けられる。PRINCE2同様、このような体系化が不十分だが有益な知識をPMBOKに落とし込んでいく、あるいは関連づけていくことが重要だと考える。

2016年1月10日日曜日

韻を踏むべきなのか?〜「声に出して読みたい韻」を読んで〜




概要

様々なヒット曲を例に挙げて、韻とは何か?どのような韻が良い韻なのか?どのように韻を踏むのか?を著者自身の豊富な経験に基づいて読みやすくまとめた一冊であった。韻について知らない人から、韻の勉強をこれから始めたい方に最適の一冊だと思う。

読んでみて、学んだことと想ったことをいくつか述べる。

韻の善し悪し

本書はまず初めに以下のような良質な韻の特徴を挙げていた。
 ・共通の母音の文字数が大きい
 ・同じ母音の文字列の回数が多い
 (イメージとしては、ゲーム「ぷよぷよ」を想像すると良いように想う。一度に消す数が多い、連鎖が多いとスコアが増加するので。)
 また、さらに以下ができると良い韻といえるようである。
 ・韻を踏む品詞や言語が異なる
 ・汎用性のない言葉で韻を踏む
 
 これらをまとめてみると、
 筆者の考える良質な韻とは、以下の性質を持つものといえるかもしれない。
 ・誰にでも作れる訳ではないという、困難性
 ・今まで作られておらずオリジナリティを含むという、新規性

言語による韻の踏みやすさの違い

日本語と英語の韻の踏みやすさに言及していたことが、大変興味深かった。
 
 日本語の文は末尾が動詞+助動詞などで終わる場合がほとんどである。
 一方で、英語においては、文末に、動詞だけでなく、目的語となる名詞や副詞など、文型や修飾の仕方に応じて様々な単語が存在しうる。
 それ故、文末で韻を踏む際のバリエーションが英語の方が多く、多様な韻が踏みやすい。

 また、日本語は母音の一致率が低く感じてしまいやすいという問題も存在する。
 これは単語ベースで母音の一致する割合を考えた場合、
 英語は1単語に含まれる母音数が比較的少ないため、母音が一致していると、単語全体が一致していることが多い。
 例えば、英語の「me(いー)」と「she(いー)」は母音で考えた場合、これら二つの単語は100%一致しているということができるのに対して、日本語の「わたし(ああい)」「きみ(いい)」は、各々33%と50%が一致しているだけで、あまり美しさを感じない。
 このように、日本語は単語が含む母音数が比較的多いため、母音全てを合致させることは難しく、単語ベースで考えた際に比較的に一致していないような印象を受けやすい。
 
 このように言語特性によって、韻の踏みやすさは異なる。
 
 日本語が比較的韻を踏みにくいことは、必ずしも悪い訳ではなく、制約が強い分、様々な工夫を重ね、色々な技術が生まれたようである。体言止めを基に、文末の言葉のバリエーションを出したり、言語を股がって韻を踏むことでオリジナリティを出したり、創造は尽きない。
 
 今後、様々な言語で詩に潜む韻に着目してみる価値はある。

韻を踏むべきなのか?

「学校へ行こう」の歴史暗記ラップにて一世を風靡したCo.慶応と筆者の対談(「韻タビュー」)が最後に記されている。

ここにきてやっと、Co.慶応の口から韻を踏むことの意味について言及されている。
実は、本書は韻とは何か?どのように韻を踏むか?などの問いには、丁寧に大変わかりやすく答えられているのだが、そもそもなぜ韻を踏む必要があるのか?についての言及がほとんどない。むしろ、筆者は韻が世の中の役に立つなんて、思っていなかったと記されている。

本巻末対談にて、Co.慶応は端的に「強く印象づける」ためのツールとして、「韻を踏む」ことに注力したと話している。実際、歴史などの暗記モノは語呂合わせなどの想起しやすい方法で覚えていくことが常套手段であり、韻を踏むことによって同じ母音の並びで特徴を覚えられれば、定着率が高くなるということは頷ける。

ここで議論になると思われるのは、「強く印象づける」ためのツールとして、韻を踏むことを捉えた場合、韻を踏むために日本語の語順を多少崩して、韻を踏むために不自然な用語を選択し、韻を踏むために・・・というように韻を踏むことに注力するあまり、日本語として理解しにくくなってしまったり、曲との調和が崩れてしまったりしては、逆に印象づかなくなってしまうことが考えられる。

個人的には、上記の調和を崩さない範囲で、韻を踏むことが出来る良い言葉が選択できた場合のみ、比較的わかりやすく韻を踏むことが、最も効果的なのではないかと考える。カタイ韻を踏むことを目的にして、理解しにくい詩にすることは逆効果の方が大きいように考える。

韻を踏むべきなのか?(再考)

しかしながら、詩の至る所で韻が踏まれているというのは、理解できた場合に、大変に気持ちよく、美しさすら感じてしまうことは事実である。個人的な感覚としては、完全数(その数自身を除く約数の和が自身となる数。例. 28=1+2+4+7+14)に近く、全く無駄がない印象を受ける。
この感覚はアートに近いと考えられ、アートの中でも秩序を持った建造物のようなアートだと考える。母音という制約条件を満たしつつ、全体として、幾重にも重なった厚みのある意味を想起させる。

ということで、韻を踏むべきかどうか、どの程度韻を踏むべきか、は目的によって全く異なるが、「韻を踏む」というテクニックは大変に有用であると考えられる。また、様々なアーティストが「韻を踏む」というテクニックを用いることがあるというのを知ることで、アーティストの表現したい「想い」を理解し易くなることは間違いないだろう。

このエントリーをはてなブックマークに追加