Posted by tricycle on 2009 年 5 月 6 日 – 12:08 AM
自然言語処理,統計的学習分野の教科書にはよく載っているPLSI.そんでもって最近この手の業界で大流行のLDA.どちらも文書集合の生成モデルを確率的に扱ったものであるが,僕はLDAに対して大きな勘違いをしていた.お話くらいしっておけばいいかということで,「はいはい,PLSIの精度良くしたやつでしょ?」的な感じで思っていたのだが,もう少し早くにちゃんと見ておくべきだった.
詳細は書かないが,僕の見逃してた重要なことは「LDAはモデル化するときに文書dが絡まない.よって文書数Nがパラメータとして入らない」ということ.こんな重要なことを見逃すなんて.よくよく論文を読んでみると,なるほど文書数Nが絡むのがイヤだから,ディリクレ分布を使うということ.なるほど.
と,ゴールデンウィーク中にちょっとだけLDA(そしてPLSI)を眺めてみたが,実際の解き方は変分ベイズやらGibbs Samplingとか使ったりするのは知っているが,全く持ってその辺の知識はないので機会があればいつか勉強してみても...確率モデルは面白いのだが,PLSIもLDAもlatent semanticとか言いながらも僕が思うにSemanticではない.統計量使っているだけでSemanticというのはやや言い過ぎだろうと.そういうこともあって最近はこれを思いっきり勉強する気にはなれない.数理的には面白いんだけど.
Posted by tricycle on 2009 年 4 月 20 日 – 10:13 PM

待ちに待った本がやっと出た.僕のプレゼンのお師匠でもある宮野公樹さんの書籍「学生・研究者のための 使える!PowerPointスライドデザイン 伝わるプレゼン1つの原理と3つの技術」が出版された.
この本,タイトル通りプレゼンの本なのだが,今まで見てきたプレゼンの本とは違って「本当に」実用的なプレゼン本である.ちまたには「PowerPointスライドの〜」とか「ロジカルプレゼンテーション〜」とか「プレゼン技術〜」とか色んな本が出回っている.しかしそれらは結局のところPowerPointの説明書的な本であったり,プレゼンテーションとは何たるかの精神論であったりこっちが期待しているものとは違ったりする.良い線言ってるのもあるんだけど,結局じゃあどうやってスライドをまとめたらいいのか,作ったらいいのかっていうのが分からない本も多い.
そんな本とは一線を画すのが本書.良いプレゼンをする心構えはもちろんのこと,良いスライドの作り方を「Before/After形式」で見せてくれるのが最高に分かりやすい.あー,こういうスライドをどうしたらいいのか分からん,って例が山盛りあって,それが「たった3つの原則に従って」修正されていく.本当に役立つ良書だと思う.
この本は研究者をターゲットと謳っているが,全然そんなことはなく社会人にも実用的な本だと思う.宮野さんって研究者なのにこんな技術も持っていてすごいなとつくづく思う.いや,宮野さんのように研究者はもっと伝える技術が磨かねばならない,そう思った.
学生・研究者のための 使える!PowerPointスライドデザイン 伝わるプレゼン1つの原理と3つの技術
著者:宮野公樹
amazonで見てみる
Posted by tricycle on 2009 年 4 月 17 日 – 12:28 AM
最近なんか論文ばかり書いてる気がする.論文を書くのは結構時間が取られるので,その間は全く研究が進まない.研究を進めるには論文を書かないのが一番だ.
しかしながら博士課程の学生には論文は学位を取るためには必要だし,学位を取った後も俗世間に認めてもらうためには論文の数は必要なのである.
論文マシンガン作成は僕にとっては空しい作業なので,今年は今書いてる論文が書き終わったらきちんと論文を書く時期と研究する時期を分けようと思う.
情報系は春先に結構国際会議への投稿論文が多い.よって4月から10月くらいまでは研究,11月から3月までは貯めてきた研究を論文化しようという作戦にしようかと思う.
Posted by tricycle on 2009 年 2 月 27 日 – 11:41 PM
最近僕の精神状態はあまりよくない.研究室のこと,研究室以外のこと—僕は何だか理想を追い求めすぎている気がする.世の中の人は結局のところ利己的だから,ある理想に対して多くの人が口では賛成していたとしても,それが自分にとって都合が悪ければ口だけで終わってしまうのが現実というものだ.それを頭では分かっているつもりでも,そういう理想が目の前でずたずたと切り裂かれていくと,さすがに持たない.
そういうえば今日Berkeleyでの共同研究の件もようやく片付いた.僕のしたことは論文という形にならなかったため,僕の考えたアルゴリズムは他人に引き継がれることになりそうだ.これもまた様々な要因でごちゃごちゃになって結局「Berkeleyで僕は何もやらなかった」という結末で締めくくられそうだ.Berkeleyに行って研究したことは大変有意義であったが,僕が他人に対して甘かったがために受けなくてもよい不当な評価を得てしまった,本来受けるべき評価を受けられなかったような気がしてなんだかむなしさを感じる.
Posted by tricycle on 2009 年 2 月 12 日 – 2:03 AM
まだまだ知らないことがたくさんありすぎる.宗教を信じるかというのは,僕が研究で考えてるように信憑性が成立する条件がうんたらというかそんな小難しい話なんか吹っ飛んでしまう話と感じてしまった.
炎が上がってみなさんが合掌し出したときに信者でも何でも無い僕がいつの間にか合掌をしてしまっていたというのは,僕が今やっている研究では話が全く付かない.
まだまだ考えることが多すぎる.情報学という世界に閉じこもりがちな僕には信憑性という問題を考えるには今日という日はとても有益だった.