<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Yusuke Yamamoto&#039;s Web site &#187; 研究</title>
	<atom:link href="http://hontolab.org/blog/research/feed/" rel="self" type="application/rss+xml" />
	<link>http://hontolab.org</link>
	<description>情報学研究者やまもとのウェブサイト</description>
	<lastBuildDate>Fri, 25 Jun 2010 16:23:53 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.6</generator>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>数学記号の表記法に混乱する</title>
		<link>http://hontolab.org/research/%e6%95%b0%e5%ad%a6%e8%a8%98%e5%8f%b7%e3%81%ae%e8%a1%a8%e8%a8%98%e6%b3%95%e3%81%ab%e6%b7%b7%e4%b9%b1%e3%81%99%e3%82%8b/</link>
		<comments>http://hontolab.org/research/%e6%95%b0%e5%ad%a6%e8%a8%98%e5%8f%b7%e3%81%ae%e8%a1%a8%e8%a8%98%e6%b3%95%e3%81%ab%e6%b7%b7%e4%b9%b1%e3%81%99%e3%82%8b/#comments</comments>
		<pubDate>Fri, 25 Jun 2010 16:23:53 +0000</pubDate>
		<dc:creator>tricycle</dc:creator>
				<category><![CDATA[研究]]></category>
		<category><![CDATA[数学記号]]></category>

		<guid isPermaLink="false">http://hontolab.org/?p=661</guid>
		<description><![CDATA[
論文や発表資料を作成しているときに数学記号の表記方法に迷うことが時々ある．数学記号の使い方に関する授業なんて無かった気がする．個人的にもちゃんと学ぼうとしてこなかったので今更ながらちょっと調べてみた．以下個人的なまと [...]]]></description>
			<content:encoded><![CDATA[
<p>論文や発表資料を作成しているときに数学記号の表記方法に迷うことが時々ある．数学記号の使い方に関する授業なんて無かった気がする．個人的にもちゃんと学ぼうとしてこなかったので今更ながらちょっと調べてみた．以下個人的なまとめ．</p>
<p>&nbsp;</p>
<p><a href="http://hontolab.org/researchtips/how-to-use-mathmatic-symbol/">数学記号の使い方</a></p>
<p>&nbsp;</p>
<p>「集合は大文字で斜体 or 直立体？」「関数は斜体 or 直立体？」なんかがはっきり分かって良かった（僕の理解は間違っていなかった！）．微分のdは斜体ではなく直立体で表記するのは知らなかった．</p>

<a href="http://twitter.com/?status=RT+%40tricycle%3A+%E6%95%B0%E5%AD%A6%E8%A8%98%E5%8F%B7%E3%81%AE%E8%A1%A8%E8%A8%98%E6%B3%95%E3%81%AB%E6%B7%B7%E4%B9%B1%E3%81%99%E3%82%8B+-+Yusuke+Yamamoto%26%23039%3Bs+Web+site+http%3A%2F%2Ftinyurl.com%2F2cjppk5&amp;in_reply_to_status_id=17026560456" class="tweet-this" ><img src="http://hontolab.org/wp/wp-content/plugins/simple-tweet/img/tweet.gif" title="ツイート" alt="ツイート" />この記事をtweetする</a>]]></content:encoded>
			<wfw:commentRss>http://hontolab.org/research/%e6%95%b0%e5%ad%a6%e8%a8%98%e5%8f%b7%e3%81%ae%e8%a1%a8%e8%a8%98%e6%b3%95%e3%81%ab%e6%b7%b7%e4%b9%b1%e3%81%99%e3%82%8b/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WWW2010メモ: Social Network 4 session</title>
		<link>http://hontolab.org/research/www2010-social-network-4-session/</link>
		<comments>http://hontolab.org/research/www2010-social-network-4-session/#comments</comments>
		<pubDate>Sat, 15 May 2010 14:24:00 +0000</pubDate>
		<dc:creator>tricycle</dc:creator>
				<category><![CDATA[研究]]></category>
		<category><![CDATA[social network]]></category>
		<category><![CDATA[WWW2010]]></category>

		<guid isPermaLink="false">http://hontolab.org/?p=576</guid>
		<description><![CDATA[
WWW2010，Social Network 4セッション．メモを書いて下書きのままにしてあったからせっかくなのでUP．Social network系は情報検索屋，データマイニング屋だけじゃなくて社会学屋さんも参戦し [...]]]></description>
			<content:encoded><![CDATA[
<p>WWW2010，Social Network 4セッション．メモを書いて下書きのままにしてあったからせっかくなのでUP．Social network系は情報検索屋，データマイニング屋だけじゃなくて社会学屋さんも参戦していたみたい．そういうのは近年より&#8221;村&#8221;化しているWWWとしては多様性が出て良いことではなかろうか．</p>
<p>&nbsp;</p>
<p><strong><span style="color: #3366ff;">&#8220;What is Twitter, a Social Network or a News Media?&#8221;<br /></span></strong>Haewoon Kwak, Changhyun Lee, Hosung Park, Sue Moon</p>
<p>概要</p>
<ul>
	<li>ありとあらゆるtwitterの統計分析をやってみたという話．調査論文としては引用できそう．</li>
</ul>
<p>背景と目的</p>
<ul>
	<li>twitterの利用方法(1): 友達同士のコミュニケーションのために使う</li>
	<li>twitterの利用方法(2):RSS的な一方向の情報収集</li>
	<li>一体どっちの使われ方をしているのかを調査してみよう</li>
</ul>
<p>データコレクション</p>
<ul>
	<li>41.7Mユーザ</li>
	<li> 106Mつぶやき（スパムは除去）</li>
	<li>四ヶ月間のつぶやき</li>
</ul>
<p>以下は統計情報に関するメモの一部</p>
<p>Followする理由:</p>
<ul>
	<li>友達関係の構築 or 情報の収集のどちらかと考えられる</li>
	<li>調べてみると，，，22%のユーザがお互いをフォローし合っている
<ul>
	<li>この値は他のソーシャルネットワークよりもあ圧倒的に低い(flick 68%)</li>
</ul>
</li>
</ul>
<p>つぶやきの内容</p>
<ul>
	<li>大半のtweetがニュース（80%）</li>
	<li>しかもトピックの大半がニュースのヘッドライン（54.3%）</li>
</ul>
<p>自分の発言がretweetされるとき平均何パスくらいまで波及するか？</p>
<ul>
	<li>96%のretweetが1パスしか波及しない（一回止まり）</li>
	<li>55%のretweetが一時間以内になされる</li>
</ul>
<p>感想</p>
<ul>
	<li>データセットの集め方が「ホットトピックを語を使って検索した結果を収集」という形を取っているので，そりゃデータに偏りが出るでしょ．</li>
	<li>馴れ合い目的でtwitterをやっている人が少ないという結果が出ているけど日本ではどうなのかな？</li>
	<li>情報収集ならRSSで留めておいた方が良くないのかなぁ．Twitterを情報活用として利用するとあまりにも情報量が多すぎて…</li>
</ul>
<p>&nbsp;</p>
<p><strong><span style="color: #3366ff;">&#8220;Earthquake Shakes Twitter Users: Real-time Event Detection by Social Sensors&#8221;<br /></span></strong>Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo</p>
<p>松尾先生の研究室の学生さんの発表．<br />twitterの一番大きな特性は&#8221;超リアルタイム性&#8221; ．リアルタイムなイベント抽出（時空間分析）をしようという研究．</p>
<p>分析</p>
<ol>
	<li>注目しているイベントに関連するキーワードに関するつぶやきをクロール</li>
	<li>収集したつぶやきをpositive/negativeに分類（個々でいうPositiveというのはイベントとの関連性があるか否かを指しているんだと思われる）
<ol>
	<li>SVMで学習．</li>
	<li>素性：単語数，キーワードが出現する位置，…</li>
</ol>
</li>
	<li>Positiveなつぶやきのみトラッキング</li>
	<li>つぶやきの時系列解析: 通常のつぶやき発生確率モデル（これは日々の観測から推定しておく）からつぶやきの傾向が外れたときイベントが発生として認識</li>
	<li>空間分析: フォローできなかった．</li>
</ol>
<p>評価に関して</p>
<ul>
	<li>Positive/Negative分類: 短いつぶやきだとイベントにPositiveなものが多い．へぇー</li>
	<li>松尾先生のところの研究はこれでもかというくらいに実験をするので圧倒される．これは論文を書くテクニックとして見習いたい．</li>
	<li>発表にネタが仕込まれすぎていて発表に気合いを感じた</li>
	<li>地震みたいなイベントを実用的なレベルで抽出しようと思うけどすごい細かい頻度でクロールしないといけないんじゃないのかね？</li>
	<li>質疑にもあったけど地震が発生したと勘違いしてつぶやいた場合やばいよね．</li>
</ul>
<p>&nbsp;</p>
<p>&nbsp;</p>

<a href="http://twitter.com/?status=RT+%40tricycle%3A+WWW2010%E3%83%A1%E3%83%A2%3A+Social+Network+4+session+-+Yusuke+Yamamoto%26%23039%3Bs+Web+site+http%3A%2F%2Ftinyurl.com%2F29kna35" class="tweet-this" ><img src="http://hontolab.org/wp/wp-content/plugins/simple-tweet/img/tweet.gif" title="ツイート" alt="ツイート" />この記事をtweetする</a>]]></content:encoded>
			<wfw:commentRss>http://hontolab.org/research/www2010-social-network-4-session/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WWW2010メモ: Query Analysis 1 session</title>
		<link>http://hontolab.org/research/www2010-query-analysis-1-session/</link>
		<comments>http://hontolab.org/research/www2010-query-analysis-1-session/#comments</comments>
		<pubDate>Thu, 06 May 2010 10:46:27 +0000</pubDate>
		<dc:creator>tricycle</dc:creator>
				<category><![CDATA[研究]]></category>
		<category><![CDATA[query analysis]]></category>
		<category><![CDATA[WWW2010]]></category>

		<guid isPermaLink="false">http://hontolab.org/?p=570</guid>
		<description><![CDATA[
WWW2010，Query Analysisセッションのメモ．発表者全員がMicrosoft Resarch関係者だったのが印象的だった．
&#160;
&#8220;Exploring Web Scale La [...]]]></description>
			<content:encoded><![CDATA[
<p>WWW2010，Query Analysisセッションのメモ．発表者全員がMicrosoft Resarch関係者だったのが印象的だった．</p>
<p>&nbsp;</p>
<p><strong><span style="color: #3366ff;">&#8220;Exploring Web Scale Language Models for Search Query Processing&#8221;<br /></span></strong>Jian Huang, Jiangbo Miao, Xiaolong Li, Jianfeng Gao, Kuansan Wang</p>
<p>目的:</p>
<ul>
	<li>WebドキュメントとクエリログをコーパスとしたN-gramモデルの分析とそのクエリ処理への応用</li>
	<li>結果はMicrosoft Web N-gram コーパスとして配布？</li>
</ul>
<p>背景:</p>
<ul>
	<li>普通のドキュメントのlanguage modelとクエリのlanguage modelは当たり前だけど異なる</li>
	<li>例えばWebコーパスから作った言語モデルをクエリの言語処理に用いるのは不適当</li>
	<li>2種類のWebコーパスについて言語モデル（ngram）の性質の違いを分析
<ul>
	<li>Title, anchor text, body</li>
	<li>クエリログ</li>
</ul>
</li>
</ul>
<p>二つのN-gram言語モデルの違いを分析．<br />評価尺度：Cross entropyとperplexity (二つともエントロピーのようなモノ) ．</p>
<ul>
	<li>（聞き逃したが）クエリログの</li>
</ul>
<p>言語モデルのクエリスペル修正への応用</p>
<ul>
	<li>2-gramよりも3-gram, 4-gramの方を使った方が断然性能は良い．しかし</li>
	<li>Queryログから作成された言語モデル &gt; Anchor &gt; &#8230;</li>
</ul>
<p>クエリ構造分析 (query bracketing)</p>
<ul>
	<li>3語のクエリ: [Sore gum] treatment, sore [gum treatment]を見分けたい</li>
	<li>これを行うために言語モデル(bi-gram)と単語間の共起関係(PMI)，カイ二乗検定を駆使する手法を提案</li>
	<li>評価:
<ul>
	<li>ベースラインとして左2語をペアリング: 60%程度</li>
	<li>明らかにクエリ構造があるクエリに関しては，PMIを使っただけでも90%でquery bracketingに成功（bi-gram, カイ二乗検定でも80%程度は出ている）</li>
	<li>しかもコーパスはクエリログよりもWebドキュメント情報を使った方が精度が出る</li>
</ul>
</li>
</ul>
<p>長いクエリの分断（Long query segmentation）</p>
<ul>
	<li>4語以上の単語: 20%</li>
	<li>クエリの意図をちゃんと見極めるためにも長いクエリの分割が必要</li>
	<li>例: raleigh serengeti mountain bike candidate tire
<ul>
	<li>[raleigh serengeti] [mountain bike] [candidate tire] etc..</li>
</ul>
</li>
	<li>分割手法: Segment-based PMIを計算し値が最大になるようにクエリを分解していく．
<ul>
	<li>例: A B C D E F → [A B C D] [E F] → [A B ] [C D] [E F] →…</li>
</ul>
</li>
</ul>
<p>感想</p>
<ul>
	<li>クエリをコーパスにした言語モデルと純粋にドキュメントをコーパスにした言語モデルの違いを調べるのは良いことだと思ったが，クエリ処理（スペルコレクション等）を行うのに実はドキュメントから生成した言語モデルの方が有効に働くというのは意外だった（直感的には．．．）．</li>
	<li>Query bracketingもquery segmentationも実は「ユーザが入力したクエリの順序は正しい」という仮定を置いていたみたいだけどそうなのかな？</li>
</ul>
<p>&nbsp;</p>
<p><strong><span style="color: #3366ff;">&#8220;Optimal Rare Query Suggestion With Implicit User Feedback&#8221;<br /></span></strong>Yang Song, Li-wei He</p>
<p>背景と手法</p>
<ul>
	<li>クエリ推薦に良く使用される手法としては（クエリ, ClickURL）から作成したクエリグラフにrandom walkモデル解析を適用することだが，これは頻度が高いクエリにしか通用しない．</li>
	<li>そこでクリックされなかったURL情報も使ったクエリ推薦手法を構築するのが目的</li>
</ul>
<p>手法の詳細</p>
<ul>
	<li>疑似フィードバックを組み込む
<ul>
	<li>仮説: SkippedURLはClickURLよりは適合性が低い</li>
</ul>
</li>
	<li>(query, ClickedURL) の二部グラフ，(query, SkippedURL)の二部グラフを別々に作成してRandom Walk解析
<ul>
	<li>Random walk解析（僕の予想）: (1) ipodを含むクエリ (ipod nano, ipod mini, ipod touchなど)をクエリログから収集．(2) 収集されたクエリとURLのペアからなる二部グラフ作成．(3)二部グラフとはいうもののグラフと見なしてPageRank的にRandomWalkしたときに最も滞在確率が高いノードを探す（dampling factorの項をクエリ拡張対象語以外の値を0とする）</li>
</ul>
</li>
	<li>その後二つの結果を結合して，あるクエリに関して最適なクエリ語を推薦
<ul>
	<li>結局の所，ClikedURLとクエリの二部グラフの分析結果とSkippedURLのそれとの分析結果をマージするということ</li>
</ul>
</li>
</ul>
<p>感想</p>
<ul>
	<li>Rare queryへのクエリ推薦とかいってたので面白いかなぁと思っていたら，ふたを開けてみるとクエリ推薦の精度改善のために既存手法を拡張したという話だった．</li>
	<li>実はSkippedURLとかあんまり必要ないのでは？そもそもレアクエリに対して本当に精度が上がっているのかが謎．</li>
	<li>クエリ推薦のための解析手法であるrandom walk modelが分かっていることが前提でプレゼンされたので訳が分からなかった（あとで論文を読んだら分かった）．</li>
</ul>

<a href="http://twitter.com/?status=RT+%40tricycle%3A+WWW2010%E3%83%A1%E3%83%A2%3A+Query+Analysis+1+session+-+Yusuke+Yamamoto%26%23039%3Bs+Web+site+http%3A%2F%2Ftinyurl.com%2F2c6nytv" class="tweet-this" ><img src="http://hontolab.org/wp/wp-content/plugins/simple-tweet/img/tweet.gif" title="ツイート" alt="ツイート" />この記事をtweetする</a>]]></content:encoded>
			<wfw:commentRss>http://hontolab.org/research/www2010-query-analysis-1-session/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WWW2010メモ: Internet Monetization session</title>
		<link>http://hontolab.org/research/www2010-internet-monetization-session/</link>
		<comments>http://hontolab.org/research/www2010-internet-monetization-session/#comments</comments>
		<pubDate>Thu, 29 Apr 2010 20:53:52 +0000</pubDate>
		<dc:creator>tricycle</dc:creator>
				<category><![CDATA[研究]]></category>
		<category><![CDATA[Internet Monetization]]></category>
		<category><![CDATA[WWW2010]]></category>

		<guid isPermaLink="false">http://hontolab.org/?p=567</guid>
		<description><![CDATA[
WWW2010，二日目二つ目のセッションはInternet Monetizationを選択．検索エンジン会社がお金を稼ぐためにどういう工夫をしようとしているのかが見えた．3つ発表があったがBroder氏が関与していた [...]]]></description>
			<content:encoded><![CDATA[
<p>WWW2010，二日目二つ目のセッションはInternet Monetizationを選択．検索エンジン会社がお金を稼ぐためにどういう工夫をしようとしているのかが見えた．3つ発表があったがBroder氏が関与していた一つ目の発表が個人的に面白かった．</p>
<p>&nbsp;</p>
<p><span style="color: #3366ff;"><strong>&#8220;Competing for Users’ Attention: On the Interplay between Organic and Sponsored Search Results&#8221;<br /></strong></span>Cristian Danescu-Niculescu-Mizil, Andrei Broder, Evgeniy Gabrilovich, Vanja Josifovski, Bo Pang</p>
<p>検索連動型広告のCTR (click through rate)とオーガニック検索の検索結果のCTRの関係の調査（64000クエリ）</p>
<ul>
	<li>Navigational queryの場合: オーガニック検索の検索結果のCTRと広告のCTRは負の相関</li>
	<li>Non-navigational queryの場合:検索連動型広告のCTRとオーガニック検索の検索結果のCTRは正の相関</li>
</ul>
<p>検索連動型広告はオーガニック検索の検索結果と類似していた方が良いのか否かの調査 (similarity vs. diversity)</p>
<ul>
	<li>Navigational queryの場合: 検索連動型広告とオーガニック検索の検索結果の類似度が高くなればなるほど，広告のCTRが下がる</li>
	<li>Non-navigational queryの場合: 広告とオーガニック検索の検索結果の類似度が高くなればなるほど，広告のCTRが上がる</li>
</ul>
<p>2種類のタイプの広告</p>
<ul>
	<li>Responsive ads: ユーザのInformation needと明らかに適合性が高そうな広告</li>
	<li>Incidental ads: ユーザのinformation needとは関連がなさそうな広告
<ul>
	<li>Non-navigational queryにはincidental adsは向かない</li>
	<li>Navigational queryには有効</li>
</ul>
</li>
</ul>
<p>感想:</p>
<p>検索エンジン会社は広告をクリックしてもらえるように工夫をしないと広告主からお金が取れない．だからユーザには広告をバンバンクリックしてもらいたいので，本当はオーガニック検索なんて無くして全部広告にしたいんだろうけど，そうするとユーザの印象が悪くなる．印象が悪くならないようにクリック確率が高い広告を出すという工夫は検索エンジン会社の醍醐味．</p>
<p>オーガニック検索との広告との関連性を弄ることでCTRが変わるってのはへぇーという感じだった．ユーザのinformation needをうまく考えていて面白いなぁと思った．</p>
<p>&nbsp;</p>
<p><span style="color: #3366ff;"><strong>&#8220;The Anatomy of an Ad: Structured Indexing and Retrieval for Sponsored Search&#8221;<br /></strong></span>Michael Bendersky, Evgeniy Gabrilovich, Vanja Josifovski, Donald Metzler</p>
<p>背景: 検索連動型広告の仕組み</p>
<ul>
	<li>基本的には(Bid keyword+広告内容)とquery とのrelevance</li>
</ul>
<p>目的:</p>
<ul>
	<li>クエリと広告のマッチングを改善するために階層性があるメタデータに広告に持たせrelevance計算の性能を上げる</li>
	<li>そのためのメタデータとそれを用いた広告のランキング関数を提案</li>
</ul>
<p>感想</p>
<ul>
	<li>正直全然分からなかった…</li>
</ul>

<a href="http://twitter.com/?status=RT+%40tricycle%3A+WWW2010%E3%83%A1%E3%83%A2%3A+Internet+Monetization+session+-+Yusuke+Yamamoto%26%23039%3Bs+Web+site+http%3A%2F%2Ftinyurl.com%2F25v7vgc" class="tweet-this" ><img src="http://hontolab.org/wp/wp-content/plugins/simple-tweet/img/tweet.gif" title="ツイート" alt="ツイート" />この記事をtweetする</a>]]></content:encoded>
			<wfw:commentRss>http://hontolab.org/research/www2010-internet-monetization-session/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WWW2010メモ: Multimedia session</title>
		<link>http://hontolab.org/research/www2010-multimedia-session/</link>
		<comments>http://hontolab.org/research/www2010-multimedia-session/#comments</comments>
		<pubDate>Thu, 29 Apr 2010 15:54:04 +0000</pubDate>
		<dc:creator>tricycle</dc:creator>
				<category><![CDATA[研究]]></category>
		<category><![CDATA[multimedia]]></category>
		<category><![CDATA[WWW2010]]></category>

		<guid isPermaLink="false">http://hontolab.org/?p=559</guid>
		<description><![CDATA[
WWW2010，二日目の第一セッションはmultimediaセッションに．画像処理とか音声処理の話が出てくるのかなと思っていたが，

	一つ目の発表は伝統的なデータマイニング
	二つ目はメタデータ記述のためのフ [...]]]></description>
			<content:encoded><![CDATA[
<p>WWW2010，二日目の第一セッションはmultimediaセッションに．画像処理とか音声処理の話が出てくるのかなと思っていたが，</p>
<ul>
	<li>一つ目の発表は伝統的なデータマイニング</li>
	<li>二つ目はメタデータ記述のためのフレームワーク設計</li>
	<li>三つ目はビデオ要約を作るためのtips</li>
</ul>
<p>と，想像していたマルチメディアセッションとは違った．</p>
<div id="_mcePaste" style="position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px; overflow-x: hidden; overflow-y: hidden;">Elena Zheleva (University of Maryland), John Guiver (Microsoft Research Ltd.), Eduarda Mendes Rodrigues (University of Porto), Nataša Milić-Frayling (Microsoft Research Ltd.)</div>
<p>&nbsp;</p>
<p><strong><span style="color: #3366ff;">&#8220;Statistical Models of Music-listening Sessions in Social Media&#8221;<br /></span></strong>Elena Zheleva (University of Maryland), John Guiver (Microsoft Research Ltd.), Eduarda Mendes Rodrigues (University of Porto), Nataša Milić-Frayling (Microsoft Research Ltd.)</p>
<p><strong>目的: </strong></p>
<ul>
	<li>オンライン音楽コミュニティ上のユーザの音楽再生傾向を考慮して曲をクラスタリング．</li>
</ul>
<p><strong> </strong></p>
<p><strong>アプリケーション </strong></p>
<ul>
	<li>プレイリストの作成，補完</li>
	<li>推薦システム等</li>
</ul>
<p><strong>曲のクラスタリング方法</strong></p>
<ul>
	<li>データ：（ユーザ，再生した曲）の組</li>
	<li>Softクラスタリング: LDAを適用
<ul>
	<li>文書にLDAを適用する例に対応させると，文書=ユーザ,  単語=曲</li>
	<li>潜在クラスの構成の仕方を二通り用意
<ul>
	<li>Taste model: 潜在クラスとして&#8221;曲の嗜好&#8221;を考慮</li>
	<li>Session model: 潜在クラスとして&#8221;曲の嗜好&#8221;と&#8221;セッション&#8221;を考慮<br /># セッション: サイト上に曲の再生記録が残っておりセッション情報ももちろん取れる</li>
</ul>
</li>
</ul>
</li>
</ul>
<p><strong>評価</strong></p>
<ul>
	<li>Perplexity（エントロピーのようなもの，低いほど良い）スコアで評価</li>
	<li>潜在クラスのパラメータを一つ余分に考慮したsession modelが最もperplexityが低い
<ul>
	<li>潜在クラスを増やしてもsession modelは安定して低い</li>
</ul>
</li>
	<li>クラスタリング結果を観察したところ「セッションを潜在クラスとして導入するとムードが考慮できる」と考えられる</li>
</ul>
<p>&nbsp;</p>
<p><strong><span style="color: #3366ff;">&#8220;What are the Most Eye-Catching and Ear-Catching Features in the Video? Implications for Video Summarization&#8221;</span></strong><br />Yaxiao Song (University of North Carolina at Chapel Hill), Gary Marchionini (University of North Carolina at Chapel Hill), Chi Young Oh (University of North Carolina at Chapel Hill)</p>
<p><strong>背景: </strong></p>
<ul>
	<li>ビデオの要約を作るのは大変．要約作成を自動化するために重要な要素を知る必要がある．</li>
	<li>ニュースとかスポーツとか映画とかの要約はよく議論されるがinstruction videoはあまり議論されていない．</li>
</ul>
<p><strong>ゴール: </strong></p>
<ul>
	<li>instruction videoの自動要約のためのキー要素について，映像と音声の観点から実際に人間が手作業で行ったビデオ要約作業から考察</li>
</ul>
<p><strong>知見:</strong></p>
<ul>
	<li>音声がない映像の要約を行う場合
<ul>
	<li>重要な視覚的要素: テキスト，引用，グラフ</li>
</ul>
</li>
	<li>音声がある映像の要約を行う場合
<ul>
	<li>重要な視覚的要素: 人間の顔，風景</li>
	<li>重要な音声要素: 一人の人間が話している箇所，自然の音</li>
</ul>
</li>
</ul>

<a href="http://twitter.com/?status=RT+%40tricycle%3A+WWW2010%E3%83%A1%E3%83%A2%3A+Multimedia+session+-+Yusuke+Yamamoto%26%23039%3Bs+Web+site+http%3A%2F%2Ftinyurl.com%2F258e2zn" class="tweet-this" ><img src="http://hontolab.org/wp/wp-content/plugins/simple-tweet/img/tweet.gif" title="ツイート" alt="ツイート" />この記事をtweetする</a>]]></content:encoded>
			<wfw:commentRss>http://hontolab.org/research/www2010-multimedia-session/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
