【博士論文】ウェブ情報の信憑性分析

Filed under 研究

タイトル

ウェブ情報の信憑性分析(論文をダウンロード

発表場所(日時)

京都大学大学院情報学研究科(2011/2/9)

アブストラクト

本研究では,玉石混淆のウェブにおいてユーザが安心してウェブ情報の検索・閲覧を行うために,社会心理学分野における信憑性の基礎理論と情報検索分野における検索・データマイニング技術を横断し,信憑性指向の情報検索・閲覧のための信憑性分析に関して以下の 3 つのトピックに焦点を当てて議論を行う.

データ対間の関係分析に基づくウェブ情報の信憑性評価

ウェブ情報の種類や評価観点によって異なる信憑性を集合的アプローチによって評価するための汎用モデルについて論じる.提案モデルでは,任意の観点からウェブ情報の信憑性を評価するために,評価対象であるウェブ情報をデータ対として表現し,関連するデータ対間のサポート関係の強さを分析する.このとき,「Supportive なデータ対を多く持つデータ対は信憑 性が高い」という仮説のもと,データ対として表現されたウェブ情報の信憑性評価を行う.信憑性の評価観点に応じてデータ対の構成,データ対間のサポート関係の定義を行うことで様々なウェブ情報の信憑性を評価することが可能となる.

ユーザの信憑性判断モデルの推定によるウェブ検索結果の最適化

情報の信憑性の判断基準はユーザによって異なる.2つ目の研究トピック では,ユーザの検索結果に対する信憑性フィードバック情報をもとにユー ザの信憑性判断モデルを推定し,それを用いてウェブ検索結果を再ランキ ングするシステムについて論じる.提案システムでは,ウェブ検索結果を信憑性の主要な判断指標ごとにスコアリングする.提案システムによって,ユーザは自身の信憑性判断指標に応じて,信憑性の高いページを大量のウェブページの中から効率よく検索することが可能となる.

ウェブ情報の集約による不確かなファクト型知識の信憑性判断支援

不確かなファクト型知識の信憑性を判断するための情報をウェブ情報の集約によって収集することでユーザの信憑性判断を支援するシステムについ て論じる.提案システムでは,信憑性検証対象として「エジソンは電気を発明した」といったようなフレーズで表現されるファクト型知識に焦点を当て,通常の検索エンジンでは収集するのが困難な様々な信憑性判断情報をリアルタイムに集約し提示する.これらの情報を提供することによって,提案システムはユーザの信憑性判断を支援する.

論文への思ひ

完成した時の感想は感慨深さ30%.研究に対する不満70%.ウェブ情報の信憑性という研究テーマは学術的にも情報検索,ウェブマイニング分野では(研究を始めた当初は)先行研究なんてほとんど皆無であった.しかも,この分野は

  • 検索結果の適合性(+多様性)や人気度といったメトリクスの枠を超えられていない(超えようとしていない)
  • マイニング屋さん,機械学習屋さんはGoogle,Twitter,Facebookなど産業界のサービス側からデータが降ってくるのを待っては食い散らかす

という状況になっており,学術界から社会的に意味のある革新的な提案というのができなくなっているのではと(僕は)感じていた.僕はウェブ情報の信憑性という研究テーマは社会的にも見ても非常に重要なテーマだし,学術的にもほとんど誰も取り組んでいなかった.だからこそ,僕は自分の研究テーマに対しては誇りをもっていた.

 

しかし,僕の力不足のために,学術界に「ウェブ情報の信憑性」というテーマで(本当の意味で)一石を投じるというところまではいけなかった.いつも査読者には”Your research is very interesting. BUT experiment is not enough”.これの繰り返しだった.「研究分野の前提を覆す研究」と「論文として採択される研究」との狭間に苦しんだ.学位取得のためには,信念を曲げ問題を作り,”論文のため”の研究せざるをえなかったこともあった.博士論文執筆の最低ラインをクリアした後,ようやく自分のしたい研究に手をつけられ始めたと思ったらタイムアウト.結果,僕の博士論文は妥協の固まりとなった.

 

博士論文の各研究課題に感想を述べてみる:

データ対間の関係分析に基づくウェブ情報の信憑性評価

  • 汎用モデルを構築するというのは聞こえが良い.しかし,モデルというのは抽象化/汎用的にすればするほど表現能力は上がるが,何のための道具なのかが分からなくなるものである.重大な問題を解くためのモデルを作るはずなのに,作ったモデルで解ける問題を探し始めたとしたら本末転倒である.

ユーザの信憑性判断モデルの推定によるウェブ検索結果の最適化

  • 一番最後に取り組んだ課題.僕がポジティブに取り組めた唯一の課題かもしれない.
  • サイエンス的側面の強い研究.僕にとって最も学びの大きかった研究である.だからこそ,もっと深くじっくりと研究に取り組みたかった.

ウェブ情報の集約による不確かなファクト型知識の信憑性判断支援

  • 「信憑性の判断情報の収集」のために「ウェブからの知識抽出」を行うのであって,「ウェブからの知識抽出」したものが「信憑性に判断に使えるかも」という方向性は僕にとっては明らかに間違い.僕は「ウェブマイニング研究者」ではなく「信憑性研究者」でありたかった.

 

このように振り返れば不満と自責の念しか出てこない博士論文であったが,そもそも素晴らしい博士論文を書ける人なんているのだろうか?指導教員に尋ねたところ

「博士論文とは勇気のかけらを拾い集めて作るものだよ」

という貴重な意見を頂いた.なるほど,確かにそうかもしれない.

 

これ以上博士論文の振り返りを行ったら,拾い集めたはずの勇気はただの「石ころ」であることに気付きかねないので,もうこれ以上博士論文はしばらく振り返らないようにしようと思う.