DEIM2019で指導学生プレゼンテーション賞を受賞

2019年3月4〜6日にかけて長崎県はハウステンボスで開催された第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて,研究室で指導している学部生齊藤史明くんと中野裕介くんが学生プレゼンテーション賞を受賞しました.

齊藤くんは「文章表現の曖昧さ指摘によるウェブ情報精査の態度・行動促進」というテーマで,中野くんは「脚本の内容と構成要素に基づく映画印象推定」というテーマで研究発表しました.

DEIM2019で研究成果を発表

2019年3月4〜6日にかけて長崎県はハウステンボスで開催された第11回「データ工学と情報マネジメントに関するシンポジウム(DEIM2019)」にて,今年度の研究成果を発表しました.

発表内容は以下の通りです:

  • 梅田浩郎, 山本祐輔:笑えるウェブ情報検索のためのクエリ推薦第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.C7-2, March 2019.
  • 齊藤史明, 山本祐輔:文章表現の曖昧さ指摘によるウェブ情報精査の態度・行動促進第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.C2-2, March 2019 (学生プレゼンテーション賞).
  • 藤堂晶輝, 山本祐輔:情報の食わず嫌いを抑制する情報提示方法第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.G6-3, March 2019.
  • 中野裕介, 山本祐輔:脚本の内容と構成要素に基づく映画印象推定第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.I3-3, March 2019 (学生プレゼンテーション賞).
  • 堀内進次, 山本祐輔:珍スポット検索のためのランキング手法の検討第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.P1-141, March 2019.
  • 村西克仁, 山本祐輔:飲食店レビュー情報の集合知分析と意思決定支援第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.F3-1, March 2019.
  • ポチラッタナチャイクル・スパナット, 山本岳洋, 山本祐輔, 吉川正俊:文書の意見と信憑性がユーザの検索行動および信念の変化に与える影響の分析第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.C2-4, March 2019 (学生プレゼンテーション賞).
  • マハルジャンラビン, 白石晃一, 山本岳洋, 山本祐輔, 大島裕明:話題提供を行うための独居家族との「気配」共有システム第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.I6-5, March 2019.
  • 楊澤華, 山本祐輔, 山本岳洋, 神門典子, 大島裕明:博物館の展示物と見学者の興味を関連付ける情報の発見第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019), pp.E4-3, March 2019.

私のブックマーク:ウェブ検索と信憑性

 

ウェブは私たちの生活を支える重要な知識基盤となっています。一方で,フェイクニュースに代表されるように,ウェブ情報の信憑性が社会問題となりつつあります。本ブックマークでは,信憑性指向のウェブ情報アクセスシステムの実現する上で重要と思われる下記項目に関して,関連情報を整理・紹介いたします:

  • 情報信憑性の構成要素とユーザ側の意識
  • 情報信憑性の評価アルゴリズム
  • ウェブ情報の信憑性の判断支援システム
  • 信憑性判断と認知バイアス

研究トピック

信憑性の構成要素

情報の信憑性に関する研究は,1950年代から社会心理学分野で行われてきました。一般的に情報の信憑性は,客観的な特性である真偽(authenticity)もしくは正確さ(accuracy)と見なされる傾向にあります。社会心理学分野では,信憑性は「主観的な特性であり,受け手や対象とする情報によって「正しさ」の解釈が異なるもの」とされています。Carl Hovland氏をはじめとする多くの社会心理学者は,「コミュニケーションと説得」という文脈で,信憑性の構成要素や信憑性判断メカニズムに関する研究を行ってきました。これまでの研究によると,信憑性は以下の2要素から大きく影響を受けるということが明らかにされています。

  • 信頼性(trustworthiness):道徳性や優良性に関する要素(例:公正さ,偏見の有無)
  • 専門性(expertise):情報発信者が有する知識やスキルに関連する要素

社会心理学分野で信憑性に関する研究が始まった当時は,信憑性の対象として新聞等のオールドメディアに焦点が当てた研究がなされていました。2000年代に入ってからはウェブ情報の信憑性に焦点をあて,その構成要素を明らかにしようとする研究が行われています。UC Santa BarbaraのMiriam Metzger氏のサーベイ論文は,ウェブ情報の信憑性の構成要素を体系的に知るうえで貴重な資料です。

図書館学分野では,真偽が不確かなウェブ情報の信憑性を判断するためのチェックリスト指標が提案されてきました。代表的な指標はJim Kapounによって提案された指標です。Kapounは情報の信憑性を判断する際には,「正確さ(accuracy)」「権威性(authority)」「客観性(objectivity)」「鮮度(currency)」「網羅性(coverage)」の5指標に注意を払うよう提案しています。同様のチェックリストとして,UC Berkeley Libraryのチェック指標などが存在します。

ウェブ情報の信憑性に対するユーザ側の意識

どういったウェブ情報に対して信憑性を感じるか(あるいは感じないか)を大規模に調査した研究としてはStanford大学のB.J. Fogg氏の研究,UC Santa BarbaraのMiriam Metzger氏の研究があります。また,アドビシステムズ株式会社が行った調査(The State of Content: Rules of Engagement)によると,日本のミレニアル世代の約8割がウェブ上のコンテンツの信憑性を疑わない傾向にあることが明らかになっています。

特定のウェブ情報に焦点を絞って,ウェブ情報の信憑性に対するユーザの意識を調査した研究事例もあります。ウェブ検索エンジンに対するユーザの信憑性に関する研究としては,Nakamuraらが行った研究事例が挙げられます。

信憑性評価アルゴリズム

信憑性の高いウェブ情報を獲得を支援するために,様々な観点から信憑性評価アルゴリズムの研究開発がなされています。以下にアルゴリズムの例を挙げます。

情報検索,データマイニング分野では,代表的な問題設定としてtruth discovery問題が挙げられます。Truth discovery問題は,「海辺のカフカの作者は村上春樹」といったファクトの信憑性を,同じ主題(この例では海辺のカフカの作者)に対するウェブ上のファクト情報を集めたときに「ファクト間に矛盾がないか」を評価する問題です。この問題に対する基本的なアルゴリズムとして,2007年にTruthFinderアルゴリズムが提案されています。その後,latent credibility analysisアルゴリズムなど様々な改良アルゴリズムが提案されています。また,truth discovery問題から派生して,矛盾のあるファクトがウェブページ中に含まれる程度に着目することで,ウェブページの信憑性を評価するアルゴリズムも提案されています(論文)。Truth discoveryアルゴズムの動向については,Yaliang Li氏らのサーベイ論文に整理されています。

情報信憑性に関連する特定の観点に着目して,ウェブ情報を評価するアルゴリズムも提案されています。AdlerらはWikipediaの編集履歴に着目し,文が編集されずに残ってきた期間を信憑性の指標とし,Wikipedia記事中の文の信憑性を評価するアルゴリズムを提案しています。Suryantoらは,Yahoo! AnswerのようなコミュニティQAサイトに投稿された回答の信憑性の一観点として,回答内容の専門性を評価するアルゴリズムを提案しています。Dongらはウェブページに記載された時間およびウェブページにリンクが張られた時間から対象ページの生成時期を推定し,ウェブページの鮮度を評価する手法を提案しています。

こまかいことを考えずに,あらかじめ信憑性の高い情報と低い情報に関するデータを収集し,教師あり学習で信憑性の有無の分類器を構築するアプローチも多数行われています。例えば,Carlos CastilloらはTwitter上のツイート情報の信憑性判定アルゴリズムを提案しています。自然言語処理では,言語的特徴量からテキストの嘘情報を判定するアルゴリズムが多数提案されています(論文1, 論文2)。これらアルゴリズムの開発・評価の肝となるデータセットも開発されています。以下は,フェイクニュースの公開データセットの例です。

評価アルゴリズムを信憑性判断に有効活用するためには,アルゴリズムが対象としている情報の種類,および信憑性評価の観点を把握しておくことが重要です。

信憑性の判断支援システム

玉石混淆のウェブ情報の信憑性問題に対応するため,情報信憑性の評価アルゴリズムの開発が進められていますが,計算機による信憑性判定にも限界があります。それゆえ,信憑性判断の成否は最終的には人間側に委ねられることになります。そこで,最終的に人間がウェブ情報の信憑性判断を行うことを前提に,判断支援に焦点を絞ったシステムも提案されています。

Ennalsらが開発したDispute Finderは,閲覧中のウェブページ中のセンテンスに対する反証がウェブ上に存在する場合,そのセンテンスをハイライトすることで疑わしいセンテンスに注意を促すシステムです。Suhらは,Wikipedia記事の信憑性判断を支援するために,Wikipedia上の記事の編集履歴を可視化するシステムWikiDashboardを提案しています。Leongらは,疑わしいと思った知識に対して,証拠となるセンテンスを検索するためのシステムを提案しています。Sunらは特定の2つのトピックを比較するために適切なウェブページを検索するシステムComparative Web Searchシステムを提案しています。最後に手前味噌ですが,筆者はウェブ検索結果の信憑性判断支援を行うCowSearchシステムを提案しました。CowSearchは,信憑性判断の際に重要とされる指標に沿ってウェブ検索結果のスコアを可視化し,ユーザが重要視した信憑性評価軸に応じてウェブ検索結果を再ランキングするシステムです。

信憑性判断と認知バイアス

上で紹介したように,信憑性判断に有用と思われる情報を提示することで,人間による信憑性判断を支援するシステムの研究開発が進められています。この種の支援システムをユーザに有効活用してもらうには,”’意思決定における認知バイアス”’を考慮してシステムをデザインする必要があります。

認知バイアスとは直感的な思考によって生じる判断の歪みであり,ウェブ情報探索プロセスにおいても様々な認知バイアスが確認されています。例えば,Ieongらは特定のドメインに属しているウェブページなら信用できるとユーザが感じてしまうドメインバイアスの存在を明らかにしています。Lindgaardらは,見た目が綺麗なウェブページを信用してしまう見た目バイアスの存在を明らかにしています。また,Whiteらは検索トピックに対する事前信念と検索行動の関係について分析を行っており,ユーザが検索トピックに関して強い事前信念を持っている場合は,ウェブ検索・閲覧をして様々な情報を見たとしても,事前信念が修正されることは少ないことを明らかにしています(論文)。このような認知バイアスが発生してしまうと,上に記したような信憑性判断支援システムが提供されていたとしても,ユーザはそれを利用しない,あるいは自分の信念をネガティブな方向に補強するためにシステムを利用するということが起こりえます。

このような問題に対応するために,認知バイアスを抑制し,ウェブ情報の信憑性の精査行動を促進する情報インタラクションの研究が行われつつあります。例えば,Q. Vera Liaoらは,トピックに関する賛否について情報検索システムを用いて考えるタスクを行うときに,検索結果で表示される各文書の賛否を分類して提示するだけでは,検索者のトピックに対する先入観を解消するには至らず,逆にその先入観を強化する方向に働いてしまうことを明らかにしています。一方で,賛否の分類に加え,各情報の発信者の専門性を併せて提示すると,検索者は自身の先入観に反する情報にも目を向けるようになるということを実験的に明らかにしています(論文)。また,Yamamotoらはプライミング効果に着目して,ウェブ情報の信憑性に対する精査行動を促進する検索キーワード推薦手法「クエリプライミング」を提案しています。

国際会議・コミュニティなど

フェイクニュースが社会問題となっていることもあり,今でこそウェブ情報の信憑性に注目が集まっていますが,ウェブ情報の信憑性については2000年代初頭から研究が行われています。

情報検索,データマイニングの分野では,ウェブ情報の信憑性の評価・ランキングアルゴリズムの研究,ウェブ情報の信憑性を判断支援するシステムについて研究が行われています。この分野の重要な国際会議としては以下が挙げられます(2018年11月現在アクセス可能なリンクを掲載しています):

自然言語処理の分野では,デマ情報の検出アルゴリズムの研究が盛んです。この分野の重要な国際会議としては以下が挙げられます(2018年11月現在アクセス可能なリンクを掲載しています):

HCI分野では,ウェブ情報の信憑性判断を支援するシステムや情報の設計に関する研究も行われていますが,ウェブ情報の信憑性判断にかかるユーザの態度・行動の理解に関する研究も多く行われているのが特徴です。この分野の重要な国際会議としては以下が挙げられます(2018年11月現在アクセス可能なリンクを掲載しています):

またウェブが人間社会に与える影響を学際的に明らかにしようとする新しい研究分野であるウェブサイエンス分野でも,ウェブ情報の信憑性に関する議論がなされています。この分野ならではの要素として,社会学的な視点からウェブ情報の信憑性を研究する事例が比較的多いことが挙げられます。この分野の重要な国際会議としては以下が挙げられます:

おわりに

本稿では,「ウェブ検索と信憑性」をテーマに関連する情報を紹介しました。ウェブから信憑性の高い情報を獲得するための効果的なアプローチを検討するには,アルゴリズム,システム設計,人間理解といった観点から複合的に考えることが重要です。本ブックマークが,ウェブから正確な情報を得るための情報環境を実現する一助になれば幸いです。

ドーナツとフィルター

静岡大学浜松キャンパス附属図書館にキャリアに関連した書籍を推薦する機会をいただいた。何を推薦してもよいとのことだったので、大阪大学ショセキカプロジェクトの「ドーナツを穴だけ残して食べる方法」を推薦した。

推薦文は150字で書くよう依頼があったので、もともと400字程度あった推薦文は削ることになった。せっかくなので、ここに圧縮前の推薦文を残すことにする。


ドーナツを穴だけ残して食べるには?くだらない、でも何故か気になるこの問題について、工学、数学、哲学などの専門家がそれぞれの立場からきわめて真面目に考える。これが本書の趣旨です。本書を読むと「面白いことに取り組むにはフィルターを外すこと」が重要ということに気付かされます。

ものごとを考えるとき、私たちは先入観というフィルターに縛れがちです。そのフィルターのせいで、より良い選択肢を逃してしまっていることもしばしば。進路の選択もその一例です。「情報学部に入ったら就職先はIT企業、職業はSE、プログラマ」 — こんなふうに選択肢を縛ってしまうことは非常にもったいない。皆さんが学んでいる知識やスキルは、思った以上に専門分野の外側で求められています。やりがいのある仕事、自分に合った働き方を見つけるためにも、一度「フィルター」を外してみてください。今まで考えてもみなかった仕事や働き方が見つかるかもしれません。

リサイクルヒソター

あるモノ(もしくはコト)xが(ある観点から見て)悪い状態に陥っている際、xの関与者のxに対する認識は様々である:

  1. xが悪い状態にあることを知らない
  2. xが悪い状態にあることを知っているが、どうしたらよいのか分からない(どうすることもできない)
  3. xが悪い状態にあることを知っているが、それが悪いとは思っておらず、状態を改善させるモチベーションはない

「リサイクルヒソター」の看板をかかげてリサイクルを受け入れている方は、どういう認識でいるのだろう。周りに間違っていることを教えてあげる人はいないのだろうか。教えてあげても修正しないのだろうか。

ここまで書いて、この看板は注目を集めるためにワザとやっている可能性を思いついた。注目を集めるほど人がいない田舎でこんなことをしてもあまり意味がないだろうから、注目集めの可能性は否定できるであろう。

ACM CIKM 2018に論文が採択されました

京都大学の山本岳洋さん、Yahoo! Japan研究所の藤田澄男さんとの共同研究 “Exploring People’s Attitudes and Behaviors toward Careful Information Seeking in Web Search” がACM CIKM 2018にフルペーパーにて採択されました。

本論文では、ウェブ検索エンジンのクエリログを用いて、批判的なウェブ検索ができるユーザの特徴を分析を試みています。

後日プレプリント版論文や発表資料をアップする予定です。

平成30年度基盤研究(C)(特設分野研究)の申請が採択されました

昨年10月に日本学術振興会 平成30年度基盤研究(C)(特設分野研究:情報社会とトラスト)に応募した申請プロジェクトが採択されました。研究課題名は「自律的・能動的な情報信憑性判断力を高める情報インタラクション」です。

本プロジェクトでは、ウェブ検索・閲覧を行うユーザが情報システムの力を借りつつも,最終的には自分自身で情報の信憑性(確からしさ)を判断できるよう,ユーザの信憑性判断能力を高め,自律的・能動的な信憑性判断を促進する情報インタラクション技術の開発を行う予定です。

固定観念:押して開かない蓋

注文していた単4電池が届いた。電池は上記のようなプラスチックケースに電池が納められていた。早速使いたかったのでツメを押して蓋を開けようとするが、まったく開かない。いかにも中華製のケースである。強く押さなければ開かないのだろうと思い、ありったけの力でツメを押すが開かない。中華製という理由で開けることを諦めた。

次の日、同じ商品を入手した学生にケースを開けられたかどうかを尋ねた。なんと、開けられたようだ。開け方を尋ねたところ、爪が引っかかっているように見える四角の輪のした部分を手前側に起こすことで開けられるとのことであった。開けにくいが、確かにその方法を試してみると、四角の上辺が軸となって、四角の輪が手前に動いた。

なんというBad User Interface!! と思えるが、それ以上に自分が他の方法を試さなかったこと、ツメを押して開ける開け方以外に方法はないと思っていたことにショックを受けた。

固定概念にハマっていることに気付くのは難しい。

「ファスト & スロー」14章のトム・W問題のベイズ推定について

研究室で輪読中の「ファスト & スロー」の14章で、直感(代表性ヒューリスティクス)を制御する方法としてベイズ推定を用いる話題が紹介されていた。同じ章で用いられている例題「トム・W問題」にベイズ推定を適用してみたときに基準率がどうなるかが解説されているのだが、学生から本の説明を読んでもよく分からなかったという報告を受けた。

淡々とベイズの定理を適用するだけだろうと思っていたのだが、たしかに問題文や解説文を読んで自分でベイズ推定をしてみようとしたが、何だかおかしい。小一時間考えてみたが、問題文の日本語訳が紛らわしい(誤訳?)ことがモヤモヤの原因だと分かった。来年以降も同じ事を学生に聞かれそうなので、僕なりの解釈を以下にまとめておこう。

トム・W問題について

トム・W問題とはある大学院生トム・Wに関する記述が与えられたときに、トムの専攻分野をコンピュータ科学を含むいくつかの分野から選択するという問題である。「ファスト&スロー日本語訳」で書かれているトム・Wに関する記述は以下の通り:

トム・Wはとても頭がよいが、創造性には欠ける。秩序や明晰さを好み、あらゆる細かい要素までしかるべき場所におさまっていて、万事がきれいに説明できるシステムを愛する。彼の書く文章はかなり単調で機械的であり、たまに陳腐な駄洒落じゃSFもどきの想像力が発揮されるにとどまる。彼は能力向上にはきわめて熱心である。他人のことにあまり関心がなく、同情心は薄いように見える。人付き合いを楽しむタイプではない。自己中心的ではあるが、倫理観はしっかりしている。(原文ママ)

この記述が与えられたときに、問題を与えられた人はたいていの場合、代表性ヒューリスティックを用いて意思決定を行ってしまい、その結果トムの専攻を「コンピュータ科学」と答えてしまう。合理的(統計的)判断を下すためにはベイズ推定を用いるのが一つのアプローチであるというのが本書の主張。以下は「ファスト&スロー日本語訳」でのベイズ推定アプローチに関する記述である:

ベイズ・ルールは、事前確率(本章の例では基準率がこれに該当する)に証拠の診断結果(相反する仮説が実現する見込み)を加味する手順を定めている。たとえばあなたは、大学院生の3%(基準率)がコンピュータ・サイエンス専攻だと考えているとしよう。そしてトム・Wの人物描写(=証拠)を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野よりも4倍高いと考えたとする。するとベイズ・ルールにより、トム・Wがコンピュータ・サイエンス専攻の確率(事後確率)は11%になる(原文ママ)。

問題の問題

脚注ではオッズや尤度比を用いた解説が書かれているのだが、愚直にベイズの定理を使って解くのがよいと思ったので、その方法で考えてみる。今、
* θ: 大学院生がコンピュータ科学を専攻しているという事象
* ¬θ: 大学院生がコンピュータ科学を専攻していないという事象
* D: トム・Wの人物記述(人となり)情報が得られたという事象
とする。ベイズの定理によって、トム・Wに関する人物記述が得られたときにトム・Wがコンピュータ科学を専攻していると思われる確率P(θ | D)は以下となる:

$$ P(\theta | D)   =   \frac{P(D | \theta)P(\theta)}{\sum_{\theta} P(D | \theta)P(\theta)} =  \frac{P(D | \theta)P(\theta)}{P(D | \theta)P(\theta) + P(D | \overline{\theta})P(\overline{\theta}) } $$

以上と問題文を対応させていけば解けると思っていたが、問題は尤度(P(θ | D))である。脚注の解説を読むと、「トム・Wの人物描写(=証拠)を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野よりも4倍高いと考えたとする」という箇所が尤度に関する情報を扱っているようなのだが、これって何を言っているのか?これは尤度だろうか?僕にはこの説明は尤度でなく事後確率の説明をしているようにしか見えない… 翻訳前の文章を見て悩みが解決した。この箇所に関する元の文章は以下の通り:

… and you also believe that the description of Tom W is 4 times more likely for a graduate student in that field than in other fields, then …

これを読むと、「トム・Wの人物描写(=証拠)を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野よりも4倍高いと考えたとする」ではなく、「あるコンピュータ科学専攻の学生にトム・Wの人物描写が当てはまる確率は、コンピュータ科学以外を専攻しているある学生に対してトム・Wの人物描写が当てはまる確率の4倍である」と書いてある。これならば尤度を計算できそう。僕が当初考えていた変数設定を使うと、上記英文は

$$P(D | \theta) : P(D | \overline{\theta}) = 4:1$$

となるので、ベイズ推定ができそう。

ベイズ推定によるトム・W問題の事後確率推定

これで準備が整った。問題設定を数式で表現すると、以下のようになる。

  • 大学院生の3%(基準率)がコンピュータ・サイエンス専攻だと考えている:P(θ | D)=0.03
  • あるコンピュータ科学専攻の学生に対してトム・Wの人物描写が当てはまる確率は、コンピュータ科学以外を専攻しているある学生に対してトム・Wの人物描写が当てはまる確率の4倍である: P(D | θ) : P(D | ¬θ) = 4:1

あとは、ベイズの定理に上の式を使う。

$$ P(\theta | D)   =   \frac{P(D | \theta)P(\theta)}{\sum_{\theta} P(D | \theta)P(\theta)} =  \frac{P(D | \theta)P(\theta)}{P(D | \theta)P(\theta) + P(D | \overline{\theta})P(\overline{\theta}) } $$

$$  =  \frac{0.03 \cdot P(D | \theta)}{0.03 \cdot P(D | \theta) + 0.97 \cdot P(D | \overline{\theta})} $$

$$  =  \frac{0.03 \cdot P(D | \theta)}{0.03 \cdot P(D | \theta) + 0.97 \cdot 0.25 \cdot P(D | \theta)} = 0.11$$

これで基準率(事前確率)3%でトム・Wの人物描写を見たら、事後確率が11%になり、基準率が3%から11%に修正されたと言える。めでたしめでたし。

研究室を検討している学生のみなさんへ(2018年度)

今年も研究室選びの時期がやってきました。このページは、2018年度後期に研究室配属される静岡大学情報学部3年生に向けてのメッセージです。研究活動あるいは研究室に対する山本の考え方をまとめてありますので、研究室選びの参考にしていただければ幸いです。

はじめに

学生のみなさんは研究活動あるいは研究室にどんなイメージを持っているでしょうか。配属されたい研究室はどんなところでしょうか。もしかして、こんな希望をお持ちですか?

  • 楽そうな研究室がよい
  • 勉強ができなくても何とかなる研究室がよい
  • 先生が優しそうな研究室がよい
  • 先生が手取り足取り何でも教えてくれる研究室がよい
  • ブラック研究室は嫌だ(注釈)

あらかじめお伝えしておきます。上のような要素を重視したい学生さんは、山本の研究室を選択肢から外した方が良いかもしれません。おそらく、学生さんも僕も不幸になります。ですので、そういう方はこれ以降のメッセージは読み飛ばしていただいて結構です。「いやいや、そんなことよりも大事なことがあるよ」とちょっとでも思った方はメッセージの続きを読んでください。「大学に入学したのはいいけど、これまで自分は一体何を勉強してきたのだろう?何か身に付いたことがあるんだろうか…?」「大学で勉強することの意義って結局何なのだろう」と思っている方、そういう方も以降のメッセージの前半だけでも読んでいただければ何かヒントが得られるかも知れません。長文ではありますが、時間があるときにご一読ください。

注:”ブラック研究室”の定義は人によって異なるため、僕の研究室がブラック研究室かどうかは一概には言えません。僕自身は自分の研究室運営のやり方はブラックだと思っていません。学生の意志を無視してひたすら膨大なタスクを与え続ける、拘束時間が長い、といったことはしませんので。ただし後述しますが、僕の研究室での卒業論文研究は幾分ハードかと思います。これまで「知的トレーニング」を受けたことのない学生にとって、自分で問題を設定し、自分で問題解決方法を考えることは体験したことのない苦しみでしょうから。

掲載項目

  1. 大学で学べること、学ぶべきこと
  2. 研究室選びは重要!
  3. 何をしている研究室なのか?
  4. 研究室の研究・教育方針
  5. 研究テーマの決め方 〜 山本研究室でできること
  6. 楽 or キツい?
  7. 山本研究室を選ぶデメリット
  8. 山本研究室を選ぶメリット

大学で学べること、学ぶべきこと

大学は何を学ぶところなのでしょうか?こう尋ねると、「専門分野についての知識やスキルを学ぶところでしょ」という回答が返ってきそうです。情報学部の学生さんでしたら、

  • 情報学に関する知識やスキルを学ぶところでしょ?
  • データベースとかAIとか情報処理に関する知識を学ぶところでしょ?
  • プログラミングを学ぶところでしょ?

という返事が返ってきそうです。みなさんにとっては「大学 = 授業」であり、授業といえば専門分野固有の知識やスキルについて話を聞くところという認識でしょうから、情報学部に関しては言えば、上記回答でも間違いではありません。では、ちょっとだけ質問を変えます。大学で最も学ぶべきことは何でしょうか?

大学で最も学ぶべきことは、データベース、AIといった情報処理の知識やプログラミングスキルではありません。こういった情報処理の知識やプログラミングを学びたいのであれば、世の中にはたくさん良書がありますし、最近ですとウェブ上にも良質なコンテンツがありますので、大学に来て学ぶ必要はありません。ご存知のとおり、大学教員が提供する授業は必ずしも分かりやすいとは言えませんので、出たくもない授業に出て知識を学習する時間を無駄にするようであれば、家や図書館で一人で勉強した方がよっぽどマシかもしれません。もっと踏み込んで言うならば、お客の要求を満たすような情報システムを開発するスキルを身につけたいのであれば、大学よりも専門学校へ行った方がはるかに実践的なトレーニングが受けられます。

改めて問います。大学では何を学び、何を身に付けるべきなのでしょうか?それは「問いを設定し、解決策を考える力」だと思います。企業の歯車として、上司から降ってくる解き方が決まっている仕事(ある程度の時間と知識、経験があればできること)を淡々とこなすだけであれば、問いを設定し、解決策を考える力は必要ないでしょう。問題を解くための知識とスキルがあればよいわけです。しかし、世の中では、解くべき問題がはっきりしていることはむしろ稀です。(スケール感は様々ですが)世の中をちょっとでも良くしたい、未来を創りたいといった場合は、進むべき道がはっきりしない or ない状況で問いを立て、問いを理解し、問いに対する解決策を考え出すことが必要となります。

「問いを設定し、解決策を考える力」はどうやったら身につくのでしょうか。これについては、一橋大学の楠木建先生が「大学での知的トレーニング:アタマがナマっている人へのメッセージ」という文書の中で述べられています。楠木先生は僕がいう「問いを設定し、解決策を考える力」を、コンセプチュアル・スキルと呼んでいます。そして、

  • 大学では、コンセプチュアル・スキルを鍛えるべきであること
  • コンセプチュアル・スキルのトレーニングは、大学以外の場所ではなかなか受けることができないこと
  • コンセプチュアル・スキルのトレーニングを積んできたか否かは、後にはっきりとした差として現れること

を述べられています。コンセプチュアル・スキルは誰しもが身に付けることができるが、そのためには時間をかけてトレーニングすることが必要とも述べられています。

僕も楠木先生の意見に同意です。そして、僕は大学研究室こそ、コンセプチュアル・スキルトレーニングを集中的に行えるほぼ唯一の場だと考えています。それゆえ「問いを設定し、解決策を考える力」という強力かつ汎用的な知的スキルを学ぶ場として、大学研究室は極めて重要な場といえます。

以上の理由より、山本の研究室では「問いを設定し、解決策を考える力」を鍛えることを非常に重視しています。そのことは、研究テーマの決め方、研究指導、研究室での活動に反映されています。ですので「問いを設定し、解決策を考える力」なんて自分には必要ないと思う人は、山本の研究室を希望リストに入れない方が良いでしょう。「問いを設定し、解決策を考える力」と聞いてちょっとでも興味あるいはひっかかりを感じた人は、引き続き本メッセージを読み進めてください。

研究室選びは重要!

「大学で学ぶべきこと」で述べたことを前提として、研究室選びを行う上で、僕なりのポイントを以下に記します。

静岡大学情報学部にはたくさんの研究室がありますが、研究テーマはもちろんのこと、研究室の研究・教育方針、イベントの充実度、文化、雰囲気、財政状況は、研究室によって様々です。(学部で卒業する場合)大学研究室で過ごす時間はたった1年半しかありませんが、どこの研究室を選ぶかが、大学生活の充実度、自分の成長、人生観などに大きく影響します。限られた時間と情報の中で研究室選びをするのは大変かと思いますが、十分に考えてみてください。このページを読んで何か聞きたいことがありましたら、遠慮なく山本にコンタクト(yamamoto あっと inf.shizuoka.ac.jp)をとってください。自分の希望や研究室の特徴を明確にするためにも、いろんな研究室を見比べることも大事です。

個人的意見ではありますが、研究室選びのポイントの例を以下に記します:

  • 研究室の研究内容
  • 卒業研究のテーマの決め方
  • 卒業研究の指導方針
  • 教員との相性
  • 教員の忙しさ
  • 研究室の雰囲気、先輩学生との相性
  • 研究室における学生の滞在率
  • イベントの充実度
  • 研究を進める上で必要となる学習のサポート体制
  • 研究室の財政状況
  • 就職実績

何をしている研究室なのか?

授業や静岡大学公式サイトでは「情報の信憑性」に焦点を当て話をすることが多いですが、山本研究室は「情報の信憑性」の研究しかしない研究室ではありません。では、何をテーマにしているか。山本の大きな興味関心は、

情報技術の進歩で便利な生活に慣れきってしまい、大事な何かを失ってしまっている人に「気づきを与えて前向きな態度/行動変化を促すにはどうすればよいか?そのための仕掛けを情報技術を使ってどう実現するか?どんな情報システム、サービス、メディアを設計すればよいか?」

です。このテーマを少しでも達成するために、僕自身はサブテーマとして

  • 情報の信憑性
  • 行動・態度変容の情報インタラクションデザイン
  • 気づき能力をアップさせる方法論

などを設定して研究しています。研究のアウトプットは様々です。仕掛けとして開発してきたものは、情報検索システム、アルゴリズム、アンケート・心理指標スキルアップのためのアナログツールなどが上げられます。仕掛けの対象となるユーザの行動分析、データマイニングなども行ってきました。

繰り返しますが、情報の信憑性のみを研究しているわけではありません。例えば、現在4年生が卒業論文執筆に向けて以下のような研究テーマを検討しています:

  • 人を笑わせる(面白い)情報の検索システム
  • 情報を精査する気にさせるブラウザ
  • B級・珍スポット検索
  • オンライン上の商品・サービスに関する誇張評価広告の発見
  • 人間-機械の協調作業による小説の半自動的創作システム
  • 情報の食わず嫌い・流し読みを防ぐ情報提示手法
  • 人文・社会科学系分野における学術成果創成メカニズム
  • 集合知の分析による芸術が社会に与える影響の分析

研究のやりかた

研究とは「新しい仮説(クレーム)を立て、その正しさを検証する」行為です(参考:「研究法」について)。

仮説の立て方にも様々なタイプがあります:

  • 既存システムの問題点を解決したり、効率や精度を高めるための方法論を考える研究(問題解決型研究)
  • みんなが気づいていない新しい問題・課題、世界観を提案する研究(問題発見型研究)

また、仮説を確かめる方法にも様々なタイプがあります:

  • プロトタイプ(仮説が反映された仮のシステム、サービス、モノ、方法論)を使った実験を行い、仮説の検証を行うアプローチ
  • 理論を使って仮説の正しさを証明するアプローチ
  • 調査、シミュレーション

など、上で述べたタイプ分けを踏まえると、山本は冒頭で述べたテーマを実現するために、

  • みんなが気づいていない新しい問題・課題、世界観を提案し、
  • それを確かめるためのプロトタイプを使った実験を行う

というやり方を採っていると言えます。また、冒頭で述べたテーマ、サブテーマを実現するためには、色々な技術や知見を組み合わせる必要があります。ですので、情報学をベースにはしていますが、それに拘らず色々な分野の知見技術を組み合わせて研究を行っています。

研究活動に関連するキーワード

研究分野や専門性で研究室選びを考えたいという学生もいると思いますので、山本がこれまで行ってきたこと、これから行いたいことに関連する内容を、あえて専門分野やキーワードに落としてみました。以下にそれを記します(分かりづらいと思われるものには関連する学会やウェブページ、書籍へのリンクを張りました):

専門分野

情報検索、ウェブマイニング、ヒューマン・コンピュータ・インタラクション(HCI)

キーワード

検索エンジン、データマイニング、機械学習、情報デザイン、説得工学、情報の信憑性、信頼、ヒューリスティックとバイアス、仕掛学、不便益、Fun Theory、ゲーミフィケーション、Visual Thinking Strategy、人と情報のエコシステム、デジタルデトックス、reflective design、critical design

研究室の研究・教育方針

学生のみなさんには「スゴい研究をすること」よりも「(スゴいかどうかさておき)研究を通じて自分を鍛えること。特に問いを設定するスキルを鍛えること」に主眼を置いた研究活動に取り組んでほしいなと思っています。

すべての学生が研究者になりたいわけではありません(教員、研究者の多くは、学生のみなさんに研究者になって活躍して欲しいと思っていますが…)。多くの学生は大学を卒業した後は企業に就職します。大学で研究活動を行う期間は、学部で卒業する人なら1年半、修士で卒業する人なら3年半です。そんな短い期間で、研究経験が乏しい学生にスゴい研究成果を出すことを要求するのは酷な話です。一方で、研究活動は、問題発見能力、問題解決能力(知的スキル)、コミュニケーション能力、プレゼンテーション能力など、社会で活躍するための力(社会人基礎力)を伸ばすのにうってつけのツールであったりします。したがって、研究者になりたい学生も就職する学生も、卒業後に社会で活躍できる力をつけてもらうためにも、研究を通じて知的スキル、社会人基礎力を磨いてもらえるような研究室運営をしているつもりです。

もちろん、スゴい研究を一緒にできれば嬉しいです。僕自身はスゴい研究をしたいと思っています。しかし、上で述べたように、スゴい研究をすることを研究者と同じレベルで学生に求めると、研究者になりたいわけではない学生は辛い思いをすることになるしょう。研究室運営、学生の教育に対しての考え方は人それぞれですが、「研究を通じて知的スキル、社会人基礎力を磨いてもらうこと」が、結果的に「スゴい研究が生まれること」につながると信じています。

研究テーマの決め方 〜 山本研でできること

研究室に入ったら何を研究するのか、できるのか?研究室選びにおいて、研究テーマは重要な判断指標のひとつですよね。研究テーマで山本研を選ぶ場合、自分の興味関心が「何を研究している研究室なのか?」で説明した内容のどこかに関連しているかを確認してください。山本自身の興味関心や研究テーマに関心があればOKです。もし山本自身の興味関心や研究テーマに直接関心がなくても「研究活動に関連するキーワード」のどれかに関心があれば、それもOKです。例えば「情報の信憑性は別に興味はないけど、情報検索システムは作ってみたいんだよね〜」という場合でもOKです。

研究室が決まったら、研究テーマはどのように決めるのか。研究テーマの決め方は研究室によって様々です。教員がテーマを決める研究室もありますし、学生にテーマを考えてもらう研究室もあります。まったく新しい研究テーマに取り組んでもらう場合もあれば、これまで研究室で行ってきた研究テーマを引き継いでもらうこともあります。

では、山本研究室はどうか?昨年度は学生主体でテーマを決めてきました。具体的には、

  • 学生の興味関心を聞きながら、
  • それに合いそうなテーマを教員側からいくつか提案し、
  • 気になるものがあればそれを修正しながらテーマを決定する

という方針で進めました。今年度は昨年度のやり方を踏襲しつつも、僕がいくつかテーマを用意して、その中から選ぶというオプションも考えています。もちろん、学生側からピンポイントで「こんなテーマをやりたい」と提案してもらっても構いません。むしろ大歓迎です。研究を進めるうえで、個人のモチベーションは重視するべきことの一つですから。

楽 or キツい?

研究はテストとは異なり、答えがない or 答えが分からない問題を扱います。学生の皆さんは、これまでの学校生活において、答えがない問題について考える機会はあまりなかったと思います。研究では答えは自分で探す必要がありますし、場合によっては答えを見つける方法すら自分で作る必要があります。研究経験の乏しい学生にとっては、卒業研究はストレスを感じる活動になることでしょう(逆に、誰も答えを知らないので、好き勝手に色々できるという醍醐味があります)。そういう意味では、どこの研究室に配属されても、楽すぎることはないと覚悟してください。誰でも必ず一度は何らかの試練が訪れることでしょう。

研究活動は大学の卒業要件の1つです。また、「研究室の研究・教育方針」でも触れたように、山本研では「研究を通じて知的スキルや社会人基礎力を鍛える」ことを重視しています。ですので、山本研究室が楽かキツいかと問われれば、楽ではないと答えます。とは言っても、スパルタ教育をしたり、結果が出ないからといって理不尽にキレたり… ということはしません。「研究室に入って色々学びたいんです」「社会に出ても問題ない能力を身につけたいんです」という気持ちがあれば、適度に自分に負荷をかけながら充実した研究室生活をおくってもらえると思います。

山本研究室を選ぶデメリット

当研究室を選ぶ最大のデメリットは、研究室に先輩学生が少ない、研究室の歴史が浅いことかと思います。僕の研究室は設立して2年目で、現在学生は4年生が6名しかいません。一般的に、大学研究室には教員スタッフや秘書さん以外に、学部生や大学院生がいます。教員は講義や学内の会議、出張等で研究室にいないこともあるので、必然的に学生が中心になって研究室生活が展開されます。自分の研究、就職活動、人間関係など,何か相談したことがあった時、まず頼るのは先輩学生です。研究室のイベントを企画・運営するのも、ふつうは先輩学生です。ところが、山本研究室にはみなさんの先輩となり得るのは6名の4年生だけです。歴史が浅く、研究室の文化や環境も発展途上です。OB/OGもいませんので、就職活動で得られる情報も他研究室よりも少ないかも知れません。これが山本研究室を選ぶ際の最大のデメリットになりえるでしょう。

山本研究室を選ぶメリット

先輩が少ない、研究室の歴史が浅いことを補うメリットとしては、僕は(他の忙しい先生方に比べ)時間的リソースに比較的余裕があるということです。研究の経験が乏しい学生が研究をうまく進めていくためには、教員(研究者)の知恵・スキルをうまく使うことが重要となります。教員が忙しいと学生と接する時間が少なくなります。教員と接する時間が少なくなると、何をしたらよいか分からない学生は不幸になる可能性が高いです(学部生の時の僕がそうでした)。幸い、まだ山本は時間的余裕があります。研究室に先輩学生がいないので、学生一人あたりにかけられるリソース(時間、研究費etc)が多いこともプラスに働くかもしれません。

上記以外で考えられる山本研究室を選ぶメリットを以下に記します:

  • スタッフ(山本)が比較的若く、コミュニケーションがとりやすい
  • 山本研究室2期生として、発展途上である研究室の文化や環境、雰囲気を作ることに関われる