情報検索タスクにおける評価指標を更新中

学生に検索タスクの設計を宿題として出すと「どんな指標があるのか知りたいです」と聞かれるのだが,ランキング指標や行動指標,アンケート指標など,色々な観点から用いるべき指標を検討する必要がある.自分でも実験を設計する度にどんな指標を用いるべきかを迷うことがあるので,以下にまとめてみた.徐々に更新する予定.

情報検索タスクにおける評価指標

 

高柳研究奨励賞を受賞

本日,浜松電子工学奨励会より高柳研究奨励賞を受賞しました.高柳研究奨励賞はテレビの父として有名な高柳健次郎氏に因んだ賞であり,静岡県及び静岡県に関連をもつ個人又は団体に対して,電子科学に関する将来有能な研究者の研究を助成する目的の賞(だそう)です.

受賞研究題目は「批判的なウェブ情報探索を促す情報インタラクションデザインに関する研究」で,電子科学ど真ん中の研究ではないのですが,受賞を励みにこれからも研究に励みたいと思います.

かけがえのない

「かけがえのない」という言葉は「かけがえ」がないという意味だろうが,そうであるならば「かけがえ」とはどういう意味でどんな漢字を書くのか,ふと気になった.

「かけがえのない」は代わりが利かないという意味だから,「かけがえ」は代替という意味だろう.そうならば,かけがえの「かえ」は「替え」だろう.では「かけ」はどんな漢字だろうか.思いつかない.

調べてみると,かけがえは「掛け替え」だそうだ.そしてその意味・語源は分からない,そうだ.

「かけがえのない」とは,意味がわからない言葉から成る言葉であった.

JCDL2020参加報告

2020年8月1日から5日までの間,オンラインにて開催された,ACM/IEEE Joint Conference on Digital Libraries (JCDL) 2020に参加してきました.JCDLは,デジタルライブラリに関する主要な国際会議です.一般的な計算機科学の国際会議との大きな違いは,研究者・技術者以外に図書館員の方も参加されているのが特徴的です.デジタルライブラリというと図書館をイメージしますが,JCDLでは情報検索やデータマイニング,HCI,デジタルヒューマニティーズ,インターネットプライバシなど,情報アクセスシステムの理論と実践にかかるトピックを幅広くカバーしています.

JCDL 2020は,当初6月中旬に中国は武漢で開催される予定でした.しかし,COVID-19の影響を受け,開催地がいったんは西安に変更され,最終的にはオンライン開催になりました.例年JCDLは北米,ヨーロッパ,アジアと世界中の様々な国から参加者が集まりますが,今年度は発表件数はFull paperが33件(採択率31%),Short paperが28件(採択率31%),ポスター・デモが48件とそれほど規模が大きくなかったため,実行委員会の配慮で地域ごとにセッションがまとめられました.そのおかげで,日中の時間帯に自身の発表が行うことができ,肉体的には楽でした.一方で,ヨーロッパや北米の方の発表の多くは,ヨーロッパ時間・北米時間の日中(日本時刻で深夜・早朝)に行われていたため,積極的に聴講することはなかなか難しかったです.オンラインでの学会開催の難しさを感じました.

本年度のJCDLは,以下のようなセッションがありました:Scholarly Communication,User in Search,Digital Libraries,Scholarly Knowledge,Document Classification,Natural Language Processing,Web Archive,Digital Humanities,Domain Specific Applications,Scholarly Data,Content Annotation,Search and Recommendation,Network and Learning,Neural Semantic Representation, Practitioner.ご覧の通り,幅広いトピックについて研究発表が行われたのですが,科学技術論文のコンテンツ・ネットワーク解析による知識獲得セッション(Scholarly X)が複数あることに目を引かれました.また,図書館員の方々が実践報告を行うPractitionerセッションにデジタルライブラリの学会らしさが感じられました.

私はUser in Searchというセッションで,下記発表を行いました:

Yusuke Yamamoto and Takehiro Yamamoto: “Personalization Finder: A Search Interface for Identifying and Self-controlling Web Search Personalization”. https://doi.org/10.1145/3383583.3398519

この研究では,ウェブ検索中のユーザがウェブ検索結果のパーソナライゼーションの影響を認識し,調整することを可能とする検索インタフェース“Personalization Finder”を提案しました.私の研究グループが事前に行ったユーザ意識調査では,ウェブ検索ユーザの多くは,意見の分極化の原因になりうるウェブ検索結果のパーソナライゼーションが政治トピックに対して行われることを懸念していることが明らかになりました.その一方,一般的なウェブ検索エンジンでは政治トピックに対する検索結果パーソナライゼーションが行われているにも関わらず,多くのユーザがそのようなパーソナライゼーションはあまり行われていないと思っていることも明らかになりました.この結果を踏まえ,自身が閲覧しているウェブ検索結果リストのうちパーソナライズされている結果をあえて可視化し,パーソナライゼーションによって逆に見えなくなってしまった結果を確認できるインタフェースを設計し,それらがユーザの検索行動に与える影響を分析しました.ユーザ実験の結果,特に政治トピックの検索時において,提案インタフェースを用いると,ユーザは客観的に情報を収集するべく,検索結果リストをより長く閲覧するようになり,より下位の検索結果を閲覧するようになることを明らかにしました.幸運なことに,本論文はBest Paper Awardに選ばれました.

JCDL2020に参加報告の執筆依頼をいただいた際,トップカンファレンスに採録されるための工夫・苦労した点について記してほしいとのご要望をいただきました.採録のための秘訣についてはこれまでも優れた研究者の方々が語ってくださっていますし,私自身はそれを語れるほどの経験はありません.ですので,大層なことは言えませんが,「不採択を恐れずトップカンファレンスに論文を投稿して,査読者から有益なフィードバックをもらうこと」は有効だと思います.

トップカンファレンスは査読者の質も相対的に高いため,論文を改善したり,研究をより良い方向に進めるために有益なフィードバックがたくさん得られます.実は今回の採択された論文は, ACM CHIという別のトップカンファレンスに投稿して不採択になった論文をブラッシュアップして再投稿したものです.レビューコメントは大変痛烈で,不採録判定による傷心状態で読むのは気が滅入ります.しかし,数日寝かせて読み直すと,どのコメントも鋭く的を得ているものばかりでした.それを改善すれば確実に研究が進展します.おかげさまで,レビューで指摘された穴を一個一個つぶしてアップデートした論文は,JCDL 2020に採択されました.不採録通知を受け取ることはショックですが,採択率からすると大抵のひとにとって不採録はデフォルトです.良質なレビューコメントをもらって論文と研究をアップデートし,めげずに投稿し続けることが,ターゲットとする国際会議に論文を通す近道だと,リジェクトの結果に凹んでは自分に言い聞かせています.

 

わたしは鼻があまりきかない.他の人が感じている匂いを感じられていないことはしばしば.自分の鼻のききが悪いことに気付いたのは,結婚して妻と生活するようになってからであった.

周りの人と同じ世界を認識していたつもりが,実はそうではなかったのである.とはいえ,鼻のききが悪いことに不自由はしていない.まったく匂いを感じれないわけではないし,匂いのもとと距離を詰めれば,それなりに匂いを感じることはできる.

自分の感じる匂いが果たして正しい匂いなのか,他の人が感じる「真」の匂いが一体どんなものか,気になることも多少はある.けれども,そのことに悲観はしていない.むしろ,受け取る嗅覚情報が他者とずれているにもかかわらず,これまで不自由も問題もなく生きてこられたことに驚きを感じるのである.

論文執筆のためのチェックリスト

今年も卒論シーズンがやってきた.静岡大学に移ってから数年経つが,年々学生数が増加し論文指導に首が回らなくなってきたため,明治大学の中村聡史先生の取り組みを参考に,論文執筆のためのチェックリストを作成してみた.チェックリストの中身も重要だが,これを使って学生同士でチェックし合ってからでないと教員はチェックしないという仕組みも重要かと思う.

作成したチェックリストは分量が多いので,様子を見ながら適宜内容を調整するようにしたい.

論文執筆のためのチェックリスト

具体と抽象

研究室の学生に具体と抽象の話を学んでもらう材料を探しのために,Amazonで高評価を集めていた「具体と抽象(細谷功著)」を読んだ.

内容は「具体」と「抽象」の意味やその特性を,実例をもって分かりやすく語るというも.本自体が具体と抽象を行き来する構成となっている.

オブジェクト指向を学んでいれば,本の内容のほとんどはそれのエッセンスであることに気付く.ただし,オブジェクト指向を「クラスや継承,カプセル化とか使うプログラミングの手法」としか見れてない人は,この本を読んでも「具体と抽象」とは何かが分からないだろうなと思う.

具体と抽象の話が分かる人にとっては,本書の内容はそれほど新鮮ではないが,個人的に得るものがあったのは「具体と抽象が分からない人とのつきあい方」に関する章である.具体の世界で生きている人に本質を抽出した抽象論の話をしても,「曖昧なことを言っていて分かりにくい」と思われてしまう.そもそも,具体の世界でのみ生きている人は,具体と抽象を行き来することが難しい.そのため,具体とセットとしてその抽象の話をしても,その間の関係性が捉えられない.分かりやすく具体と抽象をセットに話していたとしても,別のことを話しているとすら思われてしまうのである.具体を豊富にしても,抽象を捉えられなければ,具体のみで生きる人と抽象の世界と行き来している人の間を埋めることはできない.ジレンマである.

本書を読んで誤解を受けそうだなと思ったのが,「抽象度と本質度の関係」である.本書では抽象的にものごとを考えること(プラス,具体と抽象の行き来)の重要性を説いているため,どうしても「抽象化は素晴らしい」「抽象化された内容は本質を捉えている」という印象を与えてしまう.しかし,抽象度と本質度(価値)はイコールではない.抽象的でも本質的でない事柄は存在する.抽象度を上げすぎて,当たり前のことしか言えていないケースもちょくちょく遭遇する.一方で,具体的でも本質につながることは存在する.

(これは本書でも述べられているが)そもそも,具体と抽象は相対的な関係である.重要なことは,具体と抽象を行き来しながら,適切なレベルで抽象化を行い,その中から議論の価値がある本質的な事柄を選べるかだと思う.

三重Go To Eatキャンペーンマップ

研究室の学生が浜松市のGo To Eatキャンペーンをやっているお店をまとめた地図を作っていた.それに触発されて,三重県版Go To Eatキャンペーンマップを作ってみた.データソースはこのサイト(公式の三重Go To Eatキャンペーンのウェブサイトからリンクされているが,ドメインが異なるが気にはなる…).

データをスクレイピングして,Google Mapsにマッピング.近所にキャンペーンをやっている店があるか,少しはわかりやすくなった.実家のまわりではキャンペーンをやっている店が少なかったのが残念.

Google Mapのサイト上で見るにはこちらのリンクを参照.

抽象的 != 本質的

学生とミーティングをしていたときのこと.学生の提案内容が本質的でなかったので,そのことを指摘したところ,「抽象化したつもりだったのですが…」と言われた.この学生は「抽象的 = 本質的」だと思っていたようである.

言わずもがな,抽象度と本質度は独立した概念である.抽象的であっても本質的でないことはたくさんあるし,具体的で本質的な意見もたくさんある.どうしてこのような勘違いにいたったのだろうか?

何をもって本質的であると考えるかは,対象となる問題を理解できているかが重要と思われる.問題の理解には具体と抽象の行き来も必要.本質的であることと抽象的であることが違うということが分かってないとすると,具体と抽象の違いの理解も怪しそう.そうなると,問題の理解にはまだまだいたらなさそう.

Zaim APIの痛いところ

資産管理のために,銀行口座や証券口座の残高変動のログを記録しようとZaim APIを触り始めた.PythonからZaim APIを利用し,取得したデータをGoogle Spreadsheetに記録し続ける,ということを想定していたのだが,痛いことに気付いた.Zaim APIで取得できるデータは「銀行口座」に限るようだ.証券口座のデータにはアクセスできない.

証券口座の商品の変動こそ記録に残しておきたかった. Zaimのアプリ本体では,銀行,証券,クレジットカードの種類に限らず,どれでもデータが見れるので,問題ないと思っていたのだが… 結局証券のウェブサイトをスクレイピングして… ということになりそう.