2020年6月10日に開催された人工知能学会全国大会(JSAI)2020企画セッション「忘却するWebの実現に向けた認知的・経済的アプローチ」にて,ウェブ検索エンジンのパーソナライゼーションの顕在化が検索閲覧行動に与える影響について発表を行いました.
発表内容は2020年8月にJCDL2020にて発表する内容のダイジェスト版となっております.
気づきの情報インタラクションデザインの研究をしている人
2020年6月10日に開催された人工知能学会全国大会(JSAI)2020企画セッション「忘却するWebの実現に向けた認知的・経済的アプローチ」にて,ウェブ検索エンジンのパーソナライゼーションの顕在化が検索閲覧行動に与える影響について発表を行いました.
発表内容は2020年8月にJCDL2020にて発表する内容のダイジェスト版となっております.
今年度も研究室配属の時期がやってきました.今年はまだ学生へのメッセージを書いていないのですが,研究室紹介イベントに関する最低限の告知はやっておく必要があるので,以下に記します.山本の研究室に関心のある学生さんは,以下のページを見てください.
大学の電灯の草むらの中に,錆びた杭のようなものが埋もれていた.まとまった数の杭が向きを揃えて置かれていることを踏まえると,捨てられたわけではないようである.
ここで何があったかを思い返してみた.学期の始まりには立て看板が立っていたような気がするので,それを固定するために使われたのかもしれない.期間は空くが,立て看板は定期的に立てられるので,毎回の使用したらここに杭を置いては次回使うようにしているのだろうか.
すでに草がけっこう生えているが,夏が来ると来ると結構な量の草が生えてくる.毎年どなたかが草刈りをしてくださっているが,草刈りのタイミングでも杭が片付けられていないことを踏まえると,ここに杭を放置することはここを管理する人々にとっては公然の秘密なのかもしれない.
何度やっても忘れてしまう主成分分析(PCA)と特異値分解(SVD)の関係性.忘れてしまうのは分かっていないから.ということで,再度お勉強.
長らくあやふやにしてきた主成分分析の中心化問題.今回の勉強で「主成分分析では事前にデータを中心化する必要がある」ことがようやく理解した.
なぜ中心化が必要か?それは,主成分分析が重心を中心に元データを回転させることで,新たな軸を見つける操作だから.中心化をしないと,元データは原点を中心に回転されてしまう(注:中心化しなくても,主成分分析っぽい導出はできてしまうが,これではダメなのだ(参考:主成分分析 (2) – 主成分の導出と意味)).これでは主成分分析のコンセプトから逸脱してしまう(この理解に至るまで時間がかかった(参考:回転の中心 – 何を基準に考えるか)).
ちなみに,scikit learnのPCAは事前にデータを中心化しなくても,内部で勝手にデータを中心化してくれるようである.一方で,scikit learnのSVDは,データは自動的に中心化しない.SVDは単なる行列分解手法だから,主成分分析を目的としない特異値分解をしたいときに勝手に中心化されても困る.scikit learnでPCAメソッドを使わずに,SVDを使ってPCAを行うときは,対象となる行列を事前に中心化する必要があることに注意.
なお,文書-単語行列の次元圧縮手法である潜在的意味解析(LSI)もSVDを用いるが,LSIでは元データの中心化は行わない.理由は参考サイトにも書かれているように,文書-単語行列はスパースであるため,中心化すると計算量が膨大になること.また,文書ベクトルの類似度は角度が重要であることから,中心化するとその情報が保存されないことが理由だそう(参考:Latent Semantic Indexing and Data Centering).参考サイトにも書かれていたが,文書行列はもともとスパースなので,各次元の平均値はそもそもゼロに近い.これら理由より,LSIでは中心化は行わないようである.
参考にしたサイトの一覧:
コロナ禍の過ごし方について学生と雑談をしていたとき,学生Aが興味深い取り組みを語ってくれた.Aさんは大切な人Bさんと手紙を始めたそうだ.なお,Aさんは普段手紙は書かない.手紙を書くのも久方ぶりであるとのこと.AさんとBさんは,緊急事態宣言下で会えないほど遠いところに住んでいるわけでもない.にもかかわらず,手紙を書くことにしたというのだ.良い取り組みだと思った.
新型コロナウィルスの問題で人との接触を避けざるを得なくなった今,コミュニケーションのために多くの人がとったアプローチは「インターネットを使ったビデオ通話」である.確かにZoomやWebEx,あるいはもっと手軽なLINE通話などは,ネットさえあればすぐに起動し,リアルタイムに相手の顔を見ながら話をすることができる.対面では会えないけど,手軽に相手とコミュニケーションをとるには有力な方法だ.
一方で,この手のビデオ通話に疲れも感じてきている.ビデオ通話を使えば,手軽にミーティングができることに気づき,ホイホイと予定にミーティングが追加される.気付けば,3時間連続で6つのミーティングが入っている.目的の決まったビデオ会議は,始まりから終わりまであまり余白がない.そして,対面のコミュニケーションと比べて微妙に足りないものに引っかかりを感じる.ビデオ通話は時間的・空間的距離を縮める.直接会って話をすることができない状況を打破するために,ビデオ通話は可能な限りオフラインコミュニケーションを置き換えようとするが,かえってそれがストレスを感じさせる.
手紙はどうだろうか.届くのに時間がかかる.手紙を読むときに相手の顔が映っているわけでもない.即座に相手に返答をすることもできない.ビデオ通話より伝えられる情報は限られる.明らかに手紙は「今風」のリッチなコミュニケーションは演出できない.しかし,あえて限られたスペースに情報を詰め,あえて時間をかけてコミュニケーションをとる手紙は,1回1回のコミュニケーションを味わい深いものにしてくれる.相手からの手紙を待つ楽しみも生まれる.何を書こうかと考える楽しみも生まれる.
メールやLINE,SNSは,即座にコミュニケーションを取れて便利である.一方で,すぐに反応しないといけない強迫観念にせまられることもある.無駄なコミュニケーションも増えたような気もする,便利さ故に,使う側の精神がすり減っていることも事実である.こんな状況だからこそ,手紙をすることで,時間の使い方・感じ方をゆっくりだが味わい深いものにできるかもしれない.大切なものをより大切に感じられるようになるかもしれない.手紙のスローなインタラクションが一層素敵に思えた.
研究室の学生とZoomで絵しりとりをした.割と楽しめたのだが,僕が聞いたこともないルールを学生が使っていたことに驚いた.そのルールとは「1文字OK」である.例えば,「するめ(イカ)」と答えた人がいて,次の回答として「め(眼)」を許すというルールである.
しりとりというゲームは,前の人が言った単語の最後の文字から始まる別の単語を考えて,数珠つなぎのように楽しむゲームだから,前に進まない1文字の回答はナンセンスだし,NGルールだと思っていた.ウェブを調べてみると,そういうルールを設ける場合もあるが,Wikipediaを見る限りでは厳格にルールとして設けられてはいないようである.なんだか納得がいかないw
ところで,Wikipediaを読んでいて面白い情報を見つけた.日本語には「る」で始まる単語が極めて少ないそうだ.そのため,「る」で終わる日本語をたくさん知っておくこと,「る」で始まる外国語の単語をたくさん知っておくことが重要であるそうだ.なるほど.
RTX830が使えない問題について,原因が見つかった.自宅に届いたルーターは,RTX830ではなくRTX830MBだったのだ.RTX1210にはなかったシールが貼られていることは気になっていたのだが,見た目もまったく変わらないし,正確な型番表現にはMBがつくのかもくらいにしか考えてなかった.
どうもこのMBが曲者らしい.調べたところによると,RTX830MBは,第一興商という会社が販売しているカラオケ機器のDAM向けのルーターで,RTX830のOEMだそうだ.問題はファームウェアをDAM用に改造してあること.RTX830のマニュアルに従っても,管理画面に入れないことに合点がいく.某掲示板によると,ある操作をすればRTX830の状態に戻るそうだが,その方法は社内秘だそうだ.
僕がRTX830MBを注文していたのなら確認不足を反省するが,注文明細を見直したところ,確かにRTX830を注文している.問題に気付いたので,すぐに返品センターにものを送ったが,こちらの非で返金できないという結果になったら,たまったもんじゃない.
バーチャル会議システムRemoを使って見ることにした.遠隔会議にはZoomを利用しているが,どうしてもプレゼンス感が足りないし,何よりもフラット他人と雑談する気にならない.
Remoは,丸テーブルが複数台並んでいるバンケット会場のようなUIを持っており,同じテーブルに座らないとビデオも音声も使えないという仕掛けが面白い.隣のテーブルに誰がいるかは見えるようになっているので,ちょっと会話を変えてみたいと思えば移動すればよいのだ.
会場全体に話しかけたいときは,画面上部のステージに移動する.そうすれば,各テーブルでの会話を強制終了させ,全体にビデオと音声を届けることができる.
非常に良くできた仕組みになっているのだが,弱点は利用料金が高いこと.なんと月額50ドル.これを使えば研究室メンバー間でのコミュニケーションが増えるのであれば,対面でのコミュニケーションができない今であれば支払うのはやぶさかではない.
改正著作権法により,オンデマンド動画配信等を用いたオンライン授業において,他人の著作物を利用する際の条件が緩和されることになった.SARTRASという団体に補償金さえ支払えば,著作者の許諾を得ることなく著作物を使った授業資料を使ってオンライン講義することが可能になる.
緩和されたとはいえ補償金は支払わないといけないため,教育現場としては他人の著作物を利用したオンライン授業に躊躇してしまう.ところが,この度新型コロナウイルスの件もあり,2020年度は補償金ゼロとする特例措置がとられる準備が進んでいるそうだ(参考).在宅学習用に急遽学習資料を作らないといけない状況なので,この措置が実行されれば非常に助かる.
とはいっても,他者の著作物を利用したコンテンツに不特定多数の人がアクセスできるようにしてしまうのは禁じられているので,受講生のみがアクセスできるようアクセス制限をかける必要はある.