LeetCodeを始める

研究室の学生がLeetCodeの自主勉強会を始めた.LeetCodeとは知る人ぞ知る,コーディング面接対策のウェブサイト.様々なアルゴリズムの課題がリストアップされているのだが,GAFAなど有名IT企業のコーディング面接で出題された課題が掲載されているのが興味深い.

GAFA就職を目指すわけではないが,暇つぶしのためにLeetCodeにチャレンジしてみることにした.学生はアルゴリズムではなくSQLの課題に取り組むそうなので,僕もまずSQLの課題にチャレンジしてみた.

SQLの課題ということで少々舐めていたが,やり応えがある.コーディングの勉強といえば,ついついアルゴリズムに目が行ってしまうのだが,SQLもなかなか面白い.なんとか解けたとしても,模範解答を確認すると,自分が意識していなかった構文があったりして勉強になる.

下記のようなEmployeeテーブルから2番目に高い給与額を返すSQLなんかは,自分で解いたときは結構ややこしいSQLを書いたのだが,OFFSETなる便利なものがあるんですね.全く知りませんでした…

+—-+——–+
| Id | Salary |
+—-+——–+
| 1 | 100 |
| 2 | 200 |
| 3 | 300 |
+—-+——–+

[論文読み] The Language that Gets People to Give: Phrases that Predict Success on Kickstarter

出典:Tanushree Mitra and Eric Gilbert: The language that gets people to give: phrases that predict success on kickstarter. In Proceedings of the 17th ACM conference on Computer supported cooperative work & social computing (CSCW ’14), pp. 49–61 (2014).

URA時代に見つけて概要と図表くらいしか読んでなかったが,最近学生が始めた研究の進め方に参考になりそうだったので,引っ張ってざっと読んでみた.

概要

この論文では,KickstarterなどのAll-or-nothing型のクラウドファンディングにおいて,融資達成の成否と広報の文言との関係を分析.Kickstarterで融資募集された45000件のプロジェクトの紹介ページの内容とプロジェクトの成否(融資が満額達成されたか)との関係分析した結果,融資が達成されたプロジェクトでは,返報性の原理や希少性アピールなど,説得的心理作用をもつ文言をもってプロジェクトが紹介されていることが多いことを明らかにした.

研究のウリ

スモールビジネスを成功させる方法として活用が広がりつつクラウドファンディングにおいて,融資を成功させる広報文の具体的な特徴を,自然言語解析と説得コミュケーションの観点から明らかにした点.

既存研究の問題点

社会学的な観点からクラウドファンディングが普及しつつある理由を分析する研究,機械学習的なアプローチによってプロジェクトの成否を予測する研究は行われている.しかし,プロジェクトを成功に導く具体的な方法論をコンピュテーショナルに分析,検討した研究事例は少ない.

分析方法

クラウドファンディングサイトの最大手であるKickstarterのプロジェクトページをクローリングし,45000件のデータを取得.取得したデータは,融資目標金額やビデオの有無等のプロジェクトの定量的な情報に加えて,プロジェクト紹介文と融資者への返礼に関する記述が含まれる.

取得したテキストデータをuni-gram,bi-gram,tri-gramデータに変換.汎用的な言語特徴を取得するために,50回以上出現し,かつすべてのカテゴリに出現する20391フレーズのみ分析の対象とした.

上記フレーズ情報(20391種類)および融資目標金額,ビデオの有無,コメント数,更新回数等の定量情報(59種類)を説明変数に,プロジェクトの成否を目的変数として正則化ロジスティック回帰モデルを構築.

結果

  • 定量情報のみを用いるよりも,言語情報を併せて利用した方が推定性能は高い(Error rate 17% vs 2.4%).
  • 定量情報の中では図やイラストの有無の寄与率が高い(表5)が,定量情報よりも言語情報の方が予測寄与度が高い(beta coefficient)
プロジェクト成功の予測に対する非言語要因の影響度(偏回帰係数).論文の表5を引用.
プロジェクト成功の予測に対する非言語要因の影響度(偏回帰係数).論文の表5を引用.
  • 融資者に対する便益の返報を強調するフレーズ(例:also receive twoやwe can afford),希少性を協調するフレーズ(例:option is …や you are being given the chance),社会的証明を刺激するフレーズ(例:X have pledged),共同体意識を刺激するフレーズ(例:accessible to the X community)などは,プロジェクト成功につながりやすい(図6).
成功プロジェクトに特徴的に出現するフレーズ"pledgers will"の言語パターン・論文の図6を引用.
成功プロジェクトに特徴的に出現するフレーズ”pledgers will”の言語パターン・論文の図6を引用.
  • 消極性をにじませるフレーズ(例:not been able),不確実性をにじませるフレーズ(例:possibly hope to get)は,プロジェクト失敗につながりやすい

感想

単なる大規模言語解析に留まらず,得られた結果に対して社会心理学的な解釈を与えている点が面白いが,この知見を今後どう利用するのかポイントか.

イントロに書かれているようにスモールビジネスにはクラウドファンディングは有益だし,その手のビジネスに関わる人は広報のテクニックに習熟しているわけではない.プロジェクト自体は有意義にもかかわらず,プレゼンテーションで失敗しているのは大変もったいないので,そういう人々に「伝えるための方法論」を磨く機会を提供することは重要である.

だからといって,この研究で明らかになったフレーズを使って説明文を書けば,プロジェクト達成できると思い込むのは浅はか.投資を説得するためのテクニックは必要であるが,how-toの背後にある哲学を押さえなければ,言葉は上滑りする.この論文の表層的な知見に振り回される人が出てこないことを望む.人を動かすには,伝え方だけでなく,中身を充実させることも重要であることは言うまでもない.

情報処理学会論文誌データベース(TOD85)に論文が採択されました

兵庫県立大学の山本岳洋准教授,Yahoo! Japan研究所の藤田澄男さんとの共同研究の成果として,下記の論文が情報処理学会論文誌:データベース(IPSJ-TOD85)に採択されました.

山本 岳洋 (兵庫県立大学), 山本 祐輔 (静岡大学), 藤田 澄男
(ヤフー株式会社):「信頼できる情報獲得に対する心がけとウェブ検索行動の分析」

後日,詳細な書誌情報を掲載する予定です.

RSSで特定カテゴリの記事を配信しないように設定

プライベートな記事は管理者しか閲覧できないカテゴリで書いていたのだが,RSSフィードではすべての記事が配信されていたようだ.心ある先輩がわざわざ教えてくださった.多謝です.

さて,WordPressにて特定カテゴリの記事をRSSフィードに表示させないようにするには,以下のコードをfunctions.phpの末尾に追加すればOKのようだ.ウェブ上に転がっているコードを少しだけ変更.同じことで困っている人の役に立てば幸い.

 

ウェブサイトをSSL対応に

2020年にもなるのに,未だにSSL対応していなかった本ウェブサイト.重い腰を上げて,ようやくSSL対応した.

  • SSL証明書の発行
  • 証明書の更新の自動化
  • HTTPからHTTPSへのリダイレクト設定

をサクサク終わらせる.やればすぐ終わるのに,なぜ今まで手を付けなかったのか?怠慢である.

Let’s Encrypt様,今後ともどうぞよろしくお願いします.

 

iiWAS2019に論文が採択されました

研究室の学生(修士1年生)である梅田浩郎君,中野裕介君との共著論文がthe 21st International Conference on Information Integration and Web-based Applications & Services (iiWAS2019) に採択されました.論文情報は以下の通りです:

論文は2019年12月にACM Digital Libraryで公開予定です.

WebDB Forum 2019にて最優秀論文賞を授賞

2019年9月8 – 9日に東京で開催されたWebDBフォーラム2019にて,兵庫県立大学の山本岳洋准教授との共同研究である「批判的なウェブ検索を促進するクエリプライミング」に関する論文が最優秀論文賞に選ばれました.

WebDBフォーラム最優秀論文賞は,情報処理学会論文誌:データベース(TOD)で採択された一般論文およびテクニカルノートの中で,最も優れた論文に与えられる賞です.

論文情報

山本祐輔, 山本岳洋
批判的なウェブ検索を促進するクエリプライミング
情報処理学会論文誌: データベース (TOD80), Vol.12, No.1, pp.38-52, 2019年1月.

ACM CIKM 2019に論文が採択されました

京都大学の山本岳洋准教授との共同研究 “Analyzing the Effects of Document’s Opinion and Credibility on Search Behaviors and Belief Dynamics” がACM CIKM 2019にフルペーパーにて採択されました。

本論文では、検索開始時にユーザが有する信念に反する情報を検索結果上位に表示することで、批判的なウェブ情報検索を促す検索インタラクションの設計について分析を試みています。

後日プレプリント版論文や発表資料をアップする予定です。

WISE 2019 に論文が採択されました

研究室の学生(修士1年生)である齊藤史明君との共著論文”Highlighting Weasel Sentences for Promoting Critical Information Seeking on the Web”がthe 20th International Conference on Web Information Systems Engineering (WISE 2019) にフルペーパーで採択されました。

論文情報は下記の通りです.

Fumiaki Saito, Yoshiyuki Shoji and Yusuke Yamamoto: Highlighting Weasel Sentences for Promoting Critical Information Seeking on the Web, Proceedings of the 20th International Conference on Web Information Systems Engineering (WISE 2019), Hong Kong, China, November 2019 (52/211 = 24.6%)

2019年度の研究室配属学生が決定

研究室配属調整の結果,2019年度に山本の主宰する研究室に配属される3年生が決定しました.今年は行動情報学科から3名,情報社会学科から1名の学生が配属されることになりました.

2019年の後期から外国人の留学生が1名来る予定もあり,今年度後期から学生14名,教員1名の体制で研究室活動を行っていくことになります.

大変です.