名古屋市立大学データサイエンス学部で開講している講義「データベース」の講義資料を下記URLに公開しました.ご関心のある方はご活用ください.
日本データベース学会若手功績賞を受賞
2024年3月5日に開催された日本データベース学会年次総会にて,2023年度日本データベース学会若手功績賞を受賞しました.本賞は,データベース分野およびその関連分野における優れた研究実績に加えて,学会活動への多大な貢献が認められた若手研究者に贈られるものです.
賞の名称
日本データベース学会若手功績賞
授与団体・学会
一般社団法人 日本データベース学会
受賞者名
山本 祐輔(名古屋市立大学)
受賞日
2024年3月5日
関連リンク
華やかなデータ分析の裏側:バッドデータとの奮闘
ビッグデータ分析の世界がとても華やかなものに思われている方がいらっしゃるかもしれません.しかし,実際のビッグデータ分析は極めて泥臭いものです.機械学習や数理モデリングといった「花形」分析技術を使うのは,データ分析プロセスの中でもほんの一部.データ分析の大半は,収集したデータの「前処理」に費やされます.
では,なぜデータの前処理に時間がかかるのでしょうか?よくある原因の1つは,分析のために用意したデータが「バッドデータだったから」です.バッドデータとは,コンピュータで分析するときに邪魔になるデータの俗称です.例えば,
- フォーマットや単位が異なるデータが混じっている(図1a)
- 空値は想定されていないにもかかわらず,空欄になっているデータがある(図1b)
- 1つのマスに複数のデータが入っている(図1c)
といったものが挙げられます.このようなデータが混ざっていると,データ分析中にエラーやおかしな結果が出たりして,有意義なデータ分析が行えなくなります.とはいえ,バッドデータも質を改善できれば,ビッグデータとして活かせる可能性はあります.ですので,分析者は投げ出したい気持ちを押さえながら,時間を割いてバッドデータをキレイにするのです.
ところで,人間には使いやすくても,コンピュータには扱いづらいデータも存在します.その例が,図2のようなExcelを方眼紙のように使って作られたデータです.この種のデータを大量に分析する場合,分析者の苦労がまた一つ増えることになります.なぜなら,どのマス目が何を意味しているのか,人間が逐一定義しなければ,コンピュータはデータの意味を理解できないからです.コンピュータは人間のように空気を読んでデータを見てはくれないのです.
ビッグデータ分析は「21世紀で最も素敵な仕事」と言われることもありますが,実はかなり地味な側面も持ちあわせているのです.
第3回名古屋市広域連携に関する研究会で招待講演を行いました
2024年1月31日に開催された名古屋市広域連携に関する研究会で招待講演を行いました.タイトルは「ビッグデータ x AI = DX?」です.
独自ドメインでGmailからメールを送信する場合,DKIM設定が必要
独自ドメインでGmailからメールを送信する場合,DKIM設定が必要
新しい職場のメールを,自分のGoogle WorkspaceのGmailで読み書きできるようにした.うまく設定できているように見えたが,Gmailを使っている人にメールを送信すると,エラーが返ってくることに気付いた.エラーメッセージを見ると,使用しているドメインにSPFもしくはDKIMを設定しろと書かれている.
今までこんなケースはなかったので戸惑った.調べてみると,Googleがガイドを公開していた.この記事によると,
2022 年 11 月より、個人用 Gmail アカウントにメールを送信する新規の送信者は、SPF または DKIM を設定する必要
だそうだ.なりすましと迷惑メールを防ぐ仕組みらしい.まったく知らなかった.
原因が分かれば対策は簡単.迷惑メールと間違えられないようにするSPFやDKIMは新しい仕組みでもなく,Google Workspaceを使っている人の中にも大分前から対策をしてる人もいるよう.記事を参考に設定を済ます.やることは
- Google WorkspaceのGmailの管理者設定でDKIMを有効化
- ドメインの設定に指定されたtxtレコードを追加
するだけ.
設定後,テストメールを送ってみると,電子署名が付与されていることが確認された.多分これで問題解決.
名古屋市立大学に異動しました
2023年4月1日をもって,静岡大学情報学部から名古屋市立大学データサイエンス学部に異動しました.今後ともどうぞよろしくお願いします.
DEIM2023で最優秀インタラクティブ賞,インタラクティブ賞などを受賞
第15回データ工学と情報マネジメントに関するフォーラムDEIM2023にて発表した下記の研究成果について,プレゼンテーション賞,最優秀インタラクティブ賞,および優秀インタラクティブ賞を受賞しました.
学生プレゼンテーション賞
- “プライバシーリスクを考慮したウェブページ閲覧を促す検索インタフェースの設計”, 第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023), pp.3b-8-3, March 2023.
最優秀インタラクティブ賞
- “文書分類タスクにおける事前学習済みBERTモデルの検索”, 第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023), pp.1a-1-1, March 2023.
優秀インタラクティブ賞
- “対話型鑑賞システム実現に向けた質問に答えさせることによる博物館鑑賞の印象付け”, 第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023), pp.3a-8-2, March 2023.
- “主体的なミュージアム観賞を促すための個人に合わせた「宝探し」ゲームの自動生成”, 第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023), pp.4b-9-3, March 2023.
HCI International 2023に論文が採択されました
ヒューマン・コンピュータ・インタラクションに関する大きな国際会議である HCI International 2023にて,以下の研究成果が採択され発表することが決定しました.
- Yuki Wakatsuki and Yusuke Yamamoto: “Embedding Brainstorming Tasks in Twitter”, Proceedings of the 25th International Conference on Human-computer Interaction (HCI International 2023), Copenhagen, Denmark, July 2023.
- Yuya Okuse and Yusuke Yamamoto: “Chatbot to Facilitate Opinion Formation in Web Search”, Proceedings of the 25th International Conference on Human-computer Interaction (HCI International 2023), Copenhagen, Denmark, July 2023.
- Hiroki Ihoriya and Yusuke Yamamoto: “Crowdsourced Argumentation Feedback for Persuasive Writing”, Proceedings of the 25th International Conference on Human-computer Interaction (HCI International 2023), Copenhagen, Denmark, July 2023.
ポジションバイアスを緩和する手法に関する研究成果が情報処理学会論文誌に採択
情報検索の分野で知られているポジションバイアスを緩和する手法に関する以下の研究成果が,情報処理学会論文誌に採択されました.
庵谷 拓輝, 山本 祐輔: “損失回避バイアスを用いたスニペット表示によるレビュー検索結果のポジションバイアス緩和“, 情報処理学会論文誌データベース(TOD), 15(3), 7-19 (2022-10-13), 1882-7799
ACM GoodIT 2022に論文が採択されました
研究室で行った研究の成果として,下記の論文が The 2022 ACM International Conference on Information Technology for Social Good (GoodIT 2022) に採択されました.
- Masaki Suzuki and Yusuke Yamamoto: “Don’t Judge by Looks: Search User Interface to Make Searchers Reflect on Their Relevance Criteria and Promote”, Proceedings of the 2022 ACM International Conference on Information Technology for Social Good (GoodIT 2022), Limassol, Cyprus, September 2022 (to appear).
- Yusuke Shimizu, Tetsushi Ohki, and Yusuke Yamamoto: “Privacy-aware Snippets: Enhancing Assessment of Balance between Privacy Risks and Benefits in Web Search”, Proceedings of the 2022 ACM International Conference on Information Technology for Social Good (GoodIT 2022), Limassol, Cyprus, September 2022 (to appear).
- Naoya Oda, Kim Jin Hyuk, and Yusuke Yamamoto: “Information Presentation Methods for Setting Achievable and Meaningful Goals on Fitness Apps”, Proceedings of the 2022 ACM International Conference on Information Technology for Social Good (GoodIT 2022), Limassol, Cyprus, September 2022 (to appear).
後日,詳細な書誌情報を掲載する予定です.