ミニバッチ学習

及川賢治・竹内繭子作の「まるさんかくぞう」という絵本がある(出版社:文溪堂 ).上の写真のように,1ページごとに3つのオブジェクトの名前と絵本が描かれている.

  • さんかく,ぞう,まる
  • ぞう,ぞう,しかく
  • さんかく,まる,しかく

といった調子である.この構成が絵本の最初から最後まで続く.ちなみにこの本に登場するオブジェクトは「まる」「さんかく」「しかく」「ぞう」「とり」「かお」「ぼうし」「ふね」「ばす」「れもん」の10種類である.

子どもはこの絵本をめくる毎に3つのオブジェクトを見て,3つのオブジェクトが何かを読み手から音で聞く.オブジェクト認識のためのルールを学習するために,バッチサイズが3のミニバッチ学習を行うのである.

絵本の作者が各ページに配置するオブジェクトをどのように決めたのかは分からないけれども,各バッチには子どもが楽しみながらも効率よくオブジェクト認識ルールを学習できるよう,巧い具合にオブジェクトが選ばれている(ような気がする).

世間は深層学習が大流行りだが,子どもたちの学習が楽しく効果的に進むコンテンツを作るために,機械学習をうまく利用するといった事例があっても面白いと思う

熱量

三島由紀夫 vs 東大全共闘 – 50年目の真実」を観に出かけた.期待していたとおりの内容で,討論の全内容を聴けたわけではないが,2時間程度の時間で歴史と三島由紀夫の天才ぶり,ユーモアを楽しめた.内容はネタバレになるので書かないが,内田樹氏の語る三島コメントが印象的だった.

昔から全共闘の活動の歴史に興味を持っていた.当時の学生運動に参加していた学生の「熱量」に魅せられるのである(同時に,運動に関わらず冷めた目で運動を見ていた学生にも興味がある).なぜ当時の学生はあそこまでの社会変革に熱量を持てたのだろうか.もちろん時代背景もあるのだろうが,今の時代の学生(そして僕)は当時に負けないくらいの熱量を持っているだろうか.今の学生(そして僕)が当時にタイムスリップしたら,同じような熱量を持てただろうか.

熱を帯びなければならない.

水筒の蓋

水分をこまめに取れるように水筒を購入した.ドウシシャのmoshという商品である.水筒なのに牛乳瓶のような形をしているところがなんとも愛らしい.機能としては一般的な水筒と同じく保温機能があるだけで,蓋を取って水を入れて飲む.それだけである.

機能的にも見た目的にも十分満足なのだが,一点だけ気に入らないのが「蓋に印字された文字」である.蓋のてっぺんにデカデカとびっくりマークが書かれているのだ.これさえ無ければパーフェクトだったのに…

なぜびっくりマークなのか?牛乳瓶のような姿をしているのに,手に取って開けてみるとそれは水筒だから?その驚きはびっくりマークの印字で表現しなくても,手に取った人が体験として驚けばそれで良いと思うのだけど.説明してしまったらナンセンス.短歌と同じである.

浜松にある凱旋門

夏の暑さから逃れるために,引佐の渋川を訪れた.その帰り道,林道の脇に雰囲気のあるレンガ造りの門が立っていることに気付いた.ぼけーっと車で走っていると気付かないくらいひっそりと立っているのだが,明らかにオーラが違う.車を一瞬止め,名称があるかを確かめ見ると,この遺構が「凱旋記念門」であることが分かった.

この凱旋記念門.日露戦争を記念して,この地に建てられたそうだ.いわゆる凱旋門である.明治時代,日本は欧米列強に追いつくべく,富国強兵を推進し,日清戦争・日露戦争といった軍事行動を行ったが,当時は戦争勝利を記念して日本各地でこのような凱旋門が作られたそうだ.ところが,アーチ型の凱旋門として現存しているのは,鹿児島は姶良市にあるものと,ここ浜松は引佐の凱旋門の2つのみ.大変貴重な歴史遺構である.

引佐の渋川という地区はサワガニが生息するようなきれいな川をもつ山村で,人気(ひとけ)はあまりない.こんな小さな山村でも凱旋門が建てられたことから,当時の日本がいかに日露戦争の勝利に沸き立っていたのか,その高揚感が伝わってくる.

もやしとフォアグラ

夏休みの「子ども科学相談」のラジオで「もやし」についての話があった.まったく知らなかったのだが,「もやし」とは穀類や豆類の種子を人為的に発芽させた新芽の総称を表すものだそうだ.てっきりトマトや茄子のように,もやしという名称の野菜があるのかと思っていた.

科学相談の内容は,「もやしがどのようにできるのか」についてであった.植物は光合成をするために光が必要となるが,土の中で発芽した植物は光を得るために地中に出る必要がある.そのため,植物は茎を伸ばすのである.もやしはこの性質を利用し育てられる.光を与えないよう暗室で育てることによって,葉も出させず色も付けさせず,茎だけ伸ばさせる.もやしとしては,地中に出て光を浴び,光合成をするがために,種子に蓄えられた限られたエネルギーを使って必死に茎を伸ばす.私たち人間は,もやしが食べたいがため,己の欲望のために,もやしに酷な仕打ちをするのである.

どこかで聞いたことのあるような話である.フォアグラである.フ脂肪肝をもつガチョウを育てるために,強制給餌を行う.フォアグラに反対する人はベジタリアンが多いという記事もあるが,捉え方によっては,もやしの作り方はフォアグラ反対派のベジタリアンにも割とショッキングではなかろうか.

 

用が済んだら忘れられる存在

まわりに石っこひとつないこの場所にこんなデカい石が置かれているということは,何かを支えたり挟んだりするために誰かが持ってきたのだろう.

使い終えたら,使う前はすごく意識していたことを忘れられてしまう悲しさ.用済み切り捨て.怖いなぁ.

The Vannevar Bush Best Paper Award 授賞

デジタルライブラリに関して最も権威のある国際会議であるJCDL2020において発表した下記論文が,the Vannevar Bush Best Paper Awardを授賞しました.

Yusuke Yamamoto and Takehiro Yamamoto: “Personalization Finder: A Search Interface for Identifying and Self-controlling Web Search Personalization”, Proceedings of the 20th ACM/IEEE on Joint Conference on Digital Libraries (JCDL 2020), pp.37-46, China, Xi’an, August 2020 (Full Paper 33/106 = 31.1%).

The Vannevar Bush Best Paper AwardはJCDL2020で発表された査読付き論文のうち,最も優れた論文に与えられる賞です.

発表時のスライドはコチラから閲覧可能です.

JCDL2020で研究成果を発表

8月1日から5日にかけて開催されているJCDL2020(The 20th ACM/IEEE on Joint Conference on Digital Libraries)にて下記論文を発表しました.この研究は兵庫県立大学社会情報学部の山本岳洋准教授との共同研究の成果です.

Yusuke Yamamoto and Takehiro Yamamoto: “Personalization Finder: A Search Interface for Identifying and Self-controlling Web Search Personalization“, Proceedings of the 20th ACM/IEEE on Joint Conference on Digital Libraries (JCDL 2020), pp.37-46, China, Xi’an, August 2020 (Full Paper 33/106 = 31.1%).

発表スライドは以下となります.

忘却の整理学

忘却研究の息抜きとして,外山滋比古氏の忘却の整理学を読んだ.

結びにある「忘却は自由への道を拓くもの」という言葉が,本書のすべてを語っている.知的メタボリック症候群に陥っている人は,知識に縛られ思考を自由にすることが難しい.忘却が余計な情報,知識,雑念をそぎ落とし,頭の中を整理,再構成してくれることで,嫌なことを忘れ,過去をイイ感じに美化し,自由な発想でものごとを考えるように導いてくれるのだろう.

メモ:「よく学び,よく遊べ」ではなく「よく遊び,よく学べ」

あなたがAIよりも優れている点をアピールせよ

スポットで講義をしている大学院の授業でレポート課題を課した.今回のレポートは学生に自分の頭で考えてほしかったので,考える系のレポートを出題した.以下レポート課題の内容である:

あなたは現在就職活動中であるとする.あなたは,採用人数が1名の企業を志望しており,この度その企業から最終面接に呼ばれたとする.事前情報によると,最終面接に残った応募者のうち,あなた以外はすべてAI(人工知能)であることが分かった.志望企業から内定を勝ち取るためには,「AIよりもあなたを採用した方が企業にとってメリットがある」ことを採用担当にアピールする必要がある.生産性の観点から,あなたがAIよりも優れている点を,A4用紙0.5〜1ページ程度でアピールせよ.

数十人の受講生から方向性も質も多種多様なレポートが寄せられた.対象とした業界についても,情報系大学院でもっとも就職する人が多いであろう情報サービスだけでなく,コンサルティング,マーケティング,製造業,菓子メーカー,芸能,保険,医療,介護,など様々な業界が取り上げられていた.

レポートとして一番の読みどころである「AIよりもあなたが優れている点」については,類型化すると下記のような主張が挙がった:

  • 問題定義
  • 機械学習に用いるデータの設計・準備
  • フレーム問題への対処
  • 人間(お客)との円滑なコミュニケーション(例:結果の説明)
  • 少量のデータからのスキルや知識の学習
  • ユーモア等の「創造性」
  • 暗黙知の学習
  • 人間との協調作業
  • 倫理観
  • AIそのものの設計,AIに電力を供給する(させない)

どれも学生に鍛錬して欲しい重要な能力だと思うが,いくつかの項目については,最先端の機械学習・人工知能研究のトピックだったりする.

計算機にユーモアを理解させる,あるいは生成させる研究は,自然言語処理で時々見かける.例えば以下のような論文.

  • YANG, Diyi, et al. Humor recognition and humor anchor extraction. In: Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2015. p. 2367-2376.
  • ZHANG, Hang, et al. Let’s be Humorous: Knowledge Enhanced Humor Generation. In: Proceedings of the 58th Annual Meeting of the Association for
    Computational Linguistics (ACL). 2020.

人工知能の倫理観についても盛んに研究されていて,自動運転車の倫理を扱ったMITのMoralMachineは代表的な研究.ブラックスボックスな機械学習技術によって得られた結果の説明については,Explanable AIというホットな研究分野が立ち上がっている.少量のデータからのスキル獲得については,(これからますます盛んになるであろう)強化学習という研究分野がある.

学生が思っている以上に,人間にしかできないと思われている処理を計算機ができるようになる可能性がある.社会に浸透するまでにはもう少し時間がかかるかもしれないが,使いどころをうまく決めることができれば,人間が行うタスクを人工知能技術によって置き換えられることは可能であろう.情報系学部で学ぶ学生には,

  • 計算機は何ができるのか
  • これまで人間が行ってきたタスクの中で,計算機で代替できる,代替すべきものは何なのか
  • 計算機によるタスクの代替を行うには,どのような作業が必要なのか

などを考えられる人材になって欲しい.