Wikipediaダンプファイルのダウンローダ

年に1回くらいWikipediaのダンプファイルをダウンロードしたくなるのだが、その度にどのファイルを落としたらいいのか、どうやって落とすかを忘れてしまう。

こんなことに毎回頭を使いたくなくなったので、ダウンロードのためのPythonスクリプトを作成した。果たして次回以降楽になるのだろうか?

https://github.com/trycycle/wikipedia-downloader

SlideShareにアップしたPDFで特定の日本語が表示されない

MacのMicrosoft PowerPointで作成したスライドデータをPDF化し、SlideShareにアップすると、特定の日本語が表示されない。

1年くらい前にこの問題に気付いたこの問題。そのときはAdobe Acrobatを使ってPDF化すると問題なく表示されいたはずなのだが、先日学会で発表したスライドをアップした見返し見るとまた表示されなくなっていた。

1年前も解決方法を調べたのだが、Qitaの記事にあるように、Mac特有のフォントを使うことを諦めたり、そもそもSlideShareを使うことを諦めるべきだろうか?プラットフォームとしては気に入っているので、SlideShareを切り捨てることはしたくない。

僕の場合はSlideShareのコンテンツを見る限り、どうやら小塚フォントがだめなのようなので、いつも使っているスライドマスタを変更して別のフォントに切り替えることにする。

浜松に引っ越してちょうど1年

今日で浜松に引っ越してきてちょうど1年が経った。浪人生のときからずっと暮らしてきた京都を離れ、まったく知り合いもいない、教育・研究環境もこれまでの環境とはまったく異なる地での生活。どんな1年になるだろうか、自立した研究者としてやっていけるだろうかと不安もあったが、なんとか浜松引っ越し1周年を迎えることができた。

友人・知人がほぼ皆無だった僕と知り合いになってくださった浜松の皆様、ありがとうございます。そして、ときどき京都に戻っても温かく迎えてくださる皆様、ありがとうございます。

京都大学附属図書館研究開発室セミナーで講演を行いました

2018年3月19日は京都大学附属図書館で講演を行いました。モデレータデーある京都大学学術研究支援室の方からは「ウェブでの情報発信」をテーマの講演を依頼されたのですが、「ウェブ発信にかまけている時間があるならば、京大研究者は研究に時間を割いて!」という空気を読んでいない発表をしました。

国民に対する研究者からの発信は重要なことですが、ピカイチの研究者は思いっきり研究をして研究で社会に貢献すべきだと思います。研究に費やす時間が増えるように支援してくださる研究支援者がいる大学であれば、なおさらのことです。

“Oops, something went wrong. Upload failed” on SlideShare

学会での発表資料や研究室内の勉強会発表資料をSlideShareにアップロードしようとしては”Oops, something went wrong. Upload failed”というエラーと表示され四苦八苦していたのだが、ようやくアップロードに成功した。

僕の解決方法は「ファイル名を半角英数字にする」だった。同じ現象で苦しんでいる方、試してみてください。ちなみに以下の方法ではうまくいきませんでした:

  • MacデフォルトのPDF変換ではないPDF変換をつかう
  • WindowsマシンでPDF化する
  • 画像化する

Seabornで生成する画像にType 1のフォントを埋め込む

とある国際学会で発表する論文のカメラレディを提出したところ、「PDFファイルの中にType 3のフォントが埋め込まれているので、Type 1のフォントに置換して欲しい」との連絡があった。Type 1やらType 3やらの区別があることを初めて知った。該当箇所はSeabornで生成した画像中のフォントのようである。さくっと修正できるだろうと思っていたが、案外苦戦。

試行錯誤した結果、最終的には以下のコードを埋め込むことで解決。先人の知恵に感謝。

2017年度情報学方法論の受講者へ

静岡大学情報学部行動情報学科2年生のみなさん。本日のガイダンスによると、情報学方法論の授業は、いろいろな先生が情報学の方法論について60分間話をすることになっています。研究室を知ることも一応兼ねているそうですが、どんな話をするかは教員に任せられています。

そこでみなさんにお聞きします。どんな話を聞きたいですか?こちらのサイトにアクセスしてアンケートにお答えください。授業の参考にします。


候補トピック

研究室紹介:やまもとが行っている研究の一部を紹介します。

情報検索の仕組み:GoogleやYahoo!などのウェブ検索エンジン。どうやって情報を取得して、どうやって並び替えているのか?その仕組みについて解説します。

信頼できる情報システム:情報システムを有効に使ってもらうためには、情報システムの振る舞い、提供する情報に信頼性が備わっている必要があります。情報システムの信頼性とは何かについて解説します。

ヒューマンコンピューテーションとクラウドソーシング:データ集めや実験に協力してくれる人を探すのは大変ですよね。近年では、インターネットを通じて不特定多数の人に力を借りコンピューテーションを行う、クラウドソーシングという仕組みが注目されています。それを研究やサービス作りに活かす方法について解説します。

伝わる情報デザイン:同じような内容を伝えているはずなのに、伝えたいことが伝わらない情報デザインは何が悪いのか。プレゼンテーションのスライドのデザインから、デザイナでなくても伝わる情報デザインを行う方法を解説します。


アンケートサイトは以下:
https://goo.gl/forms/59Pxp6W30RRCFTg03

 

東北地区大学図書館協議会で招待講演を行いました

2017年9月22日(金)に、秋田市はぎわい交流館 AUにて開催された「東北地区大学図書館協議会 第72回総会」で招待講演を行ってきました。

依頼をいただいたときは、「図書館の専門家でもない僕がなぜ招待されるのか」と疑問に思いましたが、URAと研究者の両方の経験を持っているとのことでお声がかかったようです。

当日の発表資料は以下で閲覧することが可能です。多少なりとも図書館や大学の研究推進に参考になれば幸いです。

ノスタルジックな当たり屋情報

連休をまったり過ごしていると、妻の職場から妻に電話がかかってきた。「浜松市に当たり屋集団が来ているから気をつけてください」とのことだった。てっきり仕事の電話かと思っていたのに、仕事とはまったく関係のない内容だったから拍子抜けだった。こんな内容をなぜわざわざ職場が連絡してくるのかに関しても違和感を覚えたが、いかんせん内容が胡散臭い。情報ソースについても不明。そもそもドライブレコーダーがある今日、当たり屋なんて仕事になるのか。

すぐさま浜松市ホームページや警察のホームページを見たが、何も情報はない。Twitterで検索してみると、「浜松市に当たり屋が来てるから気をつけて」的なツイートが散見された。危険なナンバープレートの一覧が記された怪文書の画像もアップされている。ますます胡散臭い。

ウェブ検索で当たり屋を調査してみた。どうやら昔からあるデマ情報だそうだ。80、90年代年代に出回ったデマらしい。案の定、怪文書の内容もよく似たものだった。なぜ、今このタイミングでこのデマ情報が流れるのか、発信源はどこだったのかだろうか。立命館大学サトウタツヤさんの調査によると、この当たり屋デマ情報は数年に一回程度発生しているそうだ(サトウタツヤさんのHPの見た目が良い。見た目で判断するな、というメッセージを勝手に受け取りました)。

今回の当たり屋情報が最終的にTrueかFalseなのかは分からないが、いつの時代も変わらず、人はデマっぽい情報に振り回されてしまうのかと思うと、どっと疲れた。これだけインターネットが発達しているのだから、すぐに調べられるはずなのに… やっぱり情報を読み解く力は向上していないのか。今も昔もそう変わらないのか。それでいて、インターネットの利用は拡大しているから、余計にタチが悪い。根深い、根深い。

追伸:
今朝浜松市のホームページを確認したら、「当たり屋情報については浜松市では把握していない」という通知が出ていた。