昨年に引き続き、アーバンデータチャレンジに応募しました。
アーバンデータチャレンジとは、オープンデータなどを活用したアプリケーション、データ、アイデアのコンテストです。
原則は地方自治体のオープンデータを使ってということのようです。私はデータの可視化がやりたい人なので、京都の市バスの業績の推移を可視化することにしました。実はもう一つ、スマホアプリで京都の駐輪所の地図を作って、それからチェーンを使った課金アプリを作成するという壮大なアイデアがあったのですが、今やっている作業やインフルで倒れたりと新しいことをやるには時間がなさすぎ、挫折しました。
作成したアプリケーション
「すごい!京都の市バス経営」というタイトルで可視化を行いました。用いたデータは京都市バスの業績、バスの経路データ、京都の観光地データです。最初のものは京都市のオープンデータから、残る2つは国土数値情報という国交省のページから取得しました。そのほか、市バスのページのPDFから手作業でエクセルにポチポチしたデータもあります。
アプリケーションは次のようになりました。
当初は散布図をアニメーションで動かすとかデータももう少し多かったのですが、メモリが足りないということでヘロク上で動きませんでした。データを減らしてぎりぎり動くようにして満足していたら、主催者の方から落ちていますとの通知をいただきました。ななななななんだって――。ということで、アニメーションを切ったらサクサク動くようになりましたよ。
512mbの枠内に収めるのって案外難しいことを痛感しました。データ分析って普通PC上でやるので、それほどメモリが不足するとか気にしないのですが、今後はその辺りも大いに気を付けようと思いました。
心がけた点
アプリケーションはデータを中立に見れるように心がけました。あと、plotlyにはかっこよいグラフがたくさんあるのでそれらを駆使しようかと思いましたが、馴染みのないグラフというのは案外見方が分からないということで、棒グラフと散布図と折れ線グラフにとどめました。
これで良いのか?って感じもあるでしょうが、これで良いと思います。
下の散布図と線グラフ、地図は「SHIFT+右クリック」で連動して動くようになっています。この機能は好きなのですが、もう少し使い方を考えたいですね。
反省点
Dashの良いところはスマホでも見られるところなのですが、スマホで見るとどうしても、横に並んでいるグラフは見にくくなります。そのため、あまり横に並べたくないのですが、縦に並べると、一画面で見られないという問題が発生してきます。
その辺が今後の開発課題でしょうか。PCだと横に並べれば解決なんですが、スマホが多いこの世の中その辺を考えていきたいところです。
見てほしかった点
データを中立的に表現するのがアプリケーションの機能ですが、このデータを取り上げたというのはそれなりに思うところがあったので、それを書いておきます。
京都の市バスってなんか経営効率悪くて、自転車を乗っているといつもひかれそうになる。そんなイメージでした。そんな先入観を持って、京都のオープンデータを見ていると、京都の市バスの業績がありました。「どうせダメなんでしょ」と思い、見てみるととんでもない黒字となっていました。そこで昔から業績は良かったのかと思って調べると、予想通り昔の業績は全然でした。
そこから20年くらいで筋肉質な組織となった、京都の市バス。今では面白いグッズを売り出すなど、アイデアにあふれているように感じました。そこでその経営を取り上げた論文などがあるかと調べると・・・ありませんでした。ということで、あまりスポットが当たっていない部分だと思い、取り上げてみました。
多分予想されるのは、観光ブームだからでしょう!という反応です。これに答えると、観光に強い土地でも公共移動手段がこのように劇的に業績が良くなるということが起こっていない場所もあります。ダメになった組織は得てして外部環境が良くなったからと、業績が劇的に変わることはありません。それは株式市場を見ているとよくわかります。
次に予想される反応は、儲かってるんだから無料にしてよ!って反応でしょう。そういうのに先手を打ってか、京都の市バスは今後は民間の助けもなくなり10年で100億円が溶けてしまいますといっています。多分そういうことでしょう。
僕はこの儲かってるんだから無料にして、もしくは安くしてって反応は良くないと思っています。経済の原則的には、お金が循環してみんなが豊かになるので、もう100億円も貯めたんだから使ってよ!という風になるのが健全な世の中でしょう。
あと、公共交通機関が儲かるというのは、税金が安くなるということにつながることです。儲からない交通機関というのを考えるとわかりやすいのですが、それを支えるために出費がかさみます。しかし、儲けてくれるとその出費がなくなり、必要な税金がなくなります。公共交通機関が税金を納める義務があるのかは知りませんが、もしあるのであれば納税されますし、なければ儲かった分、市の予算になるようなシステムが存在するかもしれません。(これは日銀のあれだけかもしれませんが)
というわけで儲かる公共サービスって重要だ!ということを言いたかったのですが、データにそのような恣意的な部分を持たすと、最近の流れのフェイクニュースになってしまうので、そういうのは聞かれたら答えるような感じにしようと思いました。
終わりに
さて、ほかにも書きたいことがあるのですが、ブログに割り当てる時間20分を1分オーバーしてしまいました。今回Geoデータを扱うのにgeopandasを使ったのですが、これは面白いですね。もう少し使えることを考えたいと思います。でもplotlyの可視化では、geoデータは使えなかったので、それらをデータフレームに変換してというような作業を自前でやりました。でも多分メソッドとかでありそうな。
あと国土交通省の国土数値情報は思いのほか使えるデータにあふれています。ここのデータを今年1年、可視化してブログで解説するということをやっても面白そうです。
2月は経済系の可視化を作ろうと考えています。まずは、今の時点で興味のある貿易収支に関して今週中くらいに作成してみます。あと、データ分析には位置情報を扱うことが欠かせないと思た。