前回、Dashに関するLTをしましたが、今回はハンズオンをしてみました。ネタの再利用です。
Dashに関して
データ分析する上で可視化は重要で、データを眺めて何かヒントをつかみたいってのがあります。そういう中で、簡単にきれいにかけてしかも色々できるってのは素敵なのでDash良いです。
ハンズオンの最後にアイリスデータを触ってみたのですが、それをヘロクに簡単に上げられて全員で共有できるDash最高やなぁと思います。
例えばリンク先のアイリスデータのように、種類ごとに色分けしてグラフ化するなんてことも簡単にできます。またドロップダウンで要素の選択もできるので、色々な思い付きで見るデータを変えるなんてこともできます。
またレジェンドをクリックすることにより、そのデータを出したり消したりもできるので、これとこれがないグラフが見たい…ってなった時に、コードを書き換えたりしなくて良いのもメリットだと思われます。
なんて感じで気に入っているので、みんなに使ってほしいなぁと思っています。
HandsOn反省
- ハンズオンは下の資料を使って行いました。中身的にはdashのUser Guideにある事例を取り出し、コードがどうなっているかってのを説明でした。
当初の予定的には、使い方の解説(30分)==>データの前処理をして、グラフを作る(30分)==>自分でやりたいデータを可視化してみる(50分)という流れにしようと思ってましたが、最初の二つで終了しました。
「データを前処理をして、グラフを作る」のところでは、sklearnのデータセットからアイリスのデータを使ってチャートを作るってのをやりましたが、それをやっていると、最後のやつができないなという感じとなりましたので、中途半端に最後のをやるよりも、それを頑張ってやった方が良いかなと思ったからでした。
後から考えると、自分でやりたい可視化をするよりも、使い方の解説のところでもっとプロットリーの使い方を説明したらよかったなーと思っています。コード書くのが多い方が良いかなーと思ったのですが、説明が中途半端だとコードも書けませんよねぇーという感じでした。
あと以前、スクレイピングのハンズオンをやった時は6人だったので、全員ができたか確認できたのですが、今回は参加者が18人と多かったので、いまいちできてるのかどうなのかよう分かりませんという感じだったのも、ちょっと戸惑うところでした。
ハンズオンの質問なんかはここ、もしくははんなりPythonのgitterに書き込んでもらえれば幸いです。ちょっとでも反応があると嬉しいです。
次回以降へのヒント
データの前処理をやったのですが、意外にできていない人も多かったようなので、pandasのハンズオンとかも良いかもしれないですね。
最近のチャートのライブラリを見ていると、ほとんどpandasでデータ作ってそれを使うから可視化も簡単!って感じがありますよね。なんでpandasやっとくとかなり便利だと思います。
下の本はPandasの作者の人が出してて超おすすめです。numpy、pandas、matplotlibの使い方がわかる。私が持っているのは第1版ですが、2版も欲しいなー。

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
まぁ、その前にnumpyをってことになるんでしょうねー。numpyが全ての基礎になるみたいなところがありますからね。それらを一通りやって、可視化して、sklearnとか使って機械学習みたいなハンズオンを週一回2時間×4を作ったら面白いかもしれませんね。
あとハンズオンとか発表とかすると、一応一通りあきらめずに学ぶことになるので、なんか詳しくなれてよいです。herokuの使い方とか知らなかったけど、dashは簡単にアップできるので、これを使ってトランプさんの支持率可視化をherokuでやるのも面白いかもなーと思っています。
反応をもらうためにアンケートを取るなどすべきだなーと思うが、アンケートしてもらえない問題もあり結構ややこしい。
NumpyとPandas早くやってみたいという方はとりあえずドキュメント読んで、エクセサイズ100をやってみましょう!