身近なデータの分析 世界陸上の結果をQlikViewで分析してみよう(後編)

身近なデータの分析 世界陸上の結果をQlikViewで分析してみよう(後編)

Pocket

前編につづき、世界陸上のデータを分析してみましょう。
前編では使用しなかったサイクリックグループや、トレリスチャートの機能を使用して、データの見せ方や使い勝手を工夫していきます。

前編をご覧になってない方は、先に前編をご覧ください。
身近なデータの分析 世界陸上の結果をQlikViewで分析してみよう(前編)



ユーザーインターフェースのカスタマイズ


サイクリックグループの作成

前編でドリルダウンの機能を使用しました。
ドリルダウンは便利な機能ですが、場合によっては使いにくいこともあります。

たとえば、アジアとオセアニアに絞り込んだ中で、国ごとの獲得メダル数を確認したかったとします。
「大陸」から「アジア」と「オセアニア」を選択してください。
単純にアジアとオセアニアの比率が表示されます。
analyze-sekai-rikujo2-101大陸を二つ選んでいますので、ドリルダウンによる軸の切り替えはおこりません。
そのため、たとえば日本とオーストラリアなど、別の大陸にある国を比較することができません。

別の視点も試してみましょう。
たとえば、上位10ヶ国に絞り込んだ中で、国ごとの獲得メダル数を確認したかったとします。
テーブルボックスから上位10ヶ国を選択します。
analyze-sekai-rikujo2-102
大陸が一つに絞り込まれていないため、軸の切り替えはおこりません。
analyze-sekai-rikujo2-103
もちろん、ここからさらに大陸を一つ選べば軸が切り替わります。
たとえば「ヨーロッパ」を選択してみます。
analyze-sekai-rikujo2-104
上位10ヶ国の中で、さらに「ヨーロッパ」に絞り込んだ中で、国ごとの獲得メダル数を確認できました。
analyze-sekai-rikujo2-105
ドリルダウンの動作について、あらためてまとめておきましょう。
ドリルダウンは親の項目の値が一つに絞り込まれると、自動的に軸項目を子の項目に切り替えます。
逆に言うと、親の項目の値が複数ある場合には、軸項目を子の項目に切り替えることはできません。

値の絞り込み→軸の切り替えが自動化されるところが、ドリルダウンの便利なところなのですが、場合によっては値の絞り込みと軸の切り替えを切り離して、手動で制御したい場合があります。

“値の絞り込みと軸の切り替えが連動しないグループ”が、サイクリックグループです。
それでは、サイクリックグループを使用してみましょう。
まず円グラフのプロパティを開きます。
analyze-sekai-rikujo2-106
[軸]タブで画面左下の[グループの編集]ボタンをクリックします。
analyze-sekai-rikujo2-107
[編集]ボタンをクリックします。
analyze-sekai-rikujo2-108
グループの種類を、[ドリルダウングループ]から[サイクリックグループ]に変更します。
[OK]ボタンをクリックしてください。
analyze-sekai-rikujo2-109
[OK]ボタンをクリックしてください。
analyze-sekai-rikujo2-110
項目名の左側についているアイコンの形が、円形の矢印に変わりました。
analyze-sekai-rikujo2-111
「大陸」から「アジア」を選択します。
軸の切り替えはおこりません。
analyze-sekai-rikujo2-112
軸を切り替えたい場合は、手動で軸項目のアイコンをクリックします。
analyze-sekai-rikujo2-113
軸項目が切り替わりました。
analyze-sekai-rikujo2-114
アイコンの右側についている小さい黒三角▼をクリックすると、切り替え可能な項目の一覧が表示されます。ここから項目を直接選択して軸を切り替えられます。
今回は「大陸」と「国・地域」の二項目なのであまり意味がありませんが、項目数が多い場合は便利です。
analyze-sekai-rikujo2-115
上位10ヶ国に絞り込むことも可能です。
analyze-sekai-rikujo2-116
アジアとオセアニアに絞り込むことも可能です。
これを見ると、アジア・オセアニアでは中国とオーストラリアで半数を占めているようです。
また、(合計メダル数だけみると)中国、オーストラリア、日本が三強と言えそうです。
analyze-sekai-rikujo2-117
南アメリカと北アメリカに絞り込むことなども可能です。
analyze-sekai-rikujo2-118
以上でサイクリックの設定は終了です。
サイクリックはドリルダウンと違い、値の絞り込みと軸の切り替えが連動しません。
そのため、親子関係に関係なく単純に軸項目を切り替えたいときに便利な機能です。
特に、地域、商品、顧客など、親子関係のない項目を切り替えて表示したいときに使用してみてください。


トレリスチャートの作成

前編で日本のメダル数を確認した際、日本は合計メダル数は多いが、金メダルは少ないという話があったと思います。
ここからは、日本とほかの国で、金、銀、銅メダルの比率がどう違うのか確認してみましょう。

トレリスチャートという機能を使うと、チャートを複数並べて表示できます。
金、銀、銅メダルの比率を円グラフにして、それを国ごとに並べたトレリスチャートを作成してみましょう。

まず、トレリスチャートの表示領域を確保するために、円グラフを最小化します。
analyze-sekai-rikujo2-201
最小化されたアイコンが、画面左上に表示されますので、下図を参考に移動してください。
analyze-sekai-rikujo2-202
それでは、トレリスチャートを作成します。
シートの余白を右クリックして[シートオブジェクトの追加]→[チャート]を選択します。
analyze-sekai-rikujo2-203
[円グラフ]を選択して[次へ]ボタンをクリックします。
analyze-sekai-rikujo2-204
軸項目に「国グループ」を設定します。
画面左下の[トレリス]ボタンをクリックします。
analyze-sekai-rikujo2-205
[トレリスチャートを有効にする]にチェックを入れます。ここにチェックを入れるとトレリスチャートが作成されます。
画面下部はチャートを並べる際の、列数と行数の指定です。
今回は横三列にしたいので、[列数]を[固定]に変更し、「3」と入力します。
設定後[OK]ボタンをクリックします。
analyze-sekai-rikujo2-206
[次へ]ボタンをクリックします。
analyze-sekai-rikujo2-207
以下の数式を入力し、[OK]ボタンをクリックします。
Sum(金)
analyze-sekai-rikujo2-208
つづいて、銀メダルと銅メダルの数式も追加します。
画面左側の[追加]ボタンをクリックします。
analyze-sekai-rikujo2-209
以下の数式を入力し、[OK]ボタンをクリックします。
Sum(銀)
analyze-sekai-rikujo2-210
同様にして銅メダルの数式を作成します。
画面左側の[追加]ボタンをクリックします。
analyze-sekai-rikujo2-211
以下の数式を入力し、[OK]ボタンをクリックします。
Sum(銅)
analyze-sekai-rikujo2-212
以上で完成です。
[完了]ボタンをクリックしてください。
analyze-sekai-rikujo2-213
トレリスチャートが作成されました。
analyze-sekai-rikujo2-214
下図を参考にサイズを調節してください。
同時に9つの円グラフが表示されるようにしてください。
analyze-sekai-rikujo2-215
ここではトレリスチャートを作成しましたが、数式を複数設定している点にも着目してください。
QlikViewでは軸ごとに一つの数式の値を描画することもできますし、数式を複数設定して数式ごとに値を描画することもできます。

上位9ヵ国に絞り込んでみます。
これを見ると、アメリカは合計のメダル数が多いだけでなく、金メダルの比率が非常に高い(50%近い)ことが分かります。
また、ケニアも比較的金メダルの比率が高く、キューバは銅の比率が低い(金と銀の比率が高い)といったことも分かります。
analyze-sekai-rikujo2-216

それでは日本のデータを見てみましょう。
比較対象には日本と順位が近い国を選んでみましょう。日本の上下四ヵ国、28位のポルトガルから36位のメキシコまでを選択します。
analyze-sekai-rikujo2-217
これを見ると、やはり日本は金メダルが少ないようです。
逆にバーレーンやスイスは金メダルの比率が高いです。
また、メキシコは日本以上に銅メダルの比率が高いようですね。
analyze-sekai-rikujo2-218
一旦選択状態をクリアします。
こんどは、日本と合計メダル数が近い国を比較してみましょう。
日本の合計メダル数は「21」ですので、「計」のリストボックスで「18」から「27」まで選択してみます。
analyze-sekai-rikujo2-219
これを見ると、ギリシャやルーマニアは比較的日本と構成比が似ていますね。
また、チェコの金メダルの多さ、カナダの銀メダルの多さなどが目立ちます。
analyze-sekai-rikujo2-220
トレリスチャートを使用することで、国ごとのメダル構成比を分かりやすく比較できたと思います。


データ値の表示

ここまで円グラフを多用してきました。
円グラフは割合を大まかに捉えられる反面、正確な値は捉えにくいです。
ここからは、円グラフを使用する際に、実際のデータ値も表示する方法をいくつか確認してみましょう。

作業用に新しいシートを追加します。
ツールバーの[シートの追加]ボタンをクリックしてください。
analyze-sekai-rikujo2-301このツールバーが表示されていない場合は、[表示]→[ツールバー]→[デザイン]を選択するか、[レイアウト]メニュー→[シートの追加]を選択してください。

円グラフをコピーします。
最小化された円グラフを選択して[Ctrl]+[C]でコピーします。
analyze-sekai-rikujo2-302
新しいシートを開いて、[Ctrl]+[V]で貼り付けます。
最小化を解除して配置を調節してください。
analyze-sekai-rikujo2-303
まず、円グラフの中にデータ値を表示してみましょう。
※この設定はあとで、もとに戻します。
円グラフのプロパティを開きます。
[数式]タブで[相対値表示]と[データ点の値]にチェックを入れます。
analyze-sekai-rikujo2-304
[プレゼンテーション]タブで[凡例に数値を表示]にチェックを入れます。
設定後[OK]ボタンをクリックしてください。
analyze-sekai-rikujo2-305
円グラフの中にデータ値を表示できました。
analyze-sekai-rikujo2-306[データ点の値]を有効にすると、円グラフの周囲にデータ値が表示されます。
[相対値表示]を有効にすると、データ値が相対値(パーセンテージ)になります。
[凡例に数値を表示]を有効にすると、凡例の横にデータ値が表示されます。

しかし、円グラフの中にデータ値を表示する場合、数が多いと重なりあって値が読み取れなくなってしまいます。
analyze-sekai-rikujo2-307
下図のように凡例のみにデータ値を表示すると見やすくなります。
analyze-sekai-rikujo2-308しかし、データ値を確認したい場合は円グラフとは別に、ストレートテーブルかピボットテーブルを追加するのがお薦めです。
設定を変更した方は、もとに戻しておいてください。

ストレートテーブルを追加してみましょう。
円グラフを右クリックして[複製]を選択します。
analyze-sekai-rikujo2-309
複製した円グラフのプロパティを開きます。
[基本設定]タブで、画面右下の[ストレートテーブル]を選択してください。
analyze-sekai-rikujo2-310
[数式]を開きます。
数式「Sum(計)」を右クリックして、[コピー]を選択します。
analyze-sekai-rikujo2-311
空白部分で右クリックして[貼り付け]を選択します。
analyze-sekai-rikujo2-312これをもう一度繰り返して、数式を三つにしてください。

二つ目の数式を選択して[相対値表示]を有効にします。
analyze-sekai-rikujo2-313
三つ目の数式を選択して[相対値表示]を有効にし、さらに[すべて累積表示]を選択します。
設定後[OK]ボタンをクリックします。
analyze-sekai-rikujo2-314
ストレートテーブルが作成できました。
一つ目の数式をダブルクリックして、データ値の大きい順に並べ替えてください。
analyze-sekai-rikujo2-315
三つの数式はそれぞれ、以下の値を表示しています。
一つ目の数式:実際の値(今回はメダルの数)
二つ目の数式:構成比(その国のメダル数が全体に占める割合)
三つ目の数式:構成比の累計(その国までの累計が全体に占める割合)
analyze-sekai-rikujo2-316二つ目の数式を見ると、アメリカは全メダルの16%を占めていることが分かります。
また、三つ目の数式を見ると、上位三ヶ国(アメリカ、ロシア、ケニア)で全メダルの30%を占めていることが分かります。(正確には30.66%)
さらに、上位七ヶ国(アメリカからソビエト連邦)で全メダルの約半数を占めていることが分かります。(正確には50.09%)

なお、ドリルダウングループやサイクリックグループの状態は、チャート間で連動します。
円グラフ側で矢印をクリックすると、円グラフとストレートテーブル、両方の軸項目が切り替わります。
analyze-sekai-rikujo2-317
さらにもう一つ、クイック切替という機能も便利ですので、ためしてみましょう。

ストレートテーブルのプロパティを開き、[基本設定]タブを開きます。
画面右側の[クイック切替]で、[円グラフ]と[ストレートテーブル]を有効にします。
設定後[OK]ボタンをクリックしてください。
analyze-sekai-rikujo2-318
ストレートテーブルの右上に[クイック切替]のアイコンが追加されました。
これをクリックすると、チャートの種類を切り替えられます。
analyze-sekai-rikujo2-319analyze-sekai-rikujo2-320円グラフとストレートテーブルを切り替えられるようになりましたので、左側にあるもとの円グラフは削除してもよいでしょう。
また、今回の例であれば、円グラフよりもストレートテーブルの方が、狭い領域に効率よく情報を表示できていますので、そもそも円グラフは不要かもしれません。

しかし当然ながら、さきほど作成したトレリスチャートのように、円グラフにした方が見やすい例もあります。
下図は、トレリスチャートとストレートテーブルを並べて配置した例です。
ストレートテーブルだけでは、アメリカの金メダルの比率が高いことや、ジャマイカの銀メダルの比率が高いことを把握するのに時間がかかると思います。
analyze-sekai-rikujo2-321
以上でデータの分析は終了とします。


円グラフに関する注意事項

データの分析は以上で終了としますが、最後に円グラフの課題について考えてみましょう。
円グラフは割合を確認するのに向いていますが、場合によっては正確な値を読み間違えることがあります。

たとえば、上位9ヵ国のメダル構成比をあらためて確認してみましょう。
エチオピアやロシアを見ると、金、銀、銅が大体同じ比率に見えるのではないでしょうか。
しかし、実際は以下の比率になっています。
エチオピア 金:35.19% 銀:29.63% 銅:35.19% 銀の比率が低いです。
ロシア 金:30.26% 銀:36.84% 銅:32.24% 銀の比率が高いです。
analyze-sekai-rikujo2-401これは錯覚(錯視)の一種で、人間の目は角度を正確に捉えられないそうです。

下図は円グラフを棒グラフに変更したものです。
これを見ると、エチオピアの銀の比率が低いこと、ロシアの銀の比率が高いことは明らかです。
analyze-sekai-rikujo2-402
ただし、円グラフの方が正確に値を読み取れる場合もあります。
人間の目は直線や直角はかなり正確に読み取れるそうです。(ただしこれも状況によって錯覚をおこすそうですが。)

下図でアメリカの円グラフを見てみてください。
金メダルの比率が50%未満であることが分かると思います。
さらに、銀メダルの比率が25%弱、銅メダルの比率がちょうど25%程度であると読み取れると思います。
analyze-sekai-rikujo2-403ちなみに、実際の値は以下のとおりです。
金:48.00% 銀:26.91% 銅:25.09%

下図は棒グラフ版です。
金メダルの比率が50%未満であることや、銅メダルの比率が25%であることは、ここからは読み取れないと思います。
analyze-sekai-rikujo2-404
このように、データ値によっても読み取りやすさは変わりますので、どのチャートを使用すべきかは一概には言えません。しかし、前述のとおり角度を正確に捉えるのは困難なため、円グラフ使用時はストレートテーブルを並べて配置することなども検討してください。


振り返り

今回はQlikViewを使用して世界陸上のデータを分析しながら、円グラフやドリルダウングループ、サイクリックグループ、トレリスチャートなどについてご覧いただきました。
以下に今回使用した機能の中から、主要なものをまとめます。

  • ドリルダウングループ、サイクリックグループ
    チャート [軸]タブの[グループの編集]ボタン、または[設定]メニュー→[ドキュメントプロパティ]の[グループ]タブから設定する。
    • ドリルダウングループ
      親の項目の値が一つに絞り込まれると、自動的に軸項目を子の項目に切り替える。値の絞り込みと軸の切り替えが連動する。おもに親子関係を持つ項目をグループ化する際に使用する。
    • サイクリックグループ
      チャート内のボタンを使用して、手動で軸項目を切り替える。
      値の絞り込みと軸の切り替えは連動しない。おもに親子関係を持たない項目をグループ化する際に使用する。
  • トレリスチャート
    複数のチャートを並べて表示する。
    チャート [軸]タブ[トレリス]ボタンから設定する。
  • クイック切替
    複数のチャートを切り替える。
    チャート [基本設定]タブ[クイック切替]から設定する。
  • データ値の表示
    • チャート [数式]タブ[データ点の値]
      初期設定:無効
      有効にするとチャート中に値が表示される。
    • チャート [数式]タブ[相対値表示]
      初期設定:無効
      有効にするとデータ値が相対値(パーセンテージ)になる。
    • チャート [プレゼンテーション]タブ[凡例に数値を表示]
      初期設定:無効
      有効にすると凡例の横にデータ値が表示される。
    • チャート [数式]タブ[すべて累積表示]
      選択するとデータ値が累積表示になる。


最後に…

今回は円グラフを多用しましたが、円グラフはデータを読み取りやすい場合もあれば、読み取りにくい場合もあり、実は使いどころが難しいチャートです。
円グラフを使用する際は、クイック切替の機能などで他のチャートも試してみて、どのチャートが分かりやすいか比較検討するといいと思います。

また、今回は世界陸上のデータを使用しましたが、やはりスポーツ関係のデータは分かりやすいため、QlikViewの使い方を覚える際の題材としてお薦めです。
以下に参考になりそうなリンクをいくつか掲載しましたので、ぜひいろいろなデータを入手してQlikViewで分析してみてください。

お疲れ様でした。



世界陸上

IAAF – International Association of Athletics Federations
IAAF(世界陸上競技連盟)の公式サイトです。
画面上部の「RESULTS」や「RECORDS & LISTS」から、さまざまな大会や競技の記録を確認できます。

14th IAAF World Championships Medal Table
IAAF公式サイト内にある、第14回世界陸上モスクワ大会の国別メダル数のデータです。画面上部のドロップダウンリストから過去の大会も確認できます。
データとしてはウィキペディアよりもこちらの方が使いやすかったのですが、ウィキペディアよりも利用制限が厳しく再配布等が禁止されていたため、今回の記事ではウィキペディアのデータを使用しました。
個人で利用する場合は、このサイトにあるデータの方が使いやすいと思います。


ワールドカップ

FIFAワールドカップ – Wikipedia
ウィキペディアのFIFAワールドカップのページです。「代表別通算成績」から国別の通算成績のデータが確認できます。
サッカーのデータは得点、失点、勝点など、数値データが多く非常におもしろいです。たとえば上記のデータをもとに、以下の情報を確認してみると、QlikViewの勉強にもなると思います。
もっとも1試合あたり平均失点が少ない国は?逆に1試合あたりの平均得点が多い国は?
もっとも入賞回数(4位以上の回数)が多い国は?またその国の入賞率(入賞回数÷出場回数)は?など。


オリンピック

Olympic medal winners: every one since 1896 as open data | Sport | theguardian.com
英ガーディアン紙のオリンピック関連の記事です。1896年以降のオリンピックのデータを確認できます。
「Get the data」→「DATA: download the full spreadsheet」とリンクをたどることで、1896年から2008年までのデータがGoogle Docsのスプレッドシート形式で入手できます。
英ガーディアン紙はこのページ限らず、データの可視化やデータの公開に積極的で見ていて非常に参考になります。

Olympics 2012: the alternative medals table | Sport | theguardian.com
英ガーディアン紙の2012年ロンドンオリンピック関連の記事です。同じく「Get the data」→「DATA: download the full spreadsheet」とリンクをたどることでデータが入手できます。

ロンドンオリンピック (2012年) での国・地域別メダル受賞数一覧 – Wikipedia
ウィキペディアの2012年ロンドンオリンピックのページです。

その他

databaseSports.com – The Worlds Largest Free Sports Statistics Database
オリンピックをはじめ、さまざまなスポーツのデータを公開しているサイトです。
とくにオリンピック関連のデータは充実していますが、2008年までのデータしかないようです。

Sports Data Museum
日本語のサイトです。オリンピックやメジャーリーグのさまざまな記録がまとめられています。
このサイトからQlikViewにデータを取り込むのは難しそうですが、オリンピックとメジャーリーグのデータは非常に充実していて、かつ日本語で読めます。