私たちの多くは、食料品店で食器用洗剤を選ぶように、あまり考えず習慣に基づいてグラフを作成しています。 実際には、最終製品 (美しく洞察に満ちたグラフ) は、それよりももっと熟考に値するものです。 まず、データを伝える際の最終的な目標について考えてみるとよいでしょう。 時系列で傾向を示したいのか、カテゴリーごとに発見を示したいのか、あるいはデータ内の変数を全体の一部として可視化したいのか。 DataHero は、データに適したグラフを提案してくれますが、この投稿では、その理由について説明します。
これら 2 つの異なるグラフは、ほぼ互換性があるように見えますが、一般に、連続データには折れ線グラフが、カテゴリ データには棒グラフと円グラフが最も適しています。 どんなルールにも例外はありますが、大まかな経験則として覚えておいてください。 連続データは定量的なデータで、異なる値の数を数えることはできません。 これには、売上高、身長、利益などのデータが含まれます。 また、時間も含まれます。ただし、時間は連続データにもカテゴリーデータにもなり得ます。 棒グラフや柱グラフは、異なるカテゴリの数を数えることができるカテゴリデータの素晴らしい表現です。 この例では、時間は折れ線グラフの中で連続的です。 しかし、ワインのカテゴリを持つ棒グラフではカテゴリになることもあります。
折れ線グラフはかなりよく傾向を表していますが、ワインの総販売量(テーブル、デザート、スパークリング)には最適かもしれないことが、以下でわかります。
Stacked bar charts are great for showing a total, however it can be hard to compare the sizes of individual categories.
The percentage bar chart represents how each category makes up a part of the whole.
Stacked bar charts are perfect to see total but it’s ideal between each elements in categories.
Stacked bar charts are ideal to compare the elements of the entire. 言い換えれば、それは量を隠し、各グループの量間の相対的な差を表します。 カテゴリに重複がある場合、部分と全体の関係がない可能性があるので、グループ化された棒グラフを使用する必要があります。
累積棒グラフは、その時点までのすべての頻度の合計として変数の数量を表わします。 これは、たとえば、1994年から2012年まで、どれだけのデザートワインが販売されたかを知る必要がある場合に最適です。
対数棒グラフは、特に1つまたはいくつかの点がデータの大部分よりも大きく歪んでいる場合、歪んだデータに対応します。 変化率や乗数を表示します。
ワイン統計はこちらでご覧いただけます。 これらのグラフはすべて、同じ正確なデータを使用していますが、データから何を伝える必要があるかによって、大きく異なる視点を示しています。 DataHeroでは、「もっと見る」ボタンをクリックするだけで、これらのグラフの間を簡単に行き来することができます。 ダウンロードやインストールは一切不要です。 アカウントを作成し、毎日使用するデータサービス(Salesforce、Stripe、MailChimp、Google Driveなど)に接続するだけです。 DataHeroは、データを自動的にデコードし、ダイナミックなビジュアライゼーションを通じて、必要な答えを示します。