折れ線グラフ

折れ線グラフとは?

折れ線グラフは、連続変数の経時的な変化を示します。折れ線グラフは、トレンドプロット、ランチャート、または時系列プロットと呼ばれることもあります。

経時的な変化を示す折れ線グラフ

折れ線グラフは、連続変数が経時的にどのように変化するかを示しています。時間を測定した変数は、x軸にプロットされます。連続変数は、y軸にプロットされます。

折れ線グラフの例

例1:基本的な折れ線グラフ

図1のグラフは、経時的に測定されたオウムの体重の変化を示しています。データ点と線の両方が表示されます。点を省略する場合もあるでしょう。このデータで体重の軸は理にかなっています。軸ラベルも役に立ちます。折れ線グラフを使用すると、グラム単位で測定されたオウムの体重が経時的にどのように変化するかを視覚化できます。

図1:経時的な体重の変化を示す基本的な折れ線グラフ

品質管理では、上図のような基本的な折れ線グラフはランチャート(run chart)と呼ばれます。これは、y軸上の変数の値の「経時的な推移(run over time)」を示します。

例2:欠測値の処理

図2の折れ線グラフも、オウムの体重のデータを使用しています。この例では、オウムが予定通りに計量されない日がありました。折れ線グラフでは、欠測値の左右の値がつながっていません。また、折れ線グラフに欠測値があるという事実を強調するための注釈が追加されています。別の方法として、欠測値の左右の値もつなげるか、欠測値の左右の値をつなげるのに点線を使用することができます。欠測値と、それをグラフに表示する方法に留意することが重要です。

図2:欠測値のある折れ線グラフ

例3:折れ線グラフの代わりに回帰分析を使用する場合

図3のグラフは、2つの連続変数の散布図を示しています。x軸は体重を示し、y軸は睡眠時間を示します。グラフには、線で結ばれた点も表示されますが、これは正しくありません。点は異なる動物の種類を示していて、経時的な変化を示す関係はありません。図4のグラフは、線形単回帰を使用した散布図で、このデータを表示する正しい方法を示しています。

図3:折れ線グラフの不適切な使用例
図4:線形回帰を使用したこの散布図は、図3の折れ線グラフよりも有用です

例4:y軸の目盛りを検討する

折れ線グラフを作成するときは、他のグラフと同様に、目盛りに注意してください。例えば、昔は、y軸にゼロを含めることを推奨する書籍がありました。現在の慣行では、データに即している場合にのみ、ゼロを使用することが推奨されています。図5は、オーストラリアにおける、過去数年間の第4四半期のホテルの客室占有率のデータを示しています。y軸は、軸に関する昔の推奨に従って、ゼロから始まっています。このアプローチの問題は、年ごとの違いによる視覚的影響を最小限に抑えてしまうことです。図5と図6を比較してみます。図6では、y軸の範囲に適切な値域を用いているため、2006年のピークを簡単に確認できます。ほとんどのソフトウェアツールは、データに即したy軸を自動的に作成します。一部のソフトウェアツールでは、軸を変更できます。

図5:y軸にゼロがある折れ線グラフ
図6:y軸にゼロが含まれていない場合、年ごとの違いを識別しやすくなります

例5:複数の線が異なるカテゴリを表す場合

折れ線グラフには複数の線を含めることができます。図7のグラフは、2006年(最初のスマートフォンがリリース)から2011年までの、スマートフォンのオペレーティングシステムの市場シェアのデータを示しています。各線は、それぞれのオペレーティングシステムの経時的な変化を示しています。

図7:単一の折れ線グラフ上で、複数の線を色でコード化

複数の線をもつ折れ線グラフを作成する場合は、グラフの共有方法と表示方法に基づいて、使用する色を考慮してください。たとえば、常にカラーでしょうか?それとも、白黒でしょうか?白黒で印刷する場合でも、色がはっきりと区別できることを確認してください。色に加えて、または色の代わりに、さまざまな線のスタイルを使用することもできます。凡例は、線が数本しかない場合は役立ちますが、グラフに線が多い場合はあまり役に立ちません。ただし、別の変数を使用してグラフ内のさまざまな線を定義する場合は、凡例が役立ちます。

図7の折れ線グラフは、市場シェアが経時的に増加した2つのオペレーティングシステムに対して、異なる色の2つの実線を使用しています。これらの色は、白黒で印刷した場合でも簡単に区別できます。グラフは、市場シェアが経時的に減少した2つのオペレーティングシステムに対して、2つの異なる破線を使用しています。グラフは、左上隅に凡例も表示しています。

折れ線グラフとデータの種類

折れ線グラフの場合、x軸の変数として時間を指定します。ほとんどのソフトウェアツールは、この時間の変数を連続変数として保持します。

連続尺度データ:折れ線グラフに適しています

連続尺度データは、多くの可能な値を持つスケールで測定されるため、折れ線グラフのy軸に指定するのに適しています。連続尺度データの例は次のとおりです。

  • 経過時間
  • 血圧
  • 重み
  • 温度
  • 速度

これらすべての例で、折れ線グラフは、変数の経時的な変化を視覚化するための適切なグラフツールです。

カテゴリカルデータまたは名義尺度データ:別のグラフを選択します

カテゴリカルデータまたは名義尺度データは、特定の値を持つスケールで測定されるため、折れ線グラフのy軸に指定するのに適していません。

カテゴリカルデータを使用すると、標本はグループに分割されることが多く、応答の順序が定義されている場合があります。例えば、「まったくそう思わない」から「非常にそう思う」までのスケールで意見を述べるように求められる調査では、回答はカテゴリカルです。

名義尺度データの場合、標本もグループに分けられますが、特定の順序はありません。居住国は名義尺度変数の一例です。国の略語を使用することも、数字を使用して国名をコーディングすることもできます。いずれにせよ、データのさまざまなグループに名前を付けるだけです。

図7に示すように、カテゴリカル変数または名義尺度変数をグループ分けの変数として指定して、複数の線を用いて複数のグループを折れ線グラフに追加できます。