コンテンツ
分散と標準偏差を使用してデータの広がりを計算する
データのサンプルは、多くの場合、2つの統計を使用して要約されます。その平均値と、データの広がり具合です。分散と標準偏差はどちらも、それがどれだけ広がっているかの尺度です。 Excelには、分散と標準偏差を計算するための関数がいくつかあります。以下では、どちらを使用するかを決定する方法と、Excelで差異を見つける方法について説明します。
この記事の説明は、Excel 2019、2016、2013、2010、2007、Excel for Microsoft 365、およびExcel Onlineに適用されます。
データの要約:中心的な傾向と広がり
中心的な傾向は、データの中央、つまり平均値を示します。中心傾向のいくつかの一般的な尺度には、平均、中央値、最頻値が含まれます。
データの広がりは、個々の結果が平均とどれだけ異なるかを意味します。拡散の最も単純な測定は範囲ですが、より多くのデータをサンプリングするにつれて増加し続ける傾向があるため、あまり役に立ちません。分散と標準偏差は、広がりのはるかに優れた尺度です。分散は、単に標準偏差の2乗です。
標準偏差と分散式
標準偏差と分散は、平均して、各データポイントが平均からどれだけ離れているかを測定する方法です。
手作業で計算する場合は、すべてのデータの平均を見つけることから始めます。次に、各観測値と平均値の差を求め、それらのすべての差を二乗し、それらをすべて加算してから、観測値の数で割ります。
これにより、すべての2乗差の平均のような分散が得られます。分散の平方根を取ることは、すべての差が二乗されたという事実を修正する方法です。これは標準偏差と呼ばれ、データの広がりを測定するために通常使用するものです。これが紛らわしい場合でも、心配しないでください。そのため、Excelで実際の計算を実行します。
サンプルまたは人口?
多くの場合、データは、より大きな母集団から取得されたサンプルになります。そのサンプルを使用して、母集団全体の分散または標準偏差を推定します。この場合、観測数(ん)あなたは割る ん-1。これらの2つの異なるタイプの計算は、Excelでは異なる機能を持っています。
- Pを使用する関数:入力した実際の値の標準偏差を示します。彼らはあなたのデータが母集団全体であると仮定します( ん).
- S付きの関数:データがそこから取得されたサンプルであると仮定して、母集団全体の標準偏差を与えます( ん-1)。この式は母集団の推定分散を与えるため、これは混乱を招く可能性があります。 Sはデータセットがサンプルであることを示しますが、結果は母集団に対するものです。
Excelでの標準偏差式の使用
Excelで標準偏差を計算するには、次の手順に従います。
-
Excelにデータを入力します。 Excelで統計関数を使用する前に、すべてのデータをExcelの範囲(列、行、または列と行のグループマトリックス)にする必要があります。他の値を選択せずにすべてのデータを選択できる必要があります。
この例の残りの部分では、データがA1:A20の範囲にあると想定しています。
-
データが母集団全体を表す場合は、式「= STDEV.P(A1:A20)。 "または、データがより大きな母集団からのサンプルである場合は、式を入力します"= STDEV.P(A1:A20).’
Excel 2007以前を使用している場合、またはファイルにこれらのバージョンとの互換性を持たせたい場合、式は「= STDEVP(A1:A20)」です。 データが母集団全体である場合。 「= STDEV(A1:A20)」、データがより大きな母集団からのサンプルである場合。
-
標準偏差がセルに表示されます。
Excelで分散を計算する方法
分散の計算は、標準偏差の計算とよく似ています。
-
データがExcelの単一のセル範囲にあることを確認します。
-
データが母集団全体を表す場合は、式「= VAR.P(A1:A20)。 "または、データがより大きな母集団からのサンプルである場合は、式を入力します"= VAR.S(A1:A20).’
Excel 2007以前を使用している場合、またはファイルにこれらのバージョンとの互換性を持たせる場合、式は「= VARP(A1:A20)」、データが母集団全体の場合、または「= VAR(A1」 :A20)、 "データがより大きな母集団からのサンプルである場合。
-
データの分散がセルに表示されます。