統計学

統計用語集

2021年1月24日

統計分野で用いられる言葉は、字面だけ読んでもよくわからなかったりするので(例:自由度、独立、標本)まとめてみました。

順次拡張していきます。

英語 日本語 意味
analysis of variance (ANOVA) 分散分析 観測値を構成する要素間の分散の大きさを比較する分析。
分散の比から確率を推定する分析。
class limit 階級限界 隣り合う階級の境界(の値)。
class value 階級値 階級限界の真ん中の値。
confounding 交絡 複数の要因が相互に影響し合うこと。
correlation 相関 変量は互いに独立である。
正の相関と負の相関の2種類がある。
correlation coefficient 相関係数 説明変数と目的変数の共分散と、説明変数および目的変数のそれぞれの分散の比。
countable 可算無限、可付番無限 順番が数えられる大きな数(無限大より小さい。≠∞)
degree of freedom 自由度 データ数から次元数を引いた値。
フィッシャーが導入した概念。
determinant / coefficient of determination 決定係数 相関係数を二乗した値。
相関係数は -1 から +1 の範囲の値をとるため、決定係数の絶対値は相関係数の絶対値より小さくなる。
discriminant analysis 判別解析 多変量解析のひとつ。
標本として取り出した観測値が、どのグループに属しているかを判定する手法。
distribution function 分布関数 母集団の要素すべてが存在している状態を示す関数。
domain 定義域 関数が定義される領域。
dummy variable ダミー変数 実際の数値でないもの。
統計処理のための便宜上、数値化されたもの。
(例:男女を0,1で表現する等)
error of measurement 測定誤差 観測値を得るための計測結果が含む誤差。
得られた数値の最小桁の誤差を指す。
event space 事象空間 事象を要素と考えた空間。
fixed effect 固定効果 誤差項において、時間を通じて一定な要素のうち、説明変数と相関のあるもの。説明変数と相関を持つ変量効果、とも呼ばれる。
independence 独立 二つ以上の集団間に関係がないこと。
interval estimate 区間推定 標本データを用いて、母数の存在する区間を推定した際の区間。
解としては、母数がその区間に存在する確率を示す。
multiple regression 重回帰 説明変数が複数存在する回帰。
multi-variate analysis 多変量解析 複数個の確率変数を解析する手法の総称。
observed values 観測値 観察・調査・実験・研究・試験などによって入手された数値。
標本(samples)とほぼ同義。
outlier 異常値 他の観測値からかけ離れた数値ではあるが、ただ単に値だけがかけ離れているだけであるがゆえに測定ミスという理由では除外できない値。
parameter 補助変数 母集団の分布が決まれば確定する変数。
point estimate 点推定値 標本データを用いて母数を点として推定した際の値。
population distribution 母集団分布 要素の数が多く、連続的な曲線で示される。
複数個の母集団であっても、分布の形は同じことが多い。
random effect 変量効果 誤差項において、時間を通じて一定な要素のうち、説明変数と相関のないもの。(関連用語:fixed effect、固定効果)
random error 偶然誤差 たまたま発生する可能性のある誤差。
regression 回帰 変量の間に従属関係がある。
直線への回帰か、曲線への回帰かに大別される。
reproducibility 再現性 観察・調査・実験・研究・試験などによって入手したデータと、本質的に同じデータを再度入手可能であることが保証されている状態。
samples 標本 観察・調査・実験・研究・試験などによって入手されたもの。
データや観測値などと表現されることもある。
sample distribution 標本分布 標本の数は有限で小数である。
具体的な数値データの分布は標本の取り方ごとに異なった形を示す。
sample error 標本誤差 統計量が含む誤差。
標本から”母集団に関する情報”を得るための数式が含む誤差。
sample space 標本空間 標本を空間内に存在する点とし、それぞれの点と点の間の空間はないと考えた抽象空間。
sample statistics 標本統計量 標本の数値を処理して、母集団等に関する情報を得るための計算式。
sampling 標本抽出 標本を取り出すこと。
systematic error 系統誤差 たまたまではなく系統的に発生する誤差。
例えば、データ取得者の癖、測定に用いる機器の性質や精度、測定環境等が原因となり発生することがある。
topological space 位相空間 近傍や収束という位相的構造を許した集合。
unbiased variance 不偏分散 母分散の点推定値。
偏差平方和を自由度で割った値。

-統計学

© 2021 Real-World Data/Evidence website