R データ確認(一変量集計)のための関数1
一変量集計や分布、度数のプロットが一度にできないとめんどくさいので、それ用の関数をとりあえず作成。
色々なデータではまだ試していません。
dataCheck1 <- function(Data, ngr=3){
print( "データのヘッド部分, head(Data)" )
print( head(Data) )
print( "データの構造, str(Data)" )
print( str(Data) )
print("データの要約統計量, summary(Data)")
print( summary(Data) )
# 変数の数を取得
r <- length(Data)
# 変数名を取得
vname <- names(Data)
index1 <- ngr
par( mfrow=c(ceiling(r/index1), index1) )
on.exit(par( mfrow=c(1,1) )) #関数が終了するときの処理
for(i in 1:r){
if( is.factor(Data[,i]) == TRUE ){
barplot( table(Data[,i]), main=vname[i] )
}else{
hist( Data[,i], xlab="", main=vname[i] )
}
}
}
dataCheck1(データ, ngr=プロットを横に何列並べるか) で実行。
dataCheck1(iris)
ngrは指定しなければ、デフォルトで3になる。
[1] "データのヘッド部分, head(Data)" Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa [1] "データの構造, str(Data)" 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ... NULL [1] "データの要約統計量, summary(Data)" Sepal.Length Sepal.Width Petal.Length Petal.Width Species Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50 Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50 Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800 Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500