カテゴリデータだってサクッと見たい

このデータセット、カテゴリデータがたくさんあるのに、ここまであまり登場してません。カテゴリデータもサクッと把握してみたいですね。先ほどは[PCP平行座標プロット]と書いていましたが、実はこのPCPもうひと形態あります。[PCPパラレルカテゴリプロット]と呼ばれるものですが、AP+DN7では、こちらも使えるようになっています。平行座標プロットと区別するためにPCatPと表記します。

 

※カテゴリデータ:データをいくつかのグループに分類したデータのことです。例えば、果物はリンゴ・ミカン・メロンといったカテゴリに分類でき、血液型はA型/B型/O型/AB型の4つのカテゴリに分類することができます。学年(1年生/2年生/3年生)などもカテゴリデータです。

カテゴリデータのみを選択すると、自動的に第2形態に

変数選択の検索Boxに"str"と入力します。動物の横のTypeのところのStrの項目のみに絞られてくると思います。(カテゴリデータはStrに加えてIntもあり得るんですが、今回はStrのみで行きます。)

 

※Str:Stringの略。文字列のことです。基本カテゴリ値です。

※Int:Integerの略。整数値のことです。カテゴリ値の場合と連続値の場合があります。このデータだと妊娠期間は整数ですが、連続値になります。1:0~10年・2:10~20年みたいにグルーピングするとカテゴリ値になります。

絞られた全項目にチェックを入れて下さい。

目的変数にはペットを選びましょう。

 

[グラフ表示]をクリックします。

PCPでは項目ラベルを左右にドラッグアンドドロップすると軸の順番を入れ替えることができます。

 

※ドラッグアンドドロップ:画面上で動かしたいものなどがある時に、動かしたいものをクリックしたまま(ボタンを押し下げたまま)移動させ(ドラッグする、といいます)、移動先まで来てから離す(ドロップ、といいます)。

動物と食性を右の方に寄せてみます。

 

PCatPはいくつか見方がありますが、一つの見方として、カテゴリ毎の色の傾向が異なるものを探す、という見方をしてみます。

 

食性のところ、雑食/草食/肉食を見てみると、肉食だけ色が1色しかありません。雑食/草食が3色であるのに対して、ちょっと特殊ですね。

意味を考えてみると、肉食の動物はペットでないものしかない、ということになります。肉食の動物に着目してみます。

 

 

食性の項目ラベルのところで[右クリック]→[目的変数に選択]を選びます。

肉食の動物はペットになりにくいという関係がよりはっきりしますね。

食用か否かで見たデータがこちらです。食用のところの赤と青の比率に着目しましょう。

 

 単位のところ、匹が大きく比率が異なります。匹は人間より小さい動物に使われますがほとんど食用にされないということになりますね。

(ウサギはフランスなどではジビエ料理としてよく食べられる食材です。日本でも昔は食ベられていたようですが、今はあまり食べないですね。ちなみに羽という単位も使われます。これは奈良時代くらいから仏教の影響で四つ足の動物の捕食が禁止されていた際に、ウサギを鳥と見なして食べるために使われるようになったからといわれています。)

 

 ペットのところを見ると、色の比率が△のみ逆転しています。△(稀にペットになる)の場合、食用になる動物が多いことが分かります。

 

この様に色の比率で考えたときに特徴的なカテゴリを見つけることができます。

 

PCatP:パラレルカテゴリプロットを使うことで、カテゴリデータに関してもいろいろ発見することができますね。