さっそく分析をしてみましょう

それでは、動物の寿命などの特性をまとめたデータで、基本的な分析の流れをみていきましょう。

 

データは先程あったボタンからデータをダウンロードDLします。

上のリンク先からGoogle Drive(左図)に飛びます。

 

右上のダウンロードアイコンをクリックしてTSVファイルをダウンロードしましょう。

ダウンロードが終わったら、[ダウンロード]フォルダにTSVファイルが保存されたか確認してみましょう。

 

エクスプローラで[ダウンロード]を選択したら左の図のようになっていると思います。

※TSVファイル:CSVファイルと同じようなファイルです。タブ区切り値の略で、複数の項目で構成されるデータを複数件列挙して表現することができる汎用的なデータ形式の一つです。項目間の区切り文字にCSVのコンマ「,」の代わりにタブ文字を用いたものです。CSVで起こりがちなトラブルが回避できるデータフォーマットです。AP+DN7は、CSVもTSVも読むことができます。

 

※CSVファイル:文字列をコンマ「,」で区切ったデータのことです。一般的に流通しているデータ形式です。こんな感じのデータになります。

 名前, 色, 年齢

 竈門 炭治郎, 黒色, 15

 嘴平 伊之助, 藍鼠色, 15

 甘露 寺蜜璃, 桜色, 19

 煉獄 杏寿郎, 赤色,  20

こんな感じのデータです(クリックしたら大きくなります)。

こちらのデータはAP+DN7のチュートリアル用に作成したデータです。ソースに一貫性がないところがありますのでデータの内容そのものは参考値としてください。

 

レベルとあるのは各項目のログ値です。ログや対数をまだ習っていない人は、数値の"規模"だと思ってください。鶏は鳥類なので妊娠期間はありませんが、羽化期間をデータとしました。

生物のデータは文献によってもかなり違います。また犬だけでも、小型犬・中型犬・大型犬で大きく異なりますし、どの犬種の値を使うかで大きく値が変わりますので、細かいところは目をつぶってください。データ分析の理解ためのデータと割り切りましょう。

 

上記論文を中心に複数の文献から作成。