ここで学習すること
行列を扱うためのPandasというパッケージについて学習します。
Series型の行列の作成の仕方、Excelファイルの読み込み方を学習します。
Pandasはデータを行列で扱うためのパッケージです。Pandasでは数値の他に文字列データも扱えます。
扱えるデータ構造はSeriesとDataFrameの2つです。
行列が扱えるDataFrameを使うことが多いです。
縦軸の[0,1,2,3,4]をインデックスといいます。
横軸の[“日”,”湿度”,”温度”,”天候”,”風”]をカラムといいます。
Pandasの読み込み方
import pandasでpandasをインポートできます。as pdとすることでこの後pd.関数名で使用できます。
import pandas as pd
Seriesの作成方法
import pandas as pd
list = {‘気温’:5, ‘湿度’: 10} #listという辞書型の行列を作成
print(pd.Series(list)) #Series()にlistを渡します
=>
気温 5
湿度 10
dtype: int64
エクセルファイルの読み込み方
下のエクセルファイル(testdata2df.xlsx)を読み込みます。
エクセルファイルは.pyファイルと同じフォルダへ保存します。
import pandas as pd
data = pd.read_excel(‘testdata2df.xlsx’)
print(data)
=>
日 湿度 温度 天気 風
0 2 4 2 晴 強
1 1 4 9 くもり 無
2 12 5 43 雨 弱
3 0 98 3 雨 強
4 2 7 67 くもり 無
print(type(data))
=>
<class’ pandas.core.frame.DataFrame’> #DataFrameとして取り込まれました
列の順を変更する
第2引数にcolumns=[リスト]を指定することでリストに指定した順に並べ変えられます。
df = pd.DataFrame(data, columns=[“日”,”天気”,”風”,”湿度”,”温度”])
print(df)
日 天気 風 湿度 温度
0 2 晴 強 4 2
1 1 くもり 無 4 9
2 12 雨 弱 5 43
3 0 雨 強 98 3
4 2 くもり 無 7 67