Pandas1|SeriseとDataFrameの違い

  • URLをコピーしました!

ここで学習すること

行列を扱うためのPandasというパッケージについて学習します。

Series型の行列の作成の仕方、Excelファイルの読み込み方を学習します。

Pandasはデータを行列で扱うためのパッケージです。Pandasでは数値の他に文字列データも扱えます。

扱えるデータ構造はSeriesとDataFrameの2つです。

行列が扱えるDataFrameを使うことが多いです。

縦軸の[0,1,2,3,4]をインデックスといいます。

横軸の[“日”,”湿度”,”温度”,”天候”,”風”]をカラムといいます。

Pandasの読み込み方

import pandasでpandasをインポートできます。as pdとすることでこの後pd.関数名で使用できます。

import pandas as pd

Seriesの作成方法

import pandas as pd

list = {‘気温’:5, ‘湿度’: 10} #listという辞書型の行列を作成

print(pd.Series(list))      #Series()にlistを渡します

=>

気温     5

湿度    10

dtype: int64

エクセルファイルの読み込み方

下のエクセルファイル(testdata2df.xlsx)を読み込みます。

エクセルファイルは.pyファイルと同じフォルダへ保存します。

import pandas as pd

data = pd.read_excel(‘testdata2df.xlsx’)

print(data)

=>

    日  湿度 温度  天気  風

0     2         4       2       晴    強

1     1          4       9     くもり    無

2    12         5      43       雨    弱

3     0        98        3       雨    強

4     2          7       67     くもり    無

print(type(data))

=>

<class’ pandas.core.frame.DataFrame’> #DataFrameとして取り込まれました

列の順を変更する

第2引数にcolumns=[リスト]を指定することでリストに指定した順に並べ変えられます。

df = pd.DataFrame(data, columns=[“日”,”天気”,”風”,”湿度”,”温度”])

print(df)

日  天気 風 湿度  温度

0     2       晴    強         4            2

1     1     くもり    無         4            9

2    12       雨    弱         5           43

3     0       雨    強        98            3

4     2     くもり    無         7           67

よかったらシェアしてね!
  • URLをコピーしました!
目次