3.Pandas配列

Pandasの操作をコマンドプロンプト上で実行する場合は、Pythonを起動後、最初にこのコマンドを実行します。
これにより“pandas.***”と入力するところを“pd.***”と短縮できます。
>>> import pandas as pd

3.1.Pandas配列の作成

  1. 一次配列の作成(Series)
  2. 二次配列の作成(DataFrame)

(1)一次配列の作成(Series)

  • pandas.Series(data, index)
data 配列の中身を指定します。 list、Numpy配列(ndarray)で指定できます。
index 配列のラベルを指定します。 未指定の場合、0からの連番が定義されます。

#リストで指定
>>> pd.Series([1,2,3,4,5])
0    1
1    2
2    3
3    4
4    5

#Numpy配列で指定
>>> a = np.array([6,7,8,9,10])
>>> pd.Series(a)
0     6
1     7
2     8
3     9
4    10

#数値を直接指定
>>> pd.Series(1)
0    1

#indexを指定した場合
>>> pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
a    1
b    2
c    3
d    4
e    5

>>> pd.Series(1,['a','b','c'])
a    1
b    1
c    1

  • pandas.Series(dictionary)
Pythonの“Dictionary”でも設定できます。 この場合は、データとindexを同時に定義できます。
>>> a = {'a':1,'b':2,'c':3}
>>> pd.Series(a)
a    1
b    2
c    3

Numpy配列を変数に引き当てる場合は次のようにします(変数を“a”とします)。
>>> a = np.array([1.5, 2.3, 3.1])
>>> a
array([1.5, 2.3, 3.1])

その他詳細はPandas Manual参照下さい。

節はじめに戻る


(2)二次配列の作成(DataFrame)

Pandasの二次配列は、行、列それぞれをラベリングした二次元の構造を持ちます。
  • pandas.DataFrame(data, index, columns)
data 配列の中身を指定します。 list、Numpy配列(ndarray)で指定できます。
index 行方向のラベルを指定します。 未指定の場合、0からの連番が定義されます。
columns 列方向のラベルを指定します。 未指定の場合、0からの連番が定義されます。

#listで指定
>>> pd.DataFrame([[1,2,3],[4,5,6]])
   0  1  2
0  1  2  3
1  4  5  6

#Numpy配列で指定
>>> a = np.array([[1,2],[3,4]])
>>> pd.DataFrame(a)
   0  1
0  1  2
1  3  4

#indexを指定
>>> pd.DataFrame([[1,2],[3,4]],index=['a','b'])
   0  1
a  1  2
b  3  4

#columnsを指定
>>> pd.DataFrame([[1,2],[3,4]],index=['a','b'],columns=['x','y'])
   x  y
a  1  2
b  3  4

  • pandas.DataFrame(Dictionary, index)
Pythonの“Dictionary”でも設定できます。 この場合は、データとindexを同時に定義できます。
>>> a = {'a':[1,2,3],'b':[4,5,6]}
>>> pd.DataFrame(a)
   a  b
0  1  4
1  2  5
2  3  6

#index指定した場合
>>> pd.DataFrame(a,index=['x','y','z'])
   a  b
x  1  4
y  2  5
z  3  6

その他詳細はPandas Manual参照下さい。

節はじめに戻る


参考文献