pandasの使い方

1.pandasを動かしてみる

pandasを動かすには、Numpyとpandasをインストールする必要があります。 インストール方法はPythonインストールページを参照ください。
pandasを動かす方法として次の二つがあります。
  • コマンドプロンプト上で直接入力
  • ファイル内にコマンドを記述してファイル実行
ここではまず、コマンドプロンプト上で直接入力しながらpandasにふれてみて体感してみます。
そこで次のpandas_sample1.zipをダウンロードし、Desktop上に解凍しておきます。

  1. コマンドプロンプトの起動
  2. pythonの起動
  3. pandasの起動
  4. csvデータの読み込み
  5. indexの修正
  6. 行データの抽出
  7. 列データの抽出
  8. 要素データの抽出
  9. データの計算

(1)コマンドプロンプトの起動

コマンドプロンプトを立ち上げ、desktop上のpandas_sampleをカレントディレクトリに設定します。 ディレクトリの移動コマンドは“cd”です。

コマンドプロンプトの起動

Microsoft Windows [Version 10.0.18362.836]
(c) 2019 Microsoft Corporation. All rights reserved.

C:\Users\***> cd desktop

C:\Users\***\Desktop > cd pandas_sample

C:\Users\***\Desktop\pandas_sample >


節はじめに戻る


(2)pythonの起動

"python"と入力してEnterを押すと、pythonが起動します。
C:\Users\***\Desktop\pandas_sample > python

Python *.*.* (tags/v*.*.*:e********e, Jul  * ****, **:**:**) [MSC v.**** 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>


節はじめに戻る


(3)pandas(+numpy)の起動

次のコマンドを入力すると、pandasを利用できます。
>>> import numpy as np
>>> import pandas as pd


※上記コマンドのうち、“as np”、“as pd”は特に入力しなくても構いません。 ただし、以降出てくるコマンドに対し、“pandas.***”と入力しなければならないところを“pd.***”と簡略化できますので、一般に“as np”、“as pd”が用いられます。(pdでなくても構いません)。 意味合いとしては、numpyをnpとして、pandasをpdとして扱います、ということです。

節はじめに戻る


(4)csvデータの読み込み

大量データの処理を行いたい場合にpandasを使うことが多いため、まずはcsvファイルからデータを取り込んでみます。 そこで、pandas_sampleフォルダ内にあるsample1_1.csvを読み込みます。

sample1_1.csv

>>> df = pd.read_csv( 'sample1_1.csv' )


これはsample1_1.csv内のデータをpandasで読み込んで、変数dfに入れ込む、というコマンドです。
変数dfの中身を確認するため、dfと入力してEnterを押します。
>>> df
       data1  data2  data3
0   0.000154 -0.037  1.300
1   0.000142 -0.036  0.100
2   0.000148 -0.036  0.120
・・・(省略)・・・
29  0.000118 -0.033  0.920
>>>



左に1列追加されています。これは、pandasがデータの各行に自動的に貼り付けたラベルです (この列をindexと呼びます)。 また、csvファイルの1列目(data1, data2, data3)は各データ列のタイトルとして扱われます (タイトル行はcolumnsと呼びます)。

節はじめに戻る


~~~ 目次 ~~~

参考文献