Pandas的一些基础用法

首先我们导入一些‘业界标准’库

1
2
3
4
import pandas as pd
import numpy as np
import talib as ta
import matplotlib.pyplot as plt

Pandas 里有两种常用的结构,一种叫DataFrame,作为二维的一张表格;另一种叫Series,是一维数组。
DataFrame取单行和单列得到的都是Series类型的对象。

追加数据

1
df = df.append(series, ignore_index=True)

获取最后一列数据

1
series = df.iloc[-1]

按行遍历

1
2
for i in df.index:
    print(df.iloc[i])

前十行组成子DataFrame

1
2
for i in df.index:
    print(df.iloc[0:10])  # 含下标0到9的元素,不含下标10的元素

获取名为 close 的 column

1
2
3
series = df.close
或者
series = df['close']

取某行(series)中单个元素

1
2
3
series = df.iloc[0]
close: float = series.close
close: float = series['close']

1
df.iloc[0]['close']

series 转 list

1
series.list()

series 转 np array

1
2
3
4
5
np_array = np.array(series)

np_array = np.array(df.close)

np_array = np.array(df['close'])

结合 talib 计算

1
ta.RSI(np.array(bars.close))

可视化

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
df = pd.DataFrame({
    'close': ... ,
    'open': ... ,
    'high': ... ,
    'low': ... ,
    'timestamp', ...
})

# figure 1
df.plot(x='timestamp', y=['close', 'high', 'low'])  # 展示 close high low 三个属性

# figure 2
df.plot(x='timestamp')  # 展示全部属性

# 展示上面两幅绘制过的图
plt.show()

Over

Comments