首先我们导入一些‘业界标准’库
1
2
3
4
| import pandas as pd
import numpy as np
import talib as ta
import matplotlib.pyplot as plt
|
Pandas 里有两种常用的结构,一种叫DataFrame
,作为二维的一张表格;另一种叫Series
,是一维数组。
DataFrame
取单行和单列得到的都是Series
类型的对象。
追加数据
1
| df = df.append(series, ignore_index=True)
|
获取最后一列数据
按行遍历
1
2
| for i in df.index:
print(df.iloc[i])
|
前十行组成子DataFrame
1
2
| for i in df.index:
print(df.iloc[0:10]) # 含下标0到9的元素,不含下标10的元素
|
获取名为 close 的 column
1
2
3
| series = df.close
或者
series = df['close']
|
取某行(series)中单个元素
1
2
3
| series = df.iloc[0]
close: float = series.close
close: float = series['close']
|
或
series 转 list
series 转 np array
1
2
3
4
5
| np_array = np.array(series)
或
np_array = np.array(df.close)
或
np_array = np.array(df['close'])
|
结合 talib 计算
1
| ta.RSI(np.array(bars.close))
|
可视化
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
| df = pd.DataFrame({
'close': ... ,
'open': ... ,
'high': ... ,
'low': ... ,
'timestamp', ...
})
# figure 1
df.plot(x='timestamp', y=['close', 'high', 'low']) # 展示 close high low 三个属性
# figure 2
df.plot(x='timestamp') # 展示全部属性
# 展示上面两幅绘制过的图
plt.show()
|
Over