有些汇总统计(如相关系数和协方差)是通过参数对计算出来的。
获取Yahoo!的股票价格与成交量
import pandas.io.data as web
all_data = {}
for ticker in ['AAPL', 'IBM', 'MSFT', 'GOOG']:
all_data[ticker] = web.get_data_yahoo(ticker)
price = DataFrame({tic: data['Adj Close']
for tic, data in all_data.iteritems()})
volume = DataFrame({tic: data['Volume']
for tic, data in all_data.iteritems()})
计算价格的百分数变化
returns = price.pct_change()
returns.tail()
Series的corr方法用于计算两个Series中重叠的、非NA的、按索引对齐的值的相关系数
returns.MSFT.corr(returns.IBM)
cov用于计算协方差
returns.MSFT.cov(returns.IBM)
DataFrame的corr和cov方法将以DataFrame的形式返回完整的相关系数或协方差矩阵
returns.corr()
returns.cov()
利用DataFrame的corrwith方法,可以计算其列或行与另一个Series或DataFrame之间的相关系数
returns.corrwith(returns.IBM)