Tushare Pro 新版发布,免费、开源的python财经数据接口包

草莓芒果 2024-09-02 17:09:00 阅读 67

Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集清洗加工数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。考虑到Python pandas包在金融量化分析中体现出的优势,Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。当然,如果您习惯了用Excel或者关系型数据库做分析,您也可以通过Tushare的数据存储功能,将数据全部保存到本地后进行分析。应一些用户的请求,从0.2.5版本开始,Tushare同时兼容Python 2.x和Python 3.x,对部分代码进行了重构,并优化了一些算法,确保数据获取的高效和稳定。

下载安装

  • 方式1:

    pip install tushare

    如果安装网络超时可尝试国内pip源,如pip install tushare -ihttps://pypi.tuna.tsinghua.edu.cn/simple

  • 方式2:访问https://pypi.python.org/pypi/tushare/下载安装 ,执行 python setup.py install

  • 方式3:访问https://github.com/waditu/tushare,将项目下载或者clone到本地,进入到项目的目录下,

    执行: python setup.py install

版本升级

<code> pip install tushare --upgrade

查看当前版本的方法:

import tushare

print(tushare.version)

如何优雅高效的撸数据


获取Tushare Pro 的数据API,首先需要注册一个pro账号,然后登录pro网站在个人主页里拿到token码。另外,别忘了修改一下个人信息,这样可以多20积分。对于股票行情数据,只要有120积分就可以相对高频的撸数据了,这120积分随手可得(注册成功有100积分、然后修改个人信息有20积分)。

Tushare的行情等时间序列数据,一般都有两个常用参数:trade_date和ts_code,分别是交易日期和证券代码。如果你是想提取部分个股的历史数据,用ts_code参数,加上开始和结束日期可以方便提取数据。

但!如果是要获取所有历史数据,我们不建议通过ts_code来循环,而是用trade_date来提取,道理很简单,股票有5000多个,需要循环5000多次,每年的交易日也就才220左右,所以效率更高。总的来说,积分越高可以调取的频次会越高。

也就是以下方式:

import tushare as ts

pro = ts.pro_api()

df = pro.daily(trade_date='20200325')code>

在循环提取数据时,首先我们可以通过交易日历拿到一段历史的交易日。

#获取20200101~20200401之间所有有交易的日期

df = pro.trade_cal(exchange='SSE', is_open='1', code>

start_date='20200101', code>

end_date='20200401', code>

fields='cal_date')code>

print(df.head())

交易日:

cal_date

0 20200102

1 20200103

2 20200106

3 20200107

4 20200108

循环过程中,为了保持数据提取的稳定性,可以先建立一个专门的函数,实现一个重试机制:

def get_daily(self, ts_code='', trade_date='', start_date='', end_date=''):code>

for _ in range(3):

try:

if trade_date:

df = self.pro.daily(ts_code=ts_code, trade_date=trade_date)

else:

df = self.pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)

except:

time.sleep(1)

else:

return df

然后通过在循环中调取数据

for date in df['cal_date'].values:

df = get_daily(date)

更多学习资料,请关注Tushare官方公众号“挖地兔”,可以获取到数据科学和金融数据相关领域的文章:


上一篇: 6.字符串类型和年龄游戏的升级

下一篇: C语言:函数详解(2)

本文标签

tushare    数据    df    Tushare    获取   


声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。