Python大数据分析 2025-06-21 16:01 浙江
import baostock as bs
import pandas as pd
# 登录系统
lg = bs.login()
# 获取股票历史数据
rs = bs.query_history_k_data_plus("sh.600000",
"date,code,open,high,low,close,preclose,volume,amount,adjustflag",
start_date='2022-01-01', end_date='2022-12-31',
frequency="d", adjustflag="3")
# 错误码检查
if rs.error_code == '0':
result = pd.DataFrame(rs.get_data())
print(result)
else:
print('query_history_k_data_plus respond error_code:'+rs.error_code)
print('query_history_k_data_plus respond error_msg:'+rs.error_msg)
# 登出系统
bs.logout()
import akshare as ak
# 获取上证指数的历史行情数据
stock_zh_index_daily_df = ak.stock_zh_index_daily(symbol="sh000001")
print(stock_zh_index_daily_df)
TushareTushare是一个热门免费(部分需要积分)的Python财经数据接口包,是国内大佬开发的,提供股票等金融数据的采集、清洗加工到数据存储的全过程。
yfinanceyfinance 是一个基于 Python 的金融数据接口库,主要用于获取雅虎财经 (Yahoo Finance) 提供的金融数据。yfinance可以获取股票历史价格数据(包括开盘价、最高价、最低价、收盘价、成交量)、实时价格数据等,你可以选择不同的时间尺度来获取数据,如日线、周线、月线等。import tushare as ts
pro = ts.pro_api('your_token')
df = pro.index_daily(ts_code='000001.SH', start_date='20200101', end_date='20230101')
print(df)
pandas_datareaderpandas_datareader是专为 pandas 用户设计的金融数据接口库,用于从多个在线数据源获取金融和经济数据。它支持多种数据源,包括但不限于 Yahoo Finance、Google Finance、FRED、World Bank、OECD 等,使其成为金融数据分析的全能工具。import yfinance as yf
# 获取单个股票的历史数据
ticker = 'AAPL'
data = yf.download(ticker, start='2020-01-01', end='2023-01-01')
# 获取多个股票的历史数据
tickers = ['AAPL', 'MSFT', 'GOOGL']
data = yf.download(tickers, start='2020-01-01', end='2023-01-01')
Alpha VantageAlpha Vantage 是一个提供全球实时和历史金融市场数据的API服务,支持全球超过200,000种金融工具的数据查询,涵盖股票、ETFs、加密货币、外汇、商品期货等。其Python库 alpha_vantage 为开发者提供了一个简单易用的接口来访问这些数据。import pandas_datareader as pdr
from datetime import datetime
# 获取特定股票的历史数据
start = datetime(2020, 1, 1)
end = datetime(2023, 1, 1)
data = pdr.get_data_yahoo('AAPL', start, end)
print(data.head())
# 获取宏观经济数据
gdp_data = pdr.get_data_fred('GDPC1', start, end)
print(gdp_data.head())
以上的这些Python金融数据库具备广泛的市场数据覆盖、实时性、技术指标计算、易用性等特点,适用于投资分析、量化交易策略开发、学术研究和教育等多种场景。而且在Python生态中使用起来非常方面,你可以用pandas、numpy、sklearn、matplotlib等数据分析库去分析展示数据。from alpha_vantage.timeseries import TimeSeries
# 初始化 TimeSeries 对象
ts = TimeSeries(key='YOUR_API_KEY', output_format='pandas')
# 获取指定股票的日线数据
data, meta_data = ts.get_daily(symbol='AAPL', outputsize='full')
print(data)