asset embedding指标计算
概述
代码主要功能包括:
- 原始数据自动加载合并
- 关键财务指标计算
原始数据
原始数据都在rawdata文件夹中,各文件及其字段含义如下:
FS_Combas.csv:
Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。
ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。
Accper [统计截止日期] - YYYY-MM-DD,前四位表示会计报表公布年度
Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。
A001000000 [资产总计,单位元] - 资产各项目之总计。1990年起使用
A003112101 [其中:优先股,单位元] - 优先股是相对于普通股而言的。主要指在利润分红及剩余财产分配的权利方面,优先于普通股。2015年起使用。
A003000000 [所有者权益合计,单位元] - 股东权益各项目之合计。1990年起使用
TRD_Mnth.csv:
Stkcd [证券代码] - 以上交所、深交所公布的证券代码为准
Trdmnt [交易月份] - 以YYYY-MM表示
Msmvosd [月个股流通市值,单位千元] - 个股的流通股数与月收盘价的乘积。计算公式为:个股的流通股数与月收盘价的乘积。 A股以人民币元计,上海B以美元计,深圳B以港币计,注意单位是千
Msmvttl [月个股总市值,单位千元] - 个股的发行总股数与月收盘价的乘积。计算公式为:个股的发行总股数与月收盘价的乘积,A股以人民币元计,上海B股以美元计,深圳B股以港币计,注意单位是千
Mretwd [考虑现金红利再投资的月个股回报率] - 字段说明见说明书“周、月、年个股回报率的计算方法”。
TRD_Cnmont.csv:
Markettype [市场类型] - 5=沪深A股市场(不包含科创板、创业板), 10=沪深B股市场, 15=沪深AB股市场, 21=沪深A股和创业板, 31=沪深AB股和创业板, 37=沪深A股和科创板, 47=沪深AB股和科创板, 53=沪深A股和创业板和科创板, 63=沪深AB股和创业板和科创板,33=上证A股和科创板,20=深证A股和创业板, 69=沪深京A股市场,79=沪深京AB股市场,85=沪深京A股和创业板,95=沪深京AB股和创业板, 101=沪深京A股和科创板, 111=沪深京AB股和科创板, 117=沪深京A股和创业板和科创板,127=沪深京AB股和创业板和科创板。
Trdmnt [交易月份] - 以YYYY-MM表示
Cmretwdos [考虑现金红利再投资的综合月市场回报率(流通市值加权平均法)] - 字段说明见说明书“3.4 市场回报率的计算方法”。
TRD_Nrrate.csv:
Nrr1 [无风险利率基准] - NRI01=定期-整存整取-一年利率
Clsdt [统计日期] - 统计截止日期,YYYY-MM-DD
Nrrmtdt [月度化无风险利率(%)] - 根据复利计算方法,将年度的无风险利率转化为月度数据。计算公式为:(POWER(1+Nrrdata/100,1/12)-1)*100
FS_Comins.csv:
Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。
ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。
Accper [统计截止日期] - 指会计报表日,统一用10位字符表示,如1999-12-31。
Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。
B001101000 [营业收入,单位元] - 企业经营过程中确认的营业收入。
B001201000 [营业成本,单位元] - 企业确认的营业成本。
B001300000 [营业利润,单位元] - 与经营业务有关的利润。2019.06.30之前,计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益。2019.06.30之后计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益+资产减值损失+信用减值损失。其中,2019.01.01的数据因提取的是2019.12.31的期初数据,所以计算公式符合2019.06.30之后的计算公式。
DPR_Finidx.csv:
Stkcd [证券代码] - 上海A股以上交所公布的证券代码为准,深圳A股以深交所公布的证券代码前加上00
Accper [统计截止日期] - 以YYYY-MM-DD表示
T20497 [每股股利] - 每股股利 = 股利分派率*每股收益。
CG_Capchg.csv:
Stkcd [证券代码] - 以交易所公布的证券代码为准。
Reptdt [统计截止日期] - 以YYYY-MM-DD列示,部分缺少在相应位置上以00表示,如1993年12月某日表示为1993-12-00,基本情况统计的截止日期
Nshrttl [总股数]
计算方法及其代码
代码是code/main.py 在运行时,修改一下data_folder路径
各变量计算方法如下:
be: 账面价值,来自FS_Combas.csv的A003000000[所有者权益合计,单位元]
me:流通市值,来自TRD_Mnth.csv的Msmvosd [月个股流通市值,单位千元]
be_me:账面市值比,账面价值/(流通市值*1000)
at_gr1:资产增长率,$at_gr1 = \frac{AT_t}{AT_{t-12}} - 1$,参考documentation.pdf的算法
gp_at:盈利能力指标(营业利润/总资产),营业利润 / 总资产,没有找到相关文献
ret_12_1:动量指标,$ret_12_1 = \frac{RI_{t-1}}{RI_{t-12}} - 1$,参考documentation.pdf的算法
div_at:股息资产比,(每股股利 * 总股数) / 总资产,没有找到相关文献
beta_60m:Dual Beta系数(60个月滚动窗口),参考https://github.com/Quantactix/ChinaAShareEquityCharacteristics/tree/main
输出
输出结果在output文件夹中