# asset embedding指标计算 ## 概述 代码主要功能包括: - 原始数据自动加载合并 - 关键财务指标计算 ## 原始数据 原始数据都在rawdata文件夹中,各文件及其字段含义如下: ### FS_Combas.csv: Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。 ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。 Accper [统计截止日期] - YYYY-MM-DD,前四位表示会计报表公布年度 Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。 A001000000 [资产总计,单位元] - 资产各项目之总计。1990年起使用 A003112101 [其中:优先股,单位元] - 优先股是相对于普通股而言的。主要指在利润分红及剩余财产分配的权利方面,优先于普通股。2015年起使用。 A003000000 [所有者权益合计,单位元] - 股东权益各项目之合计。1990年起使用 ### TRD_Mnth.csv: Stkcd [证券代码] - 以上交所、深交所公布的证券代码为准 Trdmnt [交易月份] - 以YYYY-MM表示 Msmvosd [月个股流通市值,单位千元] - 个股的流通股数与月收盘价的乘积。计算公式为:个股的流通股数与月收盘价的乘积。 A股以人民币元计,上海B以美元计,深圳B以港币计,注意单位是千 Msmvttl [月个股总市值,单位千元] - 个股的发行总股数与月收盘价的乘积。计算公式为:个股的发行总股数与月收盘价的乘积,A股以人民币元计,上海B股以美元计,深圳B股以港币计,注意单位是千 Mretwd [考虑现金红利再投资的月个股回报率] - 字段说明见说明书“周、月、年个股回报率的计算方法”。 ### TRD_Cnmont.csv: Markettype [市场类型] - 5=沪深A股市场(不包含科创板、创业板), 10=沪深B股市场, 15=沪深AB股市场, 21=沪深A股和创业板, 31=沪深AB股和创业板, 37=沪深A股和科创板, 47=沪深AB股和科创板, 53=沪深A股和创业板和科创板, 63=沪深AB股和创业板和科创板,33=上证A股和科创板,20=深证A股和创业板, 69=沪深京A股市场,79=沪深京AB股市场,85=沪深京A股和创业板,95=沪深京AB股和创业板, 101=沪深京A股和科创板, 111=沪深京AB股和科创板, 117=沪深京A股和创业板和科创板,127=沪深京AB股和创业板和科创板。 Trdmnt [交易月份] - 以YYYY-MM表示 Cmretwdos [考虑现金红利再投资的综合月市场回报率(流通市值加权平均法)] - 字段说明见说明书“3.4 市场回报率的计算方法”。 ### TRD_Nrrate.csv: Nrr1 [无风险利率基准] - NRI01=定期-整存整取-一年利率 Clsdt [统计日期] - 统计截止日期,YYYY-MM-DD Nrrmtdt [月度化无风险利率(%)] - 根据复利计算方法,将年度的无风险利率转化为月度数据。计算公式为:(POWER(1+Nrrdata/100,1/12)-1)*100 ### FS_Comins.csv: Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。 ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。 Accper [统计截止日期] - 指会计报表日,统一用10位字符表示,如1999-12-31。 Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。 B001101000 [营业收入,单位元] - 企业经营过程中确认的营业收入。 B001201000 [营业成本,单位元] - 企业确认的营业成本。 B001300000 [营业利润,单位元] - 与经营业务有关的利润。2019.06.30之前,计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益。2019.06.30之后计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益+资产减值损失+信用减值损失。其中,2019.01.01的数据因提取的是2019.12.31的期初数据,所以计算公式符合2019.06.30之后的计算公式。 ### DPR_Finidx.csv: Stkcd [证券代码] - 上海A股以上交所公布的证券代码为准,深圳A股以深交所公布的证券代码前加上00 Accper [统计截止日期] - 以YYYY-MM-DD表示 T20497 [每股股利] - 每股股利 = 股利分派率*每股收益。 ### CG_Capchg.csv: Stkcd [证券代码] - 以交易所公布的证券代码为准。 Reptdt [统计截止日期] - 以YYYY-MM-DD列示,部分缺少在相应位置上以00表示,如1993年12月某日表示为1993-12-00,基本情况统计的截止日期 Nshrttl [总股数] ## 计算方法及其代码 代码是code/main.py 在运行时,修改一下data_folder路径 各变量计算方法如下: be: 账面价值,来自FS_Combas.csv的A003000000[所有者权益合计,单位元] me:流通市值,来自TRD_Mnth.csv的Msmvosd [月个股流通市值,单位千元] be_me:账面市值比,账面价值/(流通市值*1000) at_gr1:资产增长率,$at\_gr1 = \frac{AT\_t}{AT\_{t-12}} - 1$,参考documentation.pdf的算法 gp_at:盈利能力指标(营业利润/总资产),营业利润 / 总资产,没有找到相关文献 ret_12_1:动量指标,$ret\_12\_1 = \frac{RI\_{t-1}}{RI\_{t-12}} - 1$,参考documentation.pdf的算法 div_at:股息资产比,(每股股利 * 总股数) / 总资产,没有找到相关文献 beta_60m:Dual Beta系数(60个月滚动窗口),参考https://github.com/Quantactix/ChinaAShareEquityCharacteristics/tree/main ## 输出 输出结果在output文件夹中