AssetEmbedding / readme.md
Carzit's picture
Upload folder using huggingface_hub
7ba5baa verified

asset embedding指标计算

概述

代码主要功能包括:

  • 原始数据自动加载合并
  • 关键财务指标计算

原始数据

原始数据都在rawdata文件夹中,各文件及其字段含义如下:

FS_Combas.csv:

Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。

ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。

Accper [统计截止日期] - YYYY-MM-DD,前四位表示会计报表公布年度

Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。

A001000000 [资产总计,单位元] - 资产各项目之总计。1990年起使用

A003112101 [其中:优先股,单位元] - 优先股是相对于普通股而言的。主要指在利润分红及剩余财产分配的权利方面,优先于普通股。2015年起使用。

A003000000 [所有者权益合计,单位元] - 股东权益各项目之合计。1990年起使用

TRD_Mnth.csv:

Stkcd [证券代码] - 以上交所、深交所公布的证券代码为准

Trdmnt [交易月份] - 以YYYY-MM表示

Msmvosd [月个股流通市值,单位千元] - 个股的流通股数与月收盘价的乘积。计算公式为:个股的流通股数与月收盘价的乘积。 A股以人民币元计,上海B以美元计,深圳B以港币计,注意单位是千

Msmvttl [月个股总市值,单位千元] - 个股的发行总股数与月收盘价的乘积。计算公式为:个股的发行总股数与月收盘价的乘积,A股以人民币元计,上海B股以美元计,深圳B股以港币计,注意单位是千

Mretwd [考虑现金红利再投资的月个股回报率] - 字段说明见说明书“周、月、年个股回报率的计算方法”。

TRD_Cnmont.csv:

Markettype [市场类型] - 5=沪深A股市场(不包含科创板、创业板), 10=沪深B股市场, 15=沪深AB股市场, 21=沪深A股和创业板, 31=沪深AB股和创业板, 37=沪深A股和科创板, 47=沪深AB股和科创板, 53=沪深A股和创业板和科创板, 63=沪深AB股和创业板和科创板,33=上证A股和科创板,20=深证A股和创业板, 69=沪深京A股市场,79=沪深京AB股市场,85=沪深京A股和创业板,95=沪深京AB股和创业板, 101=沪深京A股和科创板, 111=沪深京AB股和科创板, 117=沪深京A股和创业板和科创板,127=沪深京AB股和创业板和科创板。

Trdmnt [交易月份] - 以YYYY-MM表示

Cmretwdos [考虑现金红利再投资的综合月市场回报率(流通市值加权平均法)] - 字段说明见说明书“3.4 市场回报率的计算方法”。

TRD_Nrrate.csv:

Nrr1 [无风险利率基准] - NRI01=定期-整存整取-一年利率

Clsdt [统计日期] - 统计截止日期,YYYY-MM-DD

Nrrmtdt [月度化无风险利率(%)] - 根据复利计算方法,将年度的无风险利率转化为月度数据。计算公式为:(POWER(1+Nrrdata/100,1/12)-1)*100

FS_Comins.csv:

Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。

ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。

Accper [统计截止日期] - 指会计报表日,统一用10位字符表示,如1999-12-31。

Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。

B001101000 [营业收入,单位元] - 企业经营过程中确认的营业收入。

B001201000 [营业成本,单位元] - 企业确认的营业成本。

B001300000 [营业利润,单位元] - 与经营业务有关的利润。2019.06.30之前,计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益。2019.06.30之后计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益+资产减值损失+信用减值损失。其中,2019.01.01的数据因提取的是2019.12.31的期初数据,所以计算公式符合2019.06.30之后的计算公式。

DPR_Finidx.csv:

Stkcd [证券代码] - 上海A股以上交所公布的证券代码为准,深圳A股以深交所公布的证券代码前加上00

Accper [统计截止日期] - 以YYYY-MM-DD表示

T20497 [每股股利] - 每股股利 = 股利分派率*每股收益。

CG_Capchg.csv:

Stkcd [证券代码] - 以交易所公布的证券代码为准。

Reptdt [统计截止日期] - 以YYYY-MM-DD列示,部分缺少在相应位置上以00表示,如1993年12月某日表示为1993-12-00,基本情况统计的截止日期

Nshrttl [总股数]

计算方法及其代码

代码是code/main.py 在运行时,修改一下data_folder路径

各变量计算方法如下:

be: 账面价值,来自FS_Combas.csv的A003000000[所有者权益合计,单位元]

me:流通市值,来自TRD_Mnth.csv的Msmvosd [月个股流通市值,单位千元]

be_me:账面市值比,账面价值/(流通市值*1000)

at_gr1:资产增长率,$at_gr1 = \frac{AT_t}{AT_{t-12}} - 1$,参考documentation.pdf的算法

gp_at:盈利能力指标(营业利润/总资产),营业利润 / 总资产,没有找到相关文献

ret_12_1:动量指标,$ret_12_1 = \frac{RI_{t-1}}{RI_{t-12}} - 1$,参考documentation.pdf的算法

div_at:股息资产比,(每股股利 * 总股数) / 总资产,没有找到相关文献

beta_60m:Dual Beta系数(60个月滚动窗口),参考https://github.com/Quantactix/ChinaAShareEquityCharacteristics/tree/main

输出

输出结果在output文件夹中