Carzit commited on
Commit
7ba5baa
·
verified ·
1 Parent(s): c2ad514

Upload folder using huggingface_hub

Browse files
Files changed (9) hide show
  1. .gitattributes +3 -0
  2. CG_Capchg.csv +0 -0
  3. DPR_Finidx.csv +0 -0
  4. FS_Combas.csv +3 -0
  5. FS_Comins.csv +3 -0
  6. TRD_Cnmont.csv +0 -0
  7. TRD_Mnth.csv +3 -0
  8. TRD_Nrrate.csv +0 -0
  9. readme.md +118 -0
.gitattributes CHANGED
@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ FS_Combas.csv filter=lfs diff=lfs merge=lfs -text
37
+ FS_Comins.csv filter=lfs diff=lfs merge=lfs -text
38
+ TRD_Mnth.csv filter=lfs diff=lfs merge=lfs -text
CG_Capchg.csv ADDED
The diff for this file is too large to render. See raw diff
 
DPR_Finidx.csv ADDED
The diff for this file is too large to render. See raw diff
 
FS_Combas.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dba43677a76ec50f9786e3482b8ee7be4ed139b4182dbe537364b88a73974280
3
+ size 25757548
FS_Comins.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c331f71c91334665608225463afa8aaa9df0af03d2f9804a70bc2c9b099469f3
3
+ size 29094147
TRD_Cnmont.csv ADDED
The diff for this file is too large to render. See raw diff
 
TRD_Mnth.csv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d242900d3c4159a1439abb14a9d1fc054f419c33df4500c52bbc91de5ba9e819
3
+ size 46466251
TRD_Nrrate.csv ADDED
The diff for this file is too large to render. See raw diff
 
readme.md ADDED
@@ -0,0 +1,118 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # asset embedding指标计算
2
+
3
+ ## 概述
4
+
5
+ 代码主要功能包括:
6
+
7
+ - 原始数据自动加载合并
8
+ - 关键财务指标计算
9
+
10
+
11
+ ## 原始数据
12
+
13
+ 原始数据都在rawdata文件夹中,各文件及其字段含义如下:
14
+
15
+ ### FS_Combas.csv:
16
+
17
+ Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。
18
+
19
+ ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。
20
+
21
+ Accper [统计截止日期] - YYYY-MM-DD,前四位表示会计报表公布年度
22
+
23
+ Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。
24
+
25
+ A001000000 [资产总计,单位元] - 资产各项目之总计。1990年起使用
26
+
27
+ A003112101 [其中:优先股,单位元] - 优先股是相对于普通股而言的。主要指在利润分红及剩余财产分配的权利方面,优先于普通股。2015年起使用。
28
+
29
+ A003000000 [所有者权益合计,单位元] - 股东权益各项目之合计。1990年起使用
30
+
31
+ ### TRD_Mnth.csv:
32
+
33
+ Stkcd [证券代码] - 以上交所、深交所公布的证券代码为准
34
+
35
+ Trdmnt [交易月份] - 以YYYY-MM表示
36
+
37
+ Msmvosd [月个股流通市值,单位千元] - 个股的流通股数与月收盘价的乘积。计算公式为:个股的流通股数与月收盘价的乘积。 A股以人民币元计,上海B以美元计,深圳B以港币计,注意单位是千
38
+
39
+ Msmvttl [月个股总市值,单位千元] - 个股的发行总股数与月收盘价的乘积。计算公式为:个股的发行总股数与月收盘价的乘积,A股以人民币元计,上海B股以美元计,深圳B股以港币计,注意单位是千
40
+
41
+ Mretwd [考虑现金红利再投资的月个股回报率] - 字段说明见说明书“周、月、年个股回报率的计算方法”。
42
+
43
+
44
+ ### TRD_Cnmont.csv:
45
+
46
+ Markettype [市场类型] - 5=沪深A股市场(不包含科创板、创业板), 10=沪深B股市场, 15=沪深AB股市场, 21=沪深A股和创业板, 31=沪深AB股和创业板, 37=沪深A股和科创板, 47=沪深AB股和科创板, 53=沪深A股和创业板和科创板, 63=沪深AB股和创业板和科创板,33=上证A股和科创板,20=深证A股和创业板, 69=沪深京A股市场,79=沪深京AB股市场,85=沪深京A股和创业板,95=沪深京AB股和创业板, 101=沪深京A股和科创板, 111=沪深京AB股和科创板, 117=沪深京A股和创业板和科创板,127=沪深京AB股和创业板和科创板。
47
+
48
+ Trdmnt [交易月份] - 以YYYY-MM表示
49
+
50
+ Cmretwdos [考虑现金红利再投资的综合月市场回报率(流通市值加权平均法)] - 字段说明见说明书“3.4 市场回报率的计算方法”。
51
+
52
+
53
+ ### TRD_Nrrate.csv:
54
+
55
+ Nrr1 [无风险利率基准] - NRI01=定期-整存整取-一年利率
56
+
57
+ Clsdt [统计日期] - 统计截止日期,YYYY-MM-DD
58
+
59
+ Nrrmtdt [月度化无风险利率(%)] - 根据复利计算方法,将年度的无风险利率转化为月度数据。计算公式为:(POWER(1+Nrrdata/100,1/12)-1)*100
60
+
61
+ ### FS_Comins.csv:
62
+
63
+ Stkcd [证券代码] - 以沪、深、北证券交易所公布的证券代码为准。
64
+
65
+ ShortName [证券简称] - 以沪、深、北证券交易所公布的证券简称为准。
66
+
67
+ Accper [统计截止日期] - 指会计报表日,统一用10位字符表示,如1999-12-31。
68
+
69
+ Typrep [报表类型] - 指上市公司的财务报表中反映的是合并报表或者母公司报表。“A=合并报表”、“B=母公司报表”。
70
+
71
+ B001101000 [营业收入,单位元] - 企业经营过程中确认的营业收入。
72
+
73
+ B001201000 [营业成本,单位元] - 企业确认的营业成本。
74
+
75
+ B001300000 [营业利润,单位元] - 与经营业务有关的利润。2019.06.30之前,计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益。2019.06.30之后计算公式为:营业利润=营业总收入-营业总成本+公允价值变动收益+投资收益+汇兑收益+其他业务利润+其他收益+净敞口套期收益+资产处置收益+资产减值损失+信用减值损失。其中,2019.01.01的数据因提取的是2019.12.31的期初数据,所以计算公式符合2019.06.30之后的计算公式。
76
+
77
+ ### DPR_Finidx.csv:
78
+
79
+ Stkcd [证券代码] - 上海A股以上交所公布的证券代码为准,深圳A股以深交所公布的证券代码前加上00
80
+
81
+ Accper [统计截止日期] - 以YYYY-MM-DD表示
82
+
83
+ T20497 [每股股利] - 每股股利 = 股利分派率*每股收益。
84
+
85
+ ### CG_Capchg.csv:
86
+
87
+ Stkcd [证券代码] - 以交易所公布的证券代码为准。
88
+
89
+ Reptdt [统计截止日期] - 以YYYY-MM-DD列示,部分缺少在相应位置上以00表示,如1993年12月某日表示为1993-12-00,基本情况统计的截止日期
90
+
91
+ Nshrttl [总股数]
92
+
93
+ ## 计算方法及其代码
94
+
95
+ 代码是code/main.py
96
+ 在运行时,修改一下data_folder路径
97
+
98
+ 各变量计算方法如下:
99
+
100
+ be: 账面价值,来自FS_Combas.csv的A003000000[所有者权益合计,单位元]
101
+
102
+ me:流通市值,来自TRD_Mnth.csv的Msmvosd [月个股流通市值,单位千元]
103
+
104
+ be_me:账面市值比,账面价值/(流通市值*1000)
105
+
106
+ at_gr1:资产增长率,$at\_gr1 = \frac{AT\_t}{AT\_{t-12}} - 1$,参考documentation.pdf的算法
107
+
108
+ gp_at:盈利能力指标(营业利润/总资产),营业利润 / 总资产,没有找到相关文献
109
+
110
+ ret_12_1:动量指标,$ret\_12\_1 = \frac{RI\_{t-1}}{RI\_{t-12}} - 1$,参考documentation.pdf的算法
111
+
112
+ div_at:股息资产比,(每股股利 * 总股数) / 总资产,没有找到相关文献
113
+
114
+ beta_60m:Dual Beta系数(60个月滚动窗口),参考https://github.com/Quantactix/ChinaAShareEquityCharacteristics/tree/main
115
+
116
+ ## 输出
117
+
118
+ 输出结果在output文件夹中