File size: 28,036 Bytes
5374a2d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""

股票数据抓取函数库

封装了所有数据抓取的核心功能,支持任意股票代码,可独立调用



作者: AI Assistant

日期: 2025-07-22

版本: 2.0

"""

import akshare as ak
import pandas as pd
import datetime
import logging
from pathlib import Path
import time

class StockDataFetcher:
    """股票数据抓取器 - 核心功能类"""
    
    def __init__(self, stock_code, auto_create_output_dir=True):
        """

        初始化数据抓取器

        

        Args:

            stock_code (str): 股票代码(如:300750、000001等)

            auto_create_output_dir (bool): 是否自动创建输出目录,默认True

        """
        self.stock_code = stock_code
        self.symbol_sz = f'sz{stock_code}' if stock_code.startswith('0') or stock_code.startswith('3') else f'sh{stock_code}'
        
        # 自动创建输出目录:output_股票编号
        if auto_create_output_dir:
            self.output_dir = Path(f'output_{stock_code}')
        else:
            self.output_dir = Path('output')
            
        self.output_dir.mkdir(exist_ok=True)
        
        # 配置日志
        logging.basicConfig(
            level=logging.INFO,
            format='%(asctime)s - %(levelname)s - %(message)s'
        )
        self.logger = logging.getLogger(__name__)
        
        # 获取股票名称
        self.stock_name = self._get_stock_name()
    
    def _get_stock_name(self):
        """获取股票名称"""
        try:
            # 尝试获取股票基本信息
            stock_info = ak.stock_individual_info_em(symbol=self.stock_code)
            if not stock_info.empty:
                name_row = stock_info[stock_info['item'] == '股票简称']
                if not name_row.empty:
                    return name_row['value'].iloc[0]
            return f"股票{self.stock_code}"
        except:
            return f"股票{self.stock_code}"
    
    def get_timestamp(self):
        """获取当前日期用于文件命名"""
        return datetime.datetime.now().strftime('%Y%m%d')
    
    def save_data(self, data, filename_prefix, description=""):
        """

        保存数据到CSV文件

        

        Args:

            data: 要保存的数据(pandas DataFrame)

            filename_prefix (str): 文件名前缀

            description (str): 数据描述

            

        Returns:

            str: 保存的文件路径,失败返回None

        """
        try:
            timestamp = self.get_timestamp()
            filename = f"{filename_prefix}_{timestamp}_{self.stock_code}.csv"
            filepath = self.output_dir / filename
            
            if isinstance(data, pd.DataFrame):
                data.to_csv(filepath, index=False, encoding='utf-8-sig')
                self.logger.info(f"✅ {description} 已保存: {filepath} (共{len(data)}条记录)")
            else:
                df = pd.DataFrame([data] if isinstance(data, dict) else data)
                df.to_csv(filepath, index=False, encoding='utf-8-sig')
                self.logger.info(f"✅ {description} 已保存: {filepath}")
            
            return str(filepath)
        except Exception as e:
            self.logger.error(f"❌ 保存{description}失败: {str(e)}")
            return None
    
    def fetch_stock_daily(self, days=30):
        """

        抓取股票日线数据

        

        Args:

            days (int): 抓取最近多少天的数据,默认30天

            

        Returns:

            pandas.DataFrame: 股票日线数据

        """
        try:
            self.logger.info(f"📈 开始抓取{self.stock_code}日线数据...")
            stock_df = ak.stock_zh_a_daily(symbol=self.symbol_sz).reset_index()
            
            # 只获取最近指定天数的数据
            stock_df['date'] = pd.to_datetime(stock_df['date'])
            days_ago = datetime.datetime.now() - datetime.timedelta(days=days)
            recent_data = stock_df[stock_df['date'] >= days_ago]
            
            self.save_data(recent_data, "stock_daily_catl", f"{self.stock_code}日线数据")
            return recent_data
            
        except Exception as e:
            self.logger.error(f"❌ 抓取股票日线数据失败: {str(e)}")
            return None
    
    def fetch_china_cpi(self):
        """

        抓取中国CPI数据 (限制为过去2年)

        

        Returns:

            pandas.DataFrame: 中国CPI数据

        """
        try:
            self.logger.info("📊 开始抓取中国CPI数据...")
            cpi_df = ak.macro_china_cpi()
            
            # 限制为过去2年的数据
            if not cpi_df.empty:
                # 处理中文日期格式
                if '月份' in cpi_df.columns:
                    def convert_chinese_date(date_str):
                        try:
                            if '年' in date_str and '月' in date_str:
                                year = date_str.split('年')[0]
                                month = date_str.split('年')[1].split('月')[0]
                                return f"{year}-{month.zfill(2)}-01"
                            else:
                                return date_str
                        except:
                            return None
                    cpi_df['月份'] = cpi_df['月份'].apply(convert_chinese_date)
                    # 强制转换为datetime,无法解析的变为NaT
                    cpi_df['月份'] = pd.to_datetime(cpi_df['月份'], errors='coerce')
                    cpi_df = cpi_df.dropna(subset=['月份'])
                    if not cpi_df.empty:
                        two_years_ago = datetime.datetime.now() - datetime.timedelta(days=2*365)
                        cpi_df = cpi_df[cpi_df['月份'] >= two_years_ago]
                        self.logger.info(f"✅ CPI数据已限制为过去2年: {len(cpi_df)} 条记录")
            
            return cpi_df
        except Exception as e:
            self.logger.error(f"❌ 抓取CPI数据失败: {str(e)}")
            return None
    
    def fetch_china_gdp(self):
        """

        抓取中国GDP数据

        

        Returns:

            pandas.DataFrame: 中国GDP数据

        """
        try:
            self.logger.info("📊 开始抓取中国GDP数据...")
            gdp_df = ak.macro_china_gdp_yearly()
            return gdp_df
        except Exception as e:
            self.logger.error(f"❌ 抓取GDP数据失败: {str(e)}")
            return None
    
    def fetch_industry_fund_flow(self):
        """

        抓取行业资金流数据

        

        Returns:

            pandas.DataFrame: 行业资金流数据

        """
        try:
            self.logger.info("💰 开始抓取行业资金流数据...")
            industry_fund_df = ak.stock_fund_flow_industry()
            return industry_fund_df
        except Exception as e:
            self.logger.error(f"❌ 抓取行业资金流数据失败: {str(e)}")
            return None
    
    def fetch_stock_news(self):
        """

        抓取个股新闻数据

        

        Returns:

            pandas.DataFrame: 个股新闻数据

        """
        try:
            self.logger.info(f"📰 开始抓取{self.stock_name}({self.stock_code})新闻数据...")
            # 尝试使用akshare的新闻接口
            news_df = ak.stock_news_em(symbol=self.stock_code)
            return news_df
        except Exception as e:
            self.logger.error(f"❌ 抓取新闻数据失败: {str(e)}")
            return None
    
    def fetch_market_summary(self):
        """

        抓取上交所市场概况

        

        Returns:

            pandas.DataFrame: 市场概况数据

        """
        try:
            self.logger.info("🏛️ 开始抓取上交所市场概况...")
            sse_summary = ak.stock_sse_summary()
            return sse_summary
        except Exception as e:
            self.logger.error(f"❌ 抓取市场概况失败: {str(e)}")
            return None
    
    def fetch_market_indices(self):
        """

        抓取重要指数行情

        

        Returns:

            pandas.DataFrame: 重要指数数据

        """
        try:
            self.logger.info("📊 开始抓取重要指数行情...")
            market_indices = ak.stock_zh_index_spot_em(symbol="沪深重要指数")
            return market_indices
        except Exception as e:
            self.logger.error(f"❌ 抓取市场指数失败: {str(e)}")
            return None
    
    def fetch_option_volatility(self):
        """

        抓取50ETF期权波动率指数 (限制为过去1个月)

        

        Returns:

            pandas.DataFrame: 期权波动率数据

        """
        try:
            self.logger.info("📈 开始抓取50ETF波动率指数...")
            vol50 = ak.index_option_50etf_qvix()
            
            # 限制为过去1个月的数据
            if not vol50.empty:
                if 'date' in vol50.columns:
                    vol50['date'] = pd.to_datetime(vol50['date'])
                    one_month_ago = datetime.datetime.now() - datetime.timedelta(days=30)
                    vol50 = vol50[vol50['date'] >= one_month_ago]
                    self.logger.info(f"✅ 期权波动率数据已限制为过去1个月: {len(vol50)} 条记录")
            
            return vol50
        except Exception as e:
            self.logger.error(f"❌ 抓取期权波动率数据失败: {str(e)}")
            return None

    def fetch_institution_recommendation(self):
        """

        抓取机构评级数据 (限制为过去半年)

        

        Returns:

            pandas.DataFrame: 机构评级数据

        """
        try:
            self.logger.info(f"🏦 开始抓取{self.stock_name}({self.stock_code})机构评级...")
            inst_rec = ak.stock_institute_recommend_detail(symbol=self.stock_code)
            
            # 限制为过去半年的数据
            if not inst_rec.empty:
                # 假设有日期列,根据实际列名调整
                date_columns = ['评级日期', 'date', '日期']
                date_col = None
                for col in date_columns:
                    if col in inst_rec.columns:
                        date_col = col
                        break
                
                if date_col:
                    inst_rec[date_col] = pd.to_datetime(inst_rec[date_col])
                    six_months_ago = datetime.datetime.now() - datetime.timedelta(days=180)
                    inst_rec = inst_rec[inst_rec[date_col] >= six_months_ago]
                    self.logger.info(f"✅ 机构评级数据已限制为过去半年: {len(inst_rec)} 条记录")
            
            return inst_rec
        except Exception as e:
            self.logger.error(f"❌ 抓取机构评级数据失败: {str(e)}")
            return None
    
    def fetch_all_data(self):
        """

        抓取所有类型的数据

        

        Returns:

            dict: 包含所有数据的字典

        """
        self.logger.info("🚀 开始抓取全部数据...")
        
        results = {}
        
        # 定义所有数据抓取任务
        tasks = [
            ("stock_daily", lambda: self.fetch_stock_daily(), "股票日线数据"),
            ("china_cpi", lambda: self.fetch_china_cpi(), "中国CPI数据"),
            ("china_gdp", lambda: self.fetch_china_gdp(), "中国GDP数据"),
            ("industry_fund_flow", lambda: self.fetch_industry_fund_flow(), "行业资金流数据"),
            ("stock_news", lambda: self.fetch_stock_news(), "个股新闻数据"),
            ("market_summary", lambda: self.fetch_market_summary(), "市场整体概况"),
            ("market_indices", lambda: self.fetch_market_indices(), "重要指数行情"),
            ("option_volatility", lambda: self.fetch_option_volatility(), "期权波动率指数"),
            ("institution_recommendation", lambda: self.fetch_institution_recommendation(), "机构评级数据")
        ]
        
        # 执行所有任务
        for task_name, task_func, description in tasks:
            try:
                self.logger.info(f"\n--- 开始执行: {description} ---")
                result = task_func()
                results[task_name] = result
                
                # 保存数据
                if result is not None:
                    filename_mapping = {
                        "stock_daily": "stock_daily_catl",
                        "china_cpi": "china_cpi",
                        "china_gdp": "china_gdp_yearly",
                        "industry_fund_flow": "industry_fund_flow",
                        "stock_news": "stock_news_catl",
                        "market_summary": "market_summary_sse",
                        "market_indices": "market_indices",
                        "option_volatility": "option_volatility_50etf",
                        "institution_recommendation": "institution_recommendation_catl"
                    }
                    
                    self.save_data(result, filename_mapping[task_name], description)
                
                # 添加延迟避免请求过频
                time.sleep(1)
                
            except Exception as e:
                self.logger.error(f"执行{description}时发生错误: {str(e)}")
                results[task_name] = None
        
        self.logger.info("🎉 全部数据抓取完成!")
        return results
    
    def create_data_documentation(self):
        """创建数据文件说明文档"""
        try:
            timestamp = self.get_timestamp()
            doc_content = f"""# {self.stock_name}({self.stock_code})数据文件说明



## 📋 文件命名规则



所有数据文件按以下格式命名:

```

数据类型_日期_股票代码.csv

```



例如:`china_cpi_{timestamp}_{self.stock_code}.csv` 表示{timestamp[:4]}{timestamp[4:6]}{timestamp[6:8]}日抓取的中国CPI数据,与{self.stock_name}({self.stock_code})相关。



---



## 📊 数据文件详细说明



### 1. 股票日线数据

**文件名**: `stock_daily_catl_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.stock_zh_a_daily()



**中文指标说明**:

- **date** - 交易日期

- **open** - 开盘价(元)

- **high** - 最高价(元)

- **low** - 最低价(元)

- **close** - 收盘价(元)

- **volume** - 成交量(股)

- **amount** - 成交额(元)

- **outstanding_share** - 流通股数(股)

- **turnover** - 换手率



**用途**: 分析{self.stock_name}股价走势、成交情况,进行技术分析



---



### 2. 中国CPI数据

**文件名**: `china_cpi_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.macro_china_cpi()



**中文指标说明**:

- **月份** - 统计月份

- **全国-当月** - 全国当月CPI指数

- **全国-同比增长** - 全国CPI同比增长率(%)

- **全国-环比增长** - 全国CPI环比增长率(%)

- **全国-累计** - 全国累计CPI指数

- **城市-当月** - 城市当月CPI指数

- **城市-同比增长** - 城市CPI同比增长率(%)

- **城市-环比增长** - 城市CPI环比增长率(%)

- **城市-累计** - 城市累计CPI指数

- **农村-当月** - 农村当月CPI指数

- **农村-同比增长** - 农村CPI同比增长率(%)

- **农村-环比增长** - 农村CPI环比增长率(%)

- **农村-累计** - 农村累计CPI指数



**用途**: 反映通胀水平,判断宏观经济环境对{self.stock_name}所在行业的影响



---



### 3. 中国GDP数据

**文件名**: `china_gdp_yearly_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.macro_china_gdp_yearly()



**中文指标说明**:

- **商品** - 数据类型(中国GDP年率报告)

- **日期** - 发布日期

- **今值** - 当期GDP增长率(%)

- **预测值** - 市场预测GDP增长率(%)

- **前值** - 前期GDP增长率(%)



**用途**: 评估国家经济增长情况,判断宏观经济对{self.stock_name}所在行业需求的影响



---



### 4. 行业资金流数据

**文件名**: `industry_fund_flow_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.stock_fund_flow_industry()



**中文指标说明**:

- **序号** - 排序编号

- **行业** - 行业名称

- **行业指数** - 行业指数代码

- **行业-涨跌幅** - 行业当日涨跌幅(%)

- **流入资金** - 资金流入金额(万元)

- **流出资金** - 资金流出金额(万元)

- **净额** - 资金净流入金额(万元)

- **公司家数** - 该行业公司数量

- **领涨股** - 行业内领涨股票

- **领涨股-涨跌幅** - 领涨股涨跌幅(%)

- **当前价** - 领涨股当前价格(元)



**用途**: 分析各行业资金流向,判断{self.stock_name}所在行业的资金关注度



---



### 5. 个股新闻数据

**文件名**: `stock_news_catl_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.stock_news_em()



**中文指标说明**:

- **关键词** - 搜索关键词(股票代码)

- **新闻标题** - 新闻标题

- **新闻内容** - 新闻摘要/内容

- **发布时间** - 新闻发布时间

- **新闻来源** - 新闻来源媒体

- **新闻链接** - 原文链接地址



**用途**: 获取{self.stock_name}相关新闻资讯,进行舆情分析和基本面研究



---



### 6. 上交所市场概况

**文件名**: `market_summary_sse_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.stock_sse_summary()



**中文指标说明**:

- **项目** - 统计项目名称

- **股票** - 股票相关数据

- **主板** - 主板市场数据

- **科创板** - 科创板市场数据



**具体项目包括**:

- **流通股本** - 流通股总数(亿股)

- **总市值** - 总市值(亿元)

- **平均市盈率** - 平均市盈率(倍)

- **上市公司** - 上市公司数量(家)

- **上市股票** - 上市股票数量(只)

- **流通市值** - 流通市值(亿元)

- **总股本** - 总股本(亿股)



**用途**: 了解整体市场状况,判断市场环境对{self.stock_name}的影响



---



### 7. 重要指数行情

**文件名**: `market_indices_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.stock_zh_index_spot_em()



**中文指标说明**:

- **序号** - 排序编号

- **代码** - 指数代码

- **名称** - 指数名称

- **最新价** - 最新指数点位

- **涨跌幅** - 当日涨跌幅(%)

- **涨跌额** - 当日涨跌点数

- **成交量** - 成交量(手)

- **成交额** - 成交金额(万元)

- **振幅** - 当日振幅(%)

- **最高** - 当日最高点位

- **最低** - 当日最低点位

- **今开** - 今日开盘点位

- **昨收** - 昨日收盘点位

- **量比** - 量比



**包含指数**:

- 上证指数、深证成指、创业板指、科创综指、北证50等



**用途**: 跟踪重要市场指数走势,判断整体市场方向



---



### 8. 50ETF期权波动率指数

**文件名**: `option_volatility_50etf_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.index_option_50etf_qvix()



**中文指标说明**:

- **date** - 交易日期

- **open** - 开盘波动率

- **high** - 最高波动率

- **low** - 最低波动率

- **close** - 收盘波动率



**用途**: 反映市场恐慌情绪和波动性预期,是重要的市场情绪指标



---



### 9. 机构评级数据

**文件名**: `institution_recommendation_catl_{timestamp}_{self.stock_code}.csv`



**数据来源**: akshare.stock_institute_recommend_detail()



**中文指标说明**:

- **股票代码** - 股票代码

- **股票名称** - 股票名称

- **目标价** - 机构给出的目标价格(元)

- **最新评级** - 机构最新评级(买入/增持/中性/减持/卖出)

- **评级机构** - 研究机构名称

- **分析师** - 分析师姓名

- **行业** - 所属行业

- **评级日期** - 评级发布日期



**评级含义**:

- **买入** - 强烈推荐买入

- **增持** - 推荐增加持仓

- **中性** - 维持现有持仓

- **减持** - 建议减少持仓

- **卖出** - 建议卖出



**用途**: 了解专业机构对{self.stock_name}的投资建议和价格预期



---



### 10. 数据收集报告

**文件名**: `collection_report_{timestamp}_{self.stock_code}.csv`



**自动生成的收集统计报告**



**中文指标说明**:

- **数据类型** - 数据收集任务名称

- **收集状态** - 收集是否成功(成功/失败)

- **记录数量** - 成功收集的数据条数

- **时间戳** - 数据收集完成时间



**用途**: 监控数据收集任务的执行情况,确保数据完整性



---



## 🔍 数据使用建议



### 综合分析框架



1. **宏观经济层面**

   - 使用CPI、GDP数据判断宏观经济环境

   - 分析对{self.stock_name}所在行业的影响



2. **市场情绪层面**

   - 使用期权波动率指数判断市场恐慌程度

   - 使用重要指数走势判断市场整体方向



3. **行业资金层面**

   - 使用行业资金流数据判断资金偏好

   - 关注{self.stock_name}所在行业的资金流向



4. **个股基本面**

   - 使用机构评级了解专业判断

   - 使用新闻数据进行舆情分析



5. **技术面分析**

   - 使用股票日线数据进行技术分析

   - 结合成交量判断趋势强度



### 数据更新频率



- **日更新**: 股票日线、新闻、指数行情、期权波动率

- **月更新**: CPI数据

- **季更新**: GDP数据

- **实时更新**: 行业资金流、机构评级



---



## ⚠️ 使用注意事项



1. **数据时效性**: 部分数据存在发布延迟,请注意数据的时效性

2. **数据完整性**: 如遇到数据源问题,某些文件可能缺失,请查看收集报告

3. **投资风险**: 数据仅供参考,不构成投资建议,投资需谨慎

4. **版权声明**: 数据来源于公开渠道,请遵守相关使用条款



---



## 📞 技术支持



如有数据解读疑问或技术问题,请参考:

- akshare官方文档: https://akshare.readthedocs.io/

- 数据抓取函数库: 本项目中的股票数据抓取函数



**生成时间**: {datetime.datetime.now().strftime('%Y年%m月%d日')}

**数据版本**: v2.0  

**适用股票**: {self.stock_name}({self.stock_code})

"""
            
            doc_filepath = self.output_dir / "数据文件说明.md"
            with open(doc_filepath, 'w', encoding='utf-8') as f:
                f.write(doc_content)
            
            self.logger.info(f"✅ 数据说明文档已生成: {doc_filepath}")
            return str(doc_filepath)
            
        except Exception as e:
            self.logger.error(f"❌ 生成数据说明文档失败: {str(e)}")
            return None


def fetch_stock_data(stock_code, output_dir=None):
    """

    快速抓取指定股票的全部数据(主要函数)

    

    Args:

        stock_code (str): 股票代码(如:300750、000001、000858等)

        output_dir (str): 输出目录路径(可选)

        

    Returns:

        dict: 包含所有数据的字典

        

    输出文件夹格式: output_股票代码/ 或指定的output_dir

    包含文件:

    - 10个CSV数据文件

    - 1个数据文件说明.md

    """
    print(f"🚀 开始抓取股票 {stock_code} 的全部数据...")
    fetcher = StockDataFetcher(stock_code=stock_code, auto_create_output_dir=False) # 设置auto_create_output_dir为False,由output_dir参数控制
    if output_dir:
        fetcher.output_dir = Path(output_dir)
        fetcher.output_dir.mkdir(exist_ok=True)
    return fetcher.fetch_all_data()


def fetch_single_data_type(stock_code, data_type):
    """

    抓取指定股票的单一类型数据

    

    Args:

        stock_code (str): 股票代码

        data_type (str): 数据类型 ('stock_daily', 'cpi', 'gdp', 'industry_fund', 

                                   'news', 'market_summary', 'indices', 'volatility', 'rating')

        

    Returns:

        pandas.DataFrame: 抓取的数据

    """
    fetcher = StockDataFetcher(stock_code=stock_code)
    
    data_map = {
        'stock_daily': fetcher.fetch_stock_daily,
        'cpi': fetcher.fetch_china_cpi,
        'gdp': fetcher.fetch_china_gdp,
        'industry_fund': fetcher.fetch_industry_fund_flow,
        'news': fetcher.fetch_stock_news,
        'market_summary': fetcher.fetch_market_summary,
        'indices': fetcher.fetch_market_indices,
        'volatility': fetcher.fetch_option_volatility,
        'rating': fetcher.fetch_institution_recommendation
    }
    
    if data_type in data_map:
        result = data_map[data_type]()
        if result is not None:
            # 保存单个数据文件
            filename_mapping = {
                "stock_daily": "stock_daily_catl",
                "cpi": "china_cpi",
                "gdp": "china_gdp_yearly",
                "industry_fund": "industry_fund_flow",
                "news": "stock_news_catl",
                "market_summary": "market_summary_sse",
                "indices": "market_indices",
                "volatility": "option_volatility_50etf",
                "rating": "institution_recommendation_catl"
            }
            fetcher.save_data(result, filename_mapping[data_type], f"{data_type}数据")
        return result
    else:
        print(f"❌ 不支持的数据类型: {data_type}")
        print(f"支持的类型: {list(data_map.keys())}")
        return None


# 保持向后兼容性
def quick_fetch_catl_data():
    """

    快速抓取宁德时代数据的便捷函数(向后兼容)

    

    Returns:

        dict: 包含所有数据的字典

    """
    return fetch_stock_data('300750')


# 示例用法
if __name__ == "__main__":
    print("🔥 股票数据抓取函数库测试")
    print("=" * 50)
    
    # 主要功能:抓取任意股票的全部数据
    print("📊 方式1:抓取宁德时代全部数据")
    results = fetch_stock_data('300750')
    print(f"✅ 宁德时代数据抓取完成,输出目录: output_300750/")
    
    print("\n📊 方式2:抓取贵州茅台全部数据")
    results = fetch_stock_data('600519')
    print(f"✅ 贵州茅台数据抓取完成,输出目录: output_600519/")
    
    print("\n📊 方式3:抓取单一类型数据")
    cpi_data = fetch_single_data_type('300750', 'cpi')
    if cpi_data is not None:
        print(f"✅ CPI数据抓取完成,Shape: {cpi_data.shape}")
    
    print("\n📊 方式4:使用类实例化(高级用法)")
    fetcher = StockDataFetcher('000858')  # 五粮液
    stock_data = fetcher.fetch_stock_daily()
    if stock_data is not None:
        print(f"✅ 五粮液日线数据Shape: {stock_data.shape}")
    
    print("\n" + "=" * 50)
    print("✅ 测试完成!")
    print("\n📁 输出说明:")
    print("- 每个股票会创建独立的 output_股票代码/ 文件夹")
    print("- 文件夹内包含10个CSV数据文件 + 1个数据说明文档")
    print("- 文件命名格式:数据类型_日期_股票代码.csv")
    print("\n🎯 常用股票代码:")
    print("- 300750: 宁德时代")
    print("- 600519: 贵州茅台") 
    print("- 000858: 五粮液")
    print("- 000001: 平安银行")
    print("- 000002: 万科A")