如何高效进行经管社科实证数据搜集与整理(县域篇)
大家好我是经管社科数据小助手作为经济学专业毕业的我深切了解经管 类 学生和学者在数据搜集上耗费的巨大精力。基于我们多年对经管社科领域的辅导经验我们帮助大家总结了在实证分析部分选取数据的经验希望对大家有一定的帮助。在确定选题后我们就要着手进行数据样本的确定和搜集了。我们选择数据的原则是根据所研究的问题以及数据可得性确定最合适的样本。经管研究的数据大致分五个层次1、 企业 层上市公司、工业企业、微观经营主体等变量最丰富实证最成熟2、国家/省级层各国或省份层面 宏 观政策或者国际经济研究常用数据规范但颗粒度粗3、地级市层城市层面中观研究的主力兼顾颗粒度和数据可得性4、县域层区县层面数据质量参差不齐但颗粒度最细5、微观调查层CFPS、CHFS等家庭个人调查数据、以及其他以个体行为为对象的微观数据适合研究微观行为机制每个层次的数据来源、常见变量、处理方式都不一样。本文从 省级层面 进行简要介绍其他层面的介绍见下方目录希望对大家有所帮助。目录1、【企业篇】上市公司数据怎么选https://blog.csdn.net/xiaozhuzhu1995/article/details/160482153?spm1001.2014.3001.55022、【省级篇】 省级面板数据 避坑指南https://blog.csdn.net/xiaozhuzhu1995/article/details/160482288?spm1001.2014.3001.55023、【地级市篇】城市数据的选择与处理https://blog.csdn.net/xiaozhuzhu1995/article/details/160482376?spm1001.2014.3001.55014、【县域篇】县域数据的使用注意事项即本文。5、【微观篇】CFPS、CHFS等调查数据使用指南https://blog.csdn.net/xiaozhuzhu1995/article/details/160482491?spm1001.2014.3001.5501【县域篇】县域数据的使用注意事项县域数据是颗粒度最细的官方统计数据适合做县域经济、农村发展、土地财政等研究。但说实话县域数据非常难搜集。什么时候用县域数据题目里出现县域县级农村或者研究的话题有明显的县域特色比如乡村振兴、农业产业化、农村金融可以考虑县域数据。常用县域数据数据类型用途县域统计年鉴面板GDP、人口、农业、工业、投资等企业工商注册数据县域营商环境、新增企业专利数据县域创新能力金融机构网点数据金融发展绿色专利数据县域绿色创新碳排放数据区县层面碳排放分行业数据农业、工业、服务业分行业数据常见坑1. 数据质量不稳定这是最大的问题。很多偏远县城的指标要么缺失、要么口径不统一、要么明显不合理奇异值。用之前务必仔细清洗剔除明显错误的数据。2. 缺失值严重县域数据年鉴更新慢很多指标不是每年都有。做面板数据时经常遇到大片缺失插值填充是常见做法但要注意合理性。3. 行政归属变化县改市、县域合并等行政区划调整频繁。研究时间跨度长的话要处理好这些变化。4. 样本量限制县域数量虽多上千个但做分组分析或者面板数据时实际可用样本往往大打折扣。考虑用县级市和县分开处理因为两者差异较大。县域数据适合研究县域经济特有的话题比如乡村振兴、农业产业化、农村金融等。但如果你的研究问题可以用更高层面的数据解决没必要死磕县域——数据搜集难处理起来费时费力审稿人也会有顾虑。