一、数据简介洞察劳动力再配置揭示结构转型机制在劳动力市场研究范式由就业存量向要素流动转变的过程中跳槽作为劳动力市场中最具行为含义的决策结果不仅反映工资与福利的权衡更蕴含着职业发展路径、工作体验与匹配质量的深层变化。尽管学术界已对劳动力流动的理论机制进行了大量探讨但系统性、可量化的事件级跳槽数据长期缺失在很大程度上限制了对技术冲击背景下人才配置与结构转型的实证检验。针对这一关键数据空白CnDataSeed 团队构建了《中外劳动力流动数据库》。我们基于数据库中 47,974,036条劳动力的职业信息数据筛选构建包含111355条流动记录62358个个体的中外劳动力流动数据库其中从中国流动到外国的记录5万3千余条从外国流动到中国的记录5万7千余条。该数据库以个体跳槽事件为基本分析单元整合个体工作经历与企业属性信息形成了一套可追溯、可聚合的劳动力流动指标体系。数据库不仅完整保留劳动者在不同雇主处的任职片段与流动轨迹还通过标准化算法生成反映企业人才吸纳能力、职业转换路径与技能重构的核心指标为刻画劳动力流动的结构性特征提供坚实基础。相较于传统的就业存量数据《中外劳动力流动数据库》能够直接刻画劳动者从来源企业到去向企业的方向性流动及其时序特征从而支持对匹配摩擦、企业异质性与人才网络结构的精细化研究。该数据库尤其适用于分析劳动力在人工智能技术变革、产业升级与区域分化背景下的动态再配置过程。《中外劳动力流动数据库》可广泛应用于劳动经济学、产业组织、企业战略、城市研究与技术变革分析等研究领域。研究者可利用该数据库量化评估跳槽行为对工资增长、创新产出与经济结构转型的影响实现从个体决策机制到宏观要素再配置的精准映射。通过事件级数据设计该数据库为理解中国劳动力市场摩擦与要素流动的微观行为机制提供了独特而可计算的数据视角。二、数据概览数据组成:数据字段数据表格中国跨国人才流动事件表企业跨国人才信息表任职记录信息表企业人才流动统计表地区人才流动统计表AI技术技能暴露分析表三、相关处理识别中国跨国流动以工作地点的地理信息作为判断标准精确识别“发生在中国境内或与中国发生联系”的跨国人才流动。cross_border_mask ( (df[origin_country].apply(is_china_location) ~df[dest_country].apply(is_china_location)) | (~df[origin_country].apply(is_china_location) df[dest_country].apply(is_china_location)) ) df_filtered df[cross_border_mask]构建人才流动网络进一步将数据聚合到企业层级与城市层级构建中国跨国人才流动网络支持对“公司之间”“城市之间”人才流向与规模的系统分析。# 按来源公司 → 去向公司 → 时间聚合流动人数 agg df.groupby( [origin_firm_id, dest_firm_id, period] ).size().reset_index(nameflow_count)四、相关研究部分相关研究示例Park, J., Wood, I.B., Jing, E. et al. Global labor flow network reveals the hierarchical organization and dynamics of geo-industrial clusters. Nat Commun 10, 3449 (2019). https://doi.org/10.1038/s41467-019-11380-w更多相关研究[1]Sun, Y., Zhu, H., Wang, L. et al. Large-scale online job search behaviors reveal labor market shifts amid COVID-19. Nat Cities 1, 150–163 (2024). https://doi.org/10.1038/s44284-023-00022-4[2]Frank M R, Moro E, South T, et al. Network constraints on worker mobility[J]. Nature Cities, 2024, 1(1): 94-104.六、获取方式https://cndataseed.com/