第 41 篇：多线程爬虫——threading 模块，让爬虫速度翻 10 倍

张

张建站

2026/6/28 5:49:11

10分钟阅读

第 41 篇：多线程爬虫——threading 模块，让爬虫速度翻 10 倍

前面 40 篇我们写的爬虫都是单线程顺序执行的——一个 URL 爬完再爬下一个。这种方式简单可靠，但效率太低：大部分时间都浪费在等待网络 I/O上（发请求、等响应）。本篇开始，我们进入"并发编程"的篇章。并发爬虫的核心思路是：当一个线程在等待网络响应时，CPU 去调度其他线程工作，从而大幅提升爬取效率。本篇我们学习多线程（threading）——Python 中最简单、最直接的并发方案。一、为什么需要并发1.1 单线程 vs 多线程importtimeimportrequests urls=[f"https://httpbin.org/delay/{

光耦继电器抗干扰抑制技巧！

工业车间、电源设备、通信主板等，经常遇到光耦继电器带来的电磁干扰，干扰周边传感器、通信总线、主控电路，出现信号乱码、设备自动重启、采集数据失真等情况，很多人只在后端加滤波，却忽略光耦本身产生与接收干扰的双重…...

2026/6/28 5:42:33 阅读更多 →

02-LlamaIndex 检索核心与私有模型部署

02-LlamaIndex 检索核心与私有模型部署

一、RAG 检索与查询机制深度解析在完成“文档 (Document) -> 节点 (Node) -> 向量化 (Embedding) -> 本地存储 (Storage)”的索引构建后，我们需要对数据进行检索和查询。1. 加载索引 (Load Index)检索的第一步是加载已存储的索引，这类似于“连…...

2026/6/28 5:39:20 阅读更多 →

天地图 Vue 基础使用指南

天地图 Vue 基础使用指南本文档说明在本项目（Vue 2.6）中如何接入和使用天地图 JS API 4.0 的基础能力：加载 SDK、显示地图。一、前置准备 1.1 申请密钥（tk） 打开天地图控制台创建应用，获取浏览器端 K…...

2026/6/28 5:36:26 阅读更多 →

2026云服务器ai部署的实践经验整理

2026云服务器ai部署的实践经验整理

和我们常见的web应用部署比，云服务器ai部署对资源的要求差异很大。普通web应用大多对CPU和内存的需求比较平稳，波动小，对GPU没有特殊要求。但云服务器ai部署不管是推理还是训练，都对异构计算资源、存储IO、内存容量有不一样的要求…...

2026/6/28 1:04:56 阅读更多 →

Unity 最强地形网格系统解析，从网格生成到 A* 寻路的实现原理

Unity 最强地形网格系统解析，从网格生成到 A* 寻路的实现原理

在策略游戏（SLG）、战棋（SRPG）、RTS、塔防甚至模拟经营类游戏中，网格（Grid）几乎是所有玩法的基础。无论是《文明》《火焰纹章》《幽浮》《XCOM》，还是大量 RTS 游戏，它们…...

2026/6/28 1:10:18 阅读更多 →

基于汤色与叶底的茶叶品质鉴别方法：技术原理、局限性与系统评估框架

基于汤色与叶底的茶叶品质鉴别方法：技术原理、局限性与系统评估框架

基于汤色与叶底的茶叶品质鉴别方法：技术原理、局限性与系统评估框架在茶叶品质鉴别领域，“看汤色”和“看叶底”常被作为直观判断手段，但能否仅凭这两项指标实现100%的真假与好坏鉴定？本文从技术角度拆解其原理、局限及正确应用方…...

2026/6/28 1:15:50 阅读更多 →

基于数据驱动的多尺度表示的信号去噪统计方法研究附Matlab代码

基于数据驱动的多尺度表示的信号去噪统计方法研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长毕业设计辅导、数学建模、数据处理、算法改进、程序设计科研仿真。🍎完整代码获取定制创新论文复现私信🍊个人信条：做科研，博学之、审问之、慎思之、明辨之、…...

2026/6/28 1:19:20 阅读更多 →