前面 40 篇我们写的爬虫都是单线程顺序执行的——一个 URL 爬完再爬下一个。这种方式简单可靠,但效率太低:大部分时间都浪费在等待网络 I/O上(发请求、等响应)。本篇开始,我们进入"并发编程"的篇章。并发爬虫的核心思路是:当一个线程在等待网络响应时,CPU 去调度其他线程工作,从而大幅提升爬取效率。本篇我们学习多线程(threading)——Python 中最简单、最直接的并发方案。一、为什么需要并发1.1 单线程 vs 多线程importtimeimportrequests urls=[f"https://httpbin.org/delay/{