理解Node.js的event loop
发布于 12 年前 作者 justfly 20291 次浏览 最后一次编辑是 8 年前

翻译的一片文章,原文在这里(ps:这个博客我推荐看下,里面还有博主自己写的node.js电子书,质量很高),很基础的东西,个人感觉理解了这个,对以后node开发帮助很大,也不会去做用js手写异步函数的傻事了。但是直接读英文觉得没什么,翻成中文有些地方真觉得罗嗦。。。翻译有问题的地方,欢迎在下面或者我的博客里指出。

正文如下:


关于Node.js的第一个基本概念是I/O操作开销是巨大的:

I/O开销

所以,当前变成技术中最大的浪费来自于等待I/O操作的完成。有几种方法可以解决性能的影响:

  • 同步方式:按次序一个一个的处理请求。利:简单;弊:任何一个请求都可以阻塞其他所有请求。
  • 开启新进程:每个请求都开启一个新进程。利:简单;弊:大量的链接意味着大量的进程。
  • 开启新线程:每个请求都开启一个新线程。利:简单,而且跟进程比,对系统内核更加友好,因为线程比进程轻的多;弊:不是所有的机器都支持线程,而且对于要处理共享资源的情况,多线程编程会很快变得太过于复杂。

第二个基本概念是每个连接都创建一个新线程是很消耗内存的(例如:你可以对比Nginx回想一下Apache内存耗尽的情景)。

Apache是多线程的:它为每个请求开启一个新的线程(或者是进程,这取决于你的配置),当并发连接增多时,你可以看看它是怎么一点一点耗尽内存的。Nginx和Node.js不是多线程的,因为线程的消耗太“重”了。它们两个是单线程、基于事件的,这就把处理众多连接所产生的线程/进程消耗给消除了。

Node.js中你的代码运行在单线程之中

确实只有一个线程:你不能并行执行任何代码,比如:下面的“sleep”将会阻塞sever1秒钟:

while(new Date().getTime() < now + 1000) {
    // do nothing
}

当这段代码运行时,Node.js不会响应客户端任何请求,因为只有一个线程来运行你的代码,另外,如果你执行cpu密集的任务,比如重设图像的大小,它也会阻塞所有请求。

……然而,除了你的代码,其它的一切都是并行执行的

单线程没法让代码并行执行。但是所有I/O操作都是事件驱动、并行的,所以下面的代码不会阻塞server:

c.query(
   'SELECT SLEEP(20);',
   function (err, results, fields) {
     if (err) {
       throw err;
     }
     res.writeHead(200, {'Content-Type': 'text/html'});
     res.end('<html><head><title>Hello</title></head><body><h1>Return from async DB query</h1></body></html>');
     c.end();
    }
);

如果你在一次请求中执行这些,当数据库sleep时,其他请求也会立即被处理。

为什么异步比较好?什么时候我们应该从同步转移到异步/并行执行呢?

同步执行也不错,因为它简便了我们敲代码。但在使用异步时,你不必关心后端是怎么处理的。而且,在I/O操作时不会阻止其他请求,同时无需承担每个请求所产生的线程/进程的成本。

I/O操作时使用异步处理很好,因为I/O操作的成本比单纯执行代码要高的多,我们应该在等待I/O时做其它更有意义的工作。

Node.js event loop

Event loop是指处理外部事件,并把外部事件转换为回调来进行调用的实体(晦涩难懂!!原文:an entity that handles and processes external events and converts them into callback invocations).所以,I/O调用的同时,server就可以去处理另一个请求。在一次I/O调用中,你的代码保存回调函数并把控制权交回到node.js运行时。当数据加载完毕可以访问时,就可以执行回调函数了。

当然,在后端有很多数据库接入和处理的进程。但是,这些都不需要通过你的代码直接实现,你也就不必了解后台I/O之间的相互作用关系。和Apache相比,省去了很多线程消耗,因为不是每个链接都需要新线程,仅那些需要并行运行的才需要新线程。

不只是I/O调用,Node.js期望所有的请求都能快速的响应,比如CPU密集的工作应该分离到其他进程,你可以使用事件和他交互。

内部实现

在内部,Node.js依赖libev来提供event loop,使用线程池来提供异步I/O。

5 回复

补充下,Node.js内部*nix下用的libev。Windows下用的IOCP

“Apache是多线程的:它为每个请求开启一个新的线程(或者是进程,这取决于你的配置),当并发连接增多时,你可以看看它是怎么一点一点耗尽内存的。Nginx和Node.js不是多线程的,因为线程的消耗太“重”了。”

请问这句话怎么理解,难道node是一个线程处理多个请求? 比如有三个人同时访问一个node站点,这三个请求是一个线程处理还是三个线程处理?

var responseHelper = { /** * @param res restify response obj * @param code http code * @param message 消息 * @constructor */ ManualError:function(res,code,message){ res.send(code, { code:code, message:message }); } };

三个请求的真正处理操作不在这个node线程中,这个线程运行的是event loop,把请求分发到worker 线程,worker线程应该是用c++实现的,完了后再通过callback把结果返回给客户端。

回到顶部