通过源码解析 Node.js 中 events 模块里的优化小细节

之前的文章里有说，在 Node.js 中，流（stream）是许许多多原生对象的父类，角色可谓十分重要。但是，当我们沿着“族谱”往上看时，会发现 EventEmitter 类是流（stream）类的父类，所以可以说，EventEmitter 类是 Node.js 的根基类之一，地位可显一般。虽然 EventEmitter 类暴露的接口并不多而且十分简单，并且是少数纯 JavaScript 实现的模块之一，但因为它的应用实在是太广泛，身份太基础，所以在它的实现里处处闪光着一些优化代码执行效率，和保证极端情况下代码结果正确性的小细节。在了解之后，我们也可以将其使用到我们的日常编码之后，学以致用。

好，现在就让我们跟随 Node.js 项目中的 lib/events.js 中的代码，来逐一了解：

效率更高的键 / 值对存储对象的创建。
效率更高的从数组中去除一个元素。
效率更高的不定参数的函数调用。
如果防止在一个事件监听器中监听同一个事件，接而导致死循环？
emitter.once 是怎么办到的？

效率更高的键 / 值对存储对象的创建

在 EventEmitter 类中，以键 / 值对的方式来存储事件名和对应的监听器。在 Node.js里，最简单的键 / 值对的存储方式就是直接创建一个空对象：

let store = {}
store.key = 'value'

你可能会说，ES2015 中的 Map 已经在目前版本的 Node.js 中可用了，在语义上它更有优势：

let store = new Map()
store.set('key', 'value')

不过，你可能只需要一个纯粹的键 / 值对存储对象，并不需要 Object 和 Map 这两个类的原型中的提供的那些多余的方法，所以你直接：

let store = Object.create(null)
store.key = 'value'

好，我们已经做的挺极致了，但这还不是 EventEmitter 中的最终实现，它的办法是使用一个空的构造函数，并且把这个构造的原型事先置空：

function Store () {}
Store.prototype = Object.create(null)

然后：

let store = new Store()
store.key = 'value'

现在让我们来比一比效率，代码：

/* global suite bench */
'use strict'

suite('key / value store', function () {
  function Store () {}
  Store.prototype = Object.create(null)

  bench('let store = {}', function () {
    let store = {}
    store.key = 'value'
  })

  bench('let store = new Map()', function () {
    let store = new Map()
    store.set('key', 'value')
  })

  bench('let store = Object.create(null)', function () {
    let store = Object.create(null)
    store.key = 'value'
  })

  bench('EventEmitter way', function () {
    let store = new Store()
    store.key = 'value'
  })
})

比较结果：

                      key / value store
      83,196,978 op/s » let store = {}
       4,826,143 op/s » let store = new Map()
       7,405,904 op/s » let store = Object.create(null)
     165,608,103 op/s » EventEmitter way

效率更高的从数组中去除一个元素

在 EventEmitter#removeListener 这个 API 的实现里，需要从存储的监听器数组中除去一个元素，我们首先想到的就是使用 Array#splice 这个 API ，即 arr.splice(i, 1) 。不过这个 API 所提供的功能过于多了，它支持去除自定义数量的元素，还支持向数组中添加自定义的元素。所以，源码中选择自己实现一个最小可用的：

// lib/events.js
// ...

function spliceOne(list, index) {
  for (var i = index, k = i + 1, n = list.length; k < n; i += 1, k += 1)
    list[i] = list[k];
  list.pop();
}

比一比，代码：

/* global suite bench */
'use strict'

suite('Remove one element from an array', function () {
  function spliceOne (list, index) {
    for (var i = index, k = i + 1, n = list.length; k < n; i += 1, k += 1) {
      list[i] = list[k]
    }
    list.pop()
  }

  bench('Array#splice', function () {
    let array = [1, 2, 3]
    array.splice(1, 1)
  })

  bench('EventEmitter way', function () {
    let array = [1, 2, 3]
    spliceOne(array, 1)
  })
})

结果，好吧，秒了：

                      Remove one element from an array
       4,262,168 op/s » Array#splice
      54,829,749 op/s » EventEmitter way

效率更高的不定参数的函数调用

在事件触发时，监听器拥有的参数数量是任意的，所以源码中优化了不定参数的函数调用。

不过好吧，这里使用的是笨办法，即…把不定参数的函数调用转变成固定参数的函数调用，且最多支持到三个参数：

// lib/events.js
// ...

function emitNone(handler, isFn, self) {
  // ...
}
function emitOne(handler, isFn, self, arg1) {
  // ...
}
function emitTwo(handler, isFn, self, arg1, arg2) {
  // ...
}
function emitThree(handler, isFn, self, arg1, arg2, arg3) {
  // ...
}

function emitMany(handler, isFn, self, args) {
  // ...
}

虽然结果不言而喻，我们还是比较下会差多少，以三个参数为例：

/* global suite bench */
'use strict'

suite('calling function with any amount of arguments', function () {
  function nope () {}

  bench('Function#apply', function () {
    function callMany () { nope.apply(null, arguments) }
    callMany(1, 2, 3)
  })

  bench('EventEmitter way', function () {
    function callThree (a, b, c) { nope.call(null, a, b, c) }
    callThree(1, 2, 3)
  })
})

结果显示差了一倍：

                      calling function with any amount of arguments
      11,354,996 op/s » Function#apply
      23,773,458 op/s » EventEmitter way

如果防止在一个事件监听器中监听同一个事件，接而导致死循环？

在注册事件监听器时，你可否曾想到过这种情况：

'use strict'
const EventEmitter = require('events')

let myEventEmitter = new EventEmitter()

myEventEmitter.on('wtf', function wtf () {
  myEventEmitter.on('wtf', wtf)
})

myEventEmitter.emit('wtf')

运行上述代码，是否会直接导致死循环？答案是不会，因为源码中做了处理。

我们先看一下具体的代码：

// lib/events.js
// ...

function emitMany(handler, isFn, self, args) {
  if (isFn)
    handler.apply(self, args);
  else {
    var len = handler.length;
    var listeners = arrayClone(handler, len);
    for (var i = 0; i < len; ++i)
      listeners[i].apply(self, args);
  }
}

// ...
function arrayClone(arr, i) {
  var copy = new Array(i);
  while (i--)
    copy[i] = arr[i];
  return copy;
}

其中的 handler 便是具体的事件监听器数组，不难看出，源码中的解决方案是，使用 arrayClone 方法，拷贝出另一个一模一样的数组，来执行它，这样一来，当我们在监听器内监听同一个事件时，的确给原监听器数组添加了新的函数，但并没有影响到当前这个被拷贝出来的副本数组。

`emitter.once` 是怎么办到的

这个很简单，使用了闭包：

function _onceWrap(target, type, listener) {
  var fired = false;
  function g() {
    target.removeListener(type, g);
    if (!fired) {
      fired = true;
      listener.apply(target, arguments);
    }
  }
  g.listener = listener;
  return g;
}

你可能会问，我既然已经在 g 函数中的第一行中移除了当前的监听器，为何还要使用 fired 这个 flag ？我个人觉得是因为，在 removeListener 这个同步方法中，会将这个 g 函数暴露出来给 removeListener 事件的监听器，所以该 flag 用来保证 once 注册的函数只会被调用一次。

最后

分析就到这里啦，在了解了这些做法之后，在今后我们写一些有性能要求的底层工具库等东西时，我们便可以用上它们啦。EventEmitter 类的源码并不复杂，并且是纯 JavaScript 实现的，所以也非常推荐大家闲时一读。

参考：

https://github.com/nodejs/node/blob/master/lib/events.js

alanyang 1楼•10 年前

不错，第二个删除数组元素很有用

youth7 2楼•10 年前

想问一下node的模块有哪些是纯js实现的，有些时候看node源码，一看到c++相关就很恶心，压根不知道根本是怎么实现的

DavidCai1993 3楼•10 年前作者

@youth7 简单一点的，可以看 events 。有挑战一点的，可以尝试看看 stream ：）

Alexis374 4楼•10 年前

为何

let store = {} //1
let store = Object.create(null) //2

2比1的效率高

captainblue2013 5楼•10 年前

@Alexis374 是1比2高好吧

captainblue2013 6楼•10 年前

这种文章才应该精华 ,顺便问一下这个bunch是什么模块

cupyong 7楼•10 年前

Alexis374 8楼•10 年前

@captainblue2013 笔误。。。。我就是想问为何1比2 高 2中没有多余的原型上的方法啊

alsotang 9楼•10 年前

我既然已经在 g 函数中的第一行中移除了当前的监听器，为何还要使用 fired 这个 flag ？我个人觉得是因为，防止在并发情况下，出现 removeListener 函数还未执行完时，函数再次被调用。

removeListener 是个同步的操作，在 js 单线程的环境中，不会出现你说的函数被两次调用的问题。

这个 .once 的地方，我觉得它就是把【移除事件】跟【只调用一次】作为两个单独的逻辑来处理，而不是通过【移除事件】这一逻辑的副作用来保证只调用一次。

这个地方如果正常使用事件的 emit 的话，我觉得 fired 变量就是不必要的。什么时候这个 fired 是必要的呢？那就是 g 这个函数被单独取出来调用，而非通过 .emit 的方式调用。

alsotang 10楼•10 年前

【移除事件】更多是为了防止内存泄露，以及切实地清除掉 listeners 里面多余的回调函数。至于它能带来的的【只调用一次】这个附加的作用，可能是没被认真考虑的。

DavidCai1993 11楼•10 年前作者

@alsotang 学习了

DavidCai1993 12楼•10 年前作者

@captainblue2013 用的是这个。

alsotang 13楼•10 年前

@DavidCai1993 我不确定我这样想对不对，但确实那个地方是没法『并发』进入的呀

alsotang 14楼•10 年前

eventemitter，表面说起来是各种异步啥啥的，其实里面绝大部分代码都是同步的对吗。。。？

qinyang912 15楼•10 年前

mark mark 😃

DavidCai1993 16楼•10 年前作者

@alsotang 刚才在路上想了想，感觉问题是出在 removeListener 这个方法里，坐下翻看一下文档，果然，这个方法会触发 removeListener 事件，会给监听器暴露两个参数：eventName 和 listener ，在上面的场景里，listener 参数就是 g 。在这个 removeListener 监听器再执行 listener 时，可能会先把这个 g 给执行了。所以它的意图是，保证 once 注册的监听器只会执行一次，验证：

'use strict'
const EventEmitter = require('events')

let ee = new EventEmitter()

ee.once('wtf', () => { console.log('wtf') })

ee.on('removeListener', (eventName, listener) => {
  console.log(`eventName: ${eventName}`)
  listener.call(ee)
})

ee.emit('wtf')
// eventName: wtf
// wtf

但是从代码来看，Node.js 还是留了后门的：

'use strict'
const EventEmitter = require('events')

let ee = new EventEmitter()

ee.once('wtf', () => { console.log('wtf') })

ee.on('removeListener', (eventName, listener) => {
  console.log(`eventName: ${eventName}`)
  listener.listener()
})

ee.emit('wtf')
// eventName: wtf
// wtf
// wtf

我觉得是这个原因！你觉得捏？你也觉得的话，我就把文章内容改了。。

DavidCai1993 17楼•10 年前作者

@alsotang “eventemitter，表面说起来是各种异步啥啥的，其实里面绝大部分代码都是同步的对吗。。。？” 赞同。

alsotang 18楼•10 年前

@DavidCai1993 这种用法太 hack 了，我还是认为这段代码在产出时，【移除事件】和【保证只调用一次】是两个分开的逻辑。

这样理解就不用在意为什么事件都移除了，还需要通过一个 flag 去标记。

那段内容本身是很正常的。。。说明 fired 变量的作用就好了。只需要告诉大家它们的 once 通过 fired 变量来标记只运行一次，并且运行时，删除了回调监听。

DavidCai1993 19楼•10 年前作者

@alsotang 嗯已修改原文，说明了那个情况~

DavidCai1993 20楼•10 年前作者

@alsotang 上面讨论的那种 hack 做法的确我也觉得怪怪的，所以给源码提了个 PR （ https://github.com/nodejs/node/pull/6394 ），目前已合。所以以后就不需要这么 hack 啦~

fengmk2 21楼•10 年前

非常不错，看得很细致，store学习到了。自豪地采用 CNodeJS ionic

zhuyingda 22楼•10 年前

赞，源码分析的非常到位，希望继续产出类似的东西供大家一起学习

skyitachi 23楼•10 年前

防止事件死循环的那段，我感觉在handler继续on其实是在该事件emit完了之后的，自然不会触发。所以那种写法不会语义上就不应该导致死循环，复制handler的数组只是为了实现这一语义。赞楼主的细致

DavidCai1993 24楼•10 年前作者

@skyitachi 的确，在取完 handler 数组的长度后，之后的添加的监听器虽然加进来了，但的确不会被循环遍历到了。或许说 arrayClone 是为了防止已注册监听器的变动（如删 / 改）更合适？比如：

'use stirct'
const EE = require('events')
let ee = new EE()

function f1 () { ee.removeListener('test', f2) }
function f2 () {}

ee.on('test', f1)
ee.on('test', f2)

ee.emit('test')

若不经过 arrayClone 则报错：Cannot read property 'call' of undefined ，如经过，则不报。