node-require介绍

用过node的同学应该都知道require是用来加载module的,那你是否存在如下的疑问呢?

  1. require(fileName)是如何依据fileName找到对应module呢?
  2. 为何模块中一定要通过module.exports暴漏出接口?module.exports与require存在什么关系

对上述问题进行概括可以抽象出如下几个问题?

  1. module的路径分析
  2. 文件加载

序言

// node环境下执行:
console.log(require.toString)

result is as fellow:
'function require(path) {\n    return self.require(path);\n  }'

上述代码说明require函数仅仅是module.require的封装,这样就需要查看node中的module源代码了。

引入模块的方式

先别急,首先来直观来认识一下node的模块加载方式:

case 1:

// 'path'为node的核心模块
var path = require('path')

case2:

// a.js,路径为: basePath/a.js
var myModule = require('./my-module')

// my-module的路径为basePath/node_modules/myModule.js

case 3:

// a.js, 路径: basePath/a.js
var main = require('./')

// basePath下还包括package.json, index.js

路径解析

在node的官方API中,我们可以找到这段描述:

To get the exact filename that will be loaded when require() is called, use the require.resolve() function.

Putting together all of the above, here is the high-level algorithm in pseudocode of what require.resolve does: ……

试试在node环境下用用require.resolve这个API:

require.resolve('./a.js')
// 这样就得到a.js的绝对路径

为了探索缘由,就从node核心代码中的mdoule.js找答案吧:

require.resolve = function(request) {
    return Module._resolveFilename(request, self);
}

Module._resolveFilename = function(request, parent) {
    // 判断是否为node的核心模块
    if (NativeModule.exists(request)) {
        return request;
    }
    // 得到查询路径,格式为数组:[id, [paths]]
    var resolvedModule =  Module._resolveLookupPaths(request, parent);      var paths = resolvedModule[1];
    // 根据path、fileName得到绝对路径
    var filename = Module._findPath(request, paths);

    return filename;
}

那Module._resolveLookupPaths是如何得到所有查询路径的呢?

  1. 为node的核心模块,stop
  2. 以./或../开头,本地查找, stop
  3. 沿着文件树,得到node_module的所有路径,知道/node_modules,在node_module中查找,stop
  4. path为目录,则检查package.json文件是否存在main属性,否则默认为index.js
  5. 最后返回new Error(‘Cannot find module”’ + request + ‘”’);

模块加载

先看代码:

// 我们经常使用的require函数
function require(path) {
    return self.require(path);
}
// 调用_load函数,加载所需的模块
Module.prototype.require = function(path) {
    return Module._load(path, this);
}

这样模块函数的调用链到了Module._load函数:

Module.cache = {};
Module._load = function() {
    // 检测模块是否已经加载过
    var cachedModule = Module._cache[filename];
    if (cachedModule) {
        return cachedModule.exports;
    }
    // 模块还未加载,则为模块创建module实例
    var module = new Module(filename, parent);
    // 新创建的实例存储于cache中
    Module._cache[filename] = module;
    // 开始获取模块的内容
    module.load(filename);
    // 对外提供接口
    return module.exports;
}

接下来问题的关键就变成了module.load,该方法用于获取module的内容,然后进行解析:

Module.prototype.load = function(filename) {
    // 解析出文件的后缀, 存在['.js', '.json', 'node']
    var extension = path.extname(filename) || '.js';
    // 根据后缀,获取相关的模块
    Module._extensions[extension](this, filename);
}

node会匹配按照.js、.json、.node三种格式进行模块匹配,根据文件类型的不同采取不同的加载策略,但是这三种策略最后均需要调用Module.prototype._compile进行编译处理:

Module._extensions['.js'] = function(module, filename) {
  var content = fs.readFileSync(filename, 'utf8');
  module._compile(stripBOM(content), filename);
};

Module.prototype._compile = function(content, filename) {
    //将内容放入到(function() { content }),形成闭包,形成私有作用域
    var wrapper = Module.wrap(content);
    // bind新的执行上下文
    var compiledWrapper = runInThisContext(wrapper, { filename: filename });
    // 向外暴漏接口:module.exports, require, module,__filename,  __dirname,
    var args = [self.exports, require, self, filename, dirname];
  return compiledWrapper.apply(self.exports, args);
}

这样,我们就可以在require来获取相应地module。

#结论 node现在这么火,各种优势铺天盖地涌来,会让刚刚入行的人觉得深不可测,往往会让人望而却步。但是只要我们敢于突破这一步,深入下来仔细分析,就会发现其实没有那么晦涩难懂,踏出第一步真的很关键!