Skip to content

迭代器-生成器和 await-async

本章我们来学习迭代器(Iterator)和生成器(Generator)。
迭代器和生成器本身在开发中某些场景里面我们是会直接使用的,也是很多语法的底层原理(比如 for of 循环、await、async 的底层)

一. 迭代器 Iterator

1.1. 什么是迭代器?

迭代器(iterator),是确使用户可在容器对象(container,例如链表或数组)上遍访的对象,使用该接口无需关心对象的内部实现细节。

  • 其行为像数据库中的光标,迭代器最早出现在 1974 年设计的 CLU 编程语言中;
  • 在各种编程语言的实现中,迭代器的实现方式各不相同,但是基本都有迭代器,比如 Java、Python 等;

从迭代器的定义我们可以看出来,迭代器是帮助我们对某个数据结构进行遍历的对象。

在 JavaScript 中,迭代器也是一个具体的对象,这个对象需要符合迭代器协议(iterator protocol):

  • 迭代器协议定义了产生一系列值(无论是优先还是无限个)的标准方式;
  • 那么在 js 中这个标准就是一个特定的 next 方法;

next 方法有如下的要求:

  • 一个无参数函数,返回一个应当拥有以下两个属性的对象:
  • done(boolean)
    • 如果迭代器可以产生序列中的下一个值,则为 false。(这等价于没有指定 done 这个属性。)
    • 如果迭代器已将序列迭代完毕,则为 true。这种情况下,value 是可选的,如果它依然存在,即为迭代结束之后的默认返回值。
  • value
    • 迭代器返回的任何 JavaScript 值。done 为 true 时可省略。

那么我们可以自己编写一个迭代器:

javascript
const friends = ["lilei", "kobe", "james"];

// 创建一个迭代器,用于迭代friends
let index = 0;
const friendsIterator = {
  next: function () {
    if (index < friends.length) {
      return { done: false, value: friends[index++] };
    } else {
      return { done: true, value: undefined };
    }
  },
};

接下来我们可以使用这个迭代器:

javascript
console.log(friendsIterator.next()); // { done: false, value: 'lilei' }
console.log(friendsIterator.next()); // { done: false, value: 'kobe' }
console.log(friendsIterator.next()); // { done: false, value: 'james' }
console.log(friendsIterator.next()); // { done: true, value: undefined }

那么如果我们每个数组需要用上面的方式创建迭代器会有点麻烦,我们也可以封装一个函数:

javascript
function createArrayIterator(arr) {
  let index = 0;
  return {
    next: function () {
      if (index < arr.length) {
        return { done: false, value: arr[index++] };
      } else {
        return { done: true, value: undefined };
      }
    },
  };
}

const friendsIterator = createArrayIterator(friends);
console.log(friendsIterator.next());
console.log(friendsIterator.next());
console.log(friendsIterator.next());
console.log(friendsIterator.next());

我们也可以生成一个无限的数字迭代器:

javascript
function createNumberIterator() {
  let count = 0;
  return {
    next: function () {
      return { done: false, value: count++ };
    },
  };
}

const numIterator = createNumberIterator();
console.log(numIterator.next());
console.log(numIterator.next());
console.log(numIterator.next());

1.2. 可迭代的对象

但是上面的代码整体来说看起来是有点奇怪的:

  • 我们获取一个数组的时候,需要自己创建一个 index 变量,再创建一个所谓的迭代器对象;
  • 事实上我们可以对上面的代码进行进一步的封装,让其变成一个可迭代对象;

什么又是可迭代对象呢?

  • 它和迭代器是不同的概念;
  • 当一个对象实现了 iterable protocol 协议时,它就是一个可迭代对象;
  • 这个对象的要求是必须实现 @@iterator 方法,在代码中我们使用 Symbol.iterator 访问该属性;

我们对上面的代码进行重构:

javascript
const info = {
  friends: ["lilei", "kobe", "james"],
  [Symbol.iterator]: function () {
    let index = 0;
    return {
      next: () => {
        if (index < this.friends.length) {
          return { done: false, value: this.friends[index++] };
        } else {
          return { done: true, value: undefined };
        }
      },
    };
  },
};

当我们要问一个问题,我们转成这样的一个东西有什么好处呢?

  • 当一个对象变成一个可迭代对象的时候,进行某些迭代操作,比如 for...of 操作时,其实就会调用它的 @@iterator 方法;
javascript
for (const item of info) {
  console.log(item);
}

1.3. 原生迭代器对象

事实上我们平时创建的很多原生对象已经实现了可迭代协议,会生成一个迭代器对象的:

  • String、Array、Map、Set、arguments 对象、NodeList 集合;
javascript
const str = "Hello World";

for (const s of str) {
  console.log(s);
}

const arr = ["abc", "cba", "nba"];
for (const item of arr) {
  console.log(item);
}

function foo(x, y, z) {
  for (const arg of arguments) {
    console.log(arg);
  }
}

foo(20, 30, 40);

可迭代对象的拆解:

javascript
// 数组本身是一个可迭代对象
const names = ["abc", "cba", "nba"];

// 获取可迭代的函数
console.log(names[Symbol.iterator]); // [Function: values]

// 调用可迭代函数, 获取到迭代器
const iterator = names[Symbol.iterator]();
console.log(iterator.next());
console.log(iterator.next());
console.log(iterator.next());
console.log(iterator.next()); // { value: undefined, done: true }

那么这些东西可以被用在哪里呢?

  • JavaScript 中语法:for ...of、展开语法(spread syntax)、yield*(后面讲)、解构赋值(Destructuring_assignment);
  • 创建一些对象时:new Map([Iterable])new WeakMap([iterable])new Set([iterable])new WeakSet([iterable]);
  • 一些方法的调用:Promise.all(iterable)Promise.race(iterable)Array.from(iterable);
javascript
// 1.for...of
for (const item of info) {
  console.log(item);
}

// 2.展开运算符
console.log([...info, "curry"]);

// 3.解构
const [name1, name2] = info;
console.log(name1, name2);

// 4.创建其他解构
console.log(new Set(info));
console.log(Array.from(info));

// 5.调用方法
Promise.all(info).then((res) => {
  console.log(res); // [ 'lilei', 'kobe', 'james' ]
});

1.4. 自定义类迭代

在前面我们看到 Array、Set、String、Map 等类创建出来的对象都是可迭代对象:

  • 在面向对象开发中,我们可以通过 class 定义一个自己的类,这个类可以创建很多的对象:
  • 如果我们也希望自己的类创建出来的对象默认是可迭代的,那么在设计类的时候我们就可以添加上 @@iterator 方法;

案例:创建一个 classroom 的类

  • 教室中有自己的位置、名称、当前教室的学生;
  • 这个教室可以进来新学生(push);
  • 创建的教室对象是可迭代对象;
javascript
class Classroom {
  constructor(name, address, initialStudent) {
    this.name = name;
    this.address = address;
    this.students = initialStudent || [];
  }

  push(student) {
    this.students.push(student);
  }

  [Symbol.iterator]() {
    let index = 0;
    return {
      next: () => {
        if (index < this.students.length) {
          return { done: false, value: this.students[index++] };
        } else {
          return { done: true };
        }
      },
    };
  }
}

接下来我们可以使用这个类:

javascript
const classroom1 = new Classroom("2201", "3幢", ["abc", "cba"]);
const classroom2 = new Classroom("3383", "5幢", ["james", "kobe"]);

for (const stu of classroom1) {
  console.log(stu);
}

for (const stu of classroom2) {
  console.log(stu);
}

迭代器在某些情况下会在没有完全迭代的情况下终止:

  • 比如遍历的过程中通过 break、continue、return、throw 中断了循环操作;
  • 比如在解构的时候,没有解构所有的值;

那么这个时候我们想要监听中断的话,可以添加 return 方法:

javascript
class Classroom {
  constructor(name, address, initialStudent) {
    this.name = name;
    this.address = address;
    this.students = initialStudent || [];
  }

  push(student) {
    this.students.push(student);
  }

  [Symbol.iterator]() {
    let index = 0;
    return {
      next: () => {
        if (index < this.students.length) {
          return { done: false, value: this.students[index++] };
        } else {
          return { done: true };
        }
      },
      return() {
        console.log("迭代器提前终止了");
        return { done: true };
      },
    };
  }
}

比如在循环、解构的时候终止:

javascript
const classroom1 = new Classroom("2201", "3幢", ["abc", "cba"]);

for (const stu of classroom1) {
  console.log(stu);
  if (stu === "abc") {
    break;
  }
}

const [name] = classroom1;
console.log(name);

二. 生成器 Generator

2.1. 什么是生成器

生成器是 ES6 中新增的一种函数控制、使用的方案,它可以让我们更加灵活的控制函数什么时候继续执行、暂停执行等。

平时我们会编写很多的函数,这些函数终止的条件通常是返回值或者发生了异常:

  • 下面的函数在没有遇到 return 或者抛出异常时就会一直执行,直到执行到函数的末尾,默认返回一个 undefined;
javascript
function foo() {
  const value1 = 100;

  const value2 = 200;

  const value3 = 300;
}

生成器函数也是一个函数,但是和普通的函数有一些区别:

首先,生成器函数需要在 function 的后面加一个符号:*

javascript
function* foo() {}

其次,生成器函数可以通过 yield 关键字来控制函数的执行流程:

javascript
function* foo() {
  const value1 = 100;
  console.log(value1);
  yield;

  const value2 = 200;
  console.log(value2);
  yield;

  const value3 = 300;
  console.log(value3);
  yield;
}

最后,生成器函数的返回值是一个 Generator(生成器):

  • 生成器事实上是一种特殊的迭代器;
  • MDN:Instead, they return a special type of iterator, called a Generator.
javascript
// 返回生成器
const generator = foo();

2.2. 生成器函数执行

我们发现上面的生成器函数 foo 的执行体压根没有执行,它只是返回了一个生成器对象。

  • 那么我们如何可以让它执行函数中的东西呢?
  • 调用 next 即可;
javascript
// 返回生成器
const generator = foo();

// 执行到第一个yield,并且暂停
generator.next();

// 执行到第二个yield,并且暂停
generator.next();

// 执行到第三个yield,并且暂停
generator.next();

// 执行剩余的代码
generator.next();

我们之前学习迭代器时,知道迭代器的 next 是会有返回值的:

javascript
// 执行到第一个yield,并且暂停
console.log(generator.next()); // { value: undefined, done: false }

但是我们很多时候不希望 next 返回的是一个 undefined,这个时候我们可以通过 yield 来返回结果:

javascript
function* foo() {
  console.log("函数开始执行~");
  const value1 = 100;
  console.log(value1);
  yield value1;

  const value2 = 200;
  console.log(value2);
  yield value2;

  const value3 = 300;
  console.log(value3);
  yield value3;

  console.log("函数结束执行~");
}

那么事实上我们可以讲代码编写成如下的函数:

javascript
function* foo() {
  let i = 1;
  while (true) {
    yield i++ * 100;
  }
}

const generator = foo();
console.log(generator.next());
console.log(generator.next());
console.log(generator.next());

2.3. 生成器的参数

函数既然可以暂停来分段执行,那么函数应该是可以传递参数的,我们是否可以给每个分段来传递参数呢?

  • 答案是可以的;
  • 我们在调用 next 函数的时候,可以给它传递参数,那么这个参数会作为上一个 yield 语句的返回值;
  • 注意:也就是说我们是为本次的函数代码块执行提供了一个值;
javascript
function* foo(initial) {
  console.log("函数开始执行~");
  const value1 = yield initial + "aaa";
  const value2 = yield value1 + "bbb";
  const value3 = yield value2 + "ccc";
}

const generator = foo("why");
const result1 = generator.next();
console.log("result1:", result1);
const result2 = generator.next(result1.value);
console.log("result2:", result2);
const result3 = generator.next(result2.value);
console.log("result3:", result3);

还有一个可以给生成器函数传递参数的方法是通过 return 函数:

  • return 传值后这个生成器函数就会结束,之后调用 next 不会继续生成值了;
javascript
function* foo() {
  const value1 = yield "why";
  console.log("value1:", value1);
  const value2 = yield value1;
  const value3 = yield value2;
}

const generator = foo();
console.log(generator.next());
console.log(generator.return(123));
console.log(generator.next());

除了给生成器函数内部传递参数之外,也可以给生成器函数内部抛出异常:

  • 抛出异常后我们可以在生成器函数中捕获异常;
  • 但是在 catch 语句中不能继续 yield 新的值了,但是可以在 catch 语句外使用 yield 继续中断函数的执行;
javascript
function* foo() {
  console.log("函数开始执行~");

  try {
    yield "why";
  } catch (err) {
    console.log("内部捕获异常:", err);
  }

  console.log("函数结束执行~");
}

const generator = foo();
const result = generator.next();
if (result !== "why") {
  generator.throw("error message");
}

2.4. 生成器替代迭代器

我们发现生成器是一种特殊的迭代器,那么在某些情况下我们可以使用生成器来替代迭代器:

javascript
function* createArrayIterator(arr) {
  for (const item of arr) {
    yield item;
  }
}

const names = ["abc", "cba", "nba"];
namesIterator = createArrayIterator(names);
console.log(namesIterator.next());
console.log(namesIterator.next());
console.log(namesIterator.next());
console.log(namesIterator.next());

我们再创建一个范围的迭代器对象:

javascript
function* createRangeIterator(start, end) {
  for (let i = start; i < end; i++) {
    yield i;
  }
}

const rangeIterator = createRangeIterator(10, 20);
console.log(rangeIterator.next());
console.log(rangeIterator.next());
console.log(rangeIterator.next());
console.log(rangeIterator.next());

事实上我们还可以使用 yield*来生产一个可迭代对象:

  • 这个时候相当于是一种 yield 的语法糖,只不过会依次迭代这个可迭代对象,每次迭代其中的一个值;
javascript
function* createArrayIterator(arr) {
  yield* arr;
}

const names = ["abc", "cba", "nba"];
const namesIterator = createArrayIterator(names);
console.log(namesIterator.next());
console.log(namesIterator.next());
console.log(namesIterator.next());
console.log(namesIterator.next());

在之前的自定义类迭代中,我们也可以换成生成器:

javascript
class Classroom {
  constructor(name, address, initialStudent) {
    this.name = name;
    this.address = address;
    this.students = initialStudent || [];
  }

  push(student) {
    this.students.push(student);
  }

  *[Symbol.iterator]() {
    yield* this.students;
  }
}

既然生成器是一个迭代器,那么我们可以对其进行如下的操作:

javascript
const namesIterator1 = createArrayIterator(names);
for (const item of namesIterator1) {
  console.log(item);
}

const namesIterator2 = createArrayIterator(names);
const set = new Set(namesIterator2);
console.log(set);

const namesIterator3 = createArrayIterator(names);
Promise.all(namesIterator3).then((res) => {
  console.log(res);
});

2.5. 生成器处理异步

javascript
function requestData(url) {
  return new Promise((resolve, reject) => {
    setTimeout(() => {
      resolve(url);
    }, 2000);
  });
}

function getData() {
  requestData("why").then((res1) => {
    requestData(res1 + "aaa").then((res2) => {
      requestData(res2 + "bbb").then((res3) => {
        console.log("res3:", res3);
      });
    });
  });
}

getData();

我们可以对 getData 进行修正:

javascript
function getData() {
  requestData("why")
    .then((res1) => {
      return requestData(res1 + "aaa");
    })
    .then((res2) => {
      return requestData(res2 + "bbb");
    })
    .then((res3) => {
      console.log("res3:", res3);
    });
}

但是上面的代码其实看起来也是阅读性比较差的,有没有办法可以继续来对上面的代码进行优化呢?

javascript
function* getData() {
  const res1 = yield requestData("why");
  const res2 = yield requestData(res1 + "aaa");
  const res3 = yield requestData(res2 + "bbb");
  console.log(res3);
}

我们编写成了生成器函数,但是生成器函数必须自己调用 next 来执行:

javascript
const generator = getData();
generator.next().value.then((res) => {
  generator.next(res).value.then((res) => {
    generator.next(res).value.then((res) => {
      generator.next(res);
    });
  });
});

目前我们的写法有两个问题:

  • 第一,我们不能确定到底需要调用几层的 Promise 关系;
  • 第二,如果还有其他需要这样执行的函数,我们应该如何操作呢?

所以,我们可以封装一个工具函数 execGenerator 自动执行生成器函数:

javascript
function execGenerator(genFn) {
  const generator = genFn();
  function exec(res) {
    const result = generator.next(res);
    if (result.done) return result.value;
    result.value.then((res) => {
      exec(res);
    });
  }
  exec();
}

事实上对于上面的异步处理代码,在 ES8(ES2017)新增了 async、await 关键字:

javascript
function requestData(url) {
  return new Promise((resolve, reject) => {
    setTimeout(() => {
      resolve(url);
    }, 2000);
  });
}

async function getData() {
  const res1 = await requestData("why");
  const res2 = await requestData(res1 + "aaa");
  const res3 = await requestData(res2 + "bbb");
  const res4 = await requestData(res3 + "ccc");
  console.log(res4);
}

getData();

三. async/await

3.1. async 关键字

async 关键字用于声明一个异步函数:

  • async 是 asynchronous 单词的缩写,异步、非同步;
  • sync 是 synchronous 单词的缩写,同步、同时;

async 异步函数可以有很多中写法:

javascript
async function foo1() {}

const foo2 = async function () {};

const foo3 = async () => {};

class Person {
  async foo() {}
}

异步函数的内部代码执行过程和普通的函数是一致的,默认情况下也是会被同步执行:

javascript
async function foo() {
  console.log("异步函数foo开始~");
  console.log("foo function");
  console.log("异步函数foo结束~");
}

console.log("start~");
foo();
console.log("end");

异步函数也可以有返回值,但是异步函数的返回值会被包裹到 Promise.resolve 中:

javascript
async function foo() {
  return "abc";
}

foo().then((res) => {
  console.log("res:", res);
});

如果我们的异步函数的返回值是 Promise,Promise.resolve 的状态会由 Promise 决定:

javascript
async function foo() {
  return new Promise((resolve, reject) => {
    // resolve("aaa")
    reject("bbb");
  });
}

foo()
  .then((res) => {
    console.log("res:", res);
  })
  .catch((err) => {
    console.log("err:", err);
  });

如果我们的异步函数的返回值是一个对象并且实现了 thenable,那么会由对象的 then 方法来决定:

javascript
async function foo() {
  return {
    then: function (resolve, reject) {
      // resolve(111)
      reject(222);
    },
  };
}

foo()
  .then((res) => {
    console.log("res:", res);
  })
  .catch((err) => {
    console.log("err:", err);
  });

如果我们在 async 中抛出了异常,那么程序它并不会像普通函数一样报错,而是会作为 Promise 的 reject 来传递:

javascript
async function foo() {
  throw new Error("foo error message");
}

foo()
  .then((res) => {
    console.log("res:", res);
  })
  .catch((err) => {
    console.log("err:", err);
  });

3.2. await 关键字

async 函数另外一个特殊之处就是可以在它内部使用 await 关键字,而普通函数中是不可以的。

await 关键字有什么特点呢?

  • 通常使用 await 是后面会跟上一个表达式,这个表达式会返回一个 Promise;
  • 那么 await 会等到 Promise 的状态变成 fulfilled 状态,之后继续执行异步函数;
javascript
function requestData(url) {
  console.log("调用了requestData请求");
  return new Promise((resolve, reject) => {
    setTimeout(() => {
      if (url === "coderwhy") {
        // 发送成功了
        resolve("一组成功数据");
      } else {
        // 发送失败了
        reject("请求url错误");
      }
    }, 1000);
  });
}

async function foo() {
  console.log("foo函数开始~");
  const result = await requestData("coderwhy");
  console.log("代码继续执行:", result);
}

foo();

如果 await 后面是一个普通的值,那么会直接返回这个值:

javascript
async function foo() {
  console.log("foo函数开始~")
  const result = await 123
  console.log("代码继续执行:", result)
}

如果await后面是一个theable的对象,那么会根据对象的then方法调用来决定后续的值:

javascript
async function foo() {
  console.log("foo函数开始~")
  const result = await {
    then: function(resolve, reject) {
      resolve("aaa")
    }
  }
  console.log("代码继续执行:", result)
}

如果 await 后面的表达式,返回的 Promise 是 reject 的状态,那么会将这个 reject 结果直接作为 foo 的 Promise 的 reject 值:

javascript
function requestData(url) {
  console.log("调用了requestData请求");
  return new Promise((resolve, reject) => {
    setTimeout(() => {
      if (url === "coderwhy") {
        // 发送成功了
        resolve("一组成功数据");
      } else {
        // 发送失败了
        reject("请求url错误");
      }
    }, 1000);
  });
}

async function foo() {
  console.log("foo函数开始~");
  const result = await requestData("kobe");
  console.log("代码继续执行:", result);
}

foo()
  .then((res) => {
    console.log("res:", res);
  })
  .catch((err) => {
    console.log("err:", err);
  });