迭代器与生成器使用场景_实现自定义可迭代对象

迭代器用于精确控制遍历过程,如斐波那契数列生成;生成器简化惰性求值实现,适合处理大文件或节省内存;通过实现__iter__()和__next__()可创建自定义可迭代对象,支持正向与反向遍历。

在 Python 中,迭代器与生成器是处理数据序列的重要工具。它们能帮助我们更高效地遍历数据,尤其是在处理大量数据或需要惰性求值的场景中。理解它们的使用场景并学会实现自定义可迭代对象,有助于写出更清晰、内存更友好的代码。

迭代器的使用场景与实现

迭代器是一个实现了迭代协议的对象,即拥有 __iter__()__next__() 方法。每次调用 __next__() 返回下一个值,直到抛出 StopIteration 异常为止。

适用场景包括:

  • 需要精确控制遍历过程,比如按特定规则读取文件行
  • 封装复杂的遍历逻辑,如树结构的深度优先遍历
  • 节省内存,避免一次性生成所有数据

下面是一个自定义迭代器,用于生成斐波那契数列:

class Fibonacci:
    def __init__(self, max_count):
        self.max_count = max_count
        self.count = 0
        self.a, self.b = 0, 1

    def __iter__(self):
        return self

    def __next__(self):
        if self.count >= self.max_count:
            raise StopIteration
        result = self.a
        self.a, self.b = self.b, self.a + self.b
        self.count += 1
        return result

# 使用示例
fib = Fibonacci(8)
for n in fib:
    print(n)

生成器的使用场景与实现

生成器是创建迭代器的简便方式,使用 yield 关键字代替 return,函数执行到 yield 时暂停并返回值,下次调用继续执行。

适合以下情况:

  • 数据量大但只需遍历一次,如日志文件逐行处理
  • 需要惰性计算,延迟生成值以节省资源
  • 简化代码,避免手动实现迭代器协议

用生成器实现同样的斐波那契数列:

def fibonacci_gen(max_count):
    a, b = 0, 1
    count = 0
    while count         yield a
        a, b = b, a + b
        count += 1

# 使用示例
for n in fibonacci_gen(8):
    print(n)

实现自定义可迭代对象

一个对象只要实现了 __iter__() 方法并返回一个迭代器,就可以用于 for 循环等上下文中。通常做法是让 __iter__() 返回自身(如果它也是迭代器),或返回另一个迭代器实例。

例如,构建一个可迭代的范围类,支持正向和反向遍历:

class ReversibleRange:
    def __init__(self, start, end):
        self.start = start
        self.end = end

    def __iter__(self):
        return RangeIterator(self.start, self.end)

    def __reversed__(self):
        return RangeIterator(self.end - 1, self.start - 1, -1)

class RangeIterator:
    def __init__(self, start, end, step=1):
        self.current = start
        self.end = end
        self.step = step

    def __iter__(self):
        return self

    def __next__(self):
        if (self.step > 0 and self.current >= self.end) or \
          (self.step             raise StopIteration
        result = self.current
        self.current += self.step
        return result

# 使用示例
rr = ReversibleRange(2, 6)
for i in rr:
    print(i) # 输出 2,3,4,5

for i in reversed(rr):
    print(i) # 输出 5,4,3,2

基本上就这些。迭代器适合复杂控制逻辑,生成器更适合简洁实现惰性序列。根据实际需求选择合适的方式,能让代码更高效也更易读。