如果您读取整个文件时content = open('Path/to/file', 'r').read(),文件句柄是否一直打开直到脚本退出?有没有更简洁的方法来读取整个文件?
content = open('Path/to/file', 'r').read()
这个问题的答案在某种程度上取决于特定的Python实现。
要了解所有内容,请特别注意实际file对象。在您的代码中,该对象仅在表达式中被提及一次,并且在read()调用返回后立即变得不可访问。
file
read()
这意味着文件对象是垃圾。剩下的唯一问题是“垃圾收集器何时收集文件对象?”。
在使用引用计数器的CPython中,这种垃圾立即被注意到,因此将立即被收集。这通常不适用于其他python实现。
确保该文件已关闭的一种更好的解决方案是以下模式:
with open('Path/to/file', 'r') as content_file: content = content_file.read()
块结束后,它将始终立即关闭文件;即使发生异常。
编辑:在上面提出一个更好的点:
除了file.__exit__(),这是在with上下文管理器设置中“自动”调用的,唯一file.close()可以自动调用的其他方式(即,除了自己明确调用之外)是via file.__del__()。这就引出了我们什么时候__del__()打电话的问题?
file.__exit__()
with
file.close()
file.__del__()
__del__()
正确编写的程序不能假定终结器将在程序终止之前的任何时候运行。
- https://devblogs.microsoft.com/oldnewthing/20100809-00/?p=13203
特别是:
从不显式销毁对象。但是,当它们变得不可访问时,它们可能会被垃圾回收。 允许实现推迟垃圾回收或完全忽略垃圾回收 –只要没有收集仍可到达的对象,垃圾回收的实现方式就取决于实现质量。 […] CPython当前使用带有循环计数垃圾的(可选)延迟检测的引用计数方案,该方案会在无法访问时立即收集大多数对象,但不能保证收集包含循环引用的垃圾。
从不显式销毁对象。但是,当它们变得不可访问时,它们可能会被垃圾回收。 允许实现推迟垃圾回收或完全忽略垃圾回收 –只要没有收集仍可到达的对象,垃圾回收的实现方式就取决于实现质量。
[…]
CPython当前使用带有循环计数垃圾的(可选)延迟检测的引用计数方案,该方案会在无法访问时立即收集大多数对象,但不能保证收集包含循环引用的垃圾。
- https://docs.python.org/3.5/reference/datamodel.html#objects-values-and- types
(强调我的)
但正如它暗示的那样,其他实现可能具有其他行为。例如,PyPy有 6 种不同的垃圾回收实现!