我正在使用自定义API,以允许用户上传文件(希望是任意大小)。如果文件很大,将对其进行分块处理,并在对服务器的多个请求中进行处理。
我正在根据网上的许多示例编写使用File和FileReader(HTML5)的代码。通常(从我在网上阅读的内容)中,通过分块文件传输,人们首先会从文件对象中获取一滴数据
File
FileReader
var file = $('input[type=file]')[0].files[0]; var blob = file.slice(start,end)
然后使用a FileReader读取blob readAsArrayBuffer(blob)或readAsBinaryString(blob)
readAsArrayBuffer(blob)
readAsBinaryString(blob)
最后在FileReader.onload(e)方法中,将数据发送到服务器。对文件中的所有块重复此过程。
FileReader.onload(e)
我的问题是
为什么需要使用FileReader?如果我不使用它,而只是使用来发送blob File.slice,则可以保证在我尝试在每个请求中发送数据之前都会完成切片操作。File对象创建后是否会加载整个文件(肯定不会加载吗?)。是否File.slice寻求参数所规定的位置,然后读取其中的信息?该文档没有为我提供有关实现方式的线索。
File.slice
要记住的重要一点是File继承自Blob,File实际上没有切片方法,而是从Blob获取此方法。文件仅添加了几个元数据属性。
想到Blob(或文件)的最佳方法是作为数据的指针,而不是实际的数据本身。有点像其他语言的文件句柄。
如果不使用读取器,则实际上无法获取Blob中的数据,该读取器将异步读取以避免阻塞UI线程。
Blob slice()方法仅返回另一个Blob,但这又不是数据,它只是原始Blob中指向一系列数据的指针,有点像视图的有界指针。要从切出的Blob中实际获取字节,您仍然需要使用读取器。对于切成薄片的斑点,您的阅读器是有界的。
这实际上只是为了方便起见,因此您不必在代码中携带一堆相对和绝对偏移,您可以获取数据的有界视图并像使用字节读取器一样使用读取器0。
对于XMLHttpRequest(假设浏览器支持较新的接口),数据将在发送时进行流传输,并受Blob范围的约束。基本上,如果您将文件指针发送给流方法,它的工作方式将与您想象的相同(基本上是幕后的工作)。https://developer.mozilla.org/zh- CN/docs/Web/API/XMLHttpRequest/Sending_and_Receiving_Binary_Data#Sending_binary_data
本质上,这是一个懒惰的读者。如果Blob已从文件系统中加载/读取,或已在内存中创建,则将使用该Blob。但是,当您使用文件时,它将被延迟加载并从主线程异步流式传输。
这里的基本逻辑是,浏览器开发人员永远不希望读取同步发生,因为它可能阻塞主线程,因此所有API都是围绕该核心原理设计的。注意Blob.slice()是如何同步的- 这就是您知道它实际上并没有执行任何IO的方式,它只是设置边界和(可能是)文件指针。