解压缩文件

小编典典

解压缩文件

javascript

我想使用Web浏览器在客户端显示OpenOffice文件，.odt和.odp。

这些文件是压缩文件。使用Ajax，我可以从服务器获取这些文件，但是它们是压缩文件。我必须使用JavaScript解压缩它们，我尝试使用inflate.js，http： //www.onicos.com/staff/iz/amuse/javascript/expert/inflate.txt ，但没有成功。

阅读 278

2020-04-25

共1个答案

小编典典

这是Javascript中的应用程序代码：

// In my demo, this gets attached to a click event.
// it instantiates a ZipFile, and provides a callback that is
// invoked when the zip is read.  This can take a few seconds on a
// large zip file, so it's asynchronous. 
var readFile = function(){
    $("#status").html("<br/>");
    var url= $("#urlToLoad").val();
    var doneReading = function(zip){
        extractEntries(zip);
    };

    var zipFile = new ZipFile(url, doneReading);
};


// this function extracts the entries from an instantiated zip
function extractEntries(zip){
    $('#report').accordion('destroy');

    // clear
    $("#report").html('');

    var extractCb = function(id) {
        // this callback is invoked with the entry name, and entry text
        // in my demo, the text is just injected into an accordion panel.
        return (function(entryName, entryText){
            var content = entryText.replace(new RegExp( "\\n", "g" ), "<br/>");
            $("#"+id).html(content);
            $("#status").append("extract cb, entry(" + entryName + ")  id(" + id + ")<br/>");
            $('#report').accordion('destroy');
            $('#report').accordion({collapsible:true, active:false});
        });
    }

    // for each entry in the zip, extract it. 
    for (var i=0; i<zip.entries.length;  i++) {
        var entry = zip.entries[i];

        var entryInfo = "<h4><a>" + entry.name + "</a></h4>\n<div>";

        // contrive an id for the entry, make it unique
        var randomId = "id-"+ Math.floor((Math.random() * 1000000000));

        entryInfo += "<span class='inputDiv'><h4>Content:</h4><span id='" + randomId +
            "'></span></span></div>\n";

        // insert the info for one entry as the last child within the report div
        $("#report").append(entryInfo);

        // extract asynchronously
        entry.extract(extractCb(randomId));
    }
}

该演示包括以下两个步骤：readFile通过单击触发fn，并实例化一个ZipFile对象，该对象读取zip文件。当读取完成时，存在一个异步回调（对于大小合理的zip，通常在不到一秒钟的时间内发生）-在此演示中，回调被保存在doneReading局部变量中，该变量简单地调用extractEntries，只是盲目地解压缩所提供内容的所有内容。压缩文件。在实际应用中，您可能会选择一些要提取的条目（允许用户选择，或者以编程方式选择一个或多个条目，等等）。

将extractEntries在所有条目FN迭代，并呼吁extract()各一个，通过一个回调。对条目进行解压缩需要花费时间，对于zip文件中的每个条目而言，可能需要1秒或更长时间，这意味着异步是合适的。extract回调只是将提取的内容添加到页面上的jQuery手风琴中。如果内容为二进制，则将其格式化（未显示）。

它可以工作，但是我认为该实用程序有些有限。

一方面：它非常慢。从PKWare解压缩140k
AppNote.txt文件大约需要4秒钟。在.NET程序中，相同的解压缩可以在不到0.5秒的时间内完成。编辑
：在IE9和Chrome中，Javascript ZipFile的解压缩速度比现在快得多。它仍然比编译的程序慢，但是对于正常的浏览器使用来说却足够快。

另一个：它不做流式传输。它基本上将zipfile的所有内容都吸收到内存中。在“实际”编程环境中，您只能读取zip文件的元数据（例如，每个条目64个字节），然后根据需要读取和解压缩其他数据。据我所知，没有办法像在javascript中那样做IO，因此，唯一的选择是将整个zip读取到内存中并在其中进行随机访问。这意味着它将对大型zip文件的系统内存提出不合理的要求。对于较小的zip文件，这并不是什么大问题。

另外：它不处理“一般情况”的zip文件-我没有费心在解压缩中实现许多zip选项-例如ZIP加密，WinZip加密，zip64，
~~UTF-8编码的文件名~~ 等等上。（编辑
-现在处理UTF-8编码的文件名）。但是，ZipFile类处理基础知识。其中一些事情将不难实现。我在Javascript中有一个AES加密类；可以集成以支持加密。对于大多数Javascript用户而言，支持Zip64可能会毫无用处，因为它旨在支持> 4gb
zip文件-无需在浏览器中提取这些文件。

我也没有测试解压缩二进制内容的情况。
现在，它会解压缩文本。如果您有一个压缩的二进制文件，则需要编辑ZipFile类以正确处理它。我没有弄清楚如何做到这一点。它现在也执行二进制文件。

编辑 -我更新了JS解压缩库和演示。除了文本，它现在还处理二进制文件。我使它更具弹性和通用性-
您现在可以指定在读取文本文件时使用的编码。演示也进行了扩展-除其他外，它还显示了在浏览器中解压缩XLSX文件的过程。

因此，尽管我认为它的用途和兴趣有限，但它确实有效。我猜它可以在Node.js中工作。

2020-04-25