根据我的测试,标题中的错误仅在 Google Chrome 中引发。我正在对一个大的 XML 文件进行 base64 编码,以便可以下载它:
this.loader.src = "data:application/x-forcedownload;base64,"+ btoa("<?xml version=\"1.0\" encoding=\"utf-8\"?>" +"<"+this.gamesave.tagName+">" +this.xml.firstChild.innerHTML +"</"+this.gamesave.tagName+">");
this.loader是隐藏的 iframe。
this.loader
这个错误实际上是一个很大的变化,因为通常情况下,谷歌浏览器会在btoa调用时崩溃。Mozilla Firefox 在这里没有问题,所以问题与浏览器有关。我不知道文件中有任何奇怪的字符。实际上,我确实相信没有非 ascii 字符。
btoa
问: 如何找到有问题的字符并替换它们,以便 Chrome 停止抱怨?
我曾尝试使用 Downloadify 来启动下载,但它不起作用。它不可靠并且不会引发任何错误以允许调试。
如果您有 UTF8,请使用它(实际上适用于 SVG 源),例如:
btoa(unescape(encodeURIComponent(str)))
例子:
var imgsrc = 'data:image/svg+xml;base64,' + btoa(unescape(encodeURIComponent(markup))); var img = new Image(1, 1); // width, height values are optional params img.src = imgsrc;
如果您需要解码该 base64,请使用以下命令:
var str2 = decodeURIComponent(escape(window.atob(b64))); console.log(str2);
var str = "盲枚眉脛脰脺莽茅猫帽"; var b64 = window.btoa(unescape(encodeURIComponent(str))) console.log(b64); var str2 = decodeURIComponent(escape(window.atob(b64))); console.log(str2);
注意: 如果您需要让它在 mobile-safari 中工作,您可能需要从 base64 数据中删除所有空白…
function b64_to_utf8( str ) { str = str.replace(/\s/g, ''); return decodeURIComponent(escape(window.atob( str ))); }
2017 更新
这个问题再次困扰着我。 简单的事实是, atob 并没有真正处理 UTF8 字符串——它只是 ASCII。 另外,我不会使用像 js-base64 这样的英国媒体报道软件。 但是webtoolkit确实有一个小巧、漂亮且易于维护的实现:
/** * * Base64 encode / decode * http://www.webtoolkit.info * **/ var Base64 = { // private property _keyStr: "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=" // public method for encoding , encode: function (input) { var output = ""; var chr1, chr2, chr3, enc1, enc2, enc3, enc4; var i = 0; input = Base64._utf8_encode(input); while (i < input.length) { chr1 = input.charCodeAt(i++); chr2 = input.charCodeAt(i++); chr3 = input.charCodeAt(i++); enc1 = chr1 >> 2; enc2 = ((chr1 & 3) << 4) | (chr2 >> 4); enc3 = ((chr2 & 15) << 2) | (chr3 >> 6); enc4 = chr3 & 63; if (isNaN(chr2)) { enc3 = enc4 = 64; } else if (isNaN(chr3)) { enc4 = 64; } output = output + this._keyStr.charAt(enc1) + this._keyStr.charAt(enc2) + this._keyStr.charAt(enc3) + this._keyStr.charAt(enc4); } // Whend return output; } // End Function encode // public method for decoding ,decode: function (input) { var output = ""; var chr1, chr2, chr3; var enc1, enc2, enc3, enc4; var i = 0; input = input.replace(/[^A-Za-z0-9\+\/\=]/g, ""); while (i < input.length) { enc1 = this._keyStr.indexOf(input.charAt(i++)); enc2 = this._keyStr.indexOf(input.charAt(i++)); enc3 = this._keyStr.indexOf(input.charAt(i++)); enc4 = this._keyStr.indexOf(input.charAt(i++)); chr1 = (enc1 << 2) | (enc2 >> 4); chr2 = ((enc2 & 15) << 4) | (enc3 >> 2); chr3 = ((enc3 & 3) << 6) | enc4; output = output + String.fromCharCode(chr1); if (enc3 != 64) { output = output + String.fromCharCode(chr2); } if (enc4 != 64) { output = output + String.fromCharCode(chr3); } } // Whend output = Base64._utf8_decode(output); return output; } // End Function decode // private method for UTF-8 encoding ,_utf8_encode: function (string) { var utftext = ""; string = string.replace(/\r\n/g, "\n"); for (var n = 0; n < string.length; n++) { var c = string.charCodeAt(n); if (c < 128) { utftext += String.fromCharCode(c); } else if ((c > 127) && (c < 2048)) { utftext += String.fromCharCode((c >> 6) | 192); utftext += String.fromCharCode((c & 63) | 128); } else { utftext += String.fromCharCode((c >> 12) | 224); utftext += String.fromCharCode(((c >> 6) & 63) | 128); utftext += String.fromCharCode((c & 63) | 128); } } // Next n return utftext; } // End Function _utf8_encode // private method for UTF-8 decoding ,_utf8_decode: function (utftext) { var string = ""; var i = 0; var c, c1, c2, c3; c = c1 = c2 = 0; while (i < utftext.length) { c = utftext.charCodeAt(i); if (c < 128) { string += String.fromCharCode(c); i++; } else if ((c > 191) && (c < 224)) { c2 = utftext.charCodeAt(i + 1); string += String.fromCharCode(((c & 31) << 6) | (c2 & 63)); i += 2; } else { c2 = utftext.charCodeAt(i + 1); c3 = utftext.charCodeAt(i + 2); string += String.fromCharCode(((c & 15) << 12) | ((c2 & 63) << 6) | (c3 & 63)); i += 3; } } // Whend return string; } // End Function _utf8_decode }
https://www.fileformat.info/info/unicode/utf8.htm
对于等于或小于 127(十六进制 0x7F)的任何字符,UTF-8 表示为一个字节。它只是完整 unicode 值的最低 7 位。这也与 ASCII 值相同。 对于等于或小于 2047(十六进制 0x07FF)的字符,UTF-8 表示分布在两个字节上。第一个字节将设置两个高位,第三位清零(即 0xC2 到 0xDF)。第二个字节将设置最高位并清除第二个位(即 0x80 到 0xBF)。 对于等于或大于 2048 但小于 65535 (0xFFFF) 的所有字符,UTF-8 表示将分布在三个字节中。
对于等于或小于 127(十六进制 0x7F)的任何字符,UTF-8 表示为一个字节。它只是完整 unicode 值的最低 7 位。这也与 ASCII 值相同。
对于等于或小于 2047(十六进制 0x07FF)的字符,UTF-8 表示分布在两个字节上。第一个字节将设置两个高位,第三位清零(即 0xC2 到 0xDF)。第二个字节将设置最高位并清除第二个位(即 0x80 到 0xBF)。
对于等于或大于 2048 但小于 65535 (0xFFFF) 的所有字符,UTF-8 表示将分布在三个字节中。