我需要确定80%的文件是二进制文件还是文本文件,在C#中有什么方法可以使它变得又快又脏又丑吗?
我可能会寻找大量的控制字符,这些字符通常出现在二进制文件中,而很少出现在文本文件中。二进制文件倾向于使用0,以至于仅测试多个0字节就足以捕获大多数文件。如果您关心本地化,则还需要测试多字节模式。
如前所述,您总是很不走运,并且得到的二进制文件看起来像文本,反之亦然。