在Golang中,我正在寻找一种有效的方法来确定文件的行数。
当然,我总是可以遍历整个文件,但效率似乎并不高。
file, _ := os.Open("/path/to/filename") fileScanner := bufio.NewScanner(file) lineCount := 0 for fileScanner.Scan() { lineCount++ } fmt.Println("number of lines:", lineCount)
有没有一种更好的方法(更快,更便宜)来找出文件有多少行?
这是bytes.Count用于查找换行符的更快的行计数器。
bytes.Count
它之所以更快,是因为它消除了返回整行所需的所有额外逻辑和缓冲,并利用了字节包提供的某些程序集优化功能来搜索字节片中的字符。
较大的缓冲区在这里也有帮助,尤其是对于较大的文件。在我的系统上,使用我用于测试的文件,32k缓冲区是最快的。
func lineCounter(r io.Reader) (int, error) { buf := make([]byte, 32*1024) count := 0 lineSep := []byte{'\n'} for { c, err := r.Read(buf) count += bytes.Count(buf[:c], lineSep) switch { case err == io.EOF: return count, nil case err != nil: return count, err } } }
和基准输出:
BenchmarkBuffioScan 500 6408963 ns/op 4208 B/op 2 allocs/op BenchmarkBytesCount 500 4323397 ns/op 8200 B/op 1 allocs/op BenchmarkBytes32k 500 3650818 ns/op 65545 B/op 1 allocs/op