有什么方法可以预处理文本文件并跳过这些字符?
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa1 in position 1395: invalid start byte
尝试这个:
str.decode('utf-8',errors='ignore')