我url从用户那里得到,我必须用获取的 HTML 回复。
url
如何检查 URL 是否格式错误?
例如 :
url = 'google' # Malformed url = 'google.com' # Malformed url = 'http://google.com' # Valid url = 'http://google' # Malformed
验证正则表达式(来源):
import re regex = re.compile( r'^(?:http|ftp)s?://' # http:// or https:// r'(?:(?:[A-Z0-9](?:[A-Z0-9-]{0,61}[A-Z0-9])?\.)+(?:[A-Z]{2,6}\.?|[A-Z0-9-]{2,}\.?)|' #domain... r'localhost|' #localhost... r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})' # ...or ip r'(?::\d+)?' # optional port r'(?:/?|[/?]\S+)$', re.IGNORECASE) print(re.match(regex, "http://www.example.com") is not None) # True print(re.match(regex, "example.com") is not None) # False