我正在寻找一个.NET正则表达式来提取网页中的所有URL,但是还没有找到一个足以涵盖指定链接的所有不同方式的URL。
还有一个问题:
是否有 一个正则表达式可以统治所有人 ?还是我最好使用一系列不那么复杂的正则表达式,而只对原始HTML使用多重传递?(速度与可维护性)
((mailto\:|(news|(ht|f)tp(s?))\://){1}\S+)
我从regexlib.com获得
[编者注:{1}在此正则表达式中没有实际功能