usaddress 是一个 Python 库用来解析非结构化的地址字符串到地址组件,使用高级的 NLP 方法。
安装:pip install usaddress
示例方法:
>>> import usaddress >>> usaddress.parse('123 Main St. Suite 100 Chicago, IL') [('123', 'AddressNumber'), ('Main', 'StreetName'), ('St.', 'StreetNamePostType'), ('Suite', 'OccupancyType'), ('100', 'OccupancyIdentifier'), ('Chicago,', 'PlaceName'), ('IL', 'StateName')]