我有一个带有date列的pandas数据框,并且试图添加一个新的布尔值列,以指示给定的日期是否是假日。
以下是代码,但由于类型似乎不同而无法正常工作(所有值均为False),并且我无法弄清楚如何将熊猫数据框中的“日期”设为相同类型作为假期:
cal = USFederalHolidayCalendar() holidays = cal.holidays(start=train_df['date'].min(), end=train_df['date'].max()).to_pydatetime() train_df['holiday'] = train_df['date'].isin(holidays) print type(train_df['date'][1]) print type(holidays[0])
您无需进行任何转换。只是直接比较。pandas非常聪明,可以比较许多不同类型的日期和时间。如果您在日期/时间兼容性方面遇到问题,则必须使用稍微深奥的格式。
pandas
import pandas as pd from pandas.tseries.holiday import USFederalHolidayCalendar as calendar dr = pd.date_range(start='2015-07-01', end='2015-07-31') df = pd.DataFrame() df['Date'] = dr cal = calendar() holidays = cal.holidays(start=dr.min(), end=dr.max()) df['Holiday'] = df['Date'].isin(holidays) print df
结果:
Date Holiday 0 2015-07-01 False 1 2015-07-02 False 2 2015-07-03 True 3 2015-07-04 False 4 2015-07-05 False 5 2015-07-06 False 6 2015-07-07 False 7 2015-07-08 False 8 2015-07-09 False 9 2015-07-10 False 10 2015-07-11 False 11 2015-07-12 False 12 2015-07-13 False 13 2015-07-14 False 14 2015-07-15 False 15 2015-07-16 False 16 2015-07-17 False 17 2015-07-18 False 18 2015-07-19 False 19 2015-07-20 False 20 2015-07-21 False 21 2015-07-22 False 22 2015-07-23 False 23 2015-07-24 False 24 2015-07-25 False 25 2015-07-26 False 26 2015-07-27 False 27 2015-07-28 False 28 2015-07-29 False 29 2015-07-30 False 30 2015-07-31 False
请注意,2015年7月4日是星期六。