AnomalyDetection是一个R语言程序包,Twitter通常会在重大新闻和体育赛事期间用AnomalyDetection扫描入站流量,发现那些使用僵尸账号发送大量垃圾(营销)信息的机器人。
AnomalyDetection异常扫描
据Twitter透露,AnomalyDetection与Twitter去年10月开源的BreakoutDetection存在互补关系。
流量异常侦测对于号称“地球脉搏”的Twitter来说非常具有挑战性,因为对流量进行长周期跨度(例如一年)的扫描分析时,一些异常活动往往会掩 盖掉。此外,流量异常的原因也各有不同,有的是健康的,例如重大新闻事件导致的流量异常,而有的是不好的,例如QPS(每秒查询量)中point-in- time实时性下降可能意味着硬件或数据采集方面出了问题。
长周期流量异常侦测
viaCTOCIO