前段时间有个需求是要求查一段时间的dns上的域名访问次数排行,没办法,只好慢慢的去解析dns日志呗,正好学习了python,拿来练练手。首先看下原始数据文件,即dns日志内容,下面是抽取的几条有代表性的日志,2×8.2×1.2x.1×5 这种中间的x是相应的数字被我抹去了。c)排序,必须对结果进行排序,然后输出topXX的结果,由于是采用字典保存的,而字典是乱想的,所以必须有合适的办法去排序,字典的iteritems正好适用。稍后调用字典的iteritems 方法生产迭代器进行排序,最后输入top100的域名。例如采用正规去过滤时间段,在数据量很大的情况下会对性能有影响。
暂无评论