HAProxyLogAvroEventSerializer 用于解析 HAProxy HTTP 日志。该 Flume 序列化器通过正则表达式进行日志解析,因此,如果日志格式有所不同,可以很容易地进行适配。日志中的各个部分会被拆分成不同的 Avro 字段,方便后续的查询和分析。构建项目时,可以使用以下命令进行编译:$ mvn clean package。然后,将生成的文件放入 Flume 库目录或添加到 Flume 类路径中。

示例配置:

  • agent.sinks.hdfssink.type=hdfs

  • agent.sinks.hdfssink.channel=memChannel

  • agent.sinks.hdfssink.hdfs.path=/user/cloudera/ymd=%Y%m%d/hour=%H

  • agent.sinks.hdfssink.hdfs.fileType=DataStream

  • agent.sinks.hdfssink.serializer=nl.te