第八章 一、单选题
1. 当服务器突然宕机,下列Channels选项中,哪一个可以保证数据不会丢失。
A、Memory Channel B、File Channel C、JDBC Channel D、Kafka Channel
参考答案:
B
2.、以下关于flume的说法正确的是
A Event是Flume数据传输的基本单元 B Sink是Flume数据传输的基本单元 C Channel是Flume数据传输的基本单元 D Source是Flume数据传输的基本单元
参考答案: A
二、多选题
1、下列选项中,说法错误的是()。
? ? ? ?
A、在一个Agent中,同一个source可以有多个channel B、在一个Agent中,同一个sink可以有多个channel C、在一个Agent中,同一个source只能多1个channel D、在一个Agent中,同一个sink只能有1个channel
参考答案: A,D
2、下列说法中,关于配置参数说法错误的是()。
? ? ? ?
A、a1.sources.r1.channels = c1 B、a1.sinks.k1.channel = c1 C、a1.source.r1.channels = c1 D、a1.sinks.k1.channels = c1
参考答案: C,D
三、判断题
1、在一个POST请求发送的所有的events数据,可以在多个事务中插入channel。
? ?
对 错
参考答案: 错
答案解析:
在一个POST请求发送的所有的events都被认为是一个批次,会在一个事务中插入channel。
2、Flume负载均衡接收器处理器能够在多个Sink上进行均衡流量的功能。
? ?
对 错
参考答案: 对
3、查询和替换拦截器基于Java正则表达式提供了简单的用于字符串的搜索和替换功能,同时还具有进行回溯/群组捕捉功能。
? ?
对 错
参考答案: 对
4、采集方案中的sources、channels、sinks是在具体编写时根据业务需求进行配置的,可以随意设置。
? ?
对 错
参考答案: 错
5、Spooling Directory Source对指定磁盘上的文件目录进行监控并提取数据,但是不能查看新增文件数据。
? ?
对 错
参考答案: 错
答案解析:
Spooling Directory Source对指定磁盘上的文件目录进行监控并提取数据,可以查看新增文件数据。
6、Flume Agent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。
? ?
对 错
参考答案: 对
答案解析:
Flume Agent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。
7、Channel组件对采集到的数据进行缓存,可以存放在Memory或File中。
? ?
对 错
参考答案: 对
答案解析:
Channel组件对采集到的数据进行缓存,可以存放在Memory或File中。
8、在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。
? ?
对 错
参考答案: 对
答案解析:
在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。
9、Source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括avro、thrift、exec等。
? ?
对 错
参考答案: 对
10、Timestamp Interceptor能够过滤掉数据中的时间戳。
? ?
对 错
参考答案: 错
答案解析:
Timestamp Interceptor(时间戳拦截器)会将流程执行的时间插入到event的header头部。此拦截器插入带有timestamp键(或由header属性指定键名)的标头,其值为对应时间戳。如果配置中已存在时间戳时,此拦截器可以保留现有的时间戳。
11、Static Interceptor(静态拦截器)允许用户将具有静态值的静态头附加到所有event。
? ?
对 错
参考答案: 对
12、Taildir Source用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。
?
对
? 错
参考答案: 对
答案解析:
Taildir Source用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。
13、Logger Sink通常用于调试,Logger Sink接收器的不同处是它不需要在记录原始数据部分中说明额外的配置。
? ?
对 错
参考答案: 对
答案解析:
Logger Sink通常用于调试,Logger Sink接收器的不同处是它不需要在记录原始数据部分中说明额外的配置。
14、关于静态拦截器,用户可以定义多个静态拦截器来为每一个拦截器都追加一个header。
? ?
对 错
参考答案: 对
答案解析:
关于静态拦截器,用户可以定义多个静态拦截器来为每一个拦截器都追加一个header。
15、Flume-og与Flume-ng两个版本基本相同,开发者可以使用任意一款工具。
? ?
对 错
参考答案: 错
16、禁用backoff功能的情况下,在round_robin机制下,所有失败的sink将被传递到sink队列中的下一个sink后,因此不再均衡。
《大数据技术原理与操作应用》第8章习题答案



