我正在使用Java Spark API,对于KafkaUtils.createDirectStream,我想跟踪偏移量。 有一个名为fromOffset的参数,它记录了Kafka主题分区中的偏移量。对于第一次运行,我不知道将有多少个分区,那么如何设置此参数? 并且我是否需要在Kafka参数中设置“auto.offset.reset”? 如果是,它会影响我的代码从已知的偏移中恢复吗?Spark Streaming Kafka初始偏移量
0
A
回答
0
你有两种选择:
的情况下,你没有关于partions的任何信息,不提供参数去createDirectStream。 createDirectStream方法有几个实践。在这种情况下,或者每个topicPartition将使用最早或最近的偏移量(基于
auto.offset.reset
param)您可以使用通常的kafka API找到分区,偏移量。例如外观How to find the offset range for a topic-partition in Kafka 0.10?
+0
谢谢!反正Kafka 0.8有吗?因为0.10是实验性的API – peng
相关问题
- 1. Spark Streaming Kafka backpressure
- 2. Spark-Streaming Kafka Direct Streaming API&Parallelism
- 3. Spark + Kafka streaming NoClassDefFoundError kafka/serializer/StringDecoder
- 4. Kafka Streaming + Spark Streaming +机器学习
- 5. java.lang.NoClassDefFoundError:org/apache/spark/streaming/kafka/KafkaUtils
- 6. 在Spark Streaming中的Kafka createDirectStream
- 7. spark-streaming-kafka-0-10:如何限制Spark分区的数量
- 8. zkClient不能被Serializabled,sparkstreaming写kafka偏移量到zookeeper
- 9. 未初始化的数组偏移量
- 10. Pyspark Kafka Streaming
- 11. 使用Apache Spark批处理Apache Kafka的偏移管理
- 12. kafka和Spark:通过API获取主题的第一个偏移量
- 13. Horizontalscrollview初始偏移值
- 14. WhirlyGlobe初始旋转偏移
- 15. 从Spark Streaming将数据推送到Kafka
- 16. 是否支持spark-streaming-kafka-0-10 lib?
- 17. 由于InvalidClassException,Spark Kafka Streaming作业失败
- 18. apache spark streaming - kafka - 阅读旧信息
- 19. Spark Streaming - Kafka- createStream - RDD到数据帧
- 20. 在Spark Streaming中重用kafka制作者
- 21. spark-streaming-kafka-0-10 auto.offset.reset始终设置为none
- 22. Kafka喜欢Kinesis Stream上的偏移量?
- 23. Spark Streaming + Kafka:如何从kafka消息检查主题名称
- 24. 注意:初始化的字符串偏移:未初始化字符串偏移量:1
- 25. Streaming Kmeans Spark JAVA
- 26. 如何在Spark Kafka直接流式传输中手动提交偏移量?
- 27. 来自Kafka主题的Spark Streaming抛出偏移超出范围,无法重新启动流
- 28. Spark Streaming Multiple Streaming Jobs
- 29. Spark Streaming JavaCustomReceiver
- 30. Spark Streaming,kafka:java.lang.StackOverflowError
如果您不知道分区数量,您如何知道每个分区的起始偏移量? – Mariusz
如果我将“auto.offset.reset”设置为最小或最大,我仍然可以从每个红色获得分区和偏移信息 – peng