如何进行JobScheduler内幕实现

76次阅读
没有评论

共计 1107 个字符,预计需要花费 3 分钟才能阅读完成。

本篇文章给大家分享的是有关如何进行 JobScheduler 内幕实现,丸趣 TV 小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着丸趣 TV 小编一起来看看吧。

在 spark stream 程序中的一条关键的语句就是:ssc.start()

1,跟踪进入 StreamingContext 的 start 方法,有一句非常关键的语句 scheduler.start(),是个 JobScheduler(spark stream 用来 job 调度的)

进行 job 调度的入口!

2,计入 JobScheduler 的 start 方法。

在这个方法中几个关键的点是:

eventLoop.start() 一个事件循环器,用于响应其它组件发来的事件 ( 包括 job 的启动,完成,以及错误报告)。

receiverTracker.start() 控制了整个 receiver 的生成,与数据的接受

jobGenerator.start() 真正开始进行 job 的生成
 

在这个方法中也维护了一个事件处理的循环器 eventLoop,用于处理各种事件

其中最为关键的事件是 GenerateJobs(time),这个事件是进行生成 job 的事件!!

跟踪计入 generateJobs(time)

jobScheduler.receiverTracker.allocateBlocksToBatch(time) 为当前的 bath 分发收到的数据 Blocks。

graph.generateJobs(time):根据当前编写的程序的 output 动作生成相应的 job 并封装进入集合中。

最终通过

提交作业到 executor

在回去看看 jobGenerator.start() 中的 startFirstTime()

private def startFirstTime() { val startTime = new Time(timer.getStartTime())
 graph.start(startTime - graph.batchDuration)
 timer.start(startTime.milliseconds)
 logInfo(Started JobGenerator at   + startTime)
}

第一次启动会启动一个定时器,该定时器会根基 duration bath 不断的的给 jobGenerator 中的消息循环体!


在 jobGenerator 中的消息循环体就会不断的去除消息进行处理

以上就是如何进行 JobScheduler 内幕实现,丸趣 TV 小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注丸趣 TV 行业资讯频道。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-25发表,共计1107字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)