Linux 2.6.31调度程序和多线程作业

我在具有24个内核的共享
Linux计算机上运行大规模并行的科学计算工作.大多数时候,当这台计算机上没有其他任何东西运行时,我的工作能够扩展到24个核心.然而,似乎即使一个不是我的单线程作业正在运行,我的24线程作业(我设置为高优值)只能获得~1800%的CPU(使用Linux表示法).同时,大约500%的CPU周期(再次使用Linux表示法)处于空闲状态.任何人都可以解释这种行为以及我能做些什么来获得所有其他人没有使用的核心?

笔记:

>如果它是相关的,我已经在稍微不同的内核版本上观察到了这一点,尽管我不记得哪个是我的头脑.
> CPU架构是x64.我的24核作业是32位,而我正在竞争的其他作业是64位的这一事实是否有可能是相关的?

编辑:我刚注意到的一件事是,最多30个线程似乎在某种程度上缓解了这个问题.它让我高达2100%的CPU.

解决方法

这可能是由于调度程序试图将每个任务保持在先前运行的同一CPU上运行(这样做是因为该任务可能将其工作集带入该CPU的缓存中 – 它是“缓存热” “).

以下是您可以尝试的一些想法:

>运行两倍于核心的线程;>运行比核心少一两个线程;>减少/ proc / sys / kernel / sched_migration_cost的值(可能降至零);>将/proc/sys/kernel/sched_domain/…/imbalance_pct的值降低到接近100.

dawei

【声明】:丽水站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

相关文章