跳过主要内容

苹果M1的“小型”冰风暴核对“大型”火风暴核进行基准测试

苹果m1
(图片来源:在上面)

当苹果发布其M1处理器时,该芯片成为首款采用这种混合设计的芯片CPU核心将更大、高性能的核与更小、更低功耗的核配对。当然,我们已经知道这些大核的性能很好,但我们还没有看到小核通过一个面对面的基准测试的挑战。折衷照明公司博客不过,现在我们对这个问题有了一些了解,因此我们可以看到这些较小的内核与它们的高功率同胞相比,在一般任务中表现如何。

苹果M1芯片由4个高性能“火风暴”核和4个低功耗“冰风暴”核组成。两个ip都可以协同工作,尽管每个ip都是为了高效运行某些类型的代码而设计的。

较小的内核通常用于基本的操作系统处理任务和处理后台代码执行,而大的内核则可以自由地执行其他任务——尤其是高性能的工作。然而,当出现一些重大任务时,比如大量浮点计算,它会被导向更大的Firestorm内核。

这些测试将小冰风暴核置于浮点点积测试套件之下。为了确保只有IceStorm核心执行工作负载,测试人员设置服务质量(QoS)设置为9,这只会触发较小的内核,而不会触发较大的Firestorm内核,如下图所示。

苹果M1冰风暴内核加载

(图片来源:The Eclectic Light Company)

该设备测试了四个场景的性能:“在4宽单精度浮点数数组上使用混合SIMD指令的紧密循环汇编语言;Apple SIMD(加速库的一个相对库)使用Swift在两个simd_float4数组上调用simd_dot();使用嵌套循环的简单Swift;使用map和reduce的一个更‘惯用’的Swift嵌套循环。”

如果我们把它比作参考大风暴核心,这是用作得分100%,基线Icestorm芯采取以下时间来完成这些任务的百分比:190%,汇编语言,330% SIMD(加速)库函数,简单快速,为280%和550%的“地道”迅速处理。请注意,基线是100%,200%结果意味着特定任务完成所需时间的两倍。惯有的Swift代码基准代表了icestorcore的最坏情况,完成所需时间是Firestorm的5.5倍。

尽管如此,这并不意外,因为冰风暴核心主要是为了高效率而建造的。这意味着低功率和热量输出,同时仍然提供良好的性能是今天的词。由于FireStorm核心的基本性能非常好,在考虑到效率的提高后,慢几倍并不意味着什么。

还没有评论 来自论坛的评论