跳过主要内容

英特尔电弧炼金术士:发布日期,规格,我们知道的一切

英特尔Xe图形模拟
(图片来源:英特尔)

Intel已经宣传Xe Graphics两年了,但是Intel Arc Alchemist GPU最终将为Team Blue在离散GPU领域带来一些必要的性能和竞争。这是自1998年i740以来第一个“真正的”专用英特尔GPU——或者从技术上说,是继i740之后的一个合适的离散GPU英特尔Xe DG1为今年早些时候铺平了道路之间的竞争最好的显卡英特尔目前的集成图形解决方案基本上连我们的GPU的层次结构(基于1080p的中等性能,UHD显卡630占RTX 3090的1.8%)。

作为低性能集成图形处理器(“世界上最流行的图形处理器”)的供应商,英特尔可能希望参与竞争吗?是的,事实上,它可以。许多问题仍然存在,但在英特尔披露了更多的Arc Alchemist GPU架构的细节英特尔架构日2021我们谨慎地希望,最终的结果会比之前的尝试更好。英特尔也在为新产品的发布准备驱动团队,解决现有图形解决方案的兼容性和性能问题。坦白说,从现在开始,除了向上,别无他法。

英特尔在破解专用GPU市场方面所面临的困难不容小觑。AMD的2 .纳米比亚建筑与Nvidia的安培架构自2020年底以来。而第一个Xe gpu将在2020年以虎湖移动处理器而Xe DG1则是在2021年年中推出的,这两款处理器都无法与前几代的gpu竞争。总体而言,Xe DG1的性能与Nvidia的GT 1030 GDDR5这是2017年5月推出的一款弱酱GPU。它也比一半2016年的GTX 1050 2GB的性能,尽管有两倍的内存。

所以,是的,如果英特尔想在专用GPU领域获得重视,它有一座陡峭的山要攀登。这里是Arc Alchemist架构的分解,这让我们看到英特尔如何希望达到顶峰。事实上,我们只是希望因特尔能到达大本营,把真正的顶峰留给未来的战斗法师、天体和德鲁伊建筑。但我们将把这些留到以后讨论。

(图片来源:英特尔)
英特尔电弧炼金术士一瞥

规格:多达512矢量单位/ 4096 Shader Cores
记忆:可能高达16GB GDDR6
过程:TSMC N6(精炼N7)
性能:RTX 3070 / RX 6800级别,可能
上映日期(待定):2022年一季度
价格:英特尔需要有竞争力

英特尔的Xe图形抱负在2018年初登上了舞台的中心雇佣拉贾·科多里来自AMD,其次是芯片架构师吉姆·凯勒图形营销者克里斯·胡克,等等。拉贾是幕后的推动力量AMD的Radeon技术集团于2015年11月创建,与维加和纳维架构。显然,人们希望他能帮助领导英特尔的GPU部门进入新领域。显然,Arc炼金术士代表了多年劳动的成果。

这并不是说英特尔之前没有尝试过。除了1998年的i740, Larrabee和Xeon Phi在2009年也有类似的目标,尽管GPU方面从未真正实现。此外,在过去的几十年里,英特尔一直在稳步改进其集成图形解决方案的性能和功能(尽管速度缓慢而稳定)。所以,第三次就好了,对吧?

当然,建立一个而不是仅仅说你想做一个,英特尔还有很多需要证明的。以下是我们对即将发布的Intel Arc Alchemist的所有了解,包括规格、性能预期、发布日期等。

潜在的英特尔电弧炼金术士规格和价格

这个Intel的Xe显卡的概念渲染是一个合理的猜测,但肯定不是最终产品。 (图片来源:英特尔)

我们将在下面详细介绍Arc Alchemist架构,但让我们从高层概述开始。我们知道英特尔至少为Arc Alchemist计划了两种不同的GPU芯片,我们预计将会有第三种GPU在中间空间使用更大的芯片。可能有更多的构型,但这是我们期望看到的最小值。以下是我们期望在规范方面看到的内容。

英特尔Arc炼金术士预期规格
弧高端 弧中档 弧条目
GPU 弧00071 Arc 00071? 弧00329
过程(nm) 台积电N6 台积电N6 台积电N6
晶体管(十亿) ~ 20 ~ 20(部分) ~8
模大小(毫米^ 2) ~ 396平方毫米(x16.5 24日) ~ 396平方毫米(x16.5 24日) ~153mm2(12.4x12.4)
矢量发动机 512 384 128
GPU核心(alu家族) 4096 3072 1024
时钟(GHz) 2.0 - -2.3 2.0 - -2.3 2.0 - -2.3
VRAM速度(Gbps) 16? 14 - 16 14 - 16
VRAM (GB) 16 GDDR6 12 6 GDDR6
总线宽度 256 192 96
罗普 128年? 96? 32?
TMU 256年? 192年? 64年?
TFLOPS 16.4 - -18.4吗? 12.3 - -14.1吗? 4.1 - -4.7吗?
带宽(GB/s) 512年? 336 - 384吗? 168 - 192吗?
真沸点(瓦特) 300? 225年? 75年?
上市日期 2022年一季度 2022年一季度 2022年一季度
推出价格 599美元? 399美元? 199美元?

随着本文的深入,我们将讨论上述一些信息的来源,但我们对Arc Alchemist大型和小型芯片的许多核心规格相当有信心。根据晶圆和die shots,以及其他信息,我们预计英特尔将进入专用GPU市场(不包括DG1),其产品将跨越整个预算到高端范围。

目前,我们预计有三款由两种芯片组成的产品,但这种情况可能会改变。例如,英特尔(Intel)的CPU内核只有几个变种,但最终却销售了几十种不同的产品。但英特尔已经统治CPU世界几十年了,而它在GPU方面的努力却远远落后于竞争对手。因此,在我们看来,排除杂项,专注于三种核心产品会更有意义。

具体的产品名称还没有公布,不过将使用英特尔Arc品牌。我们可以看到Arc 1800, Arc 1600和Arc 1200大致对应于i7, i5和i3的CPU品牌,或者我们可以看到完全不同的东西。不过,现在在杂草中迷失是没有意义的,因为英特尔最终将决定并公布实际名称。

价格和一些更精细的细节是根据预期业绩和市场状况做出的估计。当然,真实世界的性能将在很大程度上决定英特尔可以为各种不同的显卡模型收取多少费用,但如果——这是一个相当大的如果!-这款高端卡可以和AMD的RX 6800和Nvidia的RTX 3070 Ti竞争,我们预计英特尔会相应地定价。

还有另一种观点。英特尔可能会压低价格,希望在专用显卡市场引起轰动。考虑到目前AMD和Nvidia gpu的短缺,以及我们在网上商店看到的极端价格,它通常不会比我们在我们的网站上追踪的eBay黄牛的价格好多少GPU价格指数如果英特尔的gpu价格是竞争对手的一半,许多玩家可能会更有兴趣给他们一个机会,即使他们的速度更慢。这可能有点太一厢情愿了,因为英特尔想要盈利,而对图形处理器的极端需求意味着英特尔可能不需要以低于其竞争对手那么多的价格。

这处理了高层次的概述。现在,让我们深入研究细节,并讨论这些估计来自哪里。

Arc Alchemist:超越集成图形障碍

(图片来源:英特尔)

在过去的十年里,我们已经看到了几个例子,英特尔的集成图形处理器在理论上的性能基本上翻了一番。尽管有了这些改进,英特尔坦率地承认集成显卡解决方案受到许多因素的限制:内存带宽和容量、芯片大小和总功率需求都有影响。

而cpu的功耗高达250W -英特尔的19 - 10900 k的核心19 - 11900 k的核心两者都属于这一类——最高功率在145W左右的竞争cpu更为常见(比如AMD的锐龙5000系列)。此外,集成图形必须与CPU共享所有这些资源,这意味着它通常被限制在总功耗预算的一半左右。相比之下,专用图形解决方案的约束要少得多。

考虑第一代x - lp图形发现老虎湖(TGL)。大多数芯片都有15W的TDP,即使是后期的8核TGL-H芯片也只使用45W (65W可配置TDP)。除此之外,TGL- h还将GPU预算削减到32个EUs(执行单位),而低功耗的TGL芯片有96个EUs。

相比之下,顶级的AMD和Nvidia专用显卡等Radeon RX 6900 XTGeForce RTX 3080 Ti有一个300W到350W的功率预算为参考设计,与定制的卡拉多达400W。

我们不知道英特尔计划将Arc Alchemist(又名Xe HPG)的功耗提高到多少,但我们预计它将与AMD和英伟达的gpu达到相同的水平——大约300W。如果有20倍的可用功率,英特尔的GPU能做什么呢?我们将在英特尔的Arc Alchemist GPU发布时揭晓答案。

英特尔Arc炼金术士架构

(图片来源:英特尔)

英特尔可能是专用图形卡市场的新来者,但它对GPU的制造并不陌生。当前的火箭湖和老虎湖CPU使用Xe图形体系结构,这是第12代图形更新。第一代Intel graphics出现在1998-2000年间用于socket 370的i740和810/815芯片组中。从某种意义上说,Arc Alchesman是第二代Xe图形(即整个第13代),每一代GPU都在以前的体系结构上构建,添加各种改进和增强。Arc Alchesman体系结构的变化显然足够大,以至于Intel放弃了以前体系结构的执行单元命名,主要构建块现在被称为Xe核心。

首先,电弧炼金师将全力支持举12最终特性集。这意味着增加了几个关键技术。标题是射线跟踪支持,尽管在实践中可能不是最重要的。可变速率着色Nvidia RTX 20系列图灵架构从2018年开始也支持这些功能,如果你想知道的话。取样器的反馈有助于优化的方式着色工作的数据,可以提高性能,而不降低图像质量。

Xe-core包含16个矢量引擎(以前称为执行单元),每一个都操作一个256位SIMD块(单个指令多数据)。Vector Engine可以同时处理8条FP32指令,在AMD和Nvidia架构中,每条指令都被称为“GPU核心”,尽管这是一个错误的称呼。目前还不清楚矢量引擎(可能是FP16和DP4a)还支持哪些其他数据类型,但它已经加入了另一个新的管道,XMX引擎(Xe Matrix eXtensions)。

每个XMX管道在1024位的数据块上运行,该数据块可以包含64个单独的FP16数据段。矩阵引擎实际上相当于英特尔公司的Nvidia Tensor内核,它们也在投入类似的使用。它们提供了大量潜在的FP16计算性能,在人工智能和机器学习工作负载中应该证明非常有能力。下面将对此进行详细介绍。

(图片来源:英特尔)

xcore只是英特尔Arc gpu的一个构建模块。和之前的设计一样,xcore的下一个升级叫做渲染切片(类似于Nvidia的GPC),它包含4个xcore块。总的来说,一个渲染切片包含64个矢量和矩阵引擎,外加额外的硬件。额外的硬件包括四个射线追踪单元(每个x -core一个)、几何和栅格化管道、采样器(tmu,又名纹理映射单元)和像素后端(ROPs)。

上面的框图可能完全准确,也可能不完全准确。例如,查看图表,它会显示每个渲染片包含32个tmu和16个rop。这是有道理的,但英特尔还没有确认这些数字(尽管这是我们在上面的规格表中使用的)。

射线追踪单元可能是最有趣的添加,但除了它们的存在和功能——它们可以进行射线遍历、边界框相交和三角形相交——我们还没有任何关于RT单元与AMD的射线加速器或Nvidia的RT核心相比的细节。它们的整体性能是更快、更慢还是相似?我们得等手头有硬件才能确定。

英特尔确实提供了一个使用光线追踪的虚幻引擎演示版《炼金术士》,但它是针对一个未知的游戏,运行在未知的设置……而且老实说,跑得很糟糕。希望这是因为这是早期的硬件和驱动,但跳过4分57秒弧炼金术士的视频从英特尔那里看到它的实际应用。根据上面显示的情况,我们怀疑英特尔的光线追踪装置将类似于AMD的光线加速器,这意味着即使是顶尖的Arc Alchest GPU也只能与AMD的大致相当Radeon RX 6600 XT这不是一个好的开始,但RT的性能和采用仍然不是大多数玩家的主要因素。

(图片来源:英特尔)

最后,英特尔使用多个渲染切片来创建整个GPU, L2缓存和内存结构将所有东西捆绑在一起。视频处理块和输出硬件也没有显示出来,它们会占用GPU的额外空间。最初的Arc Alchemist启动的最大Xe HPG配置将有多达8个渲染切片。忽略从欧盟到矢量引擎的命名变化,这仍然给了相同的512个欧盟/矢量引擎的最大配置,这是谣传了一年多。

英特尔并没有为每个渲染片或整个GPU提供特定数量的L2缓存。不过我们知道会有多种Arc构型。到目前为止,英特尔已经展示了一个带有两个渲染切片的芯片,以及上面框图中使用的带有八个渲染切片的更大的芯片。英特尔还透露了它的Xe HPC gpu(又名旧桥)将有512KB的每Xe核的L1缓存,和高达144MB的L2“Rambo缓存”每个堆栈,但这是一个完全不同的部分,Xe HPG gpu可能会有更少的L1和L2缓存。尽管如此,考虑到AMD从它的无限缓存中所看到的好处,我们不会惊讶于在最大的Arc gpu上看到32MB或更多的缓存。

虽然听起来英特尔并没有特别提高向量引擎的吞吐量,与eu11 /Gen12解决方案相比,但这并不意味着性能没有提高。DX12 Ultimate包括一些新功能,也可以帮助性能,但最大的变化是通过提高时钟速度。英特尔没有提供任何具体数字,但它表示,Arc Alchemist可以运行1.5倍的频率相比Xe LP,并表示,Alchemist (Xe HPG)提供了1.5倍的性能每瓦。综上所述,我们正在研究Arc gpu 2.0-2.3GHz的潜在时钟速度,这将产生大量的原始计算。

Arc Alchemist的最大配置将有多达8个渲染片,每个渲染片有4个x核,每个x核有16个矢量引擎,每个矢量引擎在每个时钟上可以做8个FP32操作。FMA运算(融合乘加运算,图形工作负载中常用的矩阵运算)是FMA运算的两倍,然后乘以潜在的2.0-2.3GHz时钟速度,我们得到GFLOPS的理论性能:

8 (RS) * 4 (Xe-core) *16 (VE) * 8 (FP32) * 2 (FMA) * 2.0-2.3 (GHz) = 16,384-18,841.6 GFLOPS

显然,GFLOPS(或TFLOPS)本身并不能告诉我们一切,但是对于顶级配置的16-19 TFLOPS肯定不是什么可以嘲笑的。Nvidia的安培gpu理论上有更多的计算-例如,RTX 3080最大有29.8 TFLOPS -但其中一些与INT32计算共享。相比之下,AMD的RX 6800 XT“只有”20.7 TFLOPS,但在许多游戏中,它提供了与RTX 3080相似的性能。换句话说,原始的理论计算绝对不能说明一切;电弧炼金术士可以在上面或下面出拳!-它的理论重量等级。

不过,让我们暂且姑且相信英特尔。根据最终的时钟速度,Arc Alchemist低于当前顶级AMD和Nvidia gpu的理论水平,但不是很多。至少在纸面上,看起来英特尔可能会在RTX 3070/3070 Ti和RX 6800附近着陆——假设驱动程序和其他一切都不会阻止它。

XMX:矩阵引擎和深度学习的XeSS

图1 / 3

Intel Arc Alchemist和Xe HPG架构

(图片来源:英特尔)
图2 / 3

Intel Arc Alchemist和Xe HPG架构

(图片来源:英特尔)
图3中的3

Intel Arc Alchemist和Xe HPG架构

(图片来源:英特尔)

我们在上面简要地提到了XMX块。它们可能和英伟达的张量核心一样有用,不仅仅用于深度学习超级采样,但也适用于其他人工智能应用程序,包括Nvidia Broadcast。英特尔还宣布了一种新的升级和图像增强算法,名为XeSS: Xe Superscaling。

英特尔没有深入探讨细节,但值得一提的是英特尔最近聘请了安东·卡普兰扬.他曾在英伟达(Nvidia)工作,并在DLSS的开发中发挥了重要作用,之后他前往Facebook从事VR开发。我们不需要太多的解读就可以得出结论,他现在可能正在为XeSS做很多基础工作,DLSS和XeSS之间有许多相似之处。

XeSS使用当前渲染的帧、运动矢量和前一帧的数据,并将所有这些输入训练有素的神经网络,由神经网络处理升级和增强,以生成最终图像。这听起来与DLSS 2.0基本相同,尽管这里的细节很重要,我们假设神经网络最终会得到不同的结果。

英特尔确实提供了一个使用虚幻引擎显示XeSS运行的演示(见下文),在比较时看起来很不错1080便士通过XeSS升级到4 k原生4K渲染。不过,这只是一个演示版本,在做出任何裁决之前,我们还需要看到XeSS在实际发行的游戏中发挥作用。

比它如何运作更重要的是,有多少游戏开发者选择使用XeSS。他们已经可以访问DLSS和AMD身上发生,以提高性能和图像质量为目标。对于开发者来说,增加第三个选择(游戏邦注:即来自GPU市场的新玩家)似乎有点牵强。然而,英特尔确实提供了DLSS的潜在优势。

XeSS设计为在两种模式下工作。最高性能模式利用XMX硬件进行升级和增强,但当然,这只适用于Intel的Arc GPU。这与DLS的问题相同,除了现有的安装基础为零之外,这在开发人员支持方面将是一个阻碍。但英特尔有一个解决方案:XeSS也将使用DP4a指令在性能较低的模式下工作。

DP4a受到其他GPU的广泛支持,包括Intel上一代Xe LP和多代AMD和Nvidia GPU(Nvidia Pascal和更高版本,或AMD Vega 20和更高版本),这意味着DP4a模式下的XeSS将在几乎任何现代GPU上运行。支持可能不像AMD的FSR那样通用,它运行在着色器中,基本上可以在任何DirectX 11或更高版本的GPU上运行,但质量也可能比FSR更好。也会是非常如果英特尔通过DirectML或类似的库支持Nvidia的张量核心,那就很有趣了,但我们没有讨论这个问题。

最大的问题仍然是开发者的理解。我们希望看到类似于DLSS 2.x的质量,支持范围涵盖所有竞争对手的各种图形卡。这肯定是Nvidia在DLSS中仍然缺少的东西,因为它需要RTX卡。但RTX卡已经在高端游戏PC市场占据了巨大的份额,大概占80%或更多(取决于你如何量化高端)。因此,英特尔基本上必须从零开始使用XeSS,这将是一个漫长的爬坡过程。好的一面是,它将在本月提供XeSS开发工具包,给它足够的时间让事情进展起来。因此,在第一个Arc GPU进入零售市场之前,我们甚至可能看到游戏实现XeSS。

电弧炼金术士和GDDR6

(图片来源:英特尔)

英特尔还没有对各种Arc Alchemist图形处理器将使用何种内存发表评论。有传言说它将是GDDR6,可能运行在16Gbps,但这只是猜测。与此同时,很难想象还有其他有意义的解决方案。GDDR5内存仍然用于一些预算方案,但速度最快的芯片最高可达8Gbps左右——只有GDDR6的一半。

还有HBM2e作为一种潜在的解决方案,虽然这可以大幅增加内存带宽,但也会显著增加成本。数据中心Xe HPC将使用HBM2e,但没有Xe HPG的芯片显示HBM堆栈的内存,这再次把我们带回到GDDR6。

将有多种Xe HPG / Arc Alchemist解决方案,具有不同的能力。到目前为止,我们所关注的更大的芯片似乎有8个32位GDDR6通道,给了它一个256位接口。这意味着它可能会有8GB或16GB的内存,我们可能会看到削减192位或128位的低端卡接口。英特尔展示的第二个Arc GPU似乎只有96位接口,可能用于6GB的GDDR6。

Intel Xe DG1卡采用了完全不同的路线,使用128位LPDDR4X接口和4GB VRAM,但这是一个特殊情况。它只能在精选的英特尔主板上工作,而且坦率地说,性能平平。我们不希望英特尔在《电弧炼金术士》上犯同样的错误。

电弧炼金师模具射击和分析

(图片来源:英特尔)

到目前为止,我们所说的大部分内容都不是全新的信息,但英特尔确实提供了一些图像和视频证据,为英特尔的未来提供了一些重要的迹象。所以让我们从我们确定的开始。

英特尔将与台积电合作,为Arc Alchemist和Xe HPG使用N6工艺(N7的优化变种)。这意味着它在技术上并不会与AMD的Zen 2、Zen 3、RDNA和RDNA 2 gpu使用的芯片竞争。与此同时,AMD和英伟达也可以使用N6,因为它的设计与N7兼容,所以英特尔使用台积电对AMD和英伟达的生产能力毫无帮助。

台积电可能也有很多在N6和N7之间重叠的工具,这意味着它可以在N6批次、批次和N7批次之间来回切换。这意味着这可能会削弱台积电向其他合作伙伴提供晶圆的能力。说到晶片……

(图片来源:英特尔)

在英特尔架构日,拉贾展示了一片电弧炼金术士芯片。通过抓取视频快照并放大晶圆,晶圆上的各种芯片相当清晰。根据我们的计算,我们画了线来显示芯片有多大;看起来更大的弧形模具大约为24x16.5mm(~396mm^2),每个尺寸的增减比例为5–10%。我们也计算了晶圆上的芯片,似乎有144个完整的芯片,这也与大约396mm^2的芯片尺寸有关。

这不是一个大型的GPU——例如,Nvidia的GA102是628mm^2, AMD的Navi 21是520mm^2——但它也不小。AMD的Navi 22尺寸为335mm^2,而Nvidia的GA104尺寸为393mm^2,所以Xe HPG将比AMD的芯片更大,尺寸与GA104相似,但制造工艺更小。不过,坦率地说:规模很重要。

这可能是自上世纪90年代末的i740以来,英特尔第一次读取专用GPU,但在过去的几年里,它已经做出了许多集成解决方案,并在过去几年里建立了一个更大的专用GPU团队。模具尺寸本身并不能决定性能,但它能够很好地指示设计中可以填入多少内容。一个大约400mm^2大小的芯片表明英特尔打算至少与RTX 3070和RX 6800竞争,这可能比一些人预期的要高。

(图片来源:英特尔)

除了wafer shot, Intel也为Xe HPG提供了这两个die shot。是的,这显然是两个不同的GPU芯片,在较大的芯片上编号为00071,在较小的芯片上编号为00329。它们是艺术效果图,而不是真正的死球,但它们确实有一些现实基础。

较大的模具在中心区域有8个集群,这将与8个渲染切片相关。内存接口位于底边和左右边的下半部分,共有4个64位接口,共256位。然后还有一些其他的东西,有点模糊,视频编码和解码,显示输出等等。

256位接口将英特尔的Arc gpu置于一个有趣的位置。这与Nvidia的GA104 (RTX 3060 Ti/3070/3070 Ti)和AMD的Navi 21的接口宽度相同。英特尔会跟随AMD的脚步使用16Gbps的内存,还是会选择像英伟达这样更保守的14Gbps内存?英特尔能否从AMD的无限缓存中得到启示?我们还不知道。

较小的模具看起来有两个渲染切片,给它只有128矢量引擎。它看起来也只有96位的内存接口(芯片右下边缘的块),这可能使它相对于其他卡处于劣势。然后还有其他“杂七杂八”的东西。显然,性能将大大低于更大的芯片,这将是一个入门级部分。

虽然小芯片应该比所有当前的RX 6000和RTX 30系列gpu慢,但它确实让英特尔处于一个有趣的位置。取决于时钟速度,一个渲染片应该相当于大约4.1-4.9 TFLOPS的计算。这款GPU仍然可以与GTX 1650 Super相媲美,甚至超过GTX 1650 Super,并具有GTX 16系列GPU所缺乏的额外特性,而且英特尔有望提供至少6GB内存的GPU。基本上,英伟达和AMD还没有在入门级市场发布任何新的gpu,所以这将是一个很好的补充。

Intel Arc会擅长挖掘加密货币吗?

(图片来源:英特尔)

目前AMD和Nvidia的GPU短缺,部分原因是cryptocurrency矿工,人们将不可避免地想知道英特尔的Arc gpu是否会面临类似的困难。在公开场合,英特尔完全没有提及挖掘潜力和Xe Graphics。然而,考虑到Xe HP/HPC(机器学习、高性能计算等)的数据中心根源,英特尔可能至少已经研究了挖掘提供的可能性。当然,它并没有对架构或gpu的挖掘适用性做出任何市场声明。但是,还有上面的图片(整个英特尔架构日的展示),上面有一个物理比特币和“加密货币”的文本,你开始想知道。

一般来说,Xe可能可以很好地用于挖掘,但最流行的GPU挖掘算法(主要是Ethash,还有Octopus和Kawpow)的性能几乎完全取决于GPU拥有多少内存带宽。例如,英特尔最快的Arc gpu可能使用16GB(可能是8GB)的GDDR6和256位接口。这将产生类似于AMD的RX 6800/6800 XT/6900 XT和Nvidia的RTX 3060 Ti/3070的带宽,这反过来会导致以太坊挖掘的性能大约60个MH/s。

英特尔可能不会使用GDDR6X,但它可能有一些其他的特性,可以提高挖掘性能——如果是这样,它还没有透露。Nvidia在RTX 3060 Ti和RTX 3070上的内存时钟为14Gbps,并且(在LHR模型出现之前)它可以达到61-62 MH/s。AMD拥有更快的16Gbps内存,经过调整,最终接近65mh /s。这是我们期望最快的Arc GPU的实际位置,而且只有在软件在卡上正常工作的情况下。

考虑到Arc gpu甚至要到2022年初才会出现,而且考虑到加密货币的波动性,挖掘性能不太可能成为英特尔在设计阶段的首要关注点。以太坊是目前GPU挖矿的最佳选择,大多数估计显示,以太坊占了挖矿所用GPU电量的90%以上。以太坊2.0计划在12月从工作量证明挖矿转向权益证明,这意味着不再有GPU挖矿。这意味着围绕以太坊挖矿构建GPU现在不是一个好主意。不过,这并不意味着Arc Alchemist在采矿方面会很差或很好。

最好的情况(或最坏的情况,取决于你的观点),我们预计挖掘性能将大致与AMD的Navi 21和Nvidia的GA104 gpu相当。不过,采矿软件可能需要进行重大更新和驱动程序修复,以便在未来的gpu上正常工作。我使用Xe DG1尝试了挖掘,但它没有通过所有的NiceHashMiner基准测试,但这并不说明什么,因为大多数软件甚至没有检测到“兼容”的GPU。在发布时,我预计Arc gpu也会处于类似的情况,但我们还得看看情况会如何发展。

Arc Alchemist发布日期和未来的GPU计划

(图片来源:英特尔)

电弧炼金术士的核心规范塑造好,和台积电N6和潜在的使用400毫米^ 2死与256位内存接口都指向一个卡,应该与当前竞争高端从AMD和Nvidia gpu,但背后的最佳性能模型。作为新来者,英特尔需要第一个Arc Alchemist gpu出来挥舞。然而,正如我们在看英特尔Xe DG1在美国,构建一个好的显卡比构建硬件要重要得多——这可能就是DG1存在的原因,为Arc准备好驱动程序和软件。

《炼金术士》代表了英特尔专用GPU计划的第一阶段,未来还会有更多。除了“炼金术士”的代号外,英特尔还公布了未来三代专用gpu的代号:战斗法师、天界和德鲁伊。现在我们知道了基本知识,下次你能不能和我一起做一个GPU ?这些可能不是最令人敬畏的代号,但我们欣赏按字母顺序排列的逻辑。

试探性地,随着炼金师使用TSMC N6,我们可能会看到战斗法师相对较快的转变。它可能会使用台积电的N5工艺,并在2022年底发货——考虑到我们预计明年会看到英伟达的Lovelace RTX 40系列gpu,以及AMD的RDNA 3架构,这也许是明智的。缩小进程,增加更多的内核,调整一些东西来提高吞吐量,战斗法师可以让英特尔与AMD和Nvidia持平。或者,它可能姗姗来迟,表现不佳。

英特尔需要对未来的架构进行迭代,如果它希望对AMD和英伟达施加一些压力,就必须尽早推出。现在,我们终于有了2022年第一季度的发布日期——我们希望我们能在2022年CES上看到和了解更多,并且看到Arc Alchemist在1月而不是3月发布将是非常棒的。

英特尔的蒸汽朋克湮灭概念显卡,将于2035年问世。或1865年。(2020年初,CES上) (图片来源:英特尔)

关于英特尔电弧炼金术士的最后想法

最重要的是,英特尔有自己的工作要做。它可能是中央处理器世界里重达800磅的大猩猩,但它甚至在那里也磕磕绊绊,在过去几年里摇摇晃晃。AMD的锐龙已经取得了进展,缩小了差距,现在在大多数指标上都领先于英特尔,而英特尔的制造困境显然已经足够糟糕,它需要转向台积电来实现自己专注的GPU梦想。

作为图形领域的失败者,英特尔需要拿出激进的性能和定价,然后快速迭代和改进。请不要谈论英特尔如何比AMD和英伟达销售更多的图形处理器。从技术上讲,这是正确的,但只有当你考虑到非常慢的集成图形解决方案,最好的情况下,轻型游戏和办公室工作。然而,很大一部分个人电脑和笔记本电脑只用于办公室工作,这就是为什么英特尔一再坚持GPU性能较差的原因。

《Arc Alchemist》有许多我们不知道的方面,比如最终产品名称和卡片设计。例如,Arc卡片会有一个鼓风机,双风扇,还是三重风扇?这并不重要,因为只要有合适的卡片设计就足够了。我们还预计英特尔将与华硕、Gigabyte和MSI等其他公司合作,帮助制造显卡,尽管这些公司愿意在多大程度上追求Arc最终取决于最重要的因素:价格、可用性和性能。

我们很好奇与AMD和Nvidia相比,真实世界的光线追踪性能,但这并不是关键因素。目前的设计最多有32个射线追踪单元(RTUs),但我们几乎不知道这些单元能做什么。每一个都可能在性能上与AMD的射线加速器相似,在这种情况下,英特尔将在射线追踪排名中处于相当低的位置。另外,每个RTU可能相当于几个AMD的射线加速器,甚至可能比英伟达的安培RT内核还要快。虽然它可能是其中任何一个,但我们怀疑它可能会在RT性能上降得更低,而不是更高,从而为未来的迭代留下增长空间。

同样,关键因素将是性能、价格和可用性。的英特尔Xe DG1和好的集成图形解决方案一样快。对于专用显卡来说,这是一个彻底的失败。作为为《Arc》铺平道路的交通工具?也许它完成了它的工作——英特尔在过去的一两年里确实在驱动程序更新方面做得更好了最新测试版驱动程序应该修复我在DG1测试中看到的问题。但DG1也是一个30W卡,基于主要用于15W笔记本电脑的GPU构建。电弧炼金师的眼光要高得多。

在接下来的六个月左右,我们将看到英特尔的离散显卡如何在竞争中脱颖而出。理想情况下,我们会看到Intel Arc Alchemist至少能达到(或接近)RTX 3070和RX 6800的性能水平,价格低于AMD和Nvidia卡,然后将一大批卡放到零售货架上。我们也可能获得入门级的Arc卡,价格低于200美元且不糟糕(游戏邦注:不是DG1)。如果英特尔能做到这一点,GPU的双头垄断可能会在2022年转变为三头垄断。

震动沃尔顿

贾里德·沃尔顿(高级编辑)对电脑的热爱可以追溯到黑暗时代,当时他的父亲带回家一台DOS2.3电脑,他把C-64留在了家中。1990年,他终于用286 12MHz的频率制造了自己的第一台定制PC,但几个月后,当Wing Commander发布时,他才发现这台PC已经过时了。他拥有杨百翰大学(Brigham Young University)计算机科学学士学位,自2004年以来一直担任科技记者,为AnandTech、Maximum PC和PC Gamer写作。从最早的S3 Virge“3D减速器”到今天的GPU,Jarred紧跟所有最新的图形趋势,是询问游戏性能的人。

31日评论 来自论坛的评论
  • InvalidError
    如果入门级的部分真的以200美元的零售价发布,并像200美元的GPU那样,根据GTX1650S以来的处理密度改进来进行扩展,那就太好了。
    回复
  • VforV
    规格表中投机和(?)的数量很有趣…: D

    如果Arc的顶级GPU将是3070 Ti级别(最好的情况),它将花费600美元,像3070 Ti,它将是一个巨大的,巨大的失败。

    我不在乎他们的名字是英特尔,他们需要证明自己在gpu和做,他们要么需要1)击败最好的gpu今天3090/6900XT(他们不会)或2)有更好的,一个更好的价格/性能比相比,nvidia和AMD,也是伟大的软件。

    所以选项2是他们唯一的选择。3070 TI性能水平不应超过$450,最好是$400。因此,任何性能较低的产品,价格也应该较低。

    让我们也不要忘记安培和RDNA2刷新应该几乎与英特尔ARC同步,2022年第一季度(或更早,甚至2021年第4季度,可能)。英特尔呀!。
    回复
  • 杰诺
    英特尔图形将于今天(美国东部时间)5:30在youtube上发布一场讨论,名为“与马丁·施特略夫和斯科特·沃森的英特尔弧形图形问答!”
    回复
  • nitts999
    VforV说:
    如果Arc的顶级GPU将是3070 Ti级别(最好的情况),它将花费600美元,像3070 Ti,它将是一个巨大的,巨大的失败。

    为什么人们要引用msrp ?你不可能花600美元买到3070-TI。

    如果我能花600美元买一台与之相当的英特尔3070ti,我会毫不犹豫地这么做。可获得性和“街头价格”是唯一重要的两件事。对于不存在的产品的msrp是浪费口舌。
    回复
  • Yuka
    正如我之前所说,决定这张卡成败的不是硅在理论上有多好,而是驱动支持。

    我不相信负责完善驱动程序的英特尔团队有足够的时间;该死,连两年都不到后释放有足够的时间让他们准备好!

    我确实希望英特尔能做得好,因为这个领域的竞争会更激烈,但我不得不说我也很害怕因为这是英特尔。他们的强势游戏比英伟达还糟糕。我很想看看nVidia在他们自己的地盘上接收它的感受。

    的问候。
    回复
  • waltc3
    ZZZZz-z-z-z-z-zzzzz……当你有真正的产品要评论的时候叫醒我。在那之前,我们真的什么都不会“知道”,不是吗?....;)现在它只是雾件。不仅仅是英特尔在这么做——还有很多关于目前还不存在的nVidia和AMD产品的文章。今年的确是一个缓慢的产品年....如果这听起来太无情了,对不起——我就是不喜欢“可能”、“也许”和“可能”……
    回复
  • InvalidError
    Yuka说:
    我不相信负责完善驱动程序的英特尔团队有足够的时间;该死,连两年都不到后释放有足够的时间让他们准备好!
    我允许我的i5的IGP卸载琐碎的东西,并扩展我的GTX1050,直到一个像样的东西出现在200美元。英特尔的控制中心似乎专注于它找到的第一个GPU,所以我不能用它配置超高清图形。不确定驱动程序中这样一个bug/缺点是如何在使用了两年的Xe igp之后仍然存在于通常也有离散图形的笔记本电脑中。

    英特尔的驱动程序和相关工具肯定需要更多的工作。
    回复
  • Yuka
    InvalidError说:
    我允许我的i5的IGP卸载琐碎的东西,并扩展我的GTX1050,直到一个像样的东西出现在200美元。英特尔的控制中心似乎专注于它找到的第一个GPU,所以我不能用它配置超高清图形。不确定驱动程序中这样一个bug/缺点是如何在使用了两年的Xe igp之后仍然存在于通常也有离散图形的笔记本电脑中。

    英特尔的驱动程序和相关工具肯定需要更多的工作。
    让我困惑的是,拥有Intel iGPU的人实际上从未拥有过经验在日常生活中使用它是多么的痛苦,除了给单个显示器供电(有时,它甚至不能正常工作),它还可以做一些更高级的事情。

    我甚至不能称他们的iGPU软件为“骨架”,因为有时甚至连最基本的功能都是粗略的。对于他们所承诺的一切,我想知道他们的优先事项最终会变成什么。我希望英特尔意识到,他们无法拥有完整的蛋糕,必须在消费者方面(游戏支持和基本功能)或他们承诺的“专业”/高级方面(编码、AI、XeSS等)做出决定。

    是的,我是个消极的南希,但那是完全合理的。虽然我希望被证明是错误的,但我认为这种情况不会发生

    的问候。
    回复
  • btmedic04
    VforV说:
    规格表中投机和(?)的数量很有趣…: D

    如果Arc的顶级GPU将是3070 Ti级别(最好的情况),它将花费600美元,像3070 Ti,它将是一个巨大的,巨大的失败。

    我不在乎他们的名字是英特尔,他们需要证明自己在gpu和做,他们要么需要1)击败最好的gpu今天3090/6900XT(他们不会)或2)有更好的,一个更好的价格/性能比相比,nvidia和AMD,也是伟大的软件。

    所以选项2是他们唯一的选择。3070 TI性能水平不应超过$450,最好是$400。因此,任何性能较低的产品,价格也应该较低。

    让我们也不要忘记安培和RDNA2刷新应该几乎与英特尔ARC同步,2022年第一季度(或更早,甚至2021年第4季度,可能)。英特尔呀!。

    我不同意这种说法。在这个市场上,如果有人能以600美元的价格提供3070 Ti性能的GPU,并保持产量领先于需求,那么无论谁拥有这一代最快的GPU,他们都将热销。看看英伟达和AMD目前离满足需求还有多远,这给英特尔提供了一个巨大的机会,只要他们能够满足或超过需求。

    Yuka说:
    正如我之前所说,决定这张卡成败的不是硅在理论上有多好,而是驱动支持。

    我不相信负责完善驱动程序的英特尔团队有足够的时间;该死,连两年都不到后释放有足够的时间让他们准备好!

    我确实希望英特尔能做得好,因为这个领域的竞争会更激烈,但我不得不说我也很害怕因为这是英特尔。他们的强势游戏比英伟达还糟糕。我很想看看nVidia在他们自己的地盘上接收它的感受。

    的问候。

    这是我最担心的。司机会有多好,更新会有多快。与AMD不同,英特尔有资金投入其驱动团队和开发人员,但钱买不到创造高性能驱动的经验。只有时间能做到

    我还记得ATi、Nvidia、3dFX、S3和matrix的日子。那是令人兴奋的时刻,我希望我们所有人都能在《Arc》中获得成功。作为消费者,我们在高端市场需要第三个竞争对手。这种双头垄断已经持续得够久了
    回复
  • ezst036
    btmedic04说:
    在这个市场上,如果有人能以600美元的价格提供3070 Ti性能的GPU,并保持产量领先于需求,他们将会像hotcakes......一样畅销

    一开始,这可能是不可能的。因特尔将从台积电采购,这意味着在同一家显卡生产晶圆厂,为争夺相同的生产空间而发生更多内讧。

    当英特尔准备好自己的晶圆厂并可以添加附加的这个特定用例的fab产能现在还没有可用,这时生产可以(目标?)保持领先需求,你说的其他部分,我认为可能是对的。

    如果台积电只是减少Nvidias和AMD,以便在生产车间为英特尔公司腾出空间,那么显卡生产等式不会改变。-除非台积电在CPU或任何其他生产区域将其他人推到一边。我想这是一件事。
    回复