操作

皓龙

来自pcdiy_dev

Xiaolang47y讨论 | 贡献2023年7月3日 (一) 10:32的版本

注:本文介绍的是Opteron(皓龙),而不是operon(操纵子)。

皓龙(英文名Opteron)处理器是AMD早期的x86服务器和工作站处理器,是第一个支持AMD64指令集架构的处理器(一般被称为x86-64或AMD64),多用于多路服务器。

它于2003年4月22日正式发布,最初采用K8内核(SledgeHammer内核),及至2007年后期逐步过渡至K10内核。 最后的皓龙处理器采用内核的是2011年基于推土机(Bulldozer)架构及其改版。 除了x86及x86-64架构以外,还发售过使用ARM架构 (AArch64、ARMv8)的机种。目的是在服务器和工作站市场上与英特尔至强(Xeon)处理器竞争。

该品牌名在2017年之前已经退役,被霄龙(Epyc)处理器替代。

历史与特性

技术特色

应用程序支持

皓龙处理器在一个处理器中结合了两个重要的功能:原生执行传统的x86 32位应用程序而不影响速度、原生执行x86-64的64位应用。

第一种功能极为重要,因为在皓龙推出之前,市场上唯一具有32位x86兼容性的64位架构处理器(英特尔的安腾(Itanium)处理器)只运行传统的x86应用,速度下降的十分明显,而皓龙处理器可直接存取多于4GB的记忆体,这使得皓龙处理器可以以正常速度来执行32为应用程序。皓龙处理器因为整合了记忆体控制器,所以存取内存的资料就不需要通过过北桥。

第二种功能本身不大重要,因为主要的RISC架构(如SPARC、Alpha、PA-RISC、PowerPC、MIPS)多年来都是64位的。

然而,在结合这两种能力时,皓龙处理器因其能够经济地运行大量基础x86应用程序,同时提供一个升级到64位计算的途径而赢得了市场的认可。

内存控制器

Opteron处理器拥有支持DDR SDRAM、DDR2 SDRAM或DDR3 SDRAM(取决于处理器的时代)的集成内存控制器。这既减少了访问主内存的延迟惩罚,也消除了对独立北桥芯片的需求。

多处理器功能

在多处理器系统中(一个主板上有一个以上的皓龙处理器),处理器通过高速HT链接使用直接连接架构进行通信。每个CPU可以访问另一个处理器的主内存。皓龙的多处理方式与标准的对称多处理方式不同;每个处理器都有自己的内存,而不是所有处理器都有一个内存组。因此,皓龙是一个非统一内存访问架构(NUMA)。中级服务器的皓龙处理器原生支持最多8路的配置,企业级服务器使用额外的路由芯片来让每个主板支持8个以上的处理器。

在各种计算基准中,皓龙表现出比英特尔至强更好的多处理器扩展性,英特尔至强直到拥有了QPI和集成内存控制器的Nehalem架构才有了点对点系统。这主要是因为在皓龙平台上增加一个皓龙处理器可以增加内存带宽,而至强并不总是这样,而且皓龙使用的是交换式结构,而不是共享总线结构。

皓龙的集成内存控制器允许处理器快速访问本地内存。相比之下,多处理器至强系统的处理器只共享两条公共总线,用于处理器与处理器以及处理器与内存的通信。而在至强系统中,随着至强处理器数量的增加,对共享总线的争夺会导致计算效率下降。

成就

2008年5月25日,IBM为美国国家核能安全管理部(NNSA)打造一台代号为“走鹃(Roadrunner)”的超级电脑,当中即采用6192颗AMD皓龙处理器与12960颗PowerX Cell 8i处理器搭配,计算峰值高达1.026 petaFLOPS,2008年高居世界500强超级电脑的第一位。

2008年7月29日,四核心的皓龙处理器在双路、四路伺服器创造了SPEC Web2005两项新的世界纪录。惠普ProLiant DL385 G5伺服器配置了两颗四核心的皓龙2356 2.3 GHz,SPEC Web2005得分30007,而惠普ProLiant DL585 G5伺服器配置了四颗四核心的皓龙8356 2.3 GHz,SPEC Web2005得分高达43854,比之前的记录提高了大约2.5%。另外四路皓龙8356也首次使用10Gbps乙太网路进行测试,展示了皓龙处理器直连架构的优异性能。

2008年8月11日,搭载四核心皓龙处理器2360 SE型号的惠普ProLiant DL785 G5伺服器在TPC-H@300 GB决策支援测试中取得突破世界纪录的成绩,另外也在SAP® Sales和Distribution Standard Application Benchmark双重测试中,在配置和工作负载相似的8颗皓龙处理器共32颗核心的x86伺服器中,荣获第一名。

(待补充)

产品列表

详见:皓龙处理器产品列表