要是您但愿不错经常碰面迪士尼彩乐园是正规吗,接待标星储藏哦~
起原:实质 编译自 theregister ,谢谢。
IBM 的最新大型机以平台传统的关节任务责任负载的安全性和可靠性属性为基础,添加了 AI 来因循大型说话模子 (LLM)、助手和代理。

z17 系列引入了矫正的 Telum II 处理器和 Spyre AI 加快器卡,这两者齐是在昨年帕洛阿尔托举行的Hot Chips 会议上询查过的,据称其 AI 性能比 z16 提高了 7.5 倍。
IBM 宣称,固然 Telum II 提供了矫正的 AI 推理来针对交往开动诓骗检测查抄(就像z16 中引入的那样),但 Spyre 卡提供了一种膨胀 AI 处理的设施,以因循生成 AI 和 LLM,并使用多种模子来提高准确性并减少误报。
IBM 院士兼 IBM Z 架构师 Elpida Tzortzatos 在谈到蓝色巨东谈主为这款最新大型诡计机开拓的硬件增强功能时暗示:“要是将数据视为新的燃料,那么基础设施即是鼓励企业 AI 之旅走向得胜的引擎。”
该公司暗示,他们花了许多时代与客户询查他们但愿在大型机中看到什么,这为 z17 的开拓提供了参考。客户显著告诉他们要更新他们的应用门径并使大型机愈加东谈主工智能驱动。

但这并不是像其他一些公司那样,将生成式东谈主工智能粗浅地参预到其中。蓝色巨东谈主宣称仍是仔细接头过这个问题。
Tzortzatos 暗示:“GenAI 对咱们的客户来说特地巨大,但也不是独一的 AI 用具。尽管最近有许多对于 GenAI 的询查,但预测性 AI 仍将在企业中推崇关节作用。”
“咱们将接续特地特地好地功绩于这些用例,但 GenAI 为新的用例掀开了大门,举例领有助手并不祥总结文档,不祥为开拓东谈主员提供因循,让副驾驶不祥自动完成代码等等。”
这些助手包括该公司的watsonx Code Assistant for Z 和 watsonx Assistant for Z 等。
Tzortzatos 宣称,该公司看到的一个新趋势是将预测东谈主工智能的上风与大型说话和代码模子的上风伙同起来,以索要新特征或新视力,并从这些东谈主工智能模子中取得更好、更准确的末端。
她举了一个保障的例子,保障公司从 DB2 数据库中索要与索赔联系的结构化信息,然后从非结构化文本中索要关节视力(举例索赔原因或索赔热切进程),并将其输入预测 AI 模子以取得更好、更准确的末端。
把柄 Hot Chips 的刺眼先容,z17 中的 Telum II 处理器与上一代相同是八核芯片,但开动速率更高,为 5.5 GHz。Telum II 的缓存大小也加多了 40%,并加多了另一项新功能——片上 IO 加快器或数据处理单位 (DPU),旨在卸载 Spyre AI Accelerator 卡在处理较新的 AI 模子时需要处理的大批数据。
Tzortzatos 阐述说:“当谈到大型说话模子和 GenAI 时,咱们看到模子复杂性和模子尺寸加多了高出一百倍,这对 AI 诡计建议了更高的条款。”
这些 Spyre AI 加快器卡可插入 PCIe 插槽,每个卡最多有 32 个中枢,传闻与 Telum II 芯片本人的 AI 加快器架构访佛。IBM 暗示,z17 不错在单个系统中领有最多 48 张卡。
蓝色巨东谈主还在准备 z/OS 3.2,这是其为 IBM Z 系统开拓的下一个主要操作系统版块,筹谋于本年第三季度发布。这将为统统这个词系统提供对硬件加快 AI 功能的因循,并使用运营 AI 已毕系统不竭功能。
IBM 暗示,新平台将加多对当代数据看望设施、NoSQL 数据库和搀杂云数据处理的因循,以使 AI 不祥行使更泛泛的企业数据来应用预测性业务瞻念察。
IBM 推出新款大型机正好这种高价位居品的穷困时代,特朗普政府的海外贸易战略动摇了交易信心。传统上,跟着旧系统客户升级,新大型机的推出将为蓝色巨东谈主带来收入激增,但本年的销售可能会很费力。
可是,Gartner 基础设施和运营集团实行副总裁 Mike Chuba 暗示,公司仍是充分了解客户的需求。
Chuba 向The Register暗示:“要是你回归一下最近几代大型机的发布会,并接续回归这一代,你会发现,IBM 在触及大型大型机客户的研发历程中参预了更多时代。”
“IBM 的研发责任目下专注于新硬件怎样平直不竭客户濒临的挑战。他们在 z16 上引入的专用加快器和这一代的涡轮增压版 2 平直不竭了交曩昔诓骗检测等挑战,从而专注于东谈主工智能。”
IBM 的的新芯片
昨年,迪士尼彩乐园哪个是真IBM 为其有名的大型机系统推出了一款更强硬的处理器,同意增强用于推理的片上 AI 加快,并集成数据处理单位 (DPU) 以增强 IO 处理能力。
IBM还为其提供了一个单独的 AI 加快器,旨在因循更大界限的推理。
据蓝色巨东谈主称, Telum II 处理器在帕洛阿尔托举行的Hot Chips 2024大会上发布,预测将为大型机带来显赫的性能栽植。该公司还预览了 Spyre AI Accelerator,并暗示预测这两款芯片将于 2025 年上半年与下一代 IBM Z 系长入起推出。
要是 IBM 的说法真确的话,那么众人精真金不怕火 70% 的交往齐是通过其大型机进行的,而 IBM 暗示,它在 Hot Chips 上展示的开拓效果将使其不祥将生成性 AI 引入这些关节任务责任负载。
Telum II 和其前代居品相同,是一款八核芯片,但在新芯片中,这些芯片的时钟速率更高,为 5.5GHz。有十个 36 MB 二级缓存;每个内核一个,DPU 一个,第十个看成合座芯片缓存。IBM 暗示,跟着捏造 L3 和捏造 L4 永别增长到 360 MB 和 2.88 GB,这意味着缓存大小加多了 40%。
首款 Telum 处理器于 2022 年推出时为 z16 带来了内置 AI 推理功能。它不祥在处理金融交曩昔对其进行及时诓骗检测查抄。
蓝色巨东谈主暗示,它已显赫增强 Telum II 处理器上的 AI 加快器功能,达到每秒 24 万亿次运算 (TOPS)。但正如The Register之前所阐述的那样,TOPS 可能是一个误导性辩论。固然加多了对 INT8 看成数据类型的因循,但 Telum II 本人的想象旨在使模子开动时不祥与最无情的企业责任负载并行开动。
添加片上 DPU是为了匡助高慢不绝增长的责任负载需求,非凡是着眼于异日的 AI 责任负载和行将推出的 Z 系统 Spyre 加快器。
据 Armonk 公司先容,每个 DPU 包括四个处理集群,每个集群有八个可编程微铁心器和一个不竭这些处理集群的 IO 加快器,以及两个 IO 抽屉域的 IO 子系统。DPU 还具有单独的 L1 缓存和苦求不竭器来追踪未完成的苦求。
DPU 位于主处理器结构和 PCIe 结构之间。将其平直链接到结构的想法是大大减少数据传输的支出,同期提高糊涂量和功率效劳。
IBM 暗示,看成最高建立,异日的 Z 系统可能领有多达 32 个 Telum II 处理器和 12 个 IO 笼,每个笼子最多有 16 个 PCIe 插槽,使系统统统因循多达 192 个 PCIe 卡,大大膨胀了 IO 容量。
Spyre 加快器将包含 32 个中枢,其架构与集成在 Telum II 芯片中的 AI 加快器访佛。IBM Z 不错建立多个 Spyre 加快器,通过 PCIe 装置,以便把柄需要膨胀 AI 加快。举例,八张卡的集群将为单个 IBM Z 系统添加 256 个加快器中枢。
Telum II 和 Spyre Accelerator 均旨在因循 IBM 所称的集成 AI,即使用多个 AI 模子来提高与单个模子比拟的预测性能和准确性。
蓝色巨东谈主 IBM Z 和 LinuxONE 居品不竭副总裁 Tina Tarquinio 在驳倒中暗示:“Telum II 处理器和 Spyre 加快器旨在提供高性能、安全且更节能的企业诡计不竭有野心。”
她补充谈:“经过多年的开拓,这些改进将被引入咱们的下一代 IBM Z 平台,以便客户不错大界限行使 LLM 和生成式 AI。”
蓝色巨东谈主但愿超过推理,在其大型机上进行微调,以致可能考验模子。该公司暗示,这将使银行和其他但愿将数据安全保存在我方局势的企业等客户不祥十足在组织里面考验和部署模子。
Telum II 和 Spyre Accelerator 齐将由三星取舍 5 nm 工艺节点为 IBM 出产。
https://www.theregister.com/2025/04/08/ibm_z17_update/
半导体极品公众号推选
专注半导体界限更多原创实质
暖热众人半导体产业动向与趋势
*免责声明:本文由作家原创。著述实质系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或因循,要是有任何异议,接待连络半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第4089期实质,接待暖热。
8. 《Sorry We're Closed》Duquesa
这个错误被铁拳系列的执行游戏总监/首席制作人原田胜弘发现,他在推特上表示:“SIE,King 是 King,但不是同一个 King 。。。我会去反映一下。”
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的实质就点“在看”共享给小伙伴哦