LOL投注app:一颗2nm芯片发布吊打英伟达

返回列表
来源:LOL投注app    发布时间:2025-11-16 10:54:40

lol投注平台:

  Tachyum表示, 公司的 Prodigy 2nm 处理器将在单个插槽上实现多达 1024 个 64 位核心,从而将性能提升到一个新的水平。这些核心的运行频率最高可达 6.0 GHz,并能扩展到 16 插槽系统,最多可容纳 8192 个 CPU 核心(1024 核心 SKU 支持 8 插槽配置)。

  虽然他们并没有详细讲述这颗芯片,但我们大家可以从相关报道中,获得更多蛛丝马迹。

  Tachyum也强调,过去几年,公司一直在升级其 Prodigy 设计,以满足服务器、AI和高性能计算市场一直在变化的需求,其整数性能提升高达 5 倍,人工智能性能提升高达 16 倍,DRAM 带宽提升 8 倍,芯片间和 I/O 带宽提升 4 倍,通过支持 16 个插槽实现 4 倍的可扩展性,以及 2 倍的能效,同时降低了每个核心的成本。

  现在,随着Prodigy芯片升级至2nm工艺,明显降低了功耗。尽管2nm晶圆成本高昂,但缩小芯片尺寸仍能减少相关成本。Prodigy封装中的每个芯片都集成了256个高性能定制64位内核。由于多个芯片共用一个封装,因此降低功耗至关重要。在近期2.2亿美元投资的支持下,2nm Prodigy芯片正准备进行流片。

  接下来,我们看一下这颗芯片的规格:规格概览:2nm架构(尚未制造)、最多可达 1024 个 64 位核心、最高可达 6 GHz 时钟频率、最多 1 GB 的 LLC、最高可达 1600W TDP、支持高达 DDR5-17,600 MT/s 的速度、每个插槽最高支持 48 TB DDR5 内存容量、最多支持 128 条 PCIe 7.0 通道。

  Tachyum介绍说,其用于Prodigy 2nm芯片的64位微架构将支持最新的矩阵和向量扩展,专为高性能AI和高性能计算应用而设计。它采用乱序执行架构,每个时钟周期可执行8条指令。

  Prodigy 2nm芯片将支持多达24个DDR5通道,速度最高可达17,600 MT/s,每个插槽最大容量可达48 TB。I/O方面,将提供128条PCIe 7.0通道和总共64个PCIe控制器。DDR5-17600规格和PCIe 7.0在现有服务器市场并不常见,因此Tachyum今天提到的这样的平台不太可能在2027年之前上市,即使到2030年,如果他们可以推出类似的产品,那也堪称奇迹。

  在此前的报道中,Tachyum 曾透露,公司的Prodigy 处理器将采用多芯片设计,系统级封装 (SiP) 内的每个计算芯片都将拥有 256 个通用核心。这在某种程度上预示着整个 SiP 将提供更多核心,从而兑现该公司“性能是目前最高性能 x86 处理器的 3 倍,是目前最高性能 HPC 通用图形处理器 (GPGPU) 的 6 倍”的承诺。然而,这一性能承诺存在一个问题:该公司尚未最终确定 CPU 的规格,因此也还没完成芯片流片,其实际性能仍有待观察。

  规格参数介绍完毕,我们来看看Tachyum公布的一些性能数据。首先,Tachyum将其Prodigy 2nm芯片与NVIDIA的Rubin Ultra GPU平台做了比较,后者预计将于2027年发布。

  Tachyum强调,Prodigy 通用处理器可提供数量级更高的 AI 性能,是最佳 x86 处理器的 3 倍,是速度最快的 GPGPU 的 6 倍 HPC 性能。Prodigy 无需昂贵的专用 AI 硬件,并可明显提高服务器利用率,从而大幅度降低数据中心的资本支出和运营支出,同时提供前所未有的性能、功耗和经济效益。

  Tachyum表示,除了开源所有软件外,Tachyum 还开放其内存技术,采用标准组件,使基于 DIMM 的内存带宽提升 10 倍,并可供内存或处理器公司授权使用,包括采用 JEDEC 标准,以实现高普及率和低成本。2023 年,Tachyum 发布了可授权的 Tachyum AI (TAI) 数据类型,其 Tachyum 处理单元 (TPU) 内核也已开放授权。Tachyum 目前正在推进指令集架构 (ISA) 的开源。

  如Tachyum所说,传统的大规模人工智能解决方案可能耗资超过 8 万亿美元,需要超过 276 GW的电力。相比之下,Tachyum 的解决方案预计仅需 780 亿美元的成本和 1 GW的电力就可以实现类似的功能,使其能够被多家公司和国家所采用。Tachyum认为,公司的Prodigy 系列新产品能股改多种性能和应用领域,包括大型人工智能、百亿亿次级超级计算、高性能计算 (HPC)、数字货币、云计算/超大规模计算、大数据分析和数据库。

  Tachyum强调,Prodigy 的卓越功能、可扩展性和价格定位确保了其快速的市场渗透。Tachyum 提供开箱即用的原生系统软件、操作系统、编译器、库、众多应用程序和 AI 基础设施框架。它还允许运行未经修改的 Intel/AMD x86 二进制文件,并将其与原生应用程序混合使用。这确保了客户从第一天起就能使用 Tachyum 系统。

  Tachyum公司总部在加利福尼亚州圣克拉拉,并在斯洛伐克首都布拉迪斯拉发设有研发实验室,其团队拥有众多经验比较丰富的工程师和高管。

  其中,联合创始人兼首席执行官Radoslav Danilak早在互联网泡沫初期就设计了自己的超长指令字(VLIW)处理器,几年后,他为一家名为Gizmo Technology的公司开发了一款64位处理和内存的乱序执行x86处理器,之后他曾在东芝公司担任首席架构师,负责东芝7901芯片的开发。该芯片是MIPS R5900 Emotion Engine处理器的变体,曾用于PlayStation 2游戏机,据推测也用于东芝的各种微控制器和电子科技类产品中。

  Danilak还曾在Nishan Systems公司参与一个为期一年的项目,开发出一款单芯片网络处理单元(NPU),将20个不同芯片的功能整合到一起。之后,他担任英伟达的高级架构师,负责设计nForce 4 GPU和第一代Tesla GPU加速器“Fermi”的特性。

  2007年,正值GPU加速浪潮即将兴起之际,Danilak离开了英伟达。他创立了闪存存储制造商SandForce,并为其开发了自主研发的闪存控制器。2010年,SandForce以3.77亿美元的价格出售给了LSI Logic。此后,Danilak联合创立了全闪存阵列制造商Skyera,该公司于2015年夏季被西部数据以未公开的价格收购。

  Tachyum 的另一位联合发起人 Shevlyakov 于 20 世纪 90 年代初以软件工程师的身份入行,随后在互联网泡沫初期,他曾在俄罗斯多家初创公司专注于编译器开发。在 1999 年至 2001 年的巅峰时期,他担任实时操作系统制造商 Wind River 的高级编译器工程师。之后,Shevlyakov 在 MicroUnity 工作了十余年,该公司开发了一款名为 BroadMX 的 RISC/SIMD 处理器,旨在用于网络处理任务。在 MicroUnity,他将 GNU 开源工具链移植到了该处理器上。随后,他与 Danilak 和 Mullendore 一起加入了 Skyera 公司,在那里,他将 GNU 工具链移植到了该公司自主研发的用于控制闪存的芯片上,并参与了全闪存阵列中闪存转换层的开发工作。西部数据收购 Skyera 后,Shevlyakov 继续留在 Tachyum,与他的联合发起人一起工作,并负责 Tachyum 的软件栈开发。

  负责业务拓展的副总裁肯·瓦格纳(Ken Wagner)也是联合发起人之一,曾就职于多家硅芯片初创公司。系统工程副总裁基兰·马尔万卡(Kiran Malwankar)是横向扩展存储设备制造商Pavilion Data Systems的创始人。弗雷德·韦伯(Fred Weber)是超级计算机制造商Encore Computer和Kendall Square的联合创始人,曾任AMD首席技术官,并参与创建了64位Athlon和Opteron架构,他是公司的顾问。曼彻斯特大学计算机科学教授史蒂夫·弗伯(Steve Furber)也是顾问,他在20世纪80年代设计了首款32位Acorn RISC Machines处理器,也就是我们熟知的Arm。分布式系统专家克里斯托斯·科兹拉基斯(Christos Kozyrakis)是斯坦福大学的教授,他经常与谷歌合作,也是公司的顾问。

  一开始,该企业具有一个内部System C模拟器,可用于内部开发和基准测试。早在2020年的时候,该公司就说芯片将流片,将采用台积电的7纳米工艺制造。这种先进的制造工艺使其能够在290平方毫米的器件中集成大量组件。

  如图所示,该设计源于对连接电路模块的导线的深入研究,以及Tachyum认为能够吸引超大规模数据中心、高性能计算中心以及机器学习和推理集群的组件比例的合理配置。Danilak指出,问题就在于导线的传输速度正在变慢。以下是一些常见的图表:

  “我们在时钟频率附近遇到了性能瓶颈,每个核心的性能增长并不显著,”Danilak表示。“核心数量在增加,但由于散热问题,我们也在降低时钟频率。所有晶体管的速度都在提高,但问题就在于导线慢慢的变细,电阻慢慢的变大,因此导线延迟也在增加。过去芯片的延迟是每毫米100皮秒,而现在每毫米的延迟已经接近1000皮秒。”

  当然,导线电阻会产生热量,还会导致延迟,因此,Danilak认为,诀窍在于尽可能缩短导线长度。这样一来,芯片的时钟频率能比以往更高,同时还能减少总计算时间(获取数据的时间加上处理数据的时间),从而完成更多工作。重点是提取芯片上运行的工作负载中的并行性,从而消除导线造成的计算延迟(就像缓存层次结构掩盖了标准处理器中的计算延迟一样),而这需要一些巧妙的编译器工作——这时,Shevlyakov拥有如此丰富的编译器经验就能发挥重要的作用。

  于是,如上图所示,他们开发了第一代芯片。关于这这个设计,Danilak 大胆宣称:“每个核心都比 Xeon 核心或 Epyc 核心更快,比 Arm 核心更小,总体而言,我们的芯片在高性能计算和人工智能方面比 GPU 更快。”

  与其他核心设计相比,L1缓存略小,数据缓存和指令缓存均为16KB,但核心上的256KB L2缓存和同样位于核心上的512KB L3缓存(两者共同构成一个覆盖整个芯片的32MB共享L3缓存)则完全正常。如您所见,整数流水线有九级,向量流水线则增加了五级。

  Tachyum原本希望在2019年底推出Prodigy芯片的样品,但由于种种原因推迟了多次。并最终在今天,带来了2nm的版本。

  根据最初计划以来,Prodigy通用处理器于2019年完成芯片流片,2020年上市,但此后计划多次调整:从2021年推迟到2022年,再到2023年,最后又推迟到2024年。今年早一点的时候,Tachyum再次更新了计划,表示将于2025年完成芯片流片,从而推迟了原定于明年第一季度提供的参考服务器样品。

  虽然该公司官方仍计划 于2025年开始量产Prodigy处理器,但能否在一年内完成所有必要的里程碑(流片、调试、样品制作、量产启动)仍有待观察。

  在去年年底,Tachyum发布了一份长达1600页的指南,旨在优化其Prodigy通用处理器FPGA硬件的性能。我们大家都认为为帮助大家更好了解这颗芯片的逻辑,可以精简一下这一些内容给大家看一下。

  据介绍,Prodigy指令集架构(ISA)融合了RISC和CISC两种架构的元素;据Tachyum公司称,该ISA避免了传统CISC处理器中常见的复杂、冗长且效率低下的变长指令。所有指令均标准化为32位或64位,部分指令还集成了内存访问功能以逐步提升性能。

  Tachuym 的 Prodigy FPGA 内置性能计数器,可对运行时事件进行实时监控和分析。该公司表示,这些工具可以帮助程序员和工程师识别性能瓶颈并优化代码,来提升效率,使该处理器成为高要求计算任务的理想之选。

  本手册提供了具体的优化技巧,包括管理调度限制、改进内存例程、对齐分支和指令以及缓解寄存器转发难题。此外,它还提供了处理缓存操作、加载/存储对齐和访问特殊寄存器的指导,确保研发人员能够对软件进行微调,进而达到最佳性能。

  Tachyum创始人兼首席执行官Radoslav Danilak博士表示:“软件程序员、测试工程师、编译器研发人员以及系统和解决方案工程师将会非常珍惜这次进一步探索Prodigy如何为高效处理AI、云计算和高性能计算工作负载提供固有性能优势的机会。Prodigy的集成功能将帮助用户实现业界领先的计算效率,从而更快地获得洞察、更快地开展研究、更快地生成结果。”

  对啦,今年十月,Tachyum透露,一家欧洲投资者将在一个月内向Tachyum的账户汇出2.2亿美元的投资款项。此举将助力Tachyum成为AI数据中心市场领先的赋能者之一。此外,该C轮投资者还签署了一份价值5亿美元的Prodigy芯片采购订单。Prodigy芯片将使AI性能提升一个数量级,并将超大型LLM/AI模型的成本降低约两个数量级。

  *免责声明:本文由作者原创。文章的主要内容系作者本人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

  一句话的事,说明在啥地方有了一个新东西性能怎么样就完了,没有必要说这么多,这里不是学术期刊,没人从这里捞技术。

  芯片到3,5纳米完全够了。 现在的重点应该转向研究电池问题。小体积,长续航!这才是研究的重点方向!

  小鸭还没买回来在大谈将来鸭子下了好多好多的蛋,规划一部做皮蛋 皮蛋口感特别美味刚上市立即售罄。另一部分做咸鸭蛋,这一点,董事长和总经理存在严重分歧闹得不可开交,己起诉到法院。法官问,谁出资多,鸭子在哪里先得冻结资产,俩人异口同声说,小鸭还没买呢!

  11月15日,全运会乒乓球男单半决赛,上海队樊振东与北京队王楚钦相遇,最终樊振东4比2战胜王楚钦。本场比赛,两人知根知底,绝对没试探环节,樊振东5比3开局,但很快就被王楚钦9比5反超,王楚钦11比7拿下首局。

  已经公布了最新寒假时间。西安市教育局关于做好2025年中小学期末及暑假工作的通知已于6月13日下发至各区县、开发区教育局。

  今年发生在山西长治的这场邻里血案,一开始大家都以为是因为狗咬人,凶手一时冲动才下的狠手。根据《潇湘晨报》11月13日的报道,今年1月30日下午,山西长治市,一起原本可通过调解解决的邻里纠纷,在晚间失控升级,最终酿成一死三伤的血案。

  日本机票免费退改方案 11月15日,国航、南航、东航、海航、川航、厦航等航司相继发布通知,公布了涉及日本航线客票的特殊处置方案,对于出行日期在12月31日之前且符合有关条件的客票,可予以免费退改处理。#国航 #南航 #东航 #日本

  打日本战略收益更高!“野爹”只要不死,岛内还会死灰复燃 #全球创作者计划 #零基础看懂全球

  明天开始万达金街不给摆摊位了,想吃小吃不知道又要去哪里了#上热搜 #快来围观 #老百姓关心的话题 #万达金街#淮安区

  “内蒙古见义勇为反杀案”最新进展:内蒙古高院认可原审法院采信的“无资质”鉴定报告,驳回申诉!

  文|启文 谢林丝 图|受访者提供视频中,三个模糊的影子出现在小区大门的黑夜里,其中一个“黑影”高跳起来,高举菜刀砍杀另一个“黑影”。而旁边一个显眼的“白影”,则冲到两个“黑影”的中间,奋不顾身地抢夺下那个持刀“黑影”手中的菜刀。随后,三个人影先后离开了第一个作案现场……。

  婚宴散席后回收喝剩茅台,主家多次追要在酒店窗帘后找到3箱,酒店否认服务员藏匿,双方已报案

  备下近100瓶茅台酒,婚宴散席后主家追要喝剩的喜酒,酒店方仅返还3个空酒瓶,后从宴会厅靠近传菜间的窗帘后面找到 3箱。主家认为是酒店服务员藏匿,酒店方予以否认,双方争执不下均报警处理。

  神舟二十号乘组已平安返回地球。据央视新闻报道,根据计划安排,神舟二十二号飞船将在无人状态下择机发射。

上一篇:鐞嗚储璁$畻鍣

下一篇:悬式绝缘子概述

Contact Us

地 址:浙江省乐清市翁垟工业区
全国统一客服热线:0577-62817588  手 机:15967777678
网站地址:www.hbhengsheng.com

  • Follow the site

Copyright 2020 LOL投注app 版权所有(C) All Rights Reserved.