AI PC卷出“芯”趋势

2024-07-07
关注
尽管苹果的人工智能 PC预计将于今年晚些时候与消费者见面,但苹果WDC将于6月11日凌晨举行 在2024年,苹果队详细描述了Mac系列将具备的AI能力。根据现场公布的信息,苹果将为整个产品线配置个性化智能系统Apple Intelligence,iPhonee将生成模型放在iPhone中、iPad、Mac的核心是根据“个人场景”为用户提供智能帮助。Mac系列,Apple 今年秋天,Intelligence的测试版将与MacOSS一起使用 Sequoia推出,支持M1Mac和后续机型。人工智能显示在苹果 在PC图片的背后,是苹果的软硬件集成能力。Craigg苹果软件工程高级副总裁 Fedrighi说,A17 Pro和M系列处理器驱动Apple Intelligence为计算能力提供了坚实的基础。   来自微软的Copilot 从Appleeppc到苹果 由Intelligence支持的Mac系列,AI正在重塑个人计算体验,推动PC向个性化、情境化方向发展。在这个过程中,AI PC处理器也在全维进化。   NPU计算战火升级 既要好用又要好用   截至2024年6月,NPU(神经网络处理器)的计算能力已达到40TOPS水平,最高为50TOPS。“卷”NPU计算能力也成为第三方处理器制造商争夺AI PC市场份额的重要手段。   在去年年底之前,NPU甚至不是PC处理器的标准。作为一种能以较低的功耗加速AI负载的处理单元,NPU率先应用于手机。2017年9月,华为推出了世界上首款内置独立NPU的手机处理器麒麟970。同年,苹果和高通分别在A11搭载了NPU Bionic处理器和Hexagon DSP(数字信号处理器)。这也可能解释了为什么高通和苹果的Fabless兼具手机和个人电脑业务,将在英特尔、AMD和其他传统的个人电脑处理器制造商之前应用NPU。2020年,苹果在M1芯片上配备了NPU,类似于苹果手机处理器A14配备的NPU,计算能力达到11TOPS。2020年9月,高通向PC发布Snapdragon 8cx Gen2 配备9TOPS计算能力的5G处理器Hexagon NPU。   2023年,面对生成人工智能向设备侧蔓延的凶猛势头,老PC处理器厂商使用人工智能 以PC为目标市场,最终将NPU武装到自己的产品线上。2023年发布的RyzenAMD Mobile 部分型号的7040系列处理器配备了NPU,可以提供最高10TOPS的计算能力。2023年12月,英特尔发布了Meteor Lake处理器首次配备NPU,计算能力为11TOPS。   同年,苹果最新的PC处理器M2 Ultra的NPU算力已经达到31.6TOPS,高通骁龙X Elite平台NPU计算能力达到45TOPS。这使得高通作为第三方处理器供应商处于领先地位。2024年5月,微软发布了“历史上最快、最智能的Windows” PC”Copilot 全新AIPC PC类别,45TOPS高通骁龙X系列处理器已成为首批Copilot PC处理器。帕万·达武鲁里,微软Windows和设备副总裁(Pavan Davuluri)认为每个Copilot, PC至少需要一个能处理40TOPS的NPU。   有了微软划定的“起跑线”和“起跑线”Wintel英特尔及其在PC市场的老对手AMD也不甘落后,在6月份的台北国际电脑展上纷纷亮出大招。英特尔宣布下一代人工智能 PC旗舰处理器架构Lunar Lake配备的NPU可以提供48TOPS的AI性能,AMD将Ryzenen AI 300系列NPU计算能力拉到50TOPS,实现了与Copilot的倍速计算能力 PC适配。   然而,计算能力的提高只是驱动设备侧人工智能计算能力的第一步。为了满足人工智能大模型的部署要求,制造商仍然需要进一步完善架构和系统设计。   例如,FP16(半精度浮点数)和INT8是AI推理任务中常见的数据类型。目前,NPU主要是INT8数据类型,运行模型所需的计算和内存较少,但牺牲了一定的精度。FP16精度较高,但不具备INT8的计算和内存特性。这使得开发人员在设计计算方案时需要平衡精度和性能。AMD根据不同数据类型的特点,采用块16位浮点(Block FP16)这种新的数据格式,将FP16的精度与INT8的性能相结合。XDNA2也成为第一个支持Block的人 FP16NPU。   此外,由于CPU和GPU也可以处理特定的人工智能任务,因此如何协调这两种芯片和NPU的计算负载也会影响系统性能的发挥。例如,英特尔的Lunar Lake架构,在人工智能任务的协调上,CPU、GPU和NPU分别负责轻型人工智能负载、人工智能和人工智能助手的创建。   全天候AI需要更高的能效比 WoA阵营迎来了机遇   AI PC强调始终在线,这意味着设备端的人工智能工具全天候在后台运行。这就要求处理器具有更高的能效比,以确保人工智能 PC的续航能力。处理器制造商除了使用NPU,一个可以用更低的功耗处理人工智能负载的处理单元外,还通过工艺,IPC、降低内存访问距离,进一步提高处理器的能效比。   芯片的工艺尺寸越小,电流传输距离越短,功耗越小。最新一代人工智能 在PC处理器中,苹果M4采用台积电第二代3nm技术,高通骁龙X Elite和AMD Ryzen AI 300采用4nm制程,与当前旗舰手机同步。   同时,IPC(每时钟周期执行的指令数)越高,CPU在同一频率下的性能就越高。英特尔Lunar 与上一代相比,Lake性能核的IPC提高了14%,在相同的功耗下,性能提高了10%~18%。AMD Ryzen AI 采用300系列处理器的Zen5架构也实现了IPC提升的16%。   同样值得注意的是,Arm架构和X86架构都在通过将内存整合到包装中,提高架构的集成度,优化功耗性能。Arm在5月底推出的终端计算子系统(CSS)中间采用系统级高速缓存(SLC),减少DRAM带宽和访问次数,提高系统能效。AppleM系列处理器也一直采用封装级内存,将SOC和DRAM芯片安装在一起。而且之前的大多数x86处理器,都是外置主内存。在Lunar 在Lake架构中,英特尔首次将内存集成到封装中。这种包装方式将PHY功耗降低了40%,使计算核心以更短的距离和更低的延迟访问内存。   “随着能效比的重要性日益突出,”WoA”(Windows on Arm)也引起了更多OEM厂商的关注。Arm在功耗和边缘侧人工智能推理方面具有优势。Windows正在深化与原生Arm的适应。据统计,在运行Windows10和Windows11的iGPU(集成GPU)笔记本电脑中,用户在87%的应用时间内使用本地支持Arm的版本。此外,Arm在最新的计算平台上,也面临着AI设备侧的发展趋势,进一步提高了能效比。例如,Arm于5月底推出的终端计算子系统(CSS)GPU的使用 Arm Immortalis-G925在提供与上一代产品相当的游戏性能时,功耗降低了30%。   目前,WoA的主要芯片玩家是高通,但英伟达和联发科也在关注这个市场。5月,英伟达宣布携带RTX Windows11GPU AI PC将在未来几个月推出,并在Windows上发布帮助开发者的信息 NVIDIAA是PC优化和部署生成AI模型的开发工具 RTX AI Toolkit。最近,联发科也报道称,基于Arm架构的人工智能正在开发中 PC芯片。Charlie,摩根士丹利分析师 Chan预计, WoA AI 2024年PC芯片出货量将达到200万台左右,2025年将增至1500万台。   混合人工智能时代的隐私挑战 苹果芯片进入服务器   AI PC产品类型的核心价值是围绕个人情境的计算体验,需要结合用户的个人数据。无论是微软Copilot PC主要的Recall功能,或者Apple Siri提供的跨APP合作能力由Inteligence支持,底层逻辑是语义索引用户信息。这就是为什么这就是为什么逐鹿AI Pavann等PC处理器制造商都强调终端侧AI的概念 Davuluri说,设备侧AI意味着响应时间更快,隐私更好,成本更低。   但是,为了保护个人数据,限制用户获得云大模型的支持,可以“因噎废食”。2023年,高通公司提出了混合人工智能架构,即根据模型和查询需求的复杂性,选择不同的方式在云和终端侧之间分配处理负载。当用户发起请求时,终端侧神经网络或基于规则运行的判断器(arbiter)决定是否需要使用云。   而苹果在WWDC 在2024年,展示了混合人工智能的具体图景。当用户向Siri提出专业问题时,Siri会提示用户是否询问ChatGPT,并询问是否可以与ChatGPT共享照片、文档等信息。同时,ChatGPT也可以用来创建苹果产品线的写作工具和图像生成工具。   然而,一旦ChatGPT部署在服务器端的大型模型服务通过设备侧的网络获得,就有可能面临服务器存储个人数据的风险。Craig Fedrighi说,在传统的方式下,服务器将存储个人数据,甚至未经同意使用,用户很难验证个人数据是否被滥用。   苹果推出了私有云计算技术,为大型服务器模型提供芯片级安全保护,面对个人数据在混合AI时代的安全挑战。当苹果设备判断用户的请求无法通过设备侧AI解决时,会引入基于服务器的模型来处理更复杂的请求,服务器端的模型会使用苹果芯片(Apple Silicon)在创建的服务器上运行,可以提供与iPhone相同的芯片级隐私安全保护。Apple Intelligence将向苹果芯片服务器发送仅与任务相关的数据。同时,独立专家可以检查服务器的运行代码,以验证用户的隐私安全是否得到保证。“私有云计算”通过加密确保iPhone、iPad、除非该服务器的软件已经被公开的安全标准认证,否则Mac可以拒绝与服务器对话。”Craig Fedrighi说。   (来源:中国电子报)
  • 人工智能
  • 苹果
  • 英特尔
  • 高通
  • 电脑服务器
  • 服务器类型
您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

IT老友记

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

SICK Inspector83x 提供开箱即用的AI质量管控方案

提取码
复制提取码
点击跳转至百度网盘