美股
基金
外汇丶加密货币
沪丶深港通
港股
 
 
 
 
 
 
新闻分享
如欲分享新闻,请填写收件人及阁下之电邮,再按「送出」。*必需填写
收件者电邮*
请用分号「;」分隔不同电邮地址,例子:a@a.com; b@b.com
阁下之电邮*
分享内容
一行代码加速60%:明略科技(2718.HK)Cider如何补齐Apple端侧AI生态的关键短板
如果给2026年上半年的开发者社区选一个关键词,"本地AI"可能会高票当选。这股风潮的标志性事件发生在3月底:Ollama宣布其Mac版本从llama.cpp切换到苹果原生的MLX框架。紧随其后,大量...
重设
送出
视窗将於5秒内关闭
一行代码加速60%:明略科技(2718.HK)Cider如何补齐Apple端侧AI生态的关键短板
有连云新闻
推荐
0
利好
0
利淡
0
 
 

如果给2026年上半年的开发者社区选一个关键词,"本地AI"可能会高票当选。

这股风潮的标志性事件发生在3月底:Ollama宣布其Mac版本从llama.cpp切换到苹果原生的MLX框架。紧随其后,大量开发者开始将自己的AI工作流迁移到本地Mac上运行。驱动力很简单——数字太有说服力了。在M5芯片上,MLX框架带来了prefill速度提升57%、生成速度近乎翻倍的实测表现。

Apple Silicon统一内存架构的优势终于被充分释放:CPU和GPU共享同一块物理内存,数据无需在不同存储池之间搬运;M5芯片更在每个GPU核心中嵌入了Neural Accelerator,通过Metal 4的TensorOps API提供原生AI推理加速。硬件层面,苹果已经为端侧AI铺好了路。

但开发者们很快发现了一个问题。

MLX的"半成品"现状

MLX目前支持的量化模式是W4A16和W8A16——即只对模型"权重"进行量化压缩(分别压缩到4bit和8bit),而计算过程中的"激活值"仍然保持FP16(16位浮点数)格式。

这意味着什么?意味着苹果专门为INT8运算设计的Neural Accelerator硬件,在MLX框架下并没有被完整利用。权重被压缩了,但实际计算的数据精度还是FP16,GPU的INT8加速单元基本处于闲置状态。

打个比方:苹果给了一辆配备涡轮增压的跑车,但MLX只把它当自然吸气在开。硬件潜力释放了一半,还有一半锁在驾驶模式的限制里。

这不是MLX的设计缺陷——激活量化的工程难度确实高于权重量化,需要解决校准精度、算子适配、硬件调度等一系列问题。但对于希望在Mac上运行生产级AI的开发者而言,这是一个明确的性能天花板。

Cider:精准补位的一行代码

明略科技近日开源的Cider推理加速SDK,精准地切入了这个缺口。它在MLX生态的基础上,补齐了W8A8和W4A8两条激活量化路径——既支持权重8bit+激活8bit(保持模型能力的前提下最大化加速),也支持权重4bit+激活8bit(在极致内存压缩的同时获得INT8加速)。

工程层面最值得关注的是接入成本:一行代码完成模型转换。开发者不需要重新训练模型、不需要修改推理脚本、不需要学习新的框架——在现有MLX工作流中加入一行convert_model()调用即可。

性能数据很实在。在M5 Pro芯片上,W8A8模式下单算子速度比原生MLX提升1.82-1.86倍。对于视觉语言模型(VLM),Qwen3-VL-2B的端到端预填充速度提升57%-61%,Qwen3-VL-4B提升17%-22%。在实验性的ANE+GPU异构协同模式下,M4芯片上还能获得额外3%-17%的加速。

精度方面,W8A8量化后的模型PPL(困惑度)与FP16原始精度相比差距仅0.03。几乎可以认为是无损加速。

生态兼容:不是另起炉灶

Cider的另一个关键设计选择是:完全基于MLX生态构建,而不是试图替代它。

这意味着所有已经适配MLX的开源模型——Qwen、Llama、Mistral、Phi等——都可以无缝受益于Cider的加速能力,无需等待模型方单独适配。对于开发者而言,这不增加技术栈复杂度,只减少推理延迟。

从苹果生态的角度看,Cider填补的是MLX框架演进路线中尚未到达的位置。苹果在WWDC 2025上展示的MLX路线图中,激活量化是明确的发展方向,但官方实现的时间表尚不确定。Cider提前为开发者提供了这一能力,且保持了与MLX API的完全兼容——即便未来MLX原生支持激活量化,现有的Cider代码也不需要大幅重构。

对端侧AI生态的意义

Cider解决的不只是一个性能优化问题。它改变的是Mac作为AI开发和部署平台的能力边界。

当Neural Accelerator被真正用起来,一台Mac能承载的模型规模和推理速度都会上一个台阶。4B参数的视觉语言模型可以流畅运行GUI操作任务,7B-14B的语言模型可以支撑更复杂的Agent推理链路——这些过去需要专用GPU服务器才能实现的能力,现在在一台桌面设备上就能跑通。

明略科技同步开源的Mano-P端侧智能体模型,就是Cider能力的一个直接受益者。4.3GB峰值内存、476 tokens/s预填充速度、76 tokens/s解码速度——这组数据的背后,是Cider将Apple Silicon的硬件潜力充分释放后的结果。

对于整个Apple端侧AI生态而言,Cider的开源意味着一个关键瓶颈被清除。MLX为Mac上的AI推理建立了基础框架,Cider在这个框架上补齐了硬件利用率的最后一块拼图。两者叠加,让"Mac即AI工作站"不再是一句营销口号,而是一个可以用benchmark数据支撑的工程事实。

新闻来源 (不包括新闻图片): 有连云
 
网站地图
支援电邮: support@aastocks.com
阿斯达克网络信息有限公司 (AASTOCKS.COM LIMITED) 版权所有,不得转载
免责声明
阁下明确同意使用本网站/应用程式的风险是由阁下个人承担。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均竭力确保所提供资讯的准确和可靠度,但不能保证其绝对准确和可靠,且亦不会承担因任何不准确或遗漏而引起的任何损失或损害的责任(不管是否侵权法下的责任或合约责任又或其他责任)。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均对资讯不作任何明示或隐含的要约、陈述或保证(包括但不限于可销售性及特殊用途合适性的资讯保证) 。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、或其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商不会就任何原因导致的中断、不准确、错误或遗漏或因此而造成的任何损害赔偿(不论直接或间接、相应而生、惩罚性或惩戒性)对任何人承担责任。

AASTOCKS.com Limited不负责,亦不承担任何由于不可抗力的事故或在AASTOCKS.com Limited不可合理控制的情况下导致的损失或损害,如台风、暴雨、其他自然灾难、政府或有关机构的限制、骚动、战争、病毒爆发,网络故障或电信故障,引致AASTOCKS.com Limited不能履行协议内的责任或提供服务。

Morningstar免责声明:版权所有©2020 Morningstar,Inc。保留所有权利此处包含的资料,数据,分析和意见(“信息”):( 1)包含Morningstar及其内容提供者的专营资料;(2)除特别授权外,不得复制或转载;(3) 不构成投资建议;(4)仅供参考,(5)并未为所载资料的完整性,准确性及时间性作出保证.Morningstar对于阁下使用任何相关资料而作出的任何有关交易决定,伤害及其它损失均不承担 任何责任。请在使用所有资料前作出核实,并且在咨询专业投资顾问意见前勿作任何投资决定。过往业绩并不代表将来表现,任何投资项目的价值及所得收入皆可升可跌。

本网站/应用程式包含的内容和信息乃根据公开资料分析和演释,该公开资料,乃从相信属可靠之来源搜集,这些分析和信息并未经独立核实和AASTOCKS.com Limited并不保证他们的准确性、完整性、实时性或者正确性。

在本网站/应用程式的资料、金融市场数据、报价、图表、统计数据、汇率、新闻、研究、分析、购买或者出售评分、财金教学及其他资讯仅作参考使用,在根据资讯执行证券或任何交易前,应咨询独立专业意见,以核实定价资料或获取更详细的市场信息。AASTOCKS.com Limited不应被视为游说任何订户或访客执行任何交易,阁下须为所有跟随在本网站/应用程式的资料、评论和购买或出售评分执行的交易负责。

为了方便使用者,阿斯达克网络信息有限公司增加了由 Azure OpenAI开发的翻译功能,以帮助用户理解阿斯达克网络信息有限公司平台上的信息中文以外的语言。 翻译后的文字可能会失去一些原本的意义。信息的某些项目(包括包含文字的图像、带字幕的影片、PDF 文件或地图)可能无法翻译,某些功能可能无法在翻译版本中使用。

阿斯达克网络信息有限公司不保证翻译的准确性及完整性,并且翻译后的文本不应被认为是准确的及完整的。 对于因使用翻译功能而造成的任何形式的损害或损失,阿斯达克网络信息有限公司不承担任何责任。

AASTOCKS.com Limited之信息服务基于「现况」及「现有」的基础提供,网站/应用程式的信息和内容如有更改恕不另行通知。AASTOCKS.com Limited有权但无此义务,改善或更正在本网站/应用程式的任何部分之错误或疏漏。

用户在没有AASTOCKS.com Limited明确的书面同意情况下,不得以任何方式复制、传播、出售、出版、广播、公布、传递资讯内容或者利用在本网站/应用程式的信息和内容作商业用途。

投资涉及风险。 阁下可自行决定利用本网站的财金教学作学术参考用途,但 AASTOCKS.com Limited不能并不会保证任何在本网站/应用程式现在或未来的购买或出售评论和讯息会否带来赢利。 过往之表现不一定反映未来之表现,AASTOCKS.com Limited不可能作出该保证及用户不应该作出该假设 。

AASTOCKS.com Limited也许连结订户或访客至其有兴趣的网站,但AASTOCKS.com Limited只提供此服务给订户或访客并不为此安排负责。

AASTOCKS.com Limited对于任何包含于、经由、连结、下载或从任何与本网站/应用程式有关服务所获得之资讯、内容或广告,不声明或保证其内容之正确性或可靠性。对于阁下透过本网站/应用程式上之广告、资讯或要约而展示、购买或取得之任何产品、资讯资料,本公司亦不负品质保证之责任。

AATV是AASTOCKS.com Limited所属的视频网站平台。

阁下确认:(i)AATV只为提供资讯,而不是为了任何交易目的;(ii)AATV节目内容及其提供的资料本身并不构成任何AASTOCKS为售出任何证券。 (iii)AATV并非并存的人或法律实体,在其他司法管辖区或国家使用,而在某处可能因该使用或分发而违反当地法律或法规。

AASTOCKS.com Limited不对任何其他人进行评论,也不会代表AASTOCKS.com有限公司。 (i)AATV的不准确,错误或遗漏,包括但不限于报价和财务数据;(ii)AATV中的节目传输的流量,错误或中断;(iii)阁下由AATV中部节目内容招致任何损失。

我们保留的权利不时更改本免责声明和并存于本网站/应用程序程序的版本更新版本。阁下必须定期定期查阅于本网站/应用程序声明该信息,并确保您及时知悉任何有关的费用。更新后仍可以继续使用本网站/应用程序,即代表代表阁下同意接受更改后的本免责声明的约束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免责声明的中英原文如有任何岐异,一切以英文原文为准。

更新日期为: 2026年2月9日