美股
基金
外汇丶加密货币
沪丶深港通
港股
 
 
 
 
 
 
新闻分享
如欲分享新闻,请填写收件人及阁下之电邮,再按「送出」。*必需填写
收件者电邮*
请用分号「;」分隔不同电邮地址,例子:a@a.com; b@b.com
阁下之电邮*
分享内容
明略科技(2718.HK)双开源背后的战略逻辑:端侧模型基础设施才是 Agentic AI 的下一块拼图
2026年3月底,Ollama宣布其Mac版本的底层推理引擎从沿用多年的llama.cpp切换为苹果的MLX框架。这则消息在开发者社区引发了远超技术更新本身的讨论——它意味着,Mac正在从"连接云端的...
重设
送出
视窗将於5秒内关闭
明略科技(2718.HK)双开源背后的战略逻辑:端侧模型基础设施才是 Agentic AI 的下一块拼图
有连云新闻
推荐
0
利好
0
利淡
0
 
 

2026年3月底,Ollama宣布其Mac版本的底层推理引擎从沿用多年的llama.cpp切换为苹果的MLX框架。这则消息在开发者社区引发了远超技术更新本身的讨论——它意味着,Mac正在从"连接云端的终端"变成"独立运行AI的工作站"。

数字佐证了这一趋势的力度。在搭载M5芯片的Mac上,切换到MLX后,prefill速度提升超过57%,生成速度接近翻倍,部分场景下TTFT(首个token等待时间)缩短至原先的四分之一。当Apple Silicon的统一内存架构遇上为其专门设计的推理框架,端侧AI的性能瓶颈正在被重新定义。

但一个更细节的问题随之浮出水面。MLX目前支持的量化模式W4A16和W8A16只对模型"权重"进行了压缩,计算过程中的"激活值"仍以FP16格式运行。这意味着,苹果从M5芯片开始在每个GPU核心中嵌入的Neural Accelerator——一个专为INT8运算设计的硬件加速单元——并没有被充分调动。硬件能力到位了,软件层还差一块拼图。

端侧推理的"水电煤":Cider做了什么

就在这个时间节点,明略科技以两个开源项目给出了回应。其中,Cider推理加速SDK直接切入MLX生态尚未覆盖的激活量化领域,补齐了W8A8和W4A8两条量化路径。

技术层面,Cider的思路很直接:既然Apple Silicon有INT8硬件加速能力,那就把激活值也量化到INT8,让Neural Accelerator真正被用起来。实测数据显示,在W8A8模式下,Cider单算子速度比原生MLX提升1.4-1.9倍;在W4A8模式下,权重内存占用降低50%的同时,性能同样获得显著提升。对于视觉语言模型(VLM),Qwen3-VL-4B的预填充速度提升17%-22%,更小的Qwen3-VL-2B提升幅度达到57%-61%。

更值得关注的是精度表现。在W8A8量化模式下,模型的困惑度(PPL)与FP16原始精度相比差距仅为0.03——几乎可以忽略不计。这意味着加速不以牺牲模型能力为代价。

从工程化角度,Cider选择了极简接入路径:一行代码即可完成模型转换,兼容Qwen、Llama、Mistral等主流开源模型架构。此外,Cider还在实验性地探索ANE(Apple Neural Engine)与GPU的异构协同推理,在M4芯片上已实现额外3%-17%的加速。

从"跑得动"到"跑得好用":Mano-P的端侧Agent验证

如果说Cider解决的是"端侧模型如何跑得更快"的问题,那么同步开源的Mano-P则回答了一个更根本的疑问:端侧模型能不能真的干活?

Mano-P是明略科技自研的端侧GUI-VLA智能体模型。它通过纯视觉方式理解并操作图形界面——不依赖API对接,不局限于浏览器场景,可以直接操作桌面软件、网页系统及复杂图形化工作流。在Apple Silicon设备上,Mano-P以4.3GB峰值内存即可运行,M4 Pro上预填充速度达到476 tokens/s,解码速度76 tokens/s。

这组数据的意义在于:它证明了一个足够强的端侧模型,配合底层推理框架的优化,完全可以在消费级硬件上实现"数据不出设备"的AI智能体操作。这不是实验室里的论文结论,而是一个可复现的工程方案。

为什么是"基础设施"而不是"应用"

明略科技此次选择开源的不是一个成品应用,而是一套基础设施——推理加速框架加上端侧模型。这个选择背后有清晰的战略逻辑。

Agentic AI的落地正在从"云端调用大模型"向"端云协同"演进。在这个过程中,端侧需要自己的推理基础设施:足够快的推理引擎、足够小但足够强的模型、以及足够低的部署门槛。谁先把这层基础设施铺好并形成生态,谁就在Agentic AI的下一阶段占据有利位置。

从明略科技的业务版图来看,这并非一个孤立的技术动作。其Mano模型家族已经在OSWorld榜单专用模型领域排名全球第一(72B版,58.2%准确率),此次4B端侧版的开源,将"跑分能力"转化为"可部署能力",打通了从研究到落地的最后一公里。

对于整个行业而言,端侧模型基础设施的成熟,意味着Agentic AI不再是一个必须依赖高昂云端算力的方案。当一台Mac mini就能运行完整的AI智能体工作流,AI Agent的部署成本和隐私边界都将被重新划定。这或许正是明略科技选择在此时开源的深层考量——不只是贡献代码,而是定义端侧AI生态中一层关键的基础设施标准。

新闻来源 (不包括新闻图片): 有连云
 
网站地图
支援电邮: support@aastocks.com
阿斯达克网络信息有限公司 (AASTOCKS.COM LIMITED) 版权所有,不得转载
免责声明
阁下明确同意使用本网站/应用程式的风险是由阁下个人承担。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均竭力确保所提供资讯的准确和可靠度,但不能保证其绝对准确和可靠,且亦不会承担因任何不准确或遗漏而引起的任何损失或损害的责任(不管是否侵权法下的责任或合约责任又或其他责任)。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均对资讯不作任何明示或隐含的要约、陈述或保证(包括但不限于可销售性及特殊用途合适性的资讯保证) 。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、或其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商不会就任何原因导致的中断、不准确、错误或遗漏或因此而造成的任何损害赔偿(不论直接或间接、相应而生、惩罚性或惩戒性)对任何人承担责任。

AASTOCKS.com Limited不负责,亦不承担任何由于不可抗力的事故或在AASTOCKS.com Limited不可合理控制的情况下导致的损失或损害,如台风、暴雨、其他自然灾难、政府或有关机构的限制、骚动、战争、病毒爆发,网络故障或电信故障,引致AASTOCKS.com Limited不能履行协议内的责任或提供服务。

Morningstar免责声明:版权所有©2020 Morningstar,Inc。保留所有权利此处包含的资料,数据,分析和意见(“信息”):( 1)包含Morningstar及其内容提供者的专营资料;(2)除特别授权外,不得复制或转载;(3) 不构成投资建议;(4)仅供参考,(5)并未为所载资料的完整性,准确性及时间性作出保证.Morningstar对于阁下使用任何相关资料而作出的任何有关交易决定,伤害及其它损失均不承担 任何责任。请在使用所有资料前作出核实,并且在咨询专业投资顾问意见前勿作任何投资决定。过往业绩并不代表将来表现,任何投资项目的价值及所得收入皆可升可跌。

本网站/应用程式包含的内容和信息乃根据公开资料分析和演释,该公开资料,乃从相信属可靠之来源搜集,这些分析和信息并未经独立核实和AASTOCKS.com Limited并不保证他们的准确性、完整性、实时性或者正确性。

在本网站/应用程式的资料、金融市场数据、报价、图表、统计数据、汇率、新闻、研究、分析、购买或者出售评分、财金教学及其他资讯仅作参考使用,在根据资讯执行证券或任何交易前,应咨询独立专业意见,以核实定价资料或获取更详细的市场信息。AASTOCKS.com Limited不应被视为游说任何订户或访客执行任何交易,阁下须为所有跟随在本网站/应用程式的资料、评论和购买或出售评分执行的交易负责。

为了方便使用者,阿斯达克网络信息有限公司增加了由 Azure OpenAI开发的翻译功能,以帮助用户理解阿斯达克网络信息有限公司平台上的信息中文以外的语言。 翻译后的文字可能会失去一些原本的意义。信息的某些项目(包括包含文字的图像、带字幕的影片、PDF 文件或地图)可能无法翻译,某些功能可能无法在翻译版本中使用。

阿斯达克网络信息有限公司不保证翻译的准确性及完整性,并且翻译后的文本不应被认为是准确的及完整的。 对于因使用翻译功能而造成的任何形式的损害或损失,阿斯达克网络信息有限公司不承担任何责任。

AASTOCKS.com Limited之信息服务基于「现况」及「现有」的基础提供,网站/应用程式的信息和内容如有更改恕不另行通知。AASTOCKS.com Limited有权但无此义务,改善或更正在本网站/应用程式的任何部分之错误或疏漏。

用户在没有AASTOCKS.com Limited明确的书面同意情况下,不得以任何方式复制、传播、出售、出版、广播、公布、传递资讯内容或者利用在本网站/应用程式的信息和内容作商业用途。

投资涉及风险。 阁下可自行决定利用本网站的财金教学作学术参考用途,但 AASTOCKS.com Limited不能并不会保证任何在本网站/应用程式现在或未来的购买或出售评论和讯息会否带来赢利。 过往之表现不一定反映未来之表现,AASTOCKS.com Limited不可能作出该保证及用户不应该作出该假设 。

AASTOCKS.com Limited也许连结订户或访客至其有兴趣的网站,但AASTOCKS.com Limited只提供此服务给订户或访客并不为此安排负责。

AASTOCKS.com Limited对于任何包含于、经由、连结、下载或从任何与本网站/应用程式有关服务所获得之资讯、内容或广告,不声明或保证其内容之正确性或可靠性。对于阁下透过本网站/应用程式上之广告、资讯或要约而展示、购买或取得之任何产品、资讯资料,本公司亦不负品质保证之责任。

AATV是AASTOCKS.com Limited所属的视频网站平台。

阁下确认:(i)AATV只为提供资讯,而不是为了任何交易目的;(ii)AATV节目内容及其提供的资料本身并不构成任何AASTOCKS为售出任何证券。 (iii)AATV并非并存的人或法律实体,在其他司法管辖区或国家使用,而在某处可能因该使用或分发而违反当地法律或法规。

AASTOCKS.com Limited不对任何其他人进行评论,也不会代表AASTOCKS.com有限公司。 (i)AATV的不准确,错误或遗漏,包括但不限于报价和财务数据;(ii)AATV中的节目传输的流量,错误或中断;(iii)阁下由AATV中部节目内容招致任何损失。

我们保留的权利不时更改本免责声明和并存于本网站/应用程序程序的版本更新版本。阁下必须定期定期查阅于本网站/应用程序声明该信息,并确保您及时知悉任何有关的费用。更新后仍可以继续使用本网站/应用程序,即代表代表阁下同意接受更改后的本免责声明的约束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免责声明的中英原文如有任何岐异,一切以英文原文为准。

更新日期为: 2026年2月9日