AI 风暴席卷全球的第三个年头,开源大模型始终是行业重点攻坚目标。截止目前,GUI 开源大模型已经走过概念验证阶段西宁股票配资,逐步向场景调优、端侧部署等生态维度延伸,不仅要拼参数、拼执行力,也要拼场景落地能力,各家大厂的技术竞赛已然进入决胜阶段。
在此阶段,开源与合作是一个绕不开的焦点,7 月 26 日在上海揭幕的世界人工智能大会(WAIC)上,这也是行业贯穿始终的核心议题。
在此次 WAIC 人工智能标准化国际合作论坛上,荣耀作为首批单位,携手阿里、百度等百余家行业领军企业共同发布《智能体协议共建共享联合倡议》,进一步推动行业标准化发展和国际合作。同时,荣耀还带来了全新惊喜:MagicGUI 大模型正式发布并开源。
事实上,国内的大模型开源早已从星星之火演变成燎原之势,前有 DeepSeek-V3、DeepSeek-R1 以千亿参数构筑智能基座,后有阿里、字节、荣耀等科技巨头纷纷加码。对比之下,硅谷众大厂似乎正"逆流"而行,Meta 的 Llama、谷歌的 Gemma 等虽然也开放了部分使用和修改权限,但并未公开训练数据集、仍在限制开发选项,很难称得上真正的开源。
大模型的竞争来到这个阶段,开源的重要意义正在凸显:不仅事关技术平权和产业创新,更是构建 AI 商业生态,加速技术扩散以换取长期价值的关键。要抹平中外发展时间差、在产业落地阶段抢得先机,就要合全行业开发者之力,通过数以亿计的微调催生"链式反应",打破外国巨头的"算力霸权"——开源是必然选择。
在此背景下,荣耀 MagicGUI 面向全球软硬件开发者正式开源。这不仅是荣耀的首个开源 GUI 大模型,也是其"阿尔法战略"的重要里程碑:高达 70 亿的参数规模,基于荣耀 Magic V5 常用场景用机操控准确率达到 91.5%,较业内同类顶级开源模型高出 16.4%,性能足以比肩 SOTA。(SOTA 是 "State of the Art" 的缩写,中文可译为"最先进的",常用于描述某一领域当前技术或模型的最高水平。例如,在人工智能领域,SOTA 模型指在特定任务中性能最优的模型,如数学证明、自然语言处理等方向。)
详细拆解之下,MagicGUI 在 GUI 数据采集框架、知识数据构建方法、动作空间定义等维度都有一系列开创性成果,比如构建了全新的数据采集与构建框架,优化了数据配比与筛选方案,在此基础上构建了多样且高质量的数据集。但其最具突破性的能力,在于对两大训练阶段——继续预训练和强化微调的迭代创新。
首先,在继续预训练阶段,MagicGUI 重点改进数据处理、合成数据等环节,目的是夯实基础能力,全方位提升大模型在推理、规划、动作执行上的综合表现。
比如在数据处理环节中,MagicGUI 通过过滤相似、重复数据,搭配启发式规则和开源模型评估,多重筛选、拦截掉低质数据。合成数据环节同样以提高数据质量为目的,一边结合 UI 元素类别、空间位置、形状等维度合成更全面的 UI 描述数据集,一边优化开源模型,批量合成多难度层次指令数据。
其次,强化微调训练阶段,MagicGUI 采用了极具创新性的采样策略—— GRPO 双重过滤方案。
所谓双重过滤,即静态过滤与动态过滤的结合:一方面,通过静态过滤剔除生成响应中始终给出完全正确 / 错误预测的样本,专注于更有挑战性和信息量的样本;另一方面则借助动态过滤模式,不对全部正确 / 错误的结果进行训练,保证强化微调效果。
技术上的突破有没有价值,不能光靠参数说话,落地到应用侧的效果也是重要检验标准。可喜的是,我们已经能看到荣耀 MagicGUI 借助关键能力突破,落地应用荣耀 Magic V5 等一系列成果,以及对用户实际生活的帮助。
比如通过一语多平台打车功能,用户只需一句话就能在高德、滴滴等主流 APP 自动完成叫车,此外还可以轻松完成打开 APP、修改地址、选择车型等细致的指令。而在这背后,想必少不了 MagicGUI 单步操作等关键能力的进步。
不积跬步无以至千里,GUI 大模型的研发与创新从来不是一蹴而就的,更像是一场比拼耐力的马拉松。在 MagicGUI 的发布,承载着荣耀长期、大力度、毫不保留的资源与人才投入。
当然,展望未来,相信中国科技企业也不会停下继续探索的步伐。目前 GUI 开源大模型仍有不少困扰整个行业的难题有待解决,如 OOD 泛化、安全与隐私保护等。
这些难题既是各大科技巨头的挑战,也是机会。谁能抢先一步取得下一阶段的突破性进展西宁股票配资,谁就更有机会抢到技术话语权——而到最终,技术层面上的创新还是会落地产业、应用,给开发者、用户带去实打实的便利与体验优化。
启泰网提示:文章来自网络,不代表本站观点。