新加坡国家AI计划倒向中国大模型 弃用Meta转投阿里千问
11月26日消息,据媒体报道,新加坡国家人工智能计划(AISG)正迎来一次关键的战略转向。在其最新的东南亚语言大模型项目中,AISG放弃了Meta的模型,转而采用阿里巴巴的通义千问(Qwen)开源架构。这一选择不仅反映了技术路线上的重新考量,也标志着中国开源AI模型在全球影响力扩展中的重要一步。
11月25日,AISG发布了基于Qwen架构的“Qwen-SEA-LION-v4”模型,该模型迅速登顶一项衡量东南亚语言能力的开源榜单。此举旨在解决长期困扰该地区的语言适配难题——以Meta的Llama系列为代表的西方开源模型,在处理印尼语、泰语、马来语等区域性语言时表现欠佳,严重制约了本地化AI应用的开发效率。
尽管Llama在开源模型中性能领先,但其“英语中心主义”的底层设计难以根本改变,在处理泰语、缅甸语等非拉丁语系文字时效率极低。AISG逐渐认识到,依赖硅谷的开源模型并非东南亚国家的最优解,必须寻找真正具备多语言理解能力、尤其是亚洲语言语境的基础模型。
在这一背景下,AISG最终将目光投向了中国,选择以阿里的Qwen3-32B作为新一代Sea-Lion模型的基座。
与西方模型不同,Qwen3在预训练阶段就使用了高达36万亿个token的数据,覆盖全球119种语言和方言。这种“原生多语言能力”使其不仅“认识”印尼语、马来语等文字,更能从底层理解其语法结构,大幅降低了AISG后续训练的技术门槛。
为更好地适配东南亚语言独特的书写习惯,Qwen-Sea-Lion-v4摒弃了西方模型常用的“句子分词器”,转而采用更先进的字节对编码(BPE)分词器。该技术能更精准地切分泰语、缅甸语等无空格语言中的字符,显著提升翻译准确度与推理速度。
除技术优势外,商业落地的现实考量也是阿里胜出的关键。东南亚地区拥有大量中小企业,难以承担昂贵的H100 GPU集群。而经过优化的Qwen-Sea-Lion-v4可在配备32GB内存的消费级笔记本电脑上流畅运行,使普通开发者也能在本地部署这一国家级模型。这种“工业级能力、消费级门槛”的特性,精准契合了该地区算力资源稀缺的痛点。
此次合作并非单向技术输出,而是一次深度的双向融合。根据协议,阿里提供了强大的通用推理底座,AISG则贡献了其经过清洗的1000亿个东南亚语言token。这些数据完全规避版权风险,且东南亚内容浓度高达13%,是Llama2的26倍。
在Sea-Helm评估榜单中,搭载阿里技术核心的Sea-Lion v4迅速登顶同量级开源模型榜首,验证了这一战略合作的技术价值与区域适配性。
本文转载于快科技,文中观点仅代表作者个人看法,本站只做信息存储
阅读前请先查看【免责声明】本文来自网络或用户投稿,本站仅供信息存储,无商业用途。若本文侵犯了原著者的合法权益,可联系我们进行处理。转载请注明出处:https://m.cd100.cn/news/18457.html
推荐阅读
-
网飞竞购华纳
-
黄仁勋透露“心酸往事”:NVIDIA首款AI超算只有马斯克敢下单
-
“AI教父”警告:盖茨、马斯克没说错 数百万劳动者将被时代抛弃
-
演员李乃文现身华为门店体验手机 不巧刚拿手机就出现小插曲
-
朱啸虎称外卖大战意义不是很大:三败俱伤
-
妈妈的拼多多评价里全是自己 网友:这才是网购最初的意义
-
偷税247.48万元!人民网锐评陈震偷税:挑战法律这你受得了吗
-
豆包语音识别模型2.0发布:能听懂字看懂图 支持13种外语
-
游客在老君山山顶点外卖 外地小哥为300块赶赴送单 结果没找见顾客
12月5日消息,近日,一则游客在河南老君山的山顶点外卖视频引发关注。事情起因是这样的,一位游客身处老君山山顶时,突发奇想点了份外卖...
-
OPPO高管陈希评饿了么更名淘宝闪购:安卓图标在桌面上找不着了


