2023年6月,韩国科学部发起“国产AI模型大赛”,旨在3年内打造性能达OpenAI、谷歌95%水平的“纯韩技术”大型AI模型,并承诺为优胜企业提供政府数据、人才及AI芯片资源,以减少对中美技术的依赖。然而,计划推进不足一年,便因“抄袭”争议陷入舆论漩涡。
比赛五强企业中,有三家被曝使用中美开源代码。其中,初创公司Upstage的参赛模型Solar Open 100B被竞争对手Sionic AI CEO高锡贤在LinkedIn公开指控,称其与智谱AI的GLM 4.5 Air模型相似度达96.8%,且代码中残留版权标记。高锡贤质疑Upstage“用纳税人资金交伪国产作业”,暗示其仅对开源模型进行微调包装。

面对指控,Upstage立即召开直播验证会,CEO金圣勋展示训练日志,证明核心模型从零开始训练,仅推理框架采用智谱AI的开源组件。他解释,模型LayerNorm数值高度相似是因大型语言模型若使用相近的Transformer或MoE架构,并以类似数据训练,最终统计特征会自然收敛至近似结果。次日,高锡贤公开道歉,承认未充分验证便发起指控“欠妥”。
Upstage事件后,其他决赛企业遭深度审查。Naver的视觉与音频编码器被指与阿里巴巴“通义千问”设计相似,SK Telecom的推理代码则疑似与DeepSeek模型“撞车”。两家公司均承认使用开源模块,但强调核心训练引擎自主开发,外部组件仅作标准化处理,属行业通用做法。
首尔大学AI研究院院长李在儒公开支持涉事企业,称被质疑模型“均从零开始训练,未直接复制外国模型权重”。但舆论质疑声未消:若开源代码占比过高,韩国“主权AI”战略是否名存实亡?

“自主AI是否需完全自写每行代码?”成为学界焦点。哈佛大学教授韦巨贤直言:“要求100%自研不现实,放弃开源等于丢弃技术红利。”但反对派警告,即使仅使用外围代码,也可能引入后门风险或供应链依赖,削弱战略意义。
目前,比赛规则未明确禁止使用开源代码,科学部也未出台新指引。部长裴庆勋仅表示“乐见技术辩论”,称“韩国AI未来光明”。
评论指出,Upstage风波暴露韩国AI生态两大问题:一是竞赛规则对开源使用的界定模糊,二是政府、企业与学界对“独立模型”定义缺乏共识。此次争议或倒逼韩国重新审视“主权AI”战略,平衡技术自主与国际合作的关系。