韩国AI大赛惊现代码雷同门：五强模型三款涉嫌套用中国开源项目

代码照搬还是创意巧合？韩国AI大赛五强三甲被曝直接复刻中国开源模型，开源界掀起信任风暴

2026-01-14 21:36 AI人工智能阅读: 1928

韩国AI大赛、代码雷同、开源项目、中国

韩国AI大赛五强中三款模型被曝套用中国开源代码，引发版权与原创性争议。

　　去年六月，韩国政府发起一项国家级竞赛，旨在开发基于韩国技术的全新独立人工智能基础模型。在当前全球AI格局由中美科技企业深度主导的背景下，此举被视为保障韩国技术主权、维护产业链安全与战略自主的关键一步。

韩国AI大赛惊现代码雷同门：五强模型三款涉嫌套用中国开源项目

　　然而最新实践表明，“独立自主”并非仅靠政策决心与资金投入即可达成——技术路径的现实复杂性正迅速浮出水面。

韩国AI大赛惊现代码雷同门：五强模型三款涉嫌套用中国开源项目

　　财联社去年8月报道，韩国科学技术信息通信部正式公布“自主AI基础模型”项目首批入围团队，共五家：Naver Cloud、Upstage、SK Telecom、NC AI及LG AI研究院。该项目周期为三年，目标是打造韩国版“AI国家队”，最终于2027年前遴选出两家胜出企业，其模型性能须达到OpenAI或谷歌同类产品的95%以上水平。胜出者将获得持续财政支持、优先采购国产AI芯片资格，并承担国家关键场景的模型部署任务。

　　但近期调查发现，五家入围企业中已有三家被证实使用了部分外国开源AI模型代码，其中尤以中国模型为主——包括智谱AI（Zhipu AI）、阿里巴巴通义实验室及DeepSeek的相关开源组件。这一事实引发韩国国内关于“技术自主”定义边界的激烈辩论：究竟何为“本国模型”？是核心训练架构自研即算自主，还是从数据预处理、训练框架、推理引擎到部署工具链必须全栈国产化？

　　争议最早集中于Upstage公司。其竞争对手Sionic AI首席执行官Ko Suk-hyun在领英公开质疑，指出Upstage某款提交至政府项目的模型中，存在与智谱AI开源模型高度相似的模块结构，且部分推理代码仍保留原始版权标识。“令人深感遗憾的是，一个疑似基于中国模型微调的版本竟被提交至纳税人资助的项目中。”该言论迅速引爆舆论。Upstage随后举行直播技术验证，展示其模型训练日志与参数初始化过程，强调主干网络为从零构建；但亦坦承，在推理层采用了智谱AI开源的vLLM兼容组件——而该组件本身已被全球数百个项目广泛集成，属行业通用基础设施。

　　这一事件触发连锁审查。Naver被指其多模态模型中的视觉编码器（ViT变体）与音频编码器（Whisper风格架构）与阿里通义听悟及OpenAI Whisper存在显著同源特征；SK Telecom则被曝其推理服务代码与DeepSeek-V2开源实现高度趋同。两家企业均未否认使用外部开源模块，但强调：模型的核心训练范式、损失函数设计、知识蒸馏策略及韩语专用对齐机制均为自主研发，外部组件仅用于工程加速与生态兼容。

　　值得深思的是，韩国科学技术信息通信部自始至终未在竞赛规则中明文禁止使用外国开源代码。规则聚焦于“模型所有权归属”“核心技术自主率”及“韩语能力基准”，却对底层工具链来源保持沉默。这种有意留白，既反映政策制定者对开源协作现实的务实认知，也暴露出在“主权AI”概念快速升温过程中，制度设计尚未跟上技术演进节奏的典型困境。

　　哈佛大学电气工程教授Gu-Yeon Wei就此评论：“要求所有代码100%国产，等同于要求汽车制造商拒绝使用任何国际标准螺栓——这不叫自主，叫自我隔绝。”他强调，真正决定AI模型主权性的，是数据主权、训练逻辑控制权与模型更新主导权，而非每一行代码的国籍。首尔国立大学人工智能研究院院长Jae W. Lee亦指出，当前受质疑的模型在权重初始化、梯度更新路径、韩语语法约束注入等关键环节均无外部模型痕迹，核心智能生成机制确属本土原创。

　　但安全隐忧同样真实存在。多位韩国国防科技研究院专家私下表示，若未来军用AI系统依赖含境外开源组件的商用模型，其反向调试接口、日志上传行为或潜在后门风险将难以彻底审计。技术自主的终极目标，从来不是“不用外国代码”，而是“能随时替换、能完全掌控、能自主迭代”。目前韩国五强团队在核心算法层的突破值得肯定，但在工具链可控性、开源依赖图谱透明度、国产替代路线图等方面，尚缺乏系统性披露与第三方验证机制。

　　按原定计划，韩国政府将于本周内从五家决赛入围者中淘汰一家。这场淘汰赛已远超技术比拼范畴，它正在成为韩国审视自身AI发展哲学的一次压力测试：当“主权”遭遇“效率”，当“安全”碰撞“开放”，一个技术后发国家该如何在夹缝中走出第三条路？裴庆勋副总理称“目睹论战反而看到光明前景”，此言未必乐观，却足够清醒——真正的技术主权，始于敢于直面矛盾，而非回避争议。