科金社2025年09月03日 08:25消息,瑞士推出国家级开源大语言模型Apertus,积极参与全球AI竞赛。
9月2日最新消息,全球人工智能竞争中又迎来一位新成员,这次是一个国家。瑞士正式推出其国家级的开源大语言模型(LLM)——Apertus,旨在成为OpenAI等公司所提供模型的替代方案。“Apertus”源自拉丁语,意为“开放”,该模型由瑞士洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETHZurich)以及瑞士国家超级计算中心(CSCS)共同研发,这三家机构均为公立机构。
“当前,Apertus是公共AI模型的领先代表,由公立机构开发,旨在服务于社会公共利益。这是目前最有力的例证——人工智能完全可以像公路、供水、供电一样,成为社会不可或缺的公共基础设施。”推动AI作为公共基础设施的核心倡导者约书亚・谭(Joshua Tan)表示。 在当前技术快速发展的背景下,AI正逐渐从商业工具转变为社会基础设施的一部分。Apertus的出现表明,公共机构有能力在这一领域发挥关键作用,确保技术发展符合公众利益。这种模式不仅有助于减少技术垄断,还能提升透明度与公平性。未来,随着更多类似项目的推进,AI有望真正融入社会运行的基础体系中,为所有人带来更广泛的价值。
瑞士研发团队将Apertus设计为完全开源模式,用户可全程查看其训练过程。除模型本身外,团队还公开了完整的训练文档、源代码以及所使用的数据集。Apertus的研发严格遵守瑞士的数据保护法与版权法,对于希望符合欧洲相关法规的企业而言,这可能是一个更具吸引力的选择。瑞士银行家协会此前曾表示,本土研发的大语言模型具有“巨大的长期潜力”,因为它们更能适应瑞士严格的本地数据保护法规和银行保密制度。目前,瑞士各大银行已在使用其他AI模型来满足业务需求,未来是否会转向Apertus,仍有待观察。 从行业发展趋势来看,开源与合规性正成为大语言模型发展的重要方向。Apertus的出现不仅提供了技术上的透明度,也体现了对数据主权和隐私保护的高度关注。在当前全球对数据安全日益重视的背景下,这类模型或许将在特定领域获得更大的认可与应用空间。
据了解,Apertus向所有用户开放使用,科研人员、AI爱好者以及企业均可基于该模型进行二次开发,根据自身需求定制功能。例如,用户可以利用它构建聊天机器人、翻译工具,甚至教育或培训类应用。该模型的训练数据覆盖1000多种语言,总token量达到15万亿,其中非英语数据占比40%,包括瑞士德语、罗曼什语等瑞士本土语言。瑞士官方表示,该模型的训练仅使用公开可获取的数据,并且在遇到网站上机器可读的“拒绝爬取”请求时,会予以尊重。值得注意的是,此前已有如Perplexity等AI企业被指控非法爬取网站数据,甚至绕过阻止爬虫的协议;一些AI公司也因未经许可使用新闻机构和创作者的内容进行模型训练,而面临法律诉讼。 从行业发展趋势来看,AI模型的开放性和合规性正成为关注焦点。Apertus在数据来源和爬取规范上的做法,为行业提供了一个较为正面的参考案例。然而,随着AI技术的广泛应用,如何在创新与版权保护之间取得平衡,仍是亟需解决的问题。
目前,Apertus推出了两种不同参数规模的版本,分别是80亿参数和700亿参数。用户可以通过瑞士电信(Swisscom)或AI平台HuggingFace获取该模型。这一举措进一步推动了大模型在实际应用中的普及,也为研究人员和开发者提供了更多选择。从技术角度看,不同参数规模的模型能够满足多样化的应用场景,既适合资源有限的环境,也适用于需要强大计算能力的复杂任务。同时,通过与知名企业和平台合作,也体现了该模型在行业内的认可度和影响力。
留言评论
(已有 0 条评论)暂无评论,成为第一个评论者吧!