自2月24日至3月1日,DeepSeek启动了“开源周”,连续开源了FlashMLA、DeepEP、DeepGEMM、Optimized Parallelism Strategies(DualPipe & EPLB)、3FS和Smallpond、DeepSeek-V3/R1推理系统这几大核心技术项目【1】,公开了模型架构、参数及部分训练框架等,旨在通过透明化分享技术成果推动AI行业发展。
然而,随着开源的普及,部分企业开始将其视为营销工具或商业策略,导致“开源”的定义逐渐模糊。美国非营利组织开放源代码促进会(“OSI”)曾指出,当前科技巨头对于“开源”一词的使用已变得毫无意义,许多公司发布的所谓“开源”产品实际上存在诸多限制,无法真正体现开源的核心精神。
更现实的问题是,训练一个顶级AI模型,尤其是能够与OpenAI等领先公司并驾齐驱的系统,所需的资金通常高达数十亿美元,这导致企业不愿完全开放技术。
OSI自2022年起启动了全球范围的开源AI定义倡议,广泛征求学术界、企业界、法律界以及非营利组织的意见,旨在制定一套标准化的开源AI定义。这一倡议的目标是,推动全球科技界和政策制定者达成共识,从而确保开源AI能够促进技术创新的同时,避免滥用与不负责任的行为。
根据OSI发布的《The Open Source AI Definition – 1.0》,开源AI应具备以下四项自由:
• 使用自由:用户可以出于任何目的使用该系统,无需获得额外许可。
• 研究自由:用户可以研究系统的工作原理并检查其组件。
• 修改自由:用户可以根据需要修改系统,包括更改其输出。
• 共享自由:用户可以出于任何目的将系统分享给他人使用,无论是否修改。
OSI对开源AI的定义也受到了业界的质疑,部分人士认为OSI降低了开源的标准。当前,该定义尚处于讨论阶段,但业界普遍认同:AI大模型的开源与传统软件开源在本质上存在显著差异,无论是从技术发展的推动力还是实际操作的可行性角度来看,开源AI的标准可能会比传统开源软件更加灵活,以应对AI技术的复杂性和潜在风险。
作者:
高级合伙人 沈建人律师