Copyright 2016-2026 柠檬网 版权所有 意见邮箱:dwzjb123@126.com
人工智能技术蓬勃发展的当下,大模型领域的创新与竞争日益激烈,每一次开源行动都备受瞩目。近期,华为盘古大模型开源后,便陷入了一场抄袭争议的风波。面对网络上质疑盘古大模型抄袭阿里巴巴通义千问模型的声音,华为盘古团队迅速回应,明确表示严格遵循开源许可证要求,坚决维护自身创新成果与开源生态的健康发展。
这场争议的源头,是7月4日发布在代码托管平台GitHub上的一份技术分析报告。一位自称为哥斯达黎加大学的韩国学生,运用“LLM-Fingerprint(大语言模型指纹)”技术,对华为盘古Pro MoE模型(总参数720亿)与阿里巴巴通义千问Qwen-2.5 14B模型展开深度比对。报告显示,两者在“指纹”上的相似度高达0.927,远超出不同独立训练模型间的正常差异范围,由此作者推断盘古Pro MoE模型存在“非独立开发”的可能性。此外,盘古开源代码文件中出现的“Copyright 2024 The Qwen team, Alibaba Group”版权声明,更是让质疑声甚嚣尘上,不少人认为这是盘古模型抄袭通义千问的“铁证”。
面对汹涌的舆论质疑,7月5日,华为盘古Pro MoE技术开发团队——诺亚方舟实验室迅速发表声明。声明指出,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,绝非基于其他厂商模型增量训练而来。在技术创新层面,盘古大模型有着独特的架构设计,它创新性地提出了分组混合专家模型(MoGE)架构,作为全球首个面向昇腾硬件平台设计的同规格混合专家模型,有效攻克了大规模分布式训练中的负载均衡难题,极大提升了训练效率,这无疑彰显了盘古大模型的技术原创性。
对于代码中出现的涉及其他开源大模型的部分开源代码以及相关版权声明,华为盘古团队明确表示,这是对业界开源实践的参考与运用,并且严格遵循了开源许可证的要求。在开源代码文件里清晰标注开源代码的版权声明,不仅是开源社区的通行做法,更是对开源协作精神的践行。在开源的世界里,代码的共享与借鉴是推动技术进步的重要力量,只要遵循规则,便是对知识产权的尊重,对创新生态的维护。华为始终秉持开放创新的理念,尊重第三方知识产权,提倡包容、公平、开放、团结和可持续的开源理念,积极与全球开发者携手共进,共同探索大模型技术的无限可能。
从技术角度分析,仅依据“模型指纹”的标准差相似度来判定抄袭,其科学性存在一定争议。深度学习模型训练过程充满随机性,数据采样、权重初始化及优化路径各不相同,因此单一的“模型指纹”指标难以确凿地证明抄袭行为。业内人士也指出,盘古大模型中使用的开源代码,是遵循开源协议的正常操作。例如,在软件开发中,许多项目都会借鉴开源组件,只要按照开源许可证的规定进行标注和使用,就属于合法合规的行为。