2025 年 7 月 5 日,针对网络上关于盘古大模型疑似抄袭阿里的 Qwen 的质疑,
华为发布声明予以否认。
质疑情况
- 高相似度参数结构:
2025年6月30日,华为宣布开源盘古大模型后,
一项由@HonestAGI发布于GitHub的研究指出,
盘古大模型(Pangu Pro MoE)
与阿里巴巴发布的通义千问Qwen-2.5 14B模型
在参数结构上存在高相似度。
该研究通过测试比较称,
两者在注意力参数分布上的平均相关性高达0.927,
远超其他模型对比的正常范围(业内同类模型对比通常不超过0.7)。
- 开源代码中的版权声明:
在盘古大模型团队官方发布
在国内代码托管平台Gitcode的“盘古Pro”大模型代码中,
其“Open Source Software Notice”
里出现了关于“transformers”组件的版权声明,
提到“Copyright notice:
Copyright 2024 The Qwen team,
Alibaba Group and the HuggingFace Team.
All rights reserved.”,
这被一些网友认为是“实锤”抄袭的证据。
华为盘古团队的回应
- 否认抄袭指控:
盘古大模型团队在GitHub上回应称,其评估方法不科学,
并指出使用论文中描述的方法评估其他模型比较时,
也得到了与Qwen-2.5 14B模型高度相似的结果,
认为该论文和指标缺乏实际意义。
- 强调自主开发与合规使用开源代码:
7月5日,华为诺亚方舟实验室发布声明表示,
盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,
并非基于其他厂商模型增量训练而来,
在架构设计、技术特性等方面做了关键创新。
同时,声明中提到盘古Pro MoE开源模型
部分基础组件的代码实现参考了业界开源实践,
涉及其他开源大模型的部分开源代码,
但团队严格遵循开源许可证的要求,
在开源代码文件中清晰标注了开源代码的版权声明。
事件后续
- HonestAGI的进一步回应:
HonestAGI表示无法信服盘古大模型团队的说法,
并认为盘古仍然显示出最高的相似度。
他们还提供了Qwen和Hunyuan A13B之间的对比数据,
以说明其测试方法没有问题。
不过,HonestAGI似乎已经下线了之前关于盘古大模型的研究报告,
但表示计划在论文最终定稿并提交所有代码后,
将其提交给同行评审会议。
#夏季图文激励计划#
- 目前尚无定论:
目前尚无证据证实盘古大模型存在抄袭阿里Qwen的“实锤”证据,
HonestAGI所发布的质疑论文所采用的测试方法的可靠性也有待进一步验证。