斯坦福AI团队就抄袭中国大模型事件公开致歉！

据《南华早报》报道，近日一则斯坦福大学学生组成的AI团队抄袭面壁智能大模型的消息在海内外引发了热议。

图源网络

由三位美国斯坦福大学学生组成的AI团队在开源社区中发布了名为“Llama3-V”的模型，该模型一经推出就以其强大的性能吸引了全球关注。然而不久后却受到了多方质疑，因其与此前面壁智能（ModelBest）发布的模型极其相似，不少人认为这是一个“套壳”模型。

抄袭风波之下，团队的两名成员Siddharth Sharma和Aksh Garg在社交媒体上对这一学术不端行为公开致歉，并表示会将Llama3-V模型悉数撤下。

斯坦福AI团队就抄袭中国大模型事件公开致歉！

图源网络

抄袭风波：连“错例”都一样

这场风波起源于5月29日，斯坦福大学的一个研究团队在开源平台GitHub发布了名为“Llama3-V”的模型，声称仅花费不到500美元，就训练出了与 GPT4-V、Gemini Ultra 和 Claude Opus 等尖端人工智能模型相媲美的性能。

发布不久后，该模型就冲上了热门人工智能平台Hugging Face趋势榜的前五名。随着这一模型的热度越来越热，各平台出现了质疑的声音，有人怀疑Llama3-V是在“套壳”清华大学的团队和初创企业面壁智能（ModelBest）联合开发的最新8B多模态小模型MiniCPM-Llama3-V 2.5，且没有在项目中提到任何关于后者的信息。

一名举报者在开源平台GitHub上发布的内容表明，这两个项目的模型结构和代码几乎完全一样。面壁智能的一位联合创始人在社交平台上发文称，已经“比较确信”新模型是对MiniCPM-Llama3-V2.5的“套壳”。他说：“连做错的样例都一样。”

据该联合创始人说到，MiniCPM-Llama3-V2.5 有一个嵌入式功能，即可以识别战国时期（约公元前 475-221 年）的竹简。而这正来源于清华大学2008年获得的2500份战国时期的竹简，面壁智能的团队对这些竹简上的文本内容进行了逐字扫描和注释，以创建一个用于训练的数据集，但该数据集尚未公开，Llama3-V模型却显示出了相同的识别能力。

斯坦福AI团队就抄袭中国大模型事件公开致歉！