据《南华早报》报道,近日一则斯坦福大学学生组成的AI团队抄袭面壁智能大模型的消息在海内外引发了热议。
图源网络
由三位美国斯坦福大学学生组成的AI团队在开源社区中发布了名为“Llama3-V”的模型,该模型一经推出就以其强大的性能吸引了全球关注。然而不久后却受到了多方质疑,因其与此前面壁智能(ModelBest)发布的模型极其相似,不少人认为这是一个“套壳”模型。
抄袭风波之下,团队的两名成员Siddharth Sharma和Aksh Garg在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
图源网络
抄袭风波:连“错例”都一样
这场风波起源于5月29日,斯坦福大学的一个研究团队在开源平台GitHub发布了名为“Llama3-V”的模型,声称仅花费不到500美元,就训练出了与 GPT4-V、Gemini Ultra 和 Claude Opus 等尖端人工智能模型相媲美的性能。
发布不久后,该模型就冲上了热门人工智能平台Hugging Face趋势榜的前五名。随着这一模型的热度越来越热,各平台出现了质疑的声音,有人怀疑Llama3-V是在“套壳”清华大学的团队和初创企业面壁智能(ModelBest)联合开发的最新8B多模态小模型MiniCPM-Llama3-V 2.5,且没有在项目中提到任何关于后者的信息。
一名举报者在开源平台GitHub上发布的内容表明,这两个项目的模型结构和代码几乎完全一样。面壁智能的一位联合创始人在社交平台上发文称,已经“比较确信”新模型是对MiniCPM-Llama3-V2.5的“套壳”。他说:“连做错的样例都一样。”
据该联合创始人说到,MiniCPM-Llama3-V2.5 有一个嵌入式功能,即可以识别战国时期(约公元前 475-221 年)的竹简。而这正来源于清华大学2008年获得的2500份战国时期的竹简,面壁智能的团队对这些竹简上的文本内容进行了逐字扫描和注释,以创建一个用于训练的数据集,但该数据集尚未公开,Llama3-V模型却显示出了相同的识别能力。
图源网络
他还表示,没有算法、数据和模型的全球开源共享,就不可能实现人工智能的快速发展。面壁智能的模型也使用了Meta最新的开源Llama 3作为基础,但开源共享的基石是遵守协议、信任其他贡献者以及尊重和承认先驱者的工作,而斯坦福团队 “严重破坏了这些基石”。
公开致歉,撤下抄袭模型
抄袭风波之下,团队的两名成员Siddharth Sharma和Aksh Garg在社交媒体X上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
图源网络
这一抄袭案件在社交媒体上掀起了轩然大波,也引发了人们对中国AI发展与进步的更广泛的讨论。
人工智能研究实验室谷歌DeepMind的研究员Lucas Beyer在社交平台上发表文章评论说“这样好的一个模型,早已现世,但却鲜少有人关注,因为它不是来自于常青藤大学,而是来自中国实验室。”
图源网络
面壁智能的联合创始人也在朋友圈中写到,诚然中国的生成式人工智能模型与索拉和 GPT-4 等西方顶级项目之间存在 “巨大 ”差距,但中国已经 “从十多年前的无名小卒迅速成为人工智能技术创新的主要推动者”。