三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

学术出版界也是江湖,同样鱼龙混杂。而SCIgen(以下简称“SCI”)这个程序的诞生,就是为了戏耍那些“野鸡期刊”。

只需输入作者名,电脑就能帮你生成一篇“SCI级别”的计算机论文。摘要、背景介绍、实验结果、图表、讨论以及结论等都一应俱全。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

世上就是有这等美事。只要你想,一口气就能搞个几百篇计算机论文。

尽管SCI只是一个网页程序,但它产出的论文格式可能比一些本科论文还要规范。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

SCIgen界面

不过也别高兴得太早,到目前为止AI还无法取代人类完成科研任务。

别看这些生成的论文有模有样,但根本没有地球人能看得懂。不是因为太高深,内容纯属是“一本正经地胡说八道”

但这并不要紧,因为在学术界总是会有人上当。将这些计算机论文,投稿到一些国际学术期刊还会被录用,极具讽刺意味。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

戏耍“野鸡期刊”

学术出版界也是个江湖,同样鱼龙混杂。并不是所有人,都奔着证明自己或是发现真正有价值的东西而来。而SCIgen这个程序的诞生,就是为了戏耍学术界的那些“野鸡期刊”。

这些只以盈利为目的的野鸡期刊也叫掠夺性期刊(Predatory journals),学术质量与信誉都很低。

他们的日常就是疯狂地给科研人员发送垃圾邮件,以“征集论文”之名吸引那些没有发表经验的学者上当。

一般来说在论文发表前,学术刊物主编会邀请专业领域内有一定造诣的同行学者,评议论文的质量。这也叫同行评议,刊物会按评议结果决定是否发表。

但掠夺性期刊,只要钱到位他们都能安排论文的发表,连审都不用审。

因为日常不堪骚扰,麻省理工学院(MIT)计算机科学与人工智能实验的几个学生就看不过去了。

于是Dan Aguayo、Max Krohn和Jeremy Stribling三人,决定向这种”水”得不行的期刊和会议宣战。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

从左到右分别为Dan Aguayo、Max Krohn和Jeremy Stribling

那时已临近学期末,但这MIT三剑客还是花了一两星期去开发这个小程序。

SCI的原理很简单,有些类似于填词游戏。学术论文的格式是非常相似的,它本身就充满了专业词汇和固定的句式。

而SCIgen则能够从固定的词库中,随机抽取出这类计算机领域内的专业术语,以符合语法的方式生成文本

再加上一些漂亮的图表和详细的参考文献等,就能骗过不少外行。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

SCIgen生成的论文中带有的图表

但这个软件真没多厉害,内行人一看就知道全文是在“胡说八道”。

要怪,就怪一些期刊和会议灌水得太过分了。

不出所料,他们第一篇自动生成的论文就攻破了WMSCI(注:世界系统论、控制论和信息学多国会议)的防线。

这篇论文名为《Rooter:处理接入点与冗余的典型合一方法》,看似高大上其实内容根本不知所云。而WMSCI会议,不但接受了这篇假论文,还邀请作者出席会议作报告。

这下可高兴坏了MIT三剑客。毕竟在这之前,他们就听说WMSCI会议以接受水货著称,但没真想到他们居然这么水。

于是,他们便把SCI攻陷WMSCI的事情经过发到网上。

一波嘲讽下来,这在科研圈立马引起了广泛的关注。毕竟大家早就看不惯这些掠夺性期刊和会议。

这下WMSCI会议是颜面扫地,立马撤回了对他们团队的邀请。

不过,失去报告资格,这三剑客反倒来了兴致。利用在网络上众筹来的2500美金,他们决定将恶作剧升级,搞一波大的。

这三人,长途跋涉地在同一天赶往了会议所在的佛罗里达州奥兰多市。就在大会举办的同一地点,他们租了一块场地,用“假身份”开了一场属于自己的“分会场”。

想要伪装一场学术会议并不难,和论文灌水一样只要有钱就够了。而报告内容用SCIgen就能无限生成,这种垃圾想要多少就有多少。

除此之外,他们还置办了一批假的宣传海报、假名片、假胡子和假发等。反正,这场学术会议的一切都是假的。

但这并不妨碍有人上当,当时来听他们装模作样演讲的人还不少。如果不明真相,或许这些人到现在都仍以为自己是在听WMSCI的报告。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

影响持续

但这场闹剧,并没有随着这场假学术会议的结束而收场。

刚开始,只是IEEE撤销了对WMSCI会议的资助。到后来,越来越多人开始使用SCIgen产出的“钓鱼文”在其他学术期刊“试水”。

现阶段,这三位SCIgen元老已步入职场,深藏功与名。而他们留下的这款软件,则将学术界搅得天翻地覆。

例如,德国的学生利用这款神器,就攻下了2008年和2009年在中国武汉举办的两个IEEE国际会议。

当时,Schlangemann教授就被当成知名学者,还被邀请作为会议的主持人出席。但Schlangemann教授并非真有其人,他只是一个由这位学生创造的虚拟角色。

而这个名字,则源于一部名为Der Schlangemann的德国电影。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

Schlangemann教授还有虚拟的个人网站

现在SCI的访问量依然惊人,每年的浏览量仍超过60万次,无数钓鱼文在源源不断地产出。这导致了这个页面,隔几个月就要崩溃一回。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

狂刷指数

而除了期刊的审核不严格,还存在另一个漏洞。那就是,利用SCI这类垃圾论文软件,竟可以给自己狂刷h指数(H index)。

一名科研人员的h指数,是指他至少有h篇论文被引用了至少h次。这是评价个人学术成就的一个新方法。

例如,某人的h指数是20,这表示他已发表的论文中,每篇被引用了至少20次的论文总共有20篇。

但所谓的H指数,在H index的捣乱下就无法起效了。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

当时,就有人就以“IKE ANTKARE”作为作者名(注意,IKE ANTKARE这人并不存在),用SCIgen生成了102篇垃圾论文。

这让IKE ANTKARE在谷歌学术中的h指数,一下子飙升到了94。他还一度挤进了计算机科学领域科学家中h指数排名的前六。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

“我自己引用自己”,就这样IKE ANTKARE凭一己之力就成了学术界冉冉升起的新星。

当然,IKE ANTKARE这颗学术新星陨落得也很快。因为幕后操作的人已经将自己的一系列骚操作写成论文,对世人公开了IKE ANTKARE的虚拟身份。

随后谷歌学术,就对IKE ANTKARE进行了封杀并删除了他的论文。

事实上,学术钓鱼从上个世纪就已经存在了。

早在1996年,量子物理学家艾伦·索卡尔(Alan Sokal)撰写的一篇科学诈文,就引起了一场“科学大战”

他将一篇充满了常识性错误的论文,投稿至著名的文化研究杂志《社会文本》。标题为《超越界限:走向量子引力的超形式的解释学》。

结果《社会文本》的五位主编,都没有发现这是一篇诈文,还一致通过将文章发表。东窗事发,这立即触发了一场席卷全球的科学大论战,世界众多著名的媒体都参与其中。

三学生开发钓鱼软件,成功忽悠整个学术圈,戏耍“野鸡期刊”

艾伦·索卡尔

相比SCI,艾伦·索卡尔还是比较有诚意的。尽管内容还是一本正经地胡说八道,但论文毕竟还是他自己亲手炮制的。

他将量子物理学中的术语、后现代主义领军人物的术语,还有他自己捏造词句糅合在了一起。于是便得到了一篇毫无学术内涵,但又充满“后现代”风格的诈文。

而作为学术钓鱼的鼻祖,之后的学术钓鱼事件都被称为“索卡尔的平方”。

那么学术钓鱼这个江湖,何时能消失?很简单,只有鱼儿不上钩,钓鱼就会自动失去意义。

-END-

如果你对我们的内容有任何建议或者感兴趣的话题,欢迎点击下方链接留言。


分享到:


相關文章: