今天网上讨论最烈是刘大可抨击百度“文心一格”作图工具的帖子,他沿用了安替的方法,把英文有歧义,中文无歧义的词输进去作图。图1:“起重机”,英文是crane,有鹤的意思。图2:“一可以豆子”,中文里不是人话,但机翻英文one can bean,是“一罐头豆子”,画出来果真如此。图3:“牛肉可以”,同理罐头牛肉。

刘大可的发现(续):图4:“满冰箱可以”,同理,画出满冰箱罐头。图5:“羊肉和驴肉”,由于国外不吃驴肉,所以最后画出挂着羊肉长着羊毛的驴。图6:“土耳其张开翅膀”,画出来的是火鸡(turkey)。图7:“水瓜”,画出来的是西瓜(watermelon)。显示百度是将中文词硬翻为英文(翻译功能也不行)后作画。

刘大可的发现(续2):图8:“牛奶路”,画出银河“Milky way”。图9:“云中的平面”,画出飞机“plane in cloud”。图10:“金色的摔倒”,画出秋天“golden fall”。图11:“中国论文”,画出山水画,实际上是表现宣纸“Chinese Paper”。显示百度是将中文词用很次的机翻译为英文后作画。

刘大可的发现(续3):图12:“中国纸”,由于之前“中国论文”可以因被译为“Chinese paper”而画为山水画系猜想,这次用“中国纸”测试,发现果然如此。图13:法国粉笔,画出的是法国碳粉素描“French chalk”。图14:“树叶封面苹果”,画出树叶覆盖(cover)苹果。

刘大可据此认为,百度“文心一格”和汉芯、鸿蒙一样:是套壳、画皮、造假。即挂载一个翻译软件译成英文后接入某个英文的作图工具中生成。当然也有可能是拿开源工具是英文语料训练的(比如因为图片库里有中文标注的少)。但无论如何并非自主研发。

对网上层出不穷的冒出来的类似指控,百度一边修改这些问题(以上bug现在有一些已不再复现),一边辟谣称:文心跨模态大模型ERNIE-VilG不是文心一言,是使用全球互联网公开数据,以行业惯例训练的。正在不断改进中。