- 长臂猿-企业应用及系统软件平台
本文转载自微信公众号:差评(chaping321) “ 周鸿祎为什么总爱聊GPT? ” 这也是人们第一次知道,一个主打安全服务的360公司,居然也在默不作声地 “ 炼丹 ” ,而且看这发布会的召开速度,估计早就炼上了。 他们还给自家的这个产品取了一个看上去相当直白的名字—— 360智脑。 而且和NewBing一样,360智脑主打的就是生成式语言模型 + 联网搜索。 说实话,最近这段时间,国内陆陆续续也发了不少大模型,但落实新搜索应用的还真的一个都没有。 在当初周总的亲自演示中,这个智脑还存在不少错误的,比如这个梅西为国家队踢进了多少个球,重新生成了很多次,就是没有办法答对,甚至旁边的搜索栏都给出答案了。 而且还有一个问题,周鸿祎在发布会上也提到了,因为重视安全的原因,不会有语言模型的连续对话能力。 所以每次提问,如果你想要顺着问题继续问下去,那是没有办法的。 毕竟之前NewBing也是因为连续对话引发了安全问题,在那之后微软就给限制了NewBing的连续对话的能力和每日对话的次数。 根据官方的说法,360智脑作为 “ 新搜索 ” 的落地应用,这个产品的重点,也应该是在信息检索能力和答案准确性、用户体验以及实时性上。 考虑到检索能力和实时性,用已经联网的360智脑来对比不联网的ChatGPT,实在是有点欺负人了。 首先,这个智脑毕竟还是基于大语言模型的产品,所以语义理解能力的测试肯定是少不了。 上来就先给它试一个差评题库里的经典题目:“ 张三差点上上上上海的车 ” 是什么意思? 结果,智脑思维发散,把这句话理解成了逻辑学问题。还请出哲学家罗素说他也曾试图解决这个悖论,而且还没解决。。。看来这一题,智脑是没法得分了。 至于NewBing,回答的就不错,不但理解了意思,甚至还给语句里的四个“上”字,分别解释了它的词性。 到这里我已经有点怀疑,难道所有这种语义理解,360智脑都不行? 倒也不是,因为我又问了智脑一个问题:“ 我觉得奥斯卡颁奖都是假的,因为台下都是主办方请来的演员。” 这个题目,你需要把奥斯卡颁奖都是假的这个结论和台下都是请来的演员逻辑给理清楚,不然就会答非所问。 但是之前刚被我夸过的NewBing嘛。。。这一次反而是拉垮了,他说没找到证据支持我的说法,于是从网上找了一篇新闻,然后瞎答了一通,最后下结论说,台下并不全是请来的演员,完全没理解这个演员的梗。。。 好吧,这样看来,在语义理解上,本不抱有期望的智脑,还算是给了我一点意料之外的惊喜,并不是所有问题都没法理解。 那么再来看看双方的检索能力和答案准确度,我出了三道不同方向的题目,让360智脑和NewBing去回答。 在一些基础知识类的题目上,智脑和NewBing都没有什么压力。 同样的,因为模型样本基于中文,所以涉及到一些中文互联网的梗时,土生土长的360智脑显然更胜一筹。 比如我问道:“ 谁对钱不感兴趣?” 360智脑很好的接下了这个梗,但另一方面NewBing则没有理解这个梗。 免责声明:所载内容来源于互联网,微信公众号等公开渠道,我们对文中观点持中立态度,本文仅供参考、交流。转载的稿件版权归原作者和机构所有,如有侵权,请联系我们删除。 点击查看↓↓ 阿里版ChatGPT突然官宣!我们用16个提问,火速进行了测评……这是上个月底,周鸿祎在展示自家新的大语言模型产品上亲自问的问题。
只是有点没想到的是,第一个推出类NewBing产品的,竟然是360。
所以在测试前,老实说,咱们对它也没抱有多大的期待。
所以在这次测试中,咱们让360智脑只和NewBing对比。
本来,按照上一题的表现,我觉得智脑应该又会扑街,但是结果出乎意料,360智脑意外的答得不错,不仅意识到了句子里的演员的意思,而且还对我进行了一个道歉,说很抱歉听到我对奥斯卡颁奖典礼的真实性存在质疑。
看来咱们自己互联网独有的文化,还得自家的产品才能理解啊 ~
对于这三个回答,不管是智脑还是NewBing,完成的都很出色,不过在后续的几个问题测试中,我又发现了一个问题,就是当你问话的形式不一样意思一样时,360智脑和 NewBing给的答案也会不一样。
相信大家现在有很深的体会,当我们在使用传统搜索的时候,很多时候都没法搜到自己想要的东西,各种各样的链接一大堆,看着都有用,实际上翻找半天都不一定找的到自己想要的信息。
所以谷歌他们对NewBing的恐惧是应该的,搜索广告市场份额每增加1个百分点,每年可带来20亿美元收入。这个份额下降,带来的是实打实的金钱损失。后续各家巨头纷纷推出大模型,就是为的不落伍,为的就是抢占市场。
王慧文的光年之外开张,阿里知乎等四家大模型抢开发布会
ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型
本文来自AI新探索