一手体验,阿里巴巴版ChatGPT,更智能还是更“智障”?
2023-04-07 20:30:40
  • 0
  • 0
  • 0
  • 0

人工智能产品的“轰炸”一波接一波,这次轮到阿里巴巴了。

上月就传阿里会推出自己的ChatGPT应用,如今传言成真。小郝拿到了这个“通义千问”的测试码,且看它实力几何。

爱搞事的小郝试了试ChatGPT、New Bing等曾犯过的“经典”错误,对比看看,AI是否改进了“智障”翻车的老毛病。

1、唐太宗和赵匡胤打仗的问题,“通义千问”明确了历史时序,没有像其它平台那样一本正经地胡说八道。

2、数学问题:766乘以1356等于多少,“通义千问”回答也没有问题。

3、在鸡兔同笼、青蛙爬井这样的数学应用题上,“通义千问”并没有比其它人工智能更智能,同样回答错误,这块恐怕还需要语义理解和CoT思维链技术的改进。

4、小郝用夹杂错误的提问,让它解读“乔治巴顿拿着苹果iPhone指挥部队”的情况,它编出了一个故事,显然,“通义千问”把iPhone当作当年摩托罗拉生产的SCR无线电话,放了进去。

5、最后,小郝问了一个土味情话,它显然还看不懂“谐音梗”的意义。看来人工智能还不能在这方面替代人。

整体看,“通义千问”有优于其它文生文AI模型的地方,对可能的错误已经有所改进,有“智能”的进化,但在数学应用题解读、财报数据爬取等方面,还和其它平台一样,有改进的空间。

按小郝几个月的AI经验,最好的Prompt(提问)方式是“3W”模式,即What、Who、Want——情况是什么?要扮演什么角色?想让它做什么?

这三点明确,就能提出好问题,AI也会回答得更精准。

总体来说,“通义千问”是让人与AI交互,又向前推进了一步。

同时,从其二级界面来看,“通义千问”更像Notion AI,包含更细分的小学生作文、提纲、写诗等细分功能,其角色定义应该是一个“AI改进工作效率的工具或助理”。

这已经是非常不错结果,至少让阿里巴巴拿到了人工智能的部分船票,比当年抢夺移动互联网船票,多了更多先机。

当然,一切才刚刚开始几个月,AI这场长跑中,阿里巴巴有全球排名第三的云算力支持,资源给力,“通义千问”不愁迭代进化。

事实上,中国要不被卡脖子,需要更多这样的AI玩家,加速快进整个产业的发展。毕竟,咱们距离起跑线不太遥远,真正的世界级角逐,才刚刚开始。

 
最新文章
相关阅读