一手体验，阿里巴巴版ChatGPT，更智能还是更“智障”？-郝闻郝看的专栏

一手体验，阿里巴巴版ChatGPT，更智能还是更“智障”？

2023-04-07 20:30:40栏目：默认栏目 IP属地：IP未知

人工智能产品的“轰炸”一波接一波，这次轮到阿里巴巴了。

上月就传阿里会推出自己的ChatGPT应用，如今传言成真。小郝拿到了这个“通义千问”的测试码，且看它实力几何。

爱搞事的小郝试了试ChatGPT、New Bing等曾犯过的“经典”错误，对比看看，AI是否改进了“智障”翻车的老毛病。

1、唐太宗和赵匡胤打仗的问题，“通义千问”明确了历史时序，没有像其它平台那样一本正经地胡说八道。

2、数学问题：766乘以1356等于多少，“通义千问”回答也没有问题。

3、在鸡兔同笼、青蛙爬井这样的数学应用题上，“通义千问”并没有比其它人工智能更智能，同样回答错误，这块恐怕还需要语义理解和CoT思维链技术的改进。

4、小郝用夹杂错误的提问，让它解读“乔治巴顿拿着苹果iPhone指挥部队”的情况，它编出了一个故事，显然，“通义千问”把iPhone当作当年摩托罗拉生产的SCR无线电话，放了进去。

5、最后，小郝问了一个土味情话，它显然还看不懂“谐音梗”的意义。看来人工智能还不能在这方面替代人。

整体看，“通义千问”有优于其它文生文AI模型的地方，对可能的错误已经有所改进，有“智能”的进化，但在数学应用题解读、财报数据爬取等方面，还和其它平台一样，有改进的空间。

按小郝几个月的AI经验，最好的Prompt（提问）方式是“3W”模式，即What、Who、Want——情况是什么？要扮演什么角色？想让它做什么？

这三点明确，就能提出好问题，AI也会回答得更精准。

总体来说，“通义千问”是让人与AI交互，又向前推进了一步。

同时，从其二级界面来看，“通义千问”更像Notion AI，包含更细分的小学生作文、提纲、写诗等细分功能，其角色定义应该是一个“AI改进工作效率的工具或助理”。

这已经是非常不错结果，至少让阿里巴巴拿到了人工智能的部分船票，比当年抢夺移动互联网船票，多了更多先机。

当然，一切才刚刚开始几个月，AI这场长跑中，阿里巴巴有全球排名第三的云算力支持，资源给力，“通义千问”不愁迭代进化。

事实上，中国要不被卡脖子，需要更多这样的AI玩家，加速快进整个产业的发展。毕竟，咱们距离起跑线不太遥远，真正的世界级角逐，才刚刚开始。