众力资讯网

跟美国怎么比?真的是为国产AI大语言模型捏一把汗!   阿里的通义千问、腾讯的混

跟美国怎么比?真的是为国产AI大语言模型捏一把汗!   阿里的通义千问、腾讯的混元、科大讯飞的星火认知、背靠清华大学的智谱AI、百川智能,目前它们都是属于“不及格”的水平。相较而言,在“及格”水平以上的国产AI模型恐怕是,百度的文心一言、字节跳动的豆包。   对于这样一个提问:我们知道一个程序员一天可以写1024行代码,一个汽车智能驾驶系统估计需要有2千万行代码,我需要在一年内开发出一套这样的高质量系统,请问需要多少程序员?   OpenAI的GPT-4回答得最好,能够根据人类真实世界的实际情况,进行合乎逻辑的推理和运算。其次就要属微软Bing Chat,直接从人类现实世界角度出发和作答,虽然没有进行数学运算,但依然是较为令人满意的参考。谷歌Bard给出的答案,就显得十分勉强。最起码,OpenAI的GPT-4和微软Bing Chat表现出了智能的特征。   再回过头来看国产AI大模型。百度文心一言直接当成小学算术应用题目进行处理,整个推理和运算过程详细、清晰且正确。字节跳动豆包则学会了从实际角度考虑和作答,跟微软Bing Chat一样回避了数字运算(认为这样的数学运算并无多大意义)。而阿里通义千问、腾讯混元、科大讯飞星火认知、智谱AI ChatGLM、百川智能,它们暴露出来的问题包括,语言表述在逻辑上混乱,推理和运算错误,等等。 只用一个提问来测试不同厂商的AI模型,肯定显得以偏概全;但是好的AI大语言模型在应对具有一定挑战性的问题时,一般都能给出相对好的答案。

评论列表

只为今生
只为今生 21
2023-10-27 19:48
一个是潜心研究好多年,一个是赶鸭子上架催出来的,不好比!

用户18xxx86 回复 11-04 22:20
先完成,再完美!二哈!

熊二的老大 回复 11-04 21:08
OpenAI研究ChatGPT用了多少年?

用户18xxx10
用户18xxx10 16
2023-11-04 10:38
任何大模型的基础是云计算!这才是根本,中国目前有阿里云和华为云,美帝多一些!其他国家没有,所以未来就是中美之争!至于模型只是一种算法和高成本投入,只要有需求这些都不是问题!看看华为的盘古大模型!人要学会看到本质!

白连容 回复 11-09 05:34
从足球角度分析一下本质

用户87xxx82 回复 11-08 11:58
你懂个毛

用户18xxx31
用户18xxx31 11
2023-10-25 06:19
讯飞星火模型经常答非所问,问的次数多了就简单重复上次的回答,纯粹是机器,没有人工的感觉

画风 回复 12-06 17:45
文心一言回答不出来就会马上让你换一个话题😂😂😂

零度
零度 11
2023-11-09 17:57
有锤子用,都是垃圾!!说穿了就一个资料库。包括美国的一样是垃圾,吹嘘过头,如同区块链现在还有几个人提??

lsp 回复 11-10 05:31
愚蠢至极,自以为是

好名出不来
好名出不来 11
2024-01-04 23:31
认真对比,字节的和阿里巴巴的最好,成本最合理,适合投资建设。而小编说的1,2适合投简历,专业对口,适合当个人事部经理
老衲法号曹贼
老衲法号曹贼 9
2023-11-18 07:12
如果说GPT是博士生,那国产AI就是幼儿园小小班,而且永远长不大,因为有各种条条框框捆绑着

Dacian 回复 11-29 11:15
感觉11月27发布的浪潮源2.0很不错,模型参数达到了千亿级别。文章里面的模型参数太低了,不上千亿就没法达到智能门槛的。

我有个朋友 回复 01-08 03:18
语不惊人死不休啊

用户15xxx20
用户15xxx20 8
2023-10-26 08:47
都是拿人家开源的抄袭模仿的,拿什么比啊。

山鸡的故事 回复 11-04 03:14
你这种全自动喷子比智能ai厉害多了,ai说话还要过一遍数据,你开喷只需要张嘴就行,足够的数据库样本才是智能ai不断进步的核心关键,张嘴就说是抄的,数据库能抄吗?

老衲法号曹贼
老衲法号曹贼 8
2023-11-04 08:43
目前是豆包领先,但与GPT还有很大差距,功能没文心一言多,文心一言功能虽多,但限制也多,废物一个,准备卸载了
李子
李子 8
2023-11-16 12:55
十年前,你敢想象国产车现在的红火吗?此消彼长,大势所趋,已经不容易了,时间上看,国家只要稳定,结果就不会差
用户18xxx21
用户18xxx21 4
2023-11-02 19:31
百度文心一言4.0版本基本和chatgpt4.0相差无几,可以说各有千秋,但是总体还是不如4.0,我觉得博主过于悲观了

用户17xxx74 回复 11-08 07:47
我让他写段vba代码,他连结束都没有,就算有,也跑不起来,很简单的那种,还是差很多

用户18xxx21 回复 用户17xxx74 11-08 20:17
各有千秋,有的地方文心一言会胜出,不过总体还是cg胜出

坏坏笑一本正经》
坏坏笑一本正经》 4
2023-11-07 09:08
我觉得文心一言把这个当成一道数学题目,你没发现这个题目和小学数学很像吗

陆刚-刚刚 回复 12-06 10:14
这还不是数学题

DeanLouw
DeanLouw 3
2023-10-26 12:32
国产都是阉割版,最终都只能走山寨,难堪大用。
掌柜的
掌柜的 3
2023-11-08 09:06
我让文心一言帮我查带某两个字的古诗,结果给了我三首诗一个都不对,我说这些古诗里不含有我要的词,它说抱歉里面的确没有,我再给你三首,结果里面还是没有。。。
皮都都
皮都都 3
2023-11-19 05:27
看了,chatgpt也在糊弄事,中听不中用,还不如百度老老实实算数学

好名出不来 回复 01-04 23:20
确实,一个汽车系统不是按代码分的,是按系统分类来算的,而且人工的失误率也没算进去

用户92xxx62
用户92xxx62 3
2023-12-22 06:23
同等于二、三十年前华强北二手手机市场
月淡风清
月淡风清 3
2024-01-06 23:26
加油干!中国科技!!
老实人
老实人 2
2023-10-25 02:42
起码国产AI还是一天比一天强

大乘根性 回复 11-02 00:38
持续做一件事情总有改善的地方,这自然规律,有什么可说的。

将错误进行到底
将错误进行到底 2
2023-10-29 11:11
百度的文心一言还是很可以的,某些方面不比chatgpt差了
我和你
我和你 2
2023-11-02 21:40
一个程序员一天只能写出几十行高质量代码

用户94xxx45 回复 11-22 13:48
真的吗,那跟我一个业余门外汉有何区别

color
color 2
2023-11-08 15:50
一年以后,你们喷的应该不是这方面了,国外0到1国内1到无限
用户11xxx94
用户11xxx94 2
2023-11-13 23:31
荷鬼抄粉
信念de锚
信念de锚 2
2023-11-27 04:37
名字都挺好的![鼓掌]
望尘雪
望尘雪 2
2023-12-31 23:29
你知道个天井,要水煮
风之谷
风之谷 2
2024-01-04 10:49
实测百度文心一言比通义千问差一大截。
田野沐雨
田野沐雨 1
2023-10-25 10:51
你把盘古大模型吃了吗

笔记 回复 10-25 21:04
盘古还没怼普通人开放,测试不了

用户13xxx28
用户13xxx28 1
2023-11-04 07:53
昆仑的天工可以
菜刀
菜刀 1
2023-11-26 01:15
是谁让你在评测国产AI了,要评测就认真评测
用户12xxx08
用户12xxx08 1
2024-01-04 11:29
豆包,呵呵,
用户70xxx45
用户70xxx45 1
2023-11-03 14:04
免费让你用,还挑三拣四
用户13xxx86
用户13xxx86
2023-10-31 16:05
把小编拉上去,反正小编啥都能答
红绿灯
红绿灯
2023-11-04 00:00
捏一把汗说明你要去洗澡!国内AI语言模型与国外比有差距,但也不是小编说的那么不堪😂……
用户13xxx86
用户13xxx86
2023-11-04 08:03
我以为你捏一把💩呢,还捏一把汗
用户16xxx18
用户16xxx18
2023-11-07 20:29
国内主要没有顶级英伟达显卡,拿不到货,AI需要算力的

洪水的爱 回复 11-10 01:56
我国的量子计算机不是超越美国么?用量子计算机代替传统运算不就行了

智缺
智缺
2023-11-18 14:43
我在一本正经地胡说八道
Burgess--茅台三家坊1915
Burgess--茅台三家坊1915
2023-11-26 09:53
字节的从没听过
闹市隐者
闹市隐者
2023-11-09 07:12
你的问题就很有问题 让不同的人来看 他们心中有不同的答案