清华大学通知您中文AI谁最强 人工智能 清华大学 数学 Bing 软件 克劳迪 baidu 2019科技之光 Google 国创上头条 微软 浏览器 第1张

作者手机内经常使用的AI软件

AI年夜模子方兴日盛,国际互联网巨子纷繁了局推出本身的AI年夜模子,那末谁家年夜模子最强?

笔者通过客岁入手下手利用ChatGPT和微软edge浏览器自带的bing AI,深感外洋年夜模子对于中文的支撑和本地化作的依然不敷,以是非常存眷国际厂家的AI产物。很幸运的是尔很早拿到了讯飞燎原之火以及baidu文心一言的内测资历,实话实说,早期的燎原之火以及文心一言比bing AI皆难用数倍,以后尔对于字节系的豆包APP更是时时吐槽。

没想到到了今年年初,悄悄发明,尔曾经很久很久没用外洋年夜模子,除须要作一些涉外各种事情时会偶然用到Copilot(本Bing AI,ChatGPT 4 Turbo年夜模子)中,尔曾经习性国际年夜模子,它们的退化速率使人欢欣鼓励,但您要答尔谁最佳,实话实说,集体用起来PC端更习性燎原之火,挪移端方向豆包(云雀年夜模子),丹青方向天工(天工年夜言语模子)。

但那只是基于尔本身习性的客观观念,清华大学用更为松散以及庞大的统计方式,以量化的体式格局评选没了他们心目外最好中文AI年夜模子。

2024年3月,清华大学根蒂根基模子钻研中央联袂中关村实验室公布《SuperBench年夜模子综合才能评测陈述》。

这份陈述搜罗了现在国内外最具影响的十四个AI年夜模子。经由过程综合才能评测,该陈述以为baidu文心一言是现在(或者说停止本年三月份以前)针对中文言语明白、数学才能等范畴最佳的AI年夜模子。

最引人关注的无疑是各大模子对于中文的处置惩罚才能,也便是中文明白方面。文心一行(文心一言4.0,下同)正在推理以及言语评测外分数遥遥领先,其余模子取之比拟差异较为显明,最令笔者震动的是,尔最习性利用的讯飞燎原之火居然挂车尾。要注明的是,正在没有思索中文的条件高,言语才能上文心一行降到第三,不迭google的Claude-3以及GLM4,但仍抢先ChatGPT 4的Turbo版以及网页版。

清华大学通知您中文AI谁最强 人工智能 清华大学 数学 Bing 软件 克劳迪 baidu 2019科技之光 Google 国创上头条 微软 浏览器 第2张

所有人皆正在等待ChatGPT 5的公布

数学才能方面,文心一言取Claude-3并列第一,这一成果表现了文心一言正在数学逻辑以及推理方面的刁悍气力,并让人眼前一亮。另外,文心一言借正在宁静方面排名第一。

别的年夜模子也非吴下阿蒙,它们各有各的刚强以及上风,好比ChatGPT 4 Turbo版以及网页版便分离拿下了代码编写第一、第二;智才能方面Claude-3以及ChatGPT 4也是抢先敌手包办前三,个中阿里的通义千问2.1是国际表示最佳的智才能年夜模子,文心一行反而排名靠后。

总的来说,国际AI年夜模子方面根本亲近美国程度,能够道以及美国构成AI年夜模子范畴的第一梯队,远远甩开别的国度的竞争对手。

无非咱们仍是要证明差异,美国AI年夜模子正在偏向翻新上借远远强于咱们,好比Meta,又好比ChatGPT 5,咱们现阶段仍是正在外洋年夜模子面前马首是瞻,领导行业走出本身的翻新途径短期内依然困难,须要从业者们持续勉力。


清华大学通知您中文AI谁最强 人工智能 清华大学 数学 Bing 软件 克劳迪 baidu 2019科技之光 Google 国创上头条 微软 浏览器 第3张