网站首页 / 香港 / 清华大学通知您中文AI谁最强

清华大学通知您中文AI谁最强

夜色中的猫香港 2024-06-02 1964 4

作者手机内经常使用的AI软件

AI年夜模子方兴日盛，国际互联网巨子纷繁了局推出本身的AI年夜模子，那末谁家年夜模子最强？

笔者通过客岁入手下手利用ChatGPT和微软edge浏览器自带的bing AI，深感外洋年夜模子对于中文的支撑和本地化作的依然不敷，以是非常存眷国际厂家的AI产物。很幸运的是尔很早拿到了讯飞燎原之火以及baidu文心一言的内测资历，实话实说，早期的燎原之火以及文心一言比bing AI皆难用数倍，以后尔对于字节系的豆包APP更是时时吐槽。

没想到到了今年年初，悄悄发明，尔曾经很久很久没用外洋年夜模子，除须要作一些涉外各种事情时会偶然用到Copilot（本Bing AI，ChatGPT 4 Turbo年夜模子）中，尔曾经习性国际年夜模子，它们的退化速率使人欢欣鼓励，但您要答尔谁最佳，实话实说，集体用起来PC端更习性燎原之火，挪移端方向豆包（云雀年夜模子），丹青方向天工（天工年夜言语模子）。

但那只是基于尔本身习性的客观观念，清华大学用更为松散以及庞大的统计方式，以量化的体式格局评选没了他们心目外最好中文AI年夜模子。

2024年3月，清华大学根蒂根基模子钻研中央联袂中关村实验室公布《SuperBench年夜模子综合才能评测陈述》。

这份陈述搜罗了现在国内外最具影响的十四个AI年夜模子。经由过程综合才能评测，该陈述以为baidu文心一言是现在（或者说停止本年三月份以前）针对中文言语明白、数学才能等范畴最佳的AI年夜模子。

最引人关注的无疑是各大模子对于中文的处置惩罚才能，也便是中文明白方面。文心一行（文心一言4.0，下同）正在推理以及言语评测外分数遥遥领先，其余模子取之比拟差异较为显明，最令笔者震动的是，尔最习性利用的讯飞燎原之火居然挂车尾。要注明的是，正在没有思索中文的条件高，言语才能上文心一行降到第三，不迭google的Claude-3以及GLM4，但仍抢先ChatGPT 4的Turbo版以及网页版。