清华发布大模型性能报告:GPT-4第一 更懂中文的还是百度

来源:快科技时间:2023-08-10 11:07:04


(资料图)

8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先,微软、谷歌、Meta紧随其后,国内科技巨头也迅速跟进,现在国内据说已经有上百款大模型问世了。

这么多大模型中,实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,将国内外的大模型做了一番对比。

该报告还探讨了这些模型在不同知识领域,如创意写作、代码编程、舆情分析、历史知识等方面的回答情况,以及其在解决实际问题中的有效性和局限性。

从生成质量、使用与性能、安全与合规三个维度,对目前市场上的7个大型语言模型进行了全面的综合评估。

在这7款大模型中,GPT-4获得了毫无悬念的第一,第二名是百度的文心一言,其次是GPT-3.5,后面就是Claude、讯飞星火、阿里云的通义千问及昆仑的天工。

虽然GPT-4各方面领先,但是对国内用户来说,更懂中文的大模型才是关键,这方面百度的文心一言更好,在部分中文语义理解方面,文心一言以92%的得分率排名榜首,超越讯飞星火、GPT-4。

这跟百度的大模型包含大量中文文本有关系,因此能够更好地处理本土文化相关的内容。

关键词:

相关阅读

推荐阅读

清华发布大模型性能报告:GPT-4第一 更懂中文的还是百度

清华发布大模型性能报告:GPT-4第一 更懂中文的

快科技8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先更多

2023-08-10 11:07:04
美媒:月球上可能已经存在生命

美媒:月球上可能已经存在生命

据美国趣味科学网站6月12日报道,如果美国国家航空航天局(NASA)的登更多

2023-08-10 10:38:27
长二丙火箭成功发射环境减灾二号06星

长二丙火箭成功发射环境减灾二号06星

8月9日6时53分,我国在太原卫星发射中心采用长征二号丙遥四十六运载火更多

2023-08-10 10:16:29
一家五口被困荒山 消防紧急救援

一家五口被困荒山 消防紧急救援

救援现场扫码看视频早报讯(记者傅恒通讯员魏诏麒廖志程王子恒文 图)更多

2023-08-10 09:49:32
finaldata20软件(finaldata2.0)

finaldata20软件(finaldata2.0)

来为大家解答以上问题,finaldata20软件,finaldata2 0很多人还不知道更多

2023-08-10 09:15:53
宏观专题报告:CPI负增长不会持续

宏观专题报告:CPI负增长不会持续

宏观专题报告:CPI负增长不会持续更多

2023-08-10 09:01:46
消费需求持续恢复 国内物价总体稳定

消费需求持续恢复 国内物价总体稳定

国家统计局8月9日公布了7月份全国居民消费价格指数(CPI)和全国工业生更多

2023-08-10 08:06:10
7月CPI同比降0.3% PPI同比降4.4%

7月CPI同比降0.3% PPI同比降4.4%

国家统计局8月9日发布的数据显示,7月份,全国居民消费价格指数(CPI)同更多

2023-08-10 07:16:35
+ 点击查看更多精彩

精彩放送

并行配置不正确怎么解决?win7如何恢复上次正确配置?
    并行配置不正确怎么解决?按下快捷键 win+r 打开运行输入 ser...
微信折叠置顶聊天怎么关闭?微信消息太长如何折叠显示更多?
    微信折叠置顶聊天怎么关闭?打开微信,在微信的置顶折叠聊天中打开...
hp5200电脑上怎么装驱动?hp520为何安装不了系统?
    hp5200电脑上怎么装驱动?准备工作。在安装之前,你需要将驱动程序...
12寸笔记本和14寸对比有何不同?笔记本14寸算小吗?
    12寸笔记本和14寸对比有何不同?12寸和14寸笔记本只是大小不同,12...
远程桌面命令mstsc打不开何解?win7远程桌面连接有教程吗?
    远程桌面命令mstsc打不开何解?1、更新了一下电脑的缘故考虑是自己...
台式电脑组装有教程吗需要做好哪些准备?组装机七大禁忌分别是?
    台式电脑组装有教程吗需要做好哪些准备?1、工具准备常言道工欲善...