聚合搜索引擎 - 壹搜网为您找到"

Superclue 团队

"相关结果 60条

超10 家光源伙伴亮相 WAIC 2024 |光源伙伴_腾讯新闻

成立以来,百川智能先后发布了Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan2-192K、Baichuan-NPC、Baichuan 4等7 款闭源大模型,模型研发速度领先行业水平,并且其最新一代基座大模型 Baichuan 4 在国内大模型权威评测机构 SuperCLUE 的评测中表现出了国内大模型第一梯队

new.qq.com

SuperCLUE:中文大模型基准测评2024年上半年报告 - 豆丁网

www.docin.com

刚刚,华为盘古大模型5.5问世!推理、智能体能力大爆发|算法|模态|...

王云鹤透露,该模型也代表盘古系列模型首次参与了外部打榜。在刚刚发布的五月底 SuperCLUE 榜单上,盘古 Pro MoE 在千亿参数量以内的模型中,排行并列国内第一。 https://www.superclueai.com 可以看到,其在智能体任务上打榜成绩甚至比肩 6710 亿参数的 DeepSeek-R1,在文本理解和创作领域也达到开源模型的第一名。

www.163.com

【科技】大模型专题报告:从技术路径,纵观国产大模型逆袭之路

国内模型技术辨识度不高,据SuperCLUE测评结果榜单,头部的国内模型在得分上相差并不显著。在国内主流的模型中,互联网厂商和科技企业在大模型上起步较早,如百度在 GPT-4 发布的后一天即 23 年 3 月 15 日发布文心一言,23 年 3 月 2...

mp.weixin.qq.com

SuperCLUE:中文大模型基准测评2024年上半年报告 - 运营动脉

2026年1月3日-SuperCLUE中文大模型综合性测评基准中文大模型基准测评2024年上半年报告一2024年度中文大模型阶段性进展评估SuperCLUE团队2024.07.09SuperC...

www.yydm.cn

号称打败 GPT-4o 的开源 AI 新王被指造假,不要迷信大模型的榜单了 |...

▲ 中文基准测试 SuperCLUE 测试逻辑与推理那么「评卷老师」是谁?大概分为三种,一是自动化程序,比如编程的基准测试,模型生成的代码通过自动执行验证正确与否,二是用 GPT-4 等更强大的模型做裁判,三是人工。混合拳这么一打,比四书五经六艺全面多了。但基准测试也存在严重的隐患。背后的公司「既当裁判又当运动员...

www.ifanr.com

大模型新排名SuperCLUE通用能力测评报... 来自李沛超 - 微博

2024年7月10日-【大模型新排名】 SuperCLUE通用能力测评报告来了,选取国内外33个大模型的综合测评结果国内大模型如阿里通义千问、百度文心一言、讯飞星火等上榜。 ...

weibo.com

行业报告 | 2024年H1全球AIGC行业半年报_腾讯新闻

百川智能于5月22日揭晓了Baichuan 4大模型,伴随AI助手“百小应”亮相。相比前代,Baichuan 4在通用、数学及代码处理能力上分别提升10%、14%和9%,并在SuperCLUE评测中问鼎国内榜首,特别强化了多模态能力,尤其擅长中文任务处理。这标志着大模型领域正逐步迈向稳定迭代与深度应用并重的新阶段。

new.qq.com

谁最“聪明”:大模型为何需要测评_腾讯新闻

葛灿辉在引用SuperCLUE测评结果的时候,提炼出了一句总结:“360智脑”多项能力位列国产大模型第一。《麻省理工科技评论》的测评报告,传播最多的也是“讯飞星火被评为中国‘最聪明’的大模型”。更早些时候,刷屏的是百度。比如IDC的大模型报告中,“百度文心大模型3.5获多项满分”,清华大学新闻与传播学院沈阳团队发布...

new.qq.com

探秘SuperCLUE-Safety:为中文大模型打造的多轮对抗安全新框架 - ...

2024年2月21日- 探秘SuperCLUE-Safety：为中文大模型打造的多轮对抗安全新框架进入2023年以来，ChatGPT的成功带动了国内大模型的快速发展，从通用大模型、垂直...

www.cnblogs.com

上一页 1 2 3 4 5 6 7 8 9 10 下一页

Superclue 团队

超10 家光源伙伴亮相 WAIC 2024 |光源伙伴_腾讯新闻

SuperCLUE:中文大模型基准测评2024年上半年报告 - 豆丁网

刚刚,华为盘古大模型5.5问世!推理、智能体能力大爆发|算法|模态|...

【科技】大模型专题报告:从技术路径,纵观国产大模型逆袭之路

SuperCLUE:中文大模型基准测评2024年上半年报告 - 运营动脉

号称打败 GPT-4o 的开源 AI 新王被指造假,不要迷信大模型的榜单了 |...

大模型新排名SuperCLUE通用能力测评报... 来自李沛超 - 微博

行业报告 | 2024年H1全球AIGC行业半年报_腾讯新闻

谁最“聪明”:大模型为何需要测评_腾讯新闻

探秘SuperCLUE-Safety:为中文大模型打造的多轮对抗安全新框架 - ...

百度热搜

抖音热搜

知乎热搜

小红书热搜

时间筛选

所有网页和文件

站点检索

Superclue 团队

百度热搜

抖音热搜

知乎热搜

小红书热搜