成立以来,百川智能先后发布了Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan2-192K、Baichuan-NPC、Baichuan 4等7 款闭源大模型,模型研发速度领先行业水平,并且其最新一代基座大模型 Baichuan 4 在国内大模型权威评测机构 SuperCLUE 的评测中表现出了国内大模型第一梯队
new.qq.com王云鹤透露,该模型也代表盘古系列模型首次参与了外部打榜。在刚刚发布的五月底 SuperCLUE 榜单上,盘古 Pro MoE 在千亿参数量以内的模型中,排行并列国内第一。 https://www.superclueai.com 可以看到,其在智能体任务上打榜成绩甚至比肩 6710 亿参数的 DeepSeek-R1,在文本理解和创作领域也达到开源模型的第一名。
www.163.com国内模型技 术辨识度不高,据SuperCLUE测评结果榜单,头部的国内模型在得分上相差并不显著。在 国内主流的模型中,互联网厂商和科技企业在大模型上起步较早,如百度在 GPT-4 发布的 后一天即 23 年 3 月 15 日发布文心一言,23 年 3 月 2...
mp.weixin.qq.com2026年1月3日-SuperCLUE中文大模型综合性测评基准中文大模型基准测评2024年上半年报告一2024年度中文大模型阶段性进展评估SuperCLUE团队2024.07.09SuperC...
www.yydm.cn▲ 中文基准测试 SuperCLUE 测试逻辑与推理 那么「评卷老师」是谁?大概分为三种,一是自动化程序,比如编程的基准测试,模型生成的代码通过自动执行验证正确与否,二是用 GPT-4 等更强大的模型做裁判,三是人工。 混合拳这么一打,比四书五经六艺全面多了。但基准测试也存在严重的隐患。背后的公司「既当裁判又当运动员...
www.ifanr.com2024年7月10日-【大模型新排名】 SuperCLUE通用能力测评报告来了,选取国内外33个大模型的综合测评结果国内大模型如阿里通义千问、百度文心一言、讯飞星火等上榜。 ...
weibo.com百川智能于5月22日揭晓了Baichuan 4大模型,伴随AI助手“百小应”亮相。相比前代,Baichuan 4在通用、数学及代码处理能力上分别提升10%、14%和9%,并在SuperCLUE评测中问鼎国内榜首,特别强化了多模态能力,尤其擅长中文任务处理。这标志着大模型领域正逐步迈向稳定迭代与深度应用并重的新阶段。
new.qq.com葛灿辉在引用SuperCLUE测评结果的时候,提炼出了一句总结:“360智脑”多项能力位列国产大模型第一。《麻省理工科技评论》的测评报告,传播最多的也是“讯飞星火被评为中国‘最聪明’的大模型”。 更早些时候,刷屏的是百度。比如IDC的大模型报告中,“百度文心大模型3.5获多项满分”,清华大学新闻与传播学院沈阳团队发布...
new.qq.com2024年2月21日- 探秘SuperCLUE-Safety:为中文大模型打造的多轮对抗安全新框架 进入2023年以来,ChatGPT的成功带动了国内大模型的快速发展,从通用大模型、垂直...
www.cnblogs.com