聚合搜索引擎 - 壹搜网为您找到"

Ai 模型测评

"相关结果 20条

PPT制作的神器——AI PPT大模型测评

2024年12月20日 — 整体来看，讯飞智文是所有的AI PPT工具里面生成的PPT页数最长的，足足52页。生成的质量还是不错的，格式大气，内容充实，很好的描述了这个模块的特点以及优势。

www.liuwenhao.me

中文通用大模型综合性测评基准（SuperCLUE），是针对中文可用的通用大模型的一个测评基准。它主要要回答的问题是：在当前通用大模型大力发展的情况下，中文大模型的效果情况。

www.cluebenchmarks.com

2025年7月26日 — 现在我们决定停止维护该排行榜，并将测试集公开，方便用户可以直接在C-Eval测试集上进行评测，你可以直接前往Huggingface 下载使用C-Eval测试集。 ... AI ...

cevalbenchmark.com

2024年6月20日 — 6月中旬，智源研究院旗下的FlagEval 大模型评测平台发布最新榜单：在有标准答案的“客观评测”中，GPT-4 以76.11分在闭源大模型中排名第一；Doubao-Pro（豆包 ...

www.aizws.net

2024年9月24日 — 摘要. 本白皮书全面概述了营销大模型的评测工作，对于模型优化、迭代和技术创新至关重要，旨在推动人工智能技术在营销领域的深入应用和发展。

www.gamenewstc.com

2024年4月10日 — 此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行，此次测试数据共7343条，包含了个人隐私、歧视偏见、违法违规等维度，使用Responsibility ...

hk.cns.hk

这里是中文大模型能力对比的权威平台,为您提供全面、客观的大模型性能评估和排行榜单。SuperCLUE是独立、领先的中文通用大模型综合性测评基准，涵盖通用、文本、多模 ...

www.superclueai.com

2023年12月30日 — SEED-Bench评测基准在2023年7月首次发布，它包含了19K道经过人工标注正确答案的选择题，涵盖了图像和视频的12个评估维度；并在11月发布了v2版本，扩充至24K ...

www.kuxai.com

2024年12月25日 — 在其闭源大模型评测能力总榜中，字节跳动的豆包通用模型pro拿到主观评测最高分，OpenAI的o1-mini拿到客观评测最高分；多模态模型评测总榜前三名依次是OpenAI ...

xueqiu.com

本次测评揭示了AI 高阶推理能力的发展现状：一方面，美国模型在多模态. 和奥赛推理中表现突出，优势明显；目前为止，高阶推理仍是中国模型的明显短. 板，在深层语境理解 ...13 页·2 MB

hkubs.hku.hk

上一页 1 2 3 4 5 6 7 8 9 10 下一页