聚合搜索引擎 - 壹搜网为您找到"

模型评测平台

"相关结果 45条

大模型安全测评-评测中心

数据安全产业公共服务平台信息物理系统共性关键技术测试验证...漏洞扫描云计算服务安全咨询渗透测试数据安全产品检测数据安全服务能力评定安全监测与远程检测大模型安全测评攻防演练 ...

cstc.org.cn

近日，上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0，这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍，MedBench 4.0为...

www.szzg.gov.cn

AI Ping 是一款大模型服务评测与统一 API 调用平台，提供 7×24 小时模型性能榜单、延迟与稳定性监控、智能路由调度以及多模型统一接口接入。支持跨供应商快速选型、透明查看 Token 消耗与调用...

www.aihub.cn

中文大模型评测平台 ➡️ https://www.dongaigc.com/p/jeinlee1991/chinese-llm-benchmark ([dongaigc.com][4]) 亮点：持续更新中文 benchmark 与排行榜包含多维任务：分类、信息抽取、阅读...

m.blog.csdn.net

2026年1月15日，全球权威大模型评测平台LMArena公布最新排名，百度文心大模型ERNIE-5.0-0110以1460分的成绩荣登文本榜国内第一、全球第八，成为该榜单TOP10中唯一的中国大模型，同时在数学能力排名中位列全球第二。2026年1月15日...

article.pchome.net

LMArena ai，前身为lmsys.org，一个专注于众包AI基准测试的AI模型评估平台，由加州大学伯克利分校SkyLab和LMSYS研究团队打造。类似 V0 或者 Bolt 的平台，区别是你输入一个需求后会有两个模型给...

www.yjpoo.com

AI 模型评测平台(对话式)凭借提供 ASR+LLM+TTS 主流供应商的延迟数据横向测评，上线以来受到众多开发者的青睐，此次2.0版本新增多项对话式 AI 体验质量评估维度，不仅为开发者在级联大模型选型...

finance.sina.cn

AI 模型评测平台（对话式）凭借提供 ASR+LLM+TTS 主流供应商的延迟数据横向测评，上线以来受到众多开发者的青睐，此次2.0版本新增多项对话式 AI 体验质量评估维度，不仅为开发者在级联大模型...

tech.ifeng.com

大模型应用手动评测是一种基于应用维度评估应用效果的方法，通过针对特定业务场景来人工构建评测集，并对应用的回答进行人工分析与评分，产出评测报告。效果展示手动评测通过人工构建评测集，...

help.aliyun.com

上一页 5