找到"

Swe bench 是什么

"相关图片 256条

apple

SWE-bench大模型评测基准介绍：测试大模型 …

SWE-bench大模型评测基准介绍：测试大模型 …

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

Brown Wooden Bench Surrounded by Trees

Brown Wooden Bench Surrounded by Trees

Wave Bench 1

gpt5.2发布屠榜不,是openai在补课

gpt5.2发布屠榜不,是openai在补课

7 Easy DIY Wooden Bench Ideas for Every Space

7 Easy DIY Wooden Bench Ideas for Every Space

brush

SWE-Bench：如何构造 LLM 时代的优秀 Benchm…

SWE-Bench：如何构造 LLM 时代的优秀 Benchm…

joycode:swe-bench verified打榜技术报告 python 是一种高级,解释型

joycode:swe-bench verified打榜技术报告 python 是一种高级,解释型

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

Brown Wooden Bench With Brown Dried Leaves

Brown Wooden Bench With Brown Dried Leaves

swe-bench 测试成绩

swe-bench 测试成绩

介绍 swe bench 语言模型能否解决真实世界的 github 问题

介绍 swe bench 语言模型能否解决真实世界的 github 问题

gallery-slide-1

gallery-slide-1

brush-cleaning

SWE-bench - LLM Benchmark

SWE-bench - LLM Benchmark

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

Person Sitting on Bench Under Tree

Person Sitting on Bench Under Tree

迪卡农椭圆仪eshape09

迪卡农椭圆仪eshape09

joycode swe bench verified打榜技术报告

joycode swe bench verified打榜技术报告

Bench Waiting <strong>Chairs</strong> Waiting <strong>Chair</strong> 3 Seater <strong>Row</strong> <strong>Chairs</strong> for <strong>Airport</strong>

Bench Waiting <strong>Chairs</strong> Waiting <strong>Chair</strong> 3 Seater <strong>Row</strong> <strong>Chairs</strong> for <strong>Airport</strong>

Split Top Saw Bench with Downloadable Plan

Split Top Saw Bench with Downloadable Plan

cake

SWE-BENCH论文解读 - 知乎

SWE-BENCH论文解读 - 知乎

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

Black and Red Park Bench Near Grey Concrete Pathway

Black and Red Park Bench Near Grey Concrete Pathway

看到一把蹲坑椅子,用solidworks把它画出来

看到一把蹲坑椅子,用solidworks把它画出来

joycode swe bench verified打榜技术报告

joycode swe bench verified打榜技术报告

Contemporary public bench - EXCEL - Woodscape. - wooden / stainless steel / with backrest

Contemporary public bench - EXCEL - Woodscape. - wooden / stainless steel / with backrest

Bathroom Furniture

Bathroom Furniture

cake-slice

SWE-bench - a SWE-bench Collection

SWE-bench - a SWE-bench Collection

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

Boy and Girl Sitting on Bench Toy

Boy and Girl Sitting on Bench Toy

拜拜了swe-bench!cursor刚发了个ai coding评测基准,难哭claude

拜拜了swe-bench!cursor刚发了个ai coding评测基准,难哭claude

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

Shechem Bench

candy

SWE-Benchmark 综合指南：评估 AI 智能体在真实世界软件工程任务中的表现 - 知乎

SWE-Benchmark 综合指南：评估 AI 智能体在真实世界软件工程任务中的表现 - 知乎

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

细看Claude 3.7 两个重要的Benchmark：SWE-Bench & TAU-Bench ...

A Bridge Over the Lake Connecting Buildings

A Bridge Over the Lake Connecting Buildings

geekworm 推出树莓派 5 专用 ssd 扩展卡:双 m.

geekworm 推出树莓派 5 专用 ssd 扩展卡:双 m.

joycode swe bench verified打榜技术报告

joycode swe bench verified打榜技术报告

Shenone Hotel Supplies Wholesale Solid Beech Wood Folding Luggage Rack

Shenone Hotel Supplies Wholesale Solid Beech Wood Folding Luggage Rack

Bennet Bench

candy-cane

Demystifying SWE-Bench: AI Coding Assistants in Action

Demystifying SWE-Bench: AI Coding Assistants in Action

移动端开发稳了？小红书论文实证：AI 暂无法取代客户端开发，最高 ...

移动端开发稳了？小红书论文实证：AI 暂无法取代客户端开发，最高 ...

Wooden Bench in Garden

Wooden Bench in Garden

家用健身器智能ems健身腰带甩脂机健身器材健腹神器腹

家用健身器智能ems健身腰带甩脂机健身器材健腹神器腹

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

Sarwadnya New Bench - Iron & Steel, 5ft x 2.5ft x 3.5ft | Eco-Friendly, Durable, Easy to Clean, Garden Application

Sarwadnya New Bench - Iron & Steel, 5ft x 2.5ft x 3.5ft | Eco-Friendly, Durable, Easy to Clean, Garden Application

Red bench-2

candy-off

Agentic Coding表现创新高，全新KAT系列模型强势霸榜SWE-Bench - 知乎

Agentic Coding表现创新高，全新KAT系列模型强势霸榜SWE-Bench - 知乎

Cosine Genie ：最強AI 軟件工程師？ – TechNow 當代科技

Cosine Genie ：最強AI 軟件工程師？ – TechNow 當代科技

Man Sitting and Closing Eyes on Teal Bench

Man Sitting and Closing Eyes on Teal Bench

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

拜拜了swe-bench!cursor刚发了个ai coding评测基准,难哭claude

拜拜了swe-bench!cursor刚发了个ai coding评测基准,难哭claude

Seattle Seahawks Park Bench

Seattle Seahawks Park Bench

Upholstered Bench with Shelf Storage

Upholstered Bench with Shelf Storage

dessert

Aider is SOTA for both SWE Bench and SWE Bench Lite | aider

Aider is SOTA for both SWE Bench and SWE Bench Lite | aider

Claude4震撼发布！最适合开发者的究极模型！ - AI猫学长

Claude4震撼发布！最适合开发者的究极模型！ - AI猫学长

Person Wearing Grey and Orange Hoodie Sitting on Brown Wooden Park Bench during Daytime

Person Wearing Grey and Orange Hoodie Sitting on Brown Wooden Park Bench during Daytime

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

minimax m2.5 swe-bench和multi-swe-bench成绩

minimax m2.5 swe-bench和multi-swe-bench成绩

sweeek - Salon de Jardin Enfant Table et chaises métal - Anna - Terracotta 2 Places. Table et chaises. 48x48cm

sweeek - Salon de Jardin Enfant Table et chaises métal - Anna - Terracotta 2 Places. Table et chaises. 48x48cm

Standard Bench Sizes (5 Drawings Included)

Standard Bench Sizes (5 Drawings Included)

donut

GitHub - scaleapi/SWE-bench_Pro-os: SWE-Bench Pro: Can AI Agents Solve ...

GitHub - scaleapi/SWE-bench_Pro-os: SWE-Bench Pro: Can AI Agents Solve ...

技术文章« bang's blog

技术文章« bang's blog

Brown Bench Beside Tree

Brown Bench Beside Tree

拜拜了swe bench cursor刚发了个ai coding评测基准,难哭claude

拜拜了swe bench cursor刚发了个ai coding评测基准,难哭claude

15.08在位转让测量仪 - 爱企查

15.08在位转让测量仪 - 爱企查

Contemporary bench - FASSA bench - CITYSì - wooden / painted steel / with backrest

Contemporary bench - FASSA bench - CITYSì - wooden / painted steel / with backrest

Southbank bench hi-res stock photography and images - Alamy

Southbank bench hi-res stock photography and images - Alamy

house-heart

在kaggle上看到了这个比赛，比赛中涉及的SWE-bench是啥？有什么作用？ - 知乎

在kaggle上看到了这个比赛，比赛中涉及的SWE-bench是啥？有什么作用？ - 知乎

港股100强研究中心

港股100强研究中心

登顶开源ai软件工程师榜首,uiuc无agent方案轻松解决swe bench真实编程问题

登顶开源ai软件工程师榜首,uiuc无agent方案轻松解决swe bench真实编程问题

Gray Wooden Bench Surrounded by Green Grass Trees

Gray Wooden Bench Surrounded by Green Grass Trees

We-Do-It Bench

lollipop

Scale AI 发布 SWE-Bench Pro 评测：…

Scale AI 发布 SWE-Bench Pro 评测：…

智谱发布GLM-4.7-Flash并开源：同级别SOTA 为轻量化部署提供了 ...

智谱发布GLM-4.7-Flash并开源：同级别SOTA 为轻量化部署提供了 ...

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

Brown Wooden Bench Near Green Leaf Tree

Brown Wooden Bench Near Green Leaf Tree

MOVE bench

popcorn

Multi-SWE-bench - 字节豆包开源的多语言代码修复基准 | AI工具集

Multi-SWE-bench - 字节豆包开源的多语言代码修复基准 | AI工具集

SWEBench - XFastest Hong Kong

SWEBench - XFastest Hong Kong

本周ai界发生了什么 chatgpt免注册苹果进军家用机器人 anthropic发现长文本漏洞

本周ai界发生了什么 chatgpt免注册苹果进军家用机器人 anthropic发现长文本漏洞

Brown Wooden Bench

Brown Wooden Bench

DIY Slatwood Bench

DIY Slatwood Bench

popsicle

SWE-Bench：如何构造 LLM 时代的优秀 Benchmark - 知乎

SWE-Bench：如何构造 LLM 时代的优秀 Benchmark - 知乎

Claude断供中国之际，Kimi-K2-0905低调上线：时势造英雄丨302.AI ...

Claude断供中国之际，Kimi-K2-0905低调上线：时势造英雄丨302.AI ...

拜拜了swe bench cursor刚发了个ai coding评测基准,难哭claude线上线下混合评所以,结果呢

拜拜了swe bench cursor刚发了个ai coding评测基准,难哭claude线上线下混合评所以,结果呢

Person in Motorcycle Racing Suit and Helmet Sitting on a Suzuki GSX-R

Person in Motorcycle Racing Suit and Helmet Sitting on a Suzuki GSX-R

shell

GitHub - SWE-Gym/SWE-Bench-Package

GitHub - SWE-Gym/SWE-Bench-Package

Claude Sonnet 4.5 对阵GLM-4.6：中外大模型编程巅峰对决，胜负已 ...

Claude Sonnet 4.5 对阵GLM-4.6：中外大模型编程巅峰对决，胜负已 ...

豆包编程新模型 doubao seed code 来抢程序员饭碗的,每月不到10块

豆包编程新模型 doubao seed code 来抢程序员饭碗的,每月不到10块

Photo of Wet Wooden Bench

Photo of Wet Wooden Bench

Creative Solid Wood Folding Dining Table Bench Medieval Shoe Change Restaurant Casual Dining Table Bench Simple With Backrest - AliExpress 1503

Creative Solid Wood Folding Dining Table Bench Medieval Shoe Change Restaurant Casual Dining Table Bench Simple With Backrest - AliExpress 1503

torus

AI 编码新王炸！Augment （SWE-bench 冠军）免费 …

AI 编码新王炸！Augment （SWE-bench 冠军）免费 …

Android 开发AI 选型指南！谷歌Android Bench 实测，Gemini 3.1 ...

Android 开发AI 选型指南！谷歌Android Bench 实测，Gemini 3.1 ...

小红书发布 swe bench mobile 当 ai agent 面对亿级用户 app 代码库,最高通过率仅12

小红书发布 swe bench mobile 当 ai agent 面对亿级用户 app 代码库,最高通过率仅12

Empty Bench in the garden

Empty Bench in the garden

【AGI-Eval行业动态 NO.10】一文看懂，字节开源多语言的 Multi-SWE-benc…

【AGI-Eval行业动态 NO.10】一文看懂，字节开源多语言的 Multi-SWE-benc…

流动性冲击高峰已过机构称港股迎逢低布局良机

流动性冲击高峰已过机构称港股迎逢低布局良机

小红书发布 swe bench mobile 当 ai agent 面对亿级用户 app 代码库,最高通过率仅12

小红书发布 swe bench mobile 当 ai agent 面对亿级用户 app 代码库,最高通过率仅12

Grayscale Photography of Brown and Black Bench

Grayscale Photography of Brown and Black Bench

Best DIY Bench Seat Ideas That Look High-End but Are Easy to Make

Best DIY Bench Seat Ideas That Look High-End but Are Easy to Make

SWE-bench: 自动解决 GitHub issue 能力的评估方法 - zion03 - 博客园

SWE-bench: 自动解决 GitHub issue 能力的评估方法 - zion03 - 博客园

OpenAI 震撼發布o3、o4-mini 具圖像思維、識自己揀工具、編程大幅 ...

OpenAI 震撼發布o3、o4-mini 具圖像思維、識自己揀工具、編程大幅 ...

gpt 5.2来了 openai称其为智能体编码最强,赶超人类专家 altman料明年1月解除红色警报状态

gpt 5.2来了 openai称其为智能体编码最强,赶超人类专家 altman料明年1月解除红色警报状态

Bench Edo

Brown Tree With Snow

Brown Tree With Snow

OpenAI推出SWE-bench Verified:提升AI软件工程 …

OpenAI推出SWE-bench Verified:提升AI软件工程 …

2月井喷！中国AI调用量首超美国，四款大模型霸榜全球前五，国产算 ...

2月井喷！中国AI调用量首超美国，四款大模型霸榜全球前五，国产算 ...

刚刚,openai迎10周年,发gpt 5.2,重点是和白领抢工作

刚刚,openai迎10周年,发gpt 5.2,重点是和白领抢工作

Brown Wooden Park Bench Under Green Leaf Tree during Sunset

Brown Wooden Park Bench Under Green Leaf Tree during Sunset

SWE-bench官网 - SWE-bench是一个 AI 评估基准，用于评估AI大模型完成现 …

SWE-bench官网 - SWE-bench是一个 AI 评估基准，用于评估AI大模型完成现 …

MiniMax M2.5 重磅发布- 专业网站开发服务

MiniMax M2.5 重磅发布- 专业网站开发服务

科技创新世界潮人类程序员真要失业首位 ai软件工程师亮相引爆科技圈

科技创新世界潮人类程序员真要失业首位 ai软件工程师亮相引爆科技圈

Lonely bench on hill in woods

Lonely bench on hill in woods

基于GitHub的大模型能力评估数据集：SWE-BENCH - 知乎

基于GitHub的大模型能力评估数据集：SWE-BENCH - 知乎

MiniMax M2.5 重磅发布- 专业网站开发服务

MiniMax M2.5 重磅发布- 专业网站开发服务

看图写代码,3毛钱开发一个网页字节ai coding新模型真卷麻了

看图写代码,3毛钱开发一个网页字节ai coding新模型真卷麻了

字节跳动开源Multi-SWE-bench，推动大模型代码智能升级

字节跳动开源Multi-SWE-bench，推动大模型代码智能升级

实测MiniMax M2.5：开源掀桌，性价比封神？先看看它交的作业丨302 ...

实测MiniMax M2.5：开源掀桌，性价比封神？先看看它交的作业丨302 ...

全球最强ai程序员 genie 横空出世

全球最强ai程序员 genie 横空出世

SWE-bench - 基于GitHub问题的语言模型评估 - 懂AI

SWE-bench - 基于GitHub问题的语言模型评估 - 懂AI

DeepSeek-V3.1 发布，迈向Agent 时代的第一步- 城市智慧之心

DeepSeek-V3.1 发布，迈向Agent 时代的第一步- 城市智慧之心

gpt 5.2来了,首个专家级 ai复仇成功,牛马打工人终于得救了

gpt 5.2来了,首个专家级 ai复仇成功,牛马打工人终于得救了

在kaggle上看到了这个比赛，比赛中涉及的S…

在kaggle上看到了这个比赛，比赛中涉及的S…

制作环节正从人工经验主导转向数据算法辅助提高了画面剪辑的逻辑 ...

制作环节正从人工经验主导转向数据算法辅助提高了画面剪辑的逻辑 ...

kimi k2 thinking重磅开源 1万亿参数思考agent模型,300次工具调用碾压gpt 5

kimi k2 thinking重磅开源 1万亿参数思考agent模型,300次工具调用碾压gpt 5

SWE-bench/docs/guides/evaluation.md at main · SWE-bench/SWE-bench · GitHub

SWE-bench/docs/guides/evaluation.md at main · SWE-bench/SWE-bench · GitHub

BytokenAI - 助您从容把握每一个最佳投资瞬间

BytokenAI - 助您从容把握每一个最佳投资瞬间

新前端之父来了智谱深夜放出编程炸弹,开源第一国产第一

新前端之父来了智谱深夜放出编程炸弹,开源第一国产第一

再看SWE-Bench：论一个好的benchmark是如何推动2025 Agent…

再看SWE-Bench：论一个好的benchmark是如何推动2025 Agent…

港股100强研究中心

港股100强研究中心

augment code全面解析新晋ai编程助手全面提升开发效率

augment code全面解析新晋ai编程助手全面提升开发效率

在kaggle上看到了这个比赛，比赛中涉及的SWE-bench是啥？有什么作用？ - 知乎

在kaggle上看到了这个比赛，比赛中涉及的SWE-bench是啥？有什么作用？ - 知乎

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

openai 草莓模型再次跳票,凌晨发布的swe bench verified是个啥

OpenAI 推出 SWE-bench Verified 基准，此项基准测试包含哪些关键指标？ - 知乎

OpenAI 推出 SWE-bench Verified 基准，此项基准测试包含哪些关键指标？ - 知乎

科技观察】2025 AI Index：解码全球AI 发展的关键转折点-科睿研究院

科技观察】2025 AI Index：解码全球AI 发展的关键转折点-科睿研究院

大模型无法替代码农,普林斯顿芝大惊人发现 gpt 4解决github编程问题成功率为0

大模型无法替代码农,普林斯顿芝大惊人发现 gpt 4解决github编程问题成功率为0

【内附榜单】评估AI大模型的代码修复能 …

【内附榜单】评估AI大模型的代码修复能 …

MiniMax和kimi都是人才，“吊打”Opus4.6 – 托尼不是塔克

MiniMax和kimi都是人才，“吊打”Opus4.6 – 托尼不是塔克

trae 2025年度产品报告发布超50 用户每天使用cue,代码补全仍是用户刚需

trae 2025年度产品报告发布超50 用户每天使用cue,代码补全仍是用户刚需

什么是SWE-Bench基准测试 | AIUG

什么是SWE-Bench基准测试 | AIUG

BytokenAI - 助您从容把握每一个最佳投资瞬间

BytokenAI - 助您从容把握每一个最佳投资瞬间

ai编码工具未能代替码农大模型的局限性揭秘

ai编码工具未能代替码农大模型的局限性揭秘

GitHub - SWE-bench-c/SWE-bench-c

GitHub - SWE-bench-c/SWE-bench-c

Claude Code完全指南：2025年最强AI编程助手深度评测- 伊人学社

Claude Code完全指南：2025年最强AI编程助手深度评测- 伊人学社

龙虾最佳适配模型,openclaw之父给出了推荐前排国产模型含量好高啊谁是pinchbench

龙虾最佳适配模型,openclaw之父给出了推荐前排国产模型含量好高啊谁是pinchbench

Multi-SWE-bench：首个多语言代码修复基准开源 - 知乎

Multi-SWE-bench：首个多语言代码修复基准开源 - 知乎

Github Copilot提供的这几个模型，哪个代码能力最强？

Github Copilot提供的这几个模型，哪个代码能力最强？

谷歌gemini 3.0 pro发布即屠榜马斯克奥特曼祝贺点赞

谷歌gemini 3.0 pro发布即屠榜马斯克奥特曼祝贺点赞

在kaggle上看到了这个比赛，比赛中涉及的SWE-bench是啥？有什么作用？ - …

在kaggle上看到了这个比赛，比赛中涉及的SWE-bench是啥？有什么作用？ - …

302.AI 基准实验室丨全球首发亿级参数模型Kimi K2：代码能力测评 ...

302.AI 基准实验室丨全球首发亿级参数模型Kimi K2：代码能力测评 ...

gpt 5.2震撼发布多项能力大幅超越对手,打工人的ai助手终于来了

gpt 5.2震撼发布多项能力大幅超越对手,打工人的ai助手终于来了

论文略读：SWE-bench: Can Language Models Resolve Real-world Github Issu…

论文略读：SWE-bench: Can Language Models Resolve Real-world Github Issu…

Grok 4.2 Beta 重磅上线：xAI首款原生多代理AI - 专业网站开发服务

Grok 4.2 Beta 重磅上线：xAI首款原生多代理AI - 专业网站开发服务

primate labs推出面向ai工作负载的全新geekbench套件

primate labs推出面向ai工作负载的全新geekbench套件

论文略读：SWE-bench: Can Language Models Resolve Real-world Github Issues ...

论文略读：SWE-bench: Can Language Models Resolve Real-world Github Issues ...

懂交付，更懂质感：MiniMax M2.1 Vs. GLM 4.7 国产开源顶流对决丨 ...

懂交付，更懂质感：MiniMax M2.1 Vs. GLM 4.7 国产开源顶流对决丨 ...

谷歌新模型gemini 3 flash发布定义更快更省更智能

谷歌新模型gemini 3 flash发布定义更快更省更智能

MiniMax和kimi都是人才，“吊打”Opus4.6 – 托尼不是塔克

MiniMax和kimi都是人才，“吊打”Opus4.6 – 托尼不是塔克

别再盲目堆 agent 了 anthropic 官方教你从简单做起

别再盲目堆 agent 了 anthropic 官方教你从简单做起

Doubao-Seed-Code 实测：卷价格、卷跑分，却卷不动真实代码？丨 ...

Doubao-Seed-Code 实测：卷价格、卷跑分，却卷不动真实代码？丨 ...

openai史上最快模型降临,每秒1000token,代码从此炸出来

openai史上最快模型降临,每秒1000token,代码从此炸出来

实测MiniMax M2.5：开源掀桌，性价比封神？先看看它交的作业丨302 ...

实测MiniMax M2.5：开源掀桌，性价比封神？先看看它交的作业丨302 ...

刚刚,openai迎10周年,发gpt 5.2,重点是和白领抢工作

刚刚,openai迎10周年,发gpt 5.2,重点是和白领抢工作

BytokenAI - 助您从容把握每一个最佳投资瞬间

BytokenAI - 助您从容把握每一个最佳投资瞬间

刚刚,年度最强 ai 登场马斯克奥特曼点赞 gemini 3,体验后我发现 chatgpt 要慌了

刚刚,年度最强 ai 登场马斯克奥特曼点赞 gemini 3,体验后我发现 chatgpt 要慌了

DeepSeek小爆发-国际原油_中一期货｜香港中一国际期货【官方网站】

DeepSeek小爆发-国际原油_中一期货｜香港中一国际期货【官方网站】

普林斯顿首个开源 ai程序员登场,爆改gpt 4,93秒修bug

普林斯顿首个开源 ai程序员登场,爆改gpt 4,93秒修bug

AIME'25满分炸场！Qwen一波七连发，全家桶大更新它来了，它来了 ...

AIME'25满分炸场！Qwen一波七连发，全家桶大更新它来了，它来了 ...

全球首个ai程序员诞生,码农饭碗一夜被砸,10块ioi金牌华人团队震撼打造,996写代码训练模型

全球首个ai程序员诞生,码农饭碗一夜被砸,10块ioi金牌华人团队震撼打造,996写代码训练模型

MiniMax和kimi都是人才，“吊打”Opus4.6 – 托尼不是塔克

MiniMax和kimi都是人才，“吊打”Opus4.6 – 托尼不是塔克

今年trae写的代码 100000000000行超50 程序员每天在按tab键

今年trae写的代码 100000000000行超50 程序员每天在按tab键

Claude 3.7 Sonnet 正式發布：一文看清3 大升級vs Grok3 用家分享 ...

Claude 3.7 Sonnet 正式發布：一文看清3 大升級vs Grok3 用家分享 ...

大模型无法替代码农普林斯顿芝大惊人发现 gpt 4解决github编程问题成功率为0

大模型无法替代码农普林斯顿芝大惊人发现 gpt 4解决github编程问题成功率为0

DeepSeek#从图表中可以看出，DeepSeek-Coder-V2在多个基准测试中 ...

DeepSeek#从图表中可以看出，DeepSeek-Coder-V2在多个基准测试中 ...

全球首个ai程序员诞生,码农饭碗一夜被砸,10块ioi金牌华人团队震撼打造,996写代码训练模型

全球首个ai程序员诞生,码农饭碗一夜被砸,10块ioi金牌华人团队震撼打造,996写代码训练模型

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

普林斯顿首个开源 ai程序员登场,爆改gpt 4,93秒修bug

普林斯顿首个开源 ai程序员登场,爆改gpt 4,93秒修bug

OpenAI發布新模型GPT-5：「新升級是一大進步惟仍無法取代人類」

OpenAI發布新模型GPT-5：「新升級是一大進步惟仍無法取代人類」

首个ai软件工程师上线,已通过公司面试抢程序员饭碗,华人创始团队手握10块ioi金牌

首个ai软件工程师上线,已通过公司面试抢程序员饭碗,华人创始团队手握10块ioi金牌

MiniMax M2.5 重磅发布- 专业网站开发服务

MiniMax M2.5 重磅发布- 专业网站开发服务

开源版ai程序员来了 gpt 4加持,能力比肩devin,一天1.4k star

开源版ai程序员来了 gpt 4加持,能力比肩devin,一天1.4k star

性能持平价格大降80%，Anthropic新模型杀疯了-国际黄金_富士商品 ...

性能持平价格大降80%，Anthropic新模型杀疯了-国际黄金_富士商品 ...

首个ai软件工程师震撼硅谷,手握10块ioi金牌,他们铁了心砸掉程序员饭碗

首个ai软件工程师震撼硅谷,手握10块ioi金牌,他们铁了心砸掉程序员饭碗

金山云-文档中心-模型API服务简介

金山云-文档中心-模型API服务简介

Claude 悄悄进化：全新“思考”工具解锁，AI 也能像人一样“停下来想 ...

Claude 悄悄进化：全新“思考”工具解锁，AI 也能像人一样“停下来想 ...

Anthropic 推出Claude Sonnet 4.5 自主運行連續30 小時編程ASL-3 ...

Anthropic 推出Claude Sonnet 4.5 自主運行連續30 小時編程ASL-3 ...

Claude 4.5模型全解析- 专业网站开发服务

Claude 4.5模型全解析- 专业网站开发服务

从辅助编码到自主工程！智谱GLM-5 技术报告解读：开源大模型的 ...

从辅助编码到自主工程！智谱GLM-5 技术报告解读：开源大模型的 ...

GLM-4.5 震撼登場，開源生態再升級，全球競爭– TechNow 當代科技

GLM-4.5 震撼登場，開源生態再升級，全球競爭– TechNow 當代科技

懶人包】最新Gemini 3.1 Pro 推理性能增倍：3大升級重點與Lyria 3 ...

懶人包】最新Gemini 3.1 Pro 推理性能增倍：3大升級重點與Lyria 3 ...

小米mimo大模型对标deepseek，明天几个点？$小米集团-W(01810)$

小米mimo大模型对标deepseek，明天几个点？$小米集团-W(01810)$

GLM-4.5大模型介绍- 专业网站开发服务

GLM-4.5大模型介绍- 专业网站开发服务

超越GPT4.1！阿里开源最强AI编程模型Qwen3-Coder - 产业家

超越GPT4.1！阿里开源最强AI编程模型Qwen3-Coder - 产业家

AI提前过年！Codex 5.3 和Opus4.6 更新内容总结– 托尼不是塔克

AI提前过年！Codex 5.3 和Opus4.6 更新内容总结– 托尼不是塔克

AGENTS.md 真的没用？60000 + 项目在用，却被论文指出负收益 ...

AGENTS.md 真的没用？60000 + 项目在用，却被论文指出负收益 ...

全球首个混合推理模型Claude 3.7 降世！最强编程大脑暴击DeepSeek ...

全球首个混合推理模型Claude 3.7 降世！最强编程大脑暴击DeepSeek ...

OpenClaw最强大脑GPT5.4 “脚把脚”配置！ – 托尼不是塔克

OpenClaw最强大脑GPT5.4 “脚把脚”配置！ – 托尼不是塔克

Claude4深夜上线，重回巅峰- AI智能王

Claude4深夜上线，重回巅峰- AI智能王

IFeed

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

奇點真來了？史上首個自我進化AI誕生＊阿波羅新聞網

奇點真來了？史上首個自我進化AI誕生＊阿波羅新聞網

免費的Gemini3 Flash，谷歌的無解陽謀＊阿波羅新聞網

免費的Gemini3 Flash，谷歌的無解陽謀＊阿波羅新聞網

智譜打出「開源最強」牌，扭虧之路仍在迷霧中

智譜打出「開源最強」牌，扭虧之路仍在迷霧中

OpenAI 推出GPT-5.2-Codex 模型聚焦專業軟件工程及網絡安全能力 ...

OpenAI 推出GPT-5.2-Codex 模型聚焦專業軟件工程及網絡安全能力 ...

自调用代码基准测试：选择编程任务最佳LLM | 前途科技

自调用代码基准测试：选择编程任务最佳LLM | 前途科技

Claude for Chrome brings AI where you’re already working (Instrumental)

Claude for Chrome brings AI where you’re already working (Instrumental)

中国AI大战：奶茶店干爆单了- 深圳智慧云帆信息技术有限公司

中国AI大战：奶茶店干爆单了- 深圳智慧云帆信息技术有限公司

IFeed

傳聞Claude Sonnet 5 最快2 月3 日登場| 流動日報| LINE TODAY

傳聞Claude Sonnet 5 最快2 月3 日登場| 流動日報| LINE TODAY

帆軟香港峰會2025 圓滿落幕數據驅動未來，AI 賦能商業決策 ...

帆軟香港峰會2025 圓滿落幕數據驅動未來，AI 賦能商業決策 ...

流动性冲击高峰已过机构称港股迎逢低布局良机

流动性冲击高峰已过机构称港股迎逢低布局良机

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

OpenAI发布新模型付费ChatGPT用户即日起可使用

OpenAI发布新模型付费ChatGPT用户即日起可使用

斯坦福大学《2025人工智能指数报告》解读：技术突破、中美竞争与 ...

斯坦福大学《2025人工智能指数报告》解读：技术突破、中美竞争与 ...

一周AI大事：Kimi万亿模型横空出世，小鹏人形机器人“以假乱真 ...

一周AI大事：Kimi万亿模型横空出世，小鹏人形机器人“以假乱真 ...

性能持平价格大降80%，Anthropic新模型杀疯了-国际黄金_富士商品 ...

性能持平价格大降80%，Anthropic新模型杀疯了-国际黄金_富士商品 ...

流动性冲击高峰已过机构称港股迎逢低布局良机

流动性冲击高峰已过机构称港股迎逢低布局良机

全球首个混合推理模型Claude 3.7 降世！最强编程大脑暴击DeepSeek ...

全球首个混合推理模型Claude 3.7 降世！最强编程大脑暴击DeepSeek ...

OpenAI 教大家3 句Prompt 提示讓你完全發揮GPT-4.1 實力| 流動 ...

OpenAI 教大家3 句Prompt 提示讓你完全發揮GPT-4.1 實力| 流動 ...

Cursor要凉？OpenAI发布的Codex让我彻底躺平了！ - AI智能王

Cursor要凉？OpenAI发布的Codex让我彻底躺平了！ - AI智能王

Google Gemini vs GPT｜AI 搜尋差異、案例與應用完整比較

Google Gemini vs GPT｜AI 搜尋差異、案例與應用完整比較

Claude 3.7 Sonnet 登場：混合推理模型登場，POE上線，香港可用 ...

Claude 3.7 Sonnet 登場：混合推理模型登場，POE上線，香港可用 ...

字节跳动旗下AI编程产品TRAE，发布2025年度产品报告_TOM资讯

字节跳动旗下AI编程产品TRAE，发布2025年度产品报告_TOM资讯

IFeed

Grok 4.2 Beta 重磅上线：xAI首款原生多代理AI - 专业网站开发服务

Grok 4.2 Beta 重磅上线：xAI首款原生多代理AI - 专业网站开发服务

Claude4震撼发布！最适合开发者的究极模型！ - AI猫学长

Claude4震撼发布！最适合开发者的究极模型！ - AI猫学长

專家點評：軟件業打好轉型戰抗AI - 東方日報

專家點評：軟件業打好轉型戰抗AI - 東方日報

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

热度第一、Tokens 周调用破3T，MiniMax 这个春节杀疯了

IFeed

录屏扒代码、截图改网页，Kimi K2.5把「视觉x代码」玩明白了 ...

录屏扒代码、截图改网页，Kimi K2.5把「视觉x代码」玩明白了 ...

老黄杀入OpenClaw战场！最强开源「龙虾」模型直逼Opus 4.6

老黄杀入OpenClaw战场！最强开源「龙虾」模型直逼Opus 4.6

流动性冲击高峰已过机构称港股迎逢低布局良机

流动性冲击高峰已过机构称港股迎逢低布局良机

814e756ccb97425dbdf9905ec67b8d ...

814e756ccb97425dbdf9905ec67b8d ...

首位AI工程師誕生5分鐘做出網站還能debug 更懂訓練微調AI模型

首位AI工程師誕生5分鐘做出網站還能debug 更懂訓練微調AI模型

1 2 下一页