OpenAI推出SWE-bench Verified：现有框架低估模型软件工程能力

2024-08-15 5932

OpenAI 推出更可靠的代码生成评估基准：SWE-bench Verified。该公司blog里最重要的一句话是：”随着我们的系统越来越接近 AGI，我们需要在越来越具有挑战性的任务中对它们进行评估”。该基准是对现有 SWE-bench 的改进版本（子集），旨在更可靠地评估 AI 模型解决现实世界软件问题的能力。（AI寒武纪）

声明：本网所登载内容出于更直观传递信息之目的。该内容版权归原作者所有，并不代表本网赞同其观点和对其真实性负责。若有来源错误或者侵犯您的合法权益，请及时通过邮箱rwzbs@126.com与我们联系，我们会及时反馈并进行处理。
本页链接：http://todaychina.zgshjdw.com/a110117-show/news-36052.html

中国平谷经济快讯

OpenAI推出SWE-bench Verified：现有框架低估模型软件工程能力

相关文章

热门排行

点击排行

热点标签