关注微信公号,获取信息

字节跳动豆包大模型团队开源首个多语言类SWE数据集

4月10日,字节跳动豆包大模型团队正式开源首个多语言类SWE数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修Bug”能力。

在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向“全栈工程”的评测基准。

其数据均来自GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。

声明:综业网科技发布此内容旨在传播更多信息,不构成投资建议,据此操作,风险自担。转载时需注明出处:综业网科技 » 字节跳动豆包大模型团队开源首个多语言类SWE数据集