github issue_github issue

时间：2025-06-09 17:03 阅读数：2561人阅读

*** 次数：1999998 已用完，请联系开发者***

解决GitHub Issue能力登顶,字节豆包MarsCode团队分享工程实践解决真实GitHub Issue的基准测试,字节家的豆包MarsCode Agent悄悄登顶了。SWE-Bench,一个由普林斯顿大学提出的极具挑战性的Benchmark,近期受到工业界、学术界和创业团队的广泛关注。在其子集SWE-Bench Lite排行榜上,豆包MarsCode Agent近期冲上第一。虽然这是面向所有...

╯０╰

GitHub 改进项目 Issue 功能:加入子议题等特性IT之家 1 月 20 日消息,GitHub 发文,宣布对项目的 Issue 功能进行改进,新增子议题(Sub-issues)、议题类型(Issue Types)以及高级搜索(Advanced Search)功能,进一步便于开发者和用户交流讨论。据悉,其中子议题功能允许开发团队将主要议题细分为各种分类的子议题(可以理解为分成多个...

●０● 贼喊抓贼:黑客假借“捉虫”名义向 GitHub 项目发送钓鱼链接IT之家 9 月 24 日消息,据外媒 Bleeping Computer 报道,有黑客正锁定 GitHub 项目假借“捉虫”名义提交带有钓鱼链接的 issue,散布 Lumma Stealer 恶意木马。IT之家获悉,这些贼喊抓贼的黑客批量注册 GitHub 新账号,在目标项目中提报 issue 声称存在安全漏洞,诱骗项目所有者点击黑客...

∪▽∪

Claude化身服务器连一切!AI代码自己发Github,程序员只配动嘴了梦晨一水发自凹非寺量子位 | 公众号 QbitAIAnthropic又发大礼包!现在Claude自己就是一台服务器。能直连GitHub,AI自己写代码、自己创建仓库、Push代码、创建Issue、创建分支、创建PR一条龙服务。全程不用离开聊天界面,人类程序员只起到了提需求的作用,彻底退化成产品经理(狗...

format,png

GitCode 被曝批量搬运Github项目,成员称“内部在进行紧急整改”Github 地址都替换为 GitCode,还为开发者“贴心”注册了同名账号。在 GitCode 官方社区,昨日到今日有多条 Issues 要求立即删除搬运项目和用户,并得到了社区成员回复。对于开发者们的删除要求,名为 XXM 的 GitCode 官方社区成员昨日在 Issue 中表达了歉意,并很直接地表示按照要...

↓。υ。↓ watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0xlb25fSmluaGFpX1N1bg,size_16,color_FFFFFF,t_70

˙△˙ 豆包大模型团队正式开源首个多语言类SWE数据集其数据均来自GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。豆包大模型团队称,Multi-SWE-bench是业内首个面向多语言代码问题修复的大模型评测基准,覆盖Java、TypeScript、C、C++、Go、Rust和JavaScript等编程语言。作为一个标准化、可复现...

豆包大模型团队开源首个多语言类SWE数据集南方财经4月10日电,字节跳动豆包大模型团队宣布正式开源首个多语言类SWE数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言。其数据均来自GitHubissue,历时近一年构建,以尽...

watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA57m857qM44CB5oeu5YK3YA,size_20,color_FFFFFF,t_70,g_se,x_16

大模型“自动修bug”能力将提升,豆包开源多语言代码修复基准其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。Multi-SWE-bench 旨在推动自动编程技术从仅能解决单一语言(如 Python)和低复杂度的任务,朝着支持多语言、具备真实问题解决能力的通用型智能体迈进。SWE-bench 是当前最具代表性的...

大模型权威测试被曝翻车!偏袒GPT-4等闭源模型,提示词区别对待白交发自凹非寺量子位 | 公众号 QbitAI大模型权威测试,翻车了?!HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issue提出质疑。此前MMLU原始版本早已经被各家大模型刷爆了,谁考都是高分,对前沿模型已经没有了区分度。号称更强大、更具挑...

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM4MTEzMDA2,size_16,color_FFFFFF,t_70

≥０≤ OpenAI 推出 SWE-bench Verified 基准,更准确评估代码生成表现SWE-benchIT之家注:SWE-Bench 是一个用于评估 LLM 解决 GitHub 上真实软件问题能力的基准测试数据集。它收集了来自 12 个流行的 Python 仓库的 2294 个 Issue-Pull Request 对。在测试时,LLM 会拿到一个代码库和 issue 描述,然后生成一个补丁来解决 issue 描述的问题。该基准使...

⊙＾⊙ watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg2MTM5OQ==,size_16,color_FFFFFF,t_70