罗先镇

xzluo@ir.hit.edu.cn (+86) 188 4556 0861 Luowaterbi.github.io Google Scholar 15290843908

教育背景

哈尔滨工业大学 · 博士研究生 · 代码大模型 2022.09 – 至今

导师：车万翔教授 · 朱庆福副教授

荣誉：国家奖学金 · 🏆 ACL 2025 Outstanding Paper (Top 0.3%) · 🏆 ICML 2026 Oral (Top 0.7%)

哈尔滨工程大学 · 本科 · 计算机科学与技术 2018.09 – 2022.06

荣誉：国家奖学金 · 2 × ICPC 区域赛银牌 · 2 × ICPC EC-Final 铜牌

实习经历

MiniMax · Top Talent 实习生 2026.04 – 至今 · 北京

负责 Cyber Coder 的算法方向，围绕代码安全与下一代 SWE 场景，推进 CPT、PostTrain 及模型能力迭代。

快手科技 · KStar 研究实习生 2025.08 – 2026.03 · 北京

针对测试用例质量评估的分数虚高、效率低等问题，将任务转换成二元矩阵上的数学问题，系统性回答评估过程中所需的代码和测试用例数量，将评测数量收敛到5%。TC-BenchICLR 2026
从零搭建多智能体框架，大规模、高效率构建代码安全终端环境。收集、构建、测试和评估全流程自动化，无需人工干预。
复现质量达到专家级别。与专家人工复现结果（10小时+/任务）进行交叉验证，一致率超过95%。支持异步并行，单机20并行在5小时内可生成215个任务。
扩展至4k+高质量漏洞修复任务。微调后的Qwen3-32B性能提升5倍，可比肩Minimax-M2.7和Claude Sonnet 4。在TerminalBench和跨语言场景中展现出强泛化能力。CVE-FactoryICML 2026 Oral

阶跃星辰 · 预训练研究实习生 2024.12 – 2025.07 · 北京

从零开发并清洗全量GitHub文件和Issue数据。进一步优化过滤规则以去除乱码文本，显著减少loss spike。在代码数据上进行了FIM、Meta Info、MTP和Focal Loss策略的实验。Step-3Tech Report
探索并验证了代码的Scaling Law。在特定约束下，预测误差低于0.1%。Code Scaling LawsACL 2026
发现了代码压缩率与下游代码任务性能之间的对数关系。Code CompressionArxiv

度小满 · 校企合作研究员 2023.11 – 2024.09 · 北京

从正确性和细节敏感性的角度合成代码SFT数据，在小模型上达到SOTA。Semi-InstructArxiv 2024 CTF-InstructArxiv 2025
利用多编程语言辅助推理，在多个基准和模型上取得一致提升。MultiPoTEMNLP 2024
提出噪声训练框架，通过去噪任务激活LLM的并行解码能力，在保持任务性能的同时实现2倍加速。Make Some NoiseEMNLP 2024
利用LLM解码的词表分布，仅需2MB额外存储即可实现2倍无损加速，超越此前的免训练推测解码方法30%以上。Token RecyclingACL 2025 Outstanding

一作论文

🏆 ICML 2026 Oral CVE-Factory: Scaling Expert-Level Agentic Tasks for Code Security Vulnerability

罗先镇, 张景远, 周士祺, 黄金阳, 肖川, 朱庆福, 马志远, 岳星, 岳洋, 曾文聪, 车万翔

ACL 2026 Scaling Laws for Code: A More Data-Hungry Regime

罗先镇^*, 郑文镇^*, 朱庆福, 张荣燚, 李厚意, 黄思明, 范元涛, 车万翔

ICLR 2026 How Many Code and Test Cases Are Enough? Evaluating Test Cases Generation from a Binary-Matrix Perspective

罗先镇^*, 黄金阳^*, 郑文镇, 朱庆福, 徐明拯, 徐逸恒, 范元涛, 覃立波, 车万翔

🏆 ACL 2025 Outstanding Paper Turning Trash into Treasure: Accelerating Inference of Large Language Models with Token Recycling

罗先镇, 王一轩, 朱庆福, 张致铭, 张玄昱, 杨青, 许冬亮

ACL 2025 ChartCoder: Advancing Multimodal Large Language Model for Chart-to-Code Generation

赵烜乐^*, 罗先镇^*, 施琦, 陈驰, 王硕, 车万翔, 刘知远, 孙茂松

EMNLP 2024 Python is Not Always the Best Choice: Embracing Multilingual Program of Thoughts

罗先镇, 朱庆福, 张致铭, 覃立波, 张玄昱, 杨青, 许冬亮, 车万翔

EMNLP 2024 Make Some Noise: Unlocking Language Model Parallel Inference Capability through Noisy Training

王一轩^*, 罗先镇^*, 魏福烜, 刘议骏, 朱庆福, 张玄昱, 杨青, 许冬亮, 车万翔

Arxiv Is Compression Really Linear with Code Intelligence?

徐杨世杰^*, 罗先镇^*, 初征, 李厚意, 黄思明, 王秋锋, 车万翔, 朱庆福, 周水庚

Arxiv Success is in the Details: Evaluate and Enhance Details Sensitivity of Code LLMs through Counterfactuals

罗先镇, 朱庆福, 张致铭, 徐明拯, 程天豪, 王一轩, 初征, 徐杨世杰, 马志远, 范元涛, 车万翔

Arxiv Semi-Instruct: Bridging Natural-Instruct and Self-Instruct for Code Large Language Models

罗先镇, 朱庆福, 张致铭, 王旭, 杨青, 许冬亮, 车万翔

其他论文

ICML 2026 Memoria-Bench: A Comprehensive Benchmark for Evaluating Memory in Long-Horizon Autonomous Agents

王秋锋, ..., 黄思明, 罗先镇, ..., 张前文

ACL 2026 (Findings) Format-Adapter: Improving Reasoning Capability of LLMs by Adapting Suitable Format

王丁子睿, 张玄靓, 曹荣禹, 窦隆绪, 罗先镇, 马迎伟, 朱庆福, 车万翔, 黎槟华, 黄飞, 李永彬

Survey From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence

核心贡献者

Tech Report Step-3 is Large yet Affordable: Model-system Co-design for Cost-effective Decoding

核心贡献者

ACL 2025 📢 Oral OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

黄思明, 程天豪, ..., 罗先镇, ..., 汪自力

KDD 2025 Advancing Tool-Augmented Large Language Models via Meta-Verification and Reflection Learning

马志远, 刘嘉聿, 罗先镇, 黄振亚, 朱庆福, 车万翔

ACL 2025 (Findings) ChartEdit: How Far Are MLLMs From Automating Chart Analysis? Evaluating MLLMs' Capability via Chart Editing

赵烜乐^*, 刘学鑫^*, 杨昊玥^*, 罗先镇, 曾繁虎, 李建玲, 施琦, 陈驰

COLING 2024 A Survey on Natural Language Processing for Programming

朱庆福, 罗先镇, 刘芳, 高翠芸, 车万翔

ACL 2022 (Findings) Inverse is Better! Fast and Accurate Prompt for Few-shot Slot Tagging

侯宇泰, 陈成, 罗先镇, 李博涵, 车万翔

AI Open 2022 Augmented and Challenging Datasets with Multi-step Reasoning and Multi-span Questions for Chinese Judicial Reading Comprehension

孟庆烨, 王梓岳, 陈航, 罗先镇, 王宝鑫, 陈志鹏, 崔一鸣, 吴大勇, 陈志刚, 王士进

Arxiv Automated Snippet-Alignment Data Augmentation for Code Translation

张致铭, 朱庆福, 罗先镇, 王一轩, 李博涵, 车万翔

项目经历

CVE-Factory：漏洞环境大规模合成框架 3 117 2026.10 – 至今

独立开发 Multi-Agent 环境合成框架，支持宿主机多种子并行异步生成，全流程自动化。
复现约 4k 漏洞环境，与专家人工复现交叉验证一致率超 95%。代码、数据与模型全部开源。

活字：开源通用大语言模型 12 200 2023.03 – 2023.05

作为核心开发者，负责代码预训练和后训练数据的收集与整理。
主导中文预训练数据集的收集和组织工作。

Abacus：轻量级代码大语言模型 2 47 2023.10 – 2024.09

Abacus拥有27亿参数，在编程和通用语言任务上均优于Stable Code-3B和Granite-3B-Code等30亿参数以下的代码大模型。
主导后训练数据构建。