原阿里Qwen后训练负责人郁博文离职后，正式加入字节Seed团队强化多模态布局

发布时间：2026-03-12 15:05 来源：快讯作者：陈丽

近日，科技行业传来一则重磅人事变动消息：原阿里巴巴通义实验室Qwen（千问）大模型后训练负责人郁博文，已正式入职字节跳动，出任Seed团队视觉模型与多模态交互团队后训练负责人。这一变动引发了业界对大模型技术发展方向的广泛关注。

郁博文拥有深厚的学术背景，本科就读于中南大学，随后在中国科学院信息工程研究所攻读研究生，并于2022年获得中国科学院大学博士学位。在校期间，他专注于自然语言处理与信息抽取领域的研究，曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文。他创新性地将信息抽取任务转化为图结构问题，有效解决了实体重叠、嵌套等复杂场景下的识别难题，并因此荣获中国科学院院长奖。

2022年博士毕业后，郁博文以阿里集团最高级别校招项目“阿里星”的身份加入阿里巴巴达摩院，担任算法专家（P7）。他迅速成长为通义千问大模型团队的核心成员，深度参与了该模型的早期训练与研发工作，并最终担任后训练负责人。在后训练领域，郁博文展现出卓越的技术能力，主导了Qwen系列Chat模型的研发工作。他通过监督微调（SFT）、强化学习（RLHF）、直接偏好优化（DPO）等技术手段，将通用大模型转化为符合人类价值观和使用习惯的对话模型。

针对不同规模的模型，郁博文设计了“四阶段进化论”和“知识蒸馏”策略，使Qwen模型在长文本生成、复杂推理及多模态理解等任务上表现出色。在LMSYS Chatbot Arena等全球权威评测中，Qwen系列多次跻身前十，彰显了其技术实力。然而，2026年3月，阿里通义实验室启动组织架构调整，计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整导致郁博文的管理范围大幅缩小，且与其坚持的“预训练与后训练必须深度耦合”的技术理念产生冲突。阿里高层对千问团队施加的商业化考核压力，也加剧了团队内部的分歧。

2026年3月3日，郁博文提交了辞职申请，并于次日正式离职。他的工作由前Google DeepMind高级资深研究员周浩接任。郁博文的离职，被视为阿里大模型团队在技术路线与商业化压力下的一次重要调整。

与此同时，字节跳动Seed团队近年来在大模型和多模态领域持续加大投入，取得了显著进展。郁博文的加入，无疑将为Seed团队注入新的技术活力。他在视觉与多模态交互方面的后训练经验，将有助于字节跳动进一步提升其大模型的技术水平，推动公司在AI领域的布局向更深层次发展。此次人事变动，也反映出科技行业在激烈竞争中，对顶尖技术人才的争夺愈发激烈。

更多>同类内容