原阿里Qwen后训练负责人郁博文离职后,正式加入字节Seed团队强化多模态布局

   发布时间:2026-03-12 15:05 作者:陈丽

近日,科技行业传来一则重磅人事变动消息:原阿里巴巴通义实验室Qwen(千问)大模型后训练负责人郁博文,已正式入职字节跳动,出任Seed团队视觉模型与多模态交互团队后训练负责人。这一变动引发了业界对大模型技术发展方向的广泛关注。

郁博文拥有深厚的学术背景,本科就读于中南大学,随后在中国科学院信息工程研究所攻读研究生,并于2022年获得中国科学院大学博士学位。在校期间,他专注于自然语言处理与信息抽取领域的研究,曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文。他创新性地将信息抽取任务转化为图结构问题,有效解决了实体重叠、嵌套等复杂场景下的识别难题,并因此荣获中国科学院院长奖。

2022年博士毕业后,郁博文以阿里集团最高级别校招项目“阿里星”的身份加入阿里巴巴达摩院,担任算法专家(P7)。他迅速成长为通义千问大模型团队的核心成员,深度参与了该模型的早期训练与研发工作,并最终担任后训练负责人。在后训练领域,郁博文展现出卓越的技术能力,主导了Qwen系列Chat模型的研发工作。他通过监督微调(SFT)、强化学习(RLHF)、直接偏好优化(DPO)等技术手段,将通用大模型转化为符合人类价值观和使用习惯的对话模型。

针对不同规模的模型,郁博文设计了“四阶段进化论”和“知识蒸馏”策略,使Qwen模型在长文本生成、复杂推理及多模态理解等任务上表现出色。在LMSYS Chatbot Arena等全球权威评测中,Qwen系列多次跻身前十,彰显了其技术实力。然而,2026年3月,阿里通义实验室启动组织架构调整,计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整导致郁博文的管理范围大幅缩小,且与其坚持的“预训练与后训练必须深度耦合”的技术理念产生冲突。阿里高层对千问团队施加的商业化考核压力,也加剧了团队内部的分歧。

2026年3月3日,郁博文提交了辞职申请,并于次日正式离职。他的工作由前Google DeepMind高级资深研究员周浩接任。郁博文的离职,被视为阿里大模型团队在技术路线与商业化压力下的一次重要调整。

与此同时,字节跳动Seed团队近年来在大模型和多模态领域持续加大投入,取得了显著进展。郁博文的加入,无疑将为Seed团队注入新的技术活力。他在视觉与多模态交互方面的后训练经验,将有助于字节跳动进一步提升其大模型的技术水平,推动公司在AI领域的布局向更深层次发展。此次人事变动,也反映出科技行业在激烈竞争中,对顶尖技术人才的争夺愈发激烈。

 
 
更多>同类内容
全站最新
热门内容
本栏最新