抢疯了,腾讯给大模型人才,定了一个前所未有的标准
抢疯了,腾讯给大模型人才,定了一个前所未有的标准
登录
抢疯了,腾讯给大模型人才,定了一个前所未有的标准
抢疯了,腾讯给大模型人才,定了一个前所未有的标准

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:蛋酱,授权站长之家转载发布。

「21世纪什么最贵?人才!」二十年前的黎叔语录,现在听来也不过时。

这两年,大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发,期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本,并受到了研究员、工程师和投资人们的广泛关注与深刻讨论:为什么是 OpenAI?

它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金,更重要的是一批顶尖 AI 研究人员的聚集。我们能看到,在 ChatGPT、Sora、GPT-4o 等划时代产品的背后,有一长串名单的核心贡献者,

一家科技公司[]想要持续「伟[]大」,技术人[]才是关键要素[]

目光转回国内,我们同样能看到一群怀抱着理想与热忱的技术人:有人苦战数月,和团队一起打造了首个中文原生 DiT 架构文生图开源模型;有人翻遍所有最新论文,为了将用户体验到的延迟从10毫秒降到1毫秒;有人多年如一日投身科学大模型的研发,希望找到用 AI 阐释生命的密码

这些人是如何工作的?在走近并倾听了他们的故事之后,我们发现了三个共同要素:真心热爱的赛道、对前沿技术的极致追求,以及持之以恒的自我驱动。

当然,人才也[]需要鼓励创新[]的土壤来适配[]。一种观点是[],科技公司应[]该不唯学历,[]公平选择最懂[]得解决问题的[]人。还有一种[]观点是,应该[]不唯资历,敢[]于重用新人,[]让团队永远流[]动着新鲜血液[]。总之,这是[]一个值得任何[]科技公司认真[]思考的问题。[]

让中文原生大模型做到世界领先

七年前,高研[](化名)拿到[]博士学位踏上[]回国航班的时[]候,根本想象[]不到,在接下[]来的几年里,[]人工智能领域[]会经历如此一[]场巨变。

我们知道,计[]算机视觉领域[]存在两种理解[]视觉处理的方[]式:判别式和[]生成式。这两[]种引导研究者[]们走上了不同[]的道路,在高[]研毕业之前,[]以「人脸识别[]」为代表的判[]别式 AI 技术刚刚经历[]了一场爆发。[]从大洋彼岸到[]国内,技术创[]业的氛围同样[]火热,门禁打[]卡、手机解锁[]、智能家居等[]场景催生出大[]量全新的应用[]

高研就是在这一年来到腾讯。这是一个「双向奔赴」的故事:手握数篇顶会顶刊的高研,只投了腾讯一家公司,然后,顺利通过当年腾讯的「技术大咖」项目入职。

如今,仅有7[]年工作经验的[]高研,已经先[]后在多个重点[]项目和论文中[]留下了自己的[]名字。

只不过这个过[]程中,他研究[]的内容在与时[]俱进。特别是[]从2022年[]开始,生成式[] AI 的爆发几乎颠[]覆了以往的研[]究思路,文生[]图成为了视觉[]领域的新热点[]

「技术不断发展,当年学的东西很多都『淘汰』了。」因此,学习也就成为了高研日常工作的一部分:每天下班回到家,都要浏览最新的技术研究,追踪最新的论文。

作为腾讯混元[]大模型团队最[]早的一批成员[],高研的研发[]成果已经被很[]多人用上 —— 过去一年,混[]元大模型的文[]生图能力实现[]了「从无到有[]」,然后是更[]加「精准、美[]观」。

强大的文生图能力背后,是高研和团队成员的数月奋战:业内首个中文原生的 DiT 架构文生图模型「混元 - DiT」。最近,混元 - DiT 已经全面对外开源。

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

  • 模型地址:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

  • 技术报告地址:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

混元 - DiT 的视觉生成效果对比前代混元文生图大模型提升超过20%。它支持中英文双语输入及理解,参数量15亿,不仅可以支持文生图,也可以作为视频等多模态视觉生成的基础。

多次迭代后,[]混元文生图大[]模型已经解决[]了「语义、内[]容、质感」这[]三点关键难题[],且率先迈出[]了落地的步伐[]:腾讯很早就[]开始在广告场[]景进行 AI 自动生成广告[]投放素材的探[]索,比如生成[]商品广告或广[]告配图的产品[]「腾讯广告妙[]思」。在广告[]业务下的多轮[]测评中,腾讯[]混元文生图的[]案例优秀率和[]广告主采纳率[]分别达到86[]% 和26%,均[]高于同类模型[]

我们经常说幕后团队成就了一款产品的辉煌,但从另一个角度说,产品的成功也成就了团队中的每一个人。对于高研个人而言,他将参与混元大模型项目的经历比喻为「人生开了加速器」—— 手中掌握的技术不仅能在更广阔的场景上进行充分应用和验证,还能拓展出新的业务合作,这让人真正感受到自己在做一件改变世界的事。

「博士毕业后,我教 AI 打游戏」

「父母知道你[]工作时打游戏[]吗?」

听到这个问题[],傅志远(化[]名)笑了:「[]只知道我在游[]戏部门搞研究[],但不知道我[]原来也打游戏[]。」

相比于博士期[]间大部分时间[]沉浸于论文和[]实验的生活节[]奏,傅志远工[]作之后确实「[]花了更多时间[]」在游戏上。[]

傅志远的研究[]方向是强化学[]习和多智能体[]系统,高校实[]验室的环境相[]对纯粹,大多[]时候是集中力[]量去突破领域[]内的某一个课[]题。在智能体[]技术的落地探[]索中,游戏行[]业是一个非常[]理想的试验场[]。与现实世界[]一样,游戏也[]是丰富的学习[]环境,具有反[]应灵敏的实时[]设置和不断变[]化的目标。很[]多研究者致力[]于构建更强大[]的 AI 智能体,赋予[]整个系统更强[]的规划或解决[]问题的能力。[]

这也是傅志远[]在毕业之际思[]考的问题:新[]兴 AI 技术能给游戏[]带来哪些新的[]突破?

在南洋理工大[]学拿到博士学[]位之后,傅志[]远决定回国,[]加入腾讯 IEG 光子工作室群[]。像腾讯这样[]的大厂,不管[]是算力资源还[]是用来训练和[]优化 AI 系统的游戏环[]境资源,都能[]提供最顶配的[]条件。

来到腾讯后,傅志远从游戏玩家变成了帮助开发游戏的人。「粗略算来,60% 的时间跟游戏本身的业务打交道,40% 的时间在学习、应用新的游戏技术。」具体地说,他的工作任务是使用 AI 改善游戏体验。

通常来说,A[]I 会被事先设置[]一个「奖惩机[]制」,然后自[]主进行玩法机[]制的探索和检[]查游戏功能是[]否有 bug,有时[]候还能发现一[]些人类没挖掘[]到的「亮点」[]:比如哪种匹[]配方式更有利[]于获胜、哪里[]可以钻空子、[]哪里可以有无[]限资源。最终[],这些发现都[]会被用来改进[]游戏体验。

与实验室不同[]的是,技术落[]地需要更多地[]考虑用户体验[]。比如,加入[] AI 模型能力固然[]有好处,却会[]增加游戏安装[]包的体量,团[]队要考虑如何[]在极限条件下[]让模型高效运[]转,不然会带[]来高延迟、高[]耗能、占内存[]、手机发烫等[]问题。

「20毫秒延迟和1毫秒延迟,对于用户体验来说有差异的。AI 的目标是让用户玩游戏的时候更快乐!」

在一个优秀人才集聚的地方,或多或少会有些「卷」。特别是与业务紧密相关的研究项目,会驱动人不停地思考和创造,既要熟悉游戏业务,也要追踪最新的 AI 技术。所以,每当有一篇重要的 AI 智能体新论文出现,内部团队都会马上坐下来认真讨论。

当自己参与训练的第一个模型在真实的商业环境里跑起来,傅志远的心理活动很强烈:「有一种听到赛车发动机在轰鸣的感觉,会很兴奋和期待。」

做有长期价值的事

和高研和傅志[]远相比,王艾[]文(化名)多[]年来的攻关方[]向一直很「学[]术」,从博士[]到入职腾讯 AI Lab 后都是如此。[]

近年来,将 AI 技术应用于传[]统的科学领域[],如物理、化[]学、生物、医[]学,即所谓的[] AI for Scienc[]e,是被寄予[]厚望的交叉领[]域,很多此前[]无法计算的复[]杂问题能够被[]很好地建模,[]并且得出足以[]指导现实世界[]中工程实践的[]有效预测,前[]所未有地促进[]了科学发现和[]技术创新。

其中,蛋白质[]组学是一个非[]常前沿的课题[]。科学界曾经[]认为,只要绘[]制出人类基因[]组序列图,就[]能了解疾病的[]根源,但事实[]并非如此。相[]同的基因往往[]有不同的表达[],这就是蛋白[]质组不一样的[]体现。

一个有趣的比[]喻是:基因组[]和蛋白质组的[]关系就像词典[]与文章、元素[]表与化工厂。[]因此,要真正[]阐释生命,必[]须从蛋白质组[]中寻找答案。[]

这就是王艾文近年来在做的事情。今年,她参与的三项「蛋白质组」主题的研究相继登上国际顶级学术期刊,分别为解决蛋白组学中的数据库、AI 建模和 AI 辅助临床分析问题提出了极具前瞻性的研究方案。

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

对王艾文个人而言,最难得的是腾讯 AI Lab 提供了一种非常纯粹的研究环境。

相较于所见即[]所得的商业价[]值,长期价值[]往往更难被看[]清楚。今时今[]日,我们很难[]确定几项蛋白[]质组学的研究[]能不能撬动一[]个大规模的市[]场,但也许生[]物产业的下一[]个爆发点很快[]就会到来。

腾讯2025青云计划启动:大模型人才扩招50%

如果将眼光放[]长远一些,技[]术人才不仅是[]科技公司之间[]的争夺,也关[]乎国家层面的[]综合实力竞争[]

大模型浪潮的爆发,某种程度上增加了争夺顶尖 AI 人才的激烈程度。今年,腾讯在新一届青云计划中特别强调:要加强大模型领域人才的招募,名额要比去年再增加50%。招募范围面向「全球顶尖学子」,提供的是「极具竞争力的薪酬」,还有定制化的培养方案、核心业务工作机会、前瞻性技术课题等极具吸引力的条件。

今年3月,一份「全球人工智能人才追踪调查报告2.0」,追踪了多位顶级 AI 研究人员和科学家的全球分布与流动情况。报告发现,中国培养了相当大比例的全球顶级 AI 研究人员,这一数字从2019年的29% 上升到了2022年的47%,而且越来越多的 AI 人才选择了在中国发展。

中国不断增长[]的产业需求,[]正是吸引这些[] AI 人才的因素。[]经历了去年的[]一场百模大战[],中国已有2[]00多个大模[]型,且还在快[]速增长。在大[]模型时代,不[]管是科技巨头[]还是初创企业[]都有广阔的发[]展空间。

可以看到,中[]国在大模型技[]术落地层面已[]经走在前列。[]论起做产品,[]中国公司比海[]外公司多了一[]份「场景」优[]势,而大模型[]市场的升温会[]带动起上下游[]产业链,同时[]提升了数据、[]算力和算法等[]领域的人才需[]求,也为这些[]人才提供了施[]展才华的广阔[]空间。

一直以来,腾讯都非常重视对技术人才的招募和培养,过往通过顶尖技术人才招募项目加入腾讯的同学中,目前已有几十位已成长为各大业务部门的核心骨干和技术中高管。他们在各个项目中贡献自己的才华,也找到了更清晰的人生目标。

6月19日,腾讯宣布全新一年的青云计划正式启动

本年度青云计[]划招募的范围[]包括 AI 大模型、基础[]设施 / 硬件、金融科[]技、存储 / 数据库、机器[]人、多媒体、[]游戏引擎、安[]全、量子、大[]数据共十大技[]术领域。特别[]是,加入腾讯[]青云计划的人[]才,将由腾讯[]首席科学家张[]正友和俞栋、[]吴石等杰出科[]学家担任导师[]

报名候选人的毕业时间需符合:

  • 2023年1月 -2025年12月的博士同学

  • 2024年1月 -2025年12月的本硕同学

同时,报名青云计划的候选人要满足以下三项要求:

  1. 有真正的技术理想,技术热忱,技术执着,愿用技术力量提升全球各地人们的生活品质;

  2. 学生时代便取得了出色的技术成就,在学术、实践、竞赛等任一领域有卓越表现;

  3. 能以独到的洞察力,穿透技术本质并应用落地,为复杂问题提供创新而深远的答案。

另外,预计从7月起,腾讯将组织多场青云技术沙龙活动 & 技术开放日,携手业务领军人、科学界学术大咖、腾讯技术大牛等共同探讨技术领域最前沿的话题,助力技术人才发展。

    版权归属: noBug
    本文链接: https://wucuo.com/post/1597
    相关推荐

    评论区

    提示:本文章评论功能已关闭