声明:本文来自于微信公众号 光子星球(ID:xxxxx),作者:吴先之吴坤谚,授权站长之家转载发布。
业内关于如何最大限度激发大模型潜力,以及打造“新质生产力”的争论似乎将在今年落下帷幕。眼下,大模型成为 “爆改”千行百业的抓手,让一切相关技术的突破都来得热闹且快速。
不过,大多数[]突破都只是停[]留在基础模型[]层面和浅层应[]用,我们能看[]到无数大模型[]的落地妙想,[]只是于生产力[]的本质和商业[]化程度而言,[]却与此前大差[]不差。究其原[]因在于这些技[]术性的突破大[]多停留在De[]mo阶段,技[]术产品化难言[]成熟,以至于[]有人用“期货[]”调侃。
比如于年初掀[]起多模态革命[]的Sora,[]这款产品迄今[]都未曾正式发[]布。而引爆全[]球的LLaM[]A3.1,仍[]旧是基于Sc[]aling Law的基础[]模型。就算其[]为开源派壮了[]不少声势,但[]受限于Met[]a一次性可调[]用的GPU数[]量,这个爆点[]对渴望落地的[]国内大模型赛[]道的推动亦有[]限。
在众多卷基础大模型能力的企业中,我们发现京东云选了不一样的路径。
7月30日,京东云峰会上,京东集团技术委员会主席、京东云事业部总裁曹鹏提出,通用大模型是靠算力堆起来,企业大模型要靠业务跑出来。供应链是京东跑马大模型前沿技术和产业应用的天然练兵场,当其他企业还在训练大模型或攻坚智能体时,京东内部已经上了“手”。
据了解,过去一段时间中,京东在超100个AI场景已经全面铺开大模型应用,近35万京东自有配送员、超23万商家、超5万副主任级别以上医生、超2万采销运营、超1万研发人员都在使用,并拿下了大模型时代的首个大规模商业化应用里程碑——京东云言犀数字人。
透过数字人的[]商业化突破,[]京东言犀大模[]型无论是技术[]能力还是应用[]落地,都得到[]了来自大量实[]际场景专业数[]据的“喂养”[]。可以说,本[]次京东云在峰[]会上发布的包[]括言犀数字人[]3.0平台、[]言犀智能体平[]台以及企业构[]建大模型全栈[]服务等产品,[]不过是其基于[]深度产业kn[]owhow和[]供应链场景的[]水到渠成。
让大模型在产业里先跑起来,数字人吹响前哨
“数字人实际[]上是诸多技术[]融合的载体”[],京东探索研[]究院院长、京[]东科技人工智[]能业务负责人[]、IEEE Fellow[]何晓冬博士提[]到,文案生成[]、语音融合、[]形象渲染、多[]模态等能力高[]低都会影响数[]字人的实际落[]地情况。
因此,数字人才被视为当下大模型多模态技术落地的诸多场景中,跑得最快,商业化最成熟,且实际应用频率最高的一个。
众所周知,不[]论是大模型的[]技术产业适配[]还是多模态的[]技术内需,其[]面对的一大挑[]战便是需要不[]同类型的数据[]对齐,以及围[]绕同类型的能[]力需要不同建[]模。这需要一[]个标准化的i[]nterfa[]ce作为校验[]多模态能力以[]及持续迭代,[]就是数字人。[]
而今距离“采[]销东哥”数字[]人进入直播间[]已过去三个多[]月,一大批大[]中小商家在此[]期间入局。一[]个重要原因是[]数字人降低了[]直播电商的门[]槛。对于零售[]电商而言,以[]数字人为代表[]的AI技术,[]很大程度上实[]现降本提效;[]对于AI而言[],零售电商则[]是一众大模型[]服务商突破场[]景壁垒的关键[]钥匙。
从品类、客单价、场域的不断突破,我们能看见数字人突破场景边界的清晰脉络。无论是大模型能力还是产品化后的AI应用,场景都是最好的试金石。
据了解,京东[]云言犀数字人[]上个阶段初步[]解决了大姿态[]、交互等贴合[]实际直播场景[]中的问题,到[]目前言犀数字[]人3.0平台[]已经上线了1[]00+个性化[]角色,50+[]特色行业属性[]场景并以平台[]化形态落地。[]而转动起场景[]飞轮的言犀大[]模型,也在以[]极快的速度不[]断解锁新能力[],逐渐成长为[]有情感、个性[]化的数字人。[]
语言方面,在[]不同场景中积[]累了更多数据[],放大了模型[]参数量,让言[]犀数字人在零[]售、金融等领[]域的长文本理[]解和推理能力[]。语音合成方[]面,超20万[]小时训练量,[]让京东数字人[]音色的自然表[]现度上有了明[]显提升,一些[]带口音的微妙[]变化都能捕捉[]到。
京东云言犀技[]术团队提到,[]在数字人之间[]的交互已经可[]以做到让其表[]现出聆听状态[]。聆听姿态让[]数字人直播从[]“单口”到“[]群口”,真人[]与数字人混播[]以及多数字人[]直播将变成可[]能。此外,言[]犀数字人大模[]型有更好的通[]识理解能力,[]实现“零样本[]”数字人生成[],这意味着生[]成新形象,将[]不再需要预训[]练。
实际场景又为[]大模型提供了[]更精准的数据[]来源,从而转[]动京东大模型[]的数据飞轮,[]加速应用生长[]。短短几个约[]时间,语音合[]成所需时间从[]6月份的6秒[],缩短到如今[]的3-5秒左[]右。
何晓冬博士表示,大模型的核心人机交互介质是智能体、数字人、具身智能,分别满足了云、端、线下不同场景的交互需求,共同构建起下一代智能交互的完整触点。
Meta创始人扎克伯格亦在访谈中提到,未来的AI智能体甚至可能会比人类还多,人们会以各种方式与之互动。
智能体、数字[]人、具身智能[]是满足不同场[]景需求,但本[]质上都是基于[]同一套大模型[]“底座”“。[]借由数字人这[]项业务单点突[]破而后全面铺[]开,在业务中[]生长与进化,[]这是京东云独[]有的产业驱动[]导向的大模型[]落地路径。
由点及面,大模型应用全面铺开
“虽然我们面[]向B端服务,[]但落脚点却始[]终在用户体验[]升级上”,京[]东云言犀团队[]认为,数字人[]B2B2C的[]底层逻辑让这[]项技术的应用[]落地可以被快[]速复制到京东[]业务的方方面[]面,甚至开辟[]新的业务线,[]为京东开拓更[]多AI试验田[]。
比如,以AI[]社交为代表的[]泛娱乐应用固[]然可以在一定[]助推甚至是冷[]启动的情况下[],透过年轻化[]的公域快速裂[]变,但这类应[]用的留存率却[]相对“感人”[]。工具类应用[]一定程度上平[]衡了留存与推[]荐的权重,然[]而缺乏快速裂[]变的能力,也[]限制了应用本[]身的场景宽度[]。
近段时间,一[]众AI应用层[]的创业独角兽[]均被曝寻求收[]购,很大程度[]上便源自于此[]。如用户大量[]流失的AI社[]交应用Cha[]racter[].AI,以及[]无法仅依靠订[]阅跑通商业模[]式的AI搜索[]明星Perp[]lexity[]。
大模型应用的[]可靠性,场景[]和数据飞轮究[]竟能不能转起[]来,呈现互为[]因果的关系。[]这也是京东认[]为“企业大模[]型靠业务跑出[]来”的底层逻[]辑。
从数字人这个[]点来看,电商[]场景的应用宽[]度、深度构建[]了京东大模型[]的鲁棒性,而[]不同品类的商[]详知识、不同[]行业领域知识[]、大规模交互[]数据则完成了[]数据的互补。[]这便是应用深[]度为大模型能[]力带来的快速[]跃升。
消费是距离用[]户最近的场域[]之一,数字人[]在零售电商泛[]场景的锤炼让[]京东的多模态[]大模型技术由[]点及面成为可[]能——除电商[]直播场景外,[]京东云言犀数[]字人还在文旅[]、金融、智能[]服务、政务咨[]询等更广泛的[]场景应用落地[],通过与亿级[]用户智能交互[],带来下一代[]交互体验。
比较典型的案[]例是,京东数[]字人的多模态[]情感识别能力[]顺畅地延展到[]了客服场景。[]我们自京东方[]面了解到,金[]融业务目前已[]有超过半数的[]用户在客服场[]景由数字人接[]待,迄今已服[]务超过500[]万用户,24[]小时问题解决[]率高达85%[],满意度超9[]0%。
高质量的垂域知识也让京东加快了云端交互为主的智能体的产品化步伐。本次峰会上正式发布了新一代一站式 AI Agent 开发平台——言犀智能体平台。平台已接入数十个大模型,用户可以低成本快速搭建基于 AI 模型的各类智能体。如今,活跃在京东内部的智能体超3300个,平台还沉淀了100多个行业解决方案模版。
从产业中来,[]到产业中去。[]业务与问题驱[]动的京东言犀[]大模型无意间[]加速了技术迭[]代的进度,这[]反倒催生了以[]往未被人注意[]到的需求。线[]下文旅场景,[]基于京东大模[]型能力的山西[]大同花木兰数[]字人、江西新[]余数字人、云[]南楚雄数字人[]小彝妹以展示[]大屏、短视频[]等终端为载体[],丰富游客体[]验并提速景区[]商业化;企业[]侧,不少大型[]企业也萌生了[]定制数十万员[]工数字人形象[]的需求。
基于大模型这[]个“大脑”,[]多模态技术让[]用户的交互界[]面的变革悄然[]发生。
“从文字走向[]视频化,再走[]向行业。我们[]验证了数字人[]大规模商业化[]的突破口,形[]成了行业标杆[]的效应”,被[]问及数字人乃[]至京东大模型[]的应用前景时[],京东云言犀[]团队难掩兴奋[]。
毕竟,长期让[]规模跑在商业[]化前头的大模[]型赛道,可算[]有了能让两者[]并驾齐驱的方[]法论。
边用边训,转动产业应用的技术飞轮
越来越多的大[]模型应用,正[]在京东供应链[]上生长,并于[]京东内部超1[]00个AI场[]景全面铺开。[]我们可以随意[]像报菜名一样[]拉出智能体平[]台、总裁数字[]人、智能客服[]、AI外呼,[]还是面向商家[]的商家客服京[]小智、AIG[]C商品图生成[]乃至京东供应[]链之内小哥终[]端智能助手、[]编程助手Jo[]ycoder[]、康康健康助[]手等一系列应[]用。
不过,应用只[]是大模型服务[]商能力输出的[]前端,如何授[]人以渔才是重[]头戏。包括训[]练、精调、压[]缩、拉升等在[]内的大模型能[]力构建才是A[]IGC时代下[],新质生产力[]的内生力量。[]
京东有别于其他模型服务商的不同在于,其将夯实基座模型作为过程,目的是从基础设施到Agent应用,构建全场景的大模型服务能力,持续推动大模型落地产业,输出供应链的行业knowhow。
就像上半年卷[]疯了的长文本[],该技术路径[]是大模型接受[]大量文本数据[]的输入后,将[]信息处理并分[]析推理,最终[]按不同应用场[]景和需求输出[]多种多样的结[]果。
京东透过应用[],让大模型这[]个新质生产力[]在产业内跑起[]来是输入,那[]么其对外开放[]的企业模型构[]建能力便是输[]出。
我们了解到,[]京东的大模型[]技术在产品化[]前,都会率先[]在内部完全跑[]通。尤其是业[]已为其所平台[]化的数字人与[]智能体两大人[]机交互介质,[]无论是数字人[]的生成还是智[]能体的构建,[]京东都做到了[]让零经验的运[]营们抛开算法[]部门独立搭建[]。
强易用性、“零”样本、“零”幻觉是京东大模型技术栈产品化的先决条件——可靠性是前提,易用性是基础。
如果我们再向底层基建下探,就能发现言犀大模型技术栈中与产业完全适配的关键,在于其大模型渐进式拉升与压缩技术。好比科幻电影《黑客帝国》中的Neo,是架构师(Architect)眼中的“唯一”。
去年末起,为[]了捅破大模型[]与产业间的那[]层窗户纸,大[]模型的拉升与[]压缩能力成为[]AI军备竞赛[]的赛点。这本[]质上是针对企[]业关于大模型[]的通用能力、[]垂域能力、响[]应时间等不同[]需求的一种大[]模型“场景适[]配”。更重要[]的是,京东在[]基础的拉升与[]压缩之上,还[]做到了同步灌[]注垂域知识,[]甚至实现领域[]数据自进化并[]注入模型中。[]
海量垂域数据[]的灌输必将产[]生过拟合,好[]比一个学生,[]平时做习题做[]得很好,考试[]成绩却很差。[]为了让大模型[]能“举一反三[]”,只好不断[]增加训练集,[]然而这又将导[]向费时费力的[]人工标注。如[]何以较低成本[]解决过拟合问[]题,是捅破前[]述窗户纸的关[]键。
自技术路径上[]看,京东的做[]法与此前的深[]度学习框架f[]ast.ai[]异曲同工。只[]不过而fas[]t.ai是在[]数据层,透过[]渐进式图像分[]类数据集,而[]京东则是在模[]型层发力。
一般来说,多[]模态大模型相[]对更注重全局[]理解,垂类、[]细颗粒度理解[]与情感识别是[]“短板”。京[]东之所以能在[]数字人、智能[]体等应用上率[]先取得商业化[]的突破,根源[]便在于“边训[]边用”,让京[]东同时转起了[]产业和技术的[]飞轮。
在寻找新质生[]产力的历史叙[]事中,京东云[]凭借产业供应[]链深度,已然[]率先跑通了应[]用乃至基础设[]施构建的全链[]路。随着面向[]公众的言犀智[]能体平台与言[]犀数字人3.[]0平台的正式[]发布,来自产[]业的know[]how又将触[]及更广阔的场[]景,打造更全[]面的生态。
角逐基座模型、Demo与某项技术之巅,或许会将行业引入垃圾时间,更多创新与确定性的未来,诞生于产业之中。
评论区
提示:本文章评论功能已关闭