站长之家(ChinaZ.com) 4月12日 消息:中山大学HCP实验室联合Sea AI Lab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。
这项研究的关键在于使用来自日本的“大喜利”(Oogiri)创新响应游戏作为数据源。传统的大模型,如GPT-4,处理这类任务时往往表现得过于正经,缺乏幽默感。而中山大学的“梗王大模型”则能够根据图像或文本输入,生成具有幽默感和创意的响应。
项目页:ht[]tps://[]top.ai[]base.c[]om/too[]l/clot[]
论文地址:h[]ttps:/[]/arxiv[].org/p[]df/231[]2.0243[]9.pdf
“大喜利”游[]戏要求玩家对[]提供的多模态[]内容(如问题[]、图像等)给[]出幽默和创意[]的回应。例如[],一张老人向[]年轻人求助的[]图片,传统回[]应可能是询问[]路线,而“大[]喜利”风格的[]回应可能是请[]求帮助解开手[]铐,这种出人[]意料的回答具[]有强烈的幽默[]冲击感。
研究团队采用[]了一种新的非[]顺序、创造性[]思维范式——[]跳跃思维(L[]eap-of[]-Thoug[]ht,LoT[]),以及一套[]基于此范式的[]训练方法CL[]oT。CLo[]T包括关联性[]指令微调和探[]索性自我调整[]两个阶段,旨[]在激发模型的[]创新响应能力[]。
性能评估方面[],CLoT在[]Oogiri[]-GO数据集[]上的选择题和[]排序题评估中[],显著提高了[]多模态大模型[]的性能,并超[]越了包括GP[]T-4在内的[]其他先进模型[]。用户调查也[]证实了CLo[]T在生成幽默[]内容方面的优[]越性。此外,[]CLoT在其[]他任务如“看[]云猜物CGG[]”和“发散思[]维测试DAT[]”中也展现了[]良好的泛化能[]力。
中山大学人机物智能融合实验室(HCP Lab)由林倞教授于2010年创立,专注于多模态内容理解、因果及认知推理、具身学习等领域的研究,并取得了丰富的学术成果。此次研究的成功,不仅展示了该实验室在AI领域的创新能力,也为未来的人工智能研究提供了新的思路和方法。
评论区
提示:本文章评论功能已关闭