苹果开发出新款AI:可“看懂”屏幕内容并语音回复
苹果开发出新款AI:可“看懂”屏幕内容并语音回复
登录
苹果开发出新款AI:可“看懂”屏幕内容并语音回复
苹果开发出新款AI:可“看懂”屏幕内容并语音回复

苹果开发出新款AI:可“看懂”屏幕内容并语音回复

快科技4月2日消息,据媒体报道,苹果公司近日宣布,成功研发出一款前沿的人工智能系统ReALM(Reference Resolution As Language Modeling,即基于语言建模的参考解析)。

据悉,该系统具备卓越能力,能够精准解析屏幕上模糊的内容,同时深入理解相关对话及背景环境,从而为用户提供更为自然流畅的语音助手交互体验。

ReALM系统通过运用大语言模型技术,巧妙地将识别屏幕视觉元素这一复杂任务转化为纯语言处理问题。这一创新转换使得ReALM在性能上相较于传统技术实现了质的飞跃。

值得一提的是[],ReALM[]的独特之处在[]于其能够重新[]构建屏幕内容[]。通过深入分[]析屏幕上的信[]息及其位置分[]布,系统能够[]生成精准的文[]本表示,这对[]于捕捉视觉布[]局中的关键信[]息至关重要。[]

研究人员进一步展示了将ReALM与专门针对内容指向优化的语言模型相结合的方法,结果显示在执行相关任务时,ReALM的性能已超越业界翘楚GPT-4。

研究人员兴奋[]地表示:我们[]对现有系统进[]行了深度优化[]和显著改进,[]使其在处理各[]种类型的内容[]指向任务时均[]表现出卓越性[]能。即便是我[]们的最小模型[],也实现了超[]过5%的性能[]提升;而大型[]模型的表现更[]是显著超越G[]PT-4,令[]人瞩目。”

长期以来,苹[]果在创新领域[]更多扮演跟随[]者的角色,然[]而随着人工智[]能技术的迅猛[]发展,市场格[]局正发生深刻[]变革。如今,[]苹果正积极迎[]接挑战,努力[]在人工智能领[]域占据一席之[]地。

此外,备受瞩目的全球开发者大会即将在6月盛大召开。届时,苹果预计将推出一系列创新成果,包括全新大语言模型框架、Apple GPT”聊天机器人及其生态系统中的其他AI功能。

    版权归属: noBug
    本文链接: https://wucuo.com/post/817
    相关推荐

    评论区

    提示:本文章评论功能已关闭