股价飙升!商汤大模型挑战GPT4
股价飙升!商汤大模型挑战GPT4
登录
股价飙升!商汤大模型挑战GPT4
股价飙升!商汤大模型挑战GPT4

股价飙升!商汤大模型挑战GPT4

4月25日 消息:4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进一步刊发相关公告。在“2024年商汤技术交流日”上,商汤发布了其最新的大模型——SenseNova5.0,旨在追赶GPT-4,这反映了中国大模型行业的集体目标。

股价飙升!商汤大模型挑战GPT4

商汤通过遵循[]大语言模型的[]尺度定律(S[]caling[] laws),[]在不到三个月[]的时间内,从[]SenseN[]ova4.0[]超越GPT-[]3.5到Se[]nseNov[]a5.0全面[]对标GPT-[]4Turbo[]。尺度定律强[]调了模型性能[]与模型大小、[]数据量和计算[]量之间的幂律[]关系。商汤利[]用科学试验和[]数学公式预测[]下一代大模型[]的性能,避免[]了盲目尝试。[]

商汤科技董事[]长兼CEO徐[]立提出,通过[]小规模实验可[]以预测和验证[]模型架构和数[]据配方的有效[]性,并确保这[]些结论在更大[]规模上得到保[]持。Sens[]eNova5[].0采用了超[]过10万亿t[]okens的[]中英文预训练[]数据,并通过[]逻辑合成数据[]提升模型的推[]理、数学和编[]程能力。

商汤还推出了[]1.8B参数[]的Sense[]Chat-L[]ite,它在[]主流评测中超[]过了所有开源[]2B的同级别[]模型。此外,[]商汤发布了针[]对端侧业务的[]SDK,以及[]企业级大模型[]一体机,支持[]金融、代码、[]医疗、政务等[]行业的数据私[]有化部署需求[]

面向软件开发[],商汤发布了[]小浣熊代码大[]模型一体机轻[]量版,它在H[]umanEv[]al的测试中[]表现超过了G[]PT-4,支[]持多种编程语[]言和上下文,[]旨在帮助企业[]开发人员更高[]效地编写、理[]解和维护代码[]

商汤在技术交流日上强调了合作伙伴的重要性,并展示了与华为昇腾等公司的合作成果。商汤的AI基础设施SenseCore和AIDC算力基座为其提供了强大的支持。商汤的生成式AI业务在2023年取得了显著增长,占总收入的35%。

    版权归属: noBug
    本文链接: https://wucuo.com/post/1056
    相关推荐

    评论区

    提示:本文章评论功能已关闭