中新社北京1月29日电 (记者 陈航)29日,记者从北京市科委、中关村管委会获悉,致远大规模多模态模型研究成果《Multimodal Learning by Predicting the next token of a Large Multimodal Model(大型多模态模型通过预测下一个词元素进行多模态学习)》于28日发表在主流学术期刊《国际自然》上,备受期待。计划于2月12日正式印刷出版。这是中国科研院所牵头的大型模型研究成果首次在《自然》杂志正式版上发表。
2018年以来,GPT走的是“预测下一个词元素”的自回归路线,在语言模型上取得了大规模的重大进展,掀起了生成式人工智能的浪潮。
虽然亩多模态模型主要依赖于对比学习模型和扩散模型等专用路径,自回归路径是否可以作为集成多模态的通用路径一直是一个未解之谜。
志远的工作表明,多模态学习可以集成,并且仅使用自回归路径就可以学习良好的大规模原生多模态模型,这对于将自回归建立为生成人工智能的统一路径具有重要意义。
Nature编辑对该研究评价:致远提出的Emu3仅基于下一个词元素的预测就实现了文本、图像和视频的大规模集成学习。在生成和识别任务中的性能与使用 ruis professional 相当。这一成果对于构建可扩展、集成、多模态的智能系统具有重要意义。
报道称,自研发致远鸸鹋系列产品以来,Odel从2022年开始,围绕“原生多模态”核心技术路线不断迭代,每个版本都在关键特性和方法论上取得了进展。下一步,致远将继续关注智能与物理世界的深层关系,驱动下一代人工智能的科学研究和创新。 (已完)【编辑:刘洋河】
两大城市晋级,中国城市总量达29万亿元
国外明星打卡奎因跑了!云南菜味道如何?泪水从我的嘴角溢出……
如何打造川渝地区成渝电力走廊新能源供应大动脉?
多重因素导致国际金银价格暴涨
不要乱吃鱼油。做出错误的决定可能会火上浇油。
从大型展览到日常生活,非洲产品走进月球新年
西方媒体与美国白宫“交战”:“关税王”还是“恐龙来了”?
国共专家组论坛将讨论哪些议题以及谁将参加国共论坛?
结合2026年春节,多部门发声
法院裁定顾客多次携带蟑螂到敲诈餐厅
西方领导人正在排队访华吗?带领美国队很难。
现货黄金首次突破5500美元 多只贵金属股触及涨停
中新网评论:普通食品变“神药”。谨防糖衣药丸诈骗。
马年解锁90%!挑战:你能在“世界超市”找到“神马”吗?
美联储会“按兵不动”、降息,还是在鲍威尔主席“谢幕”后重启?
格陵兰岛局势拉响了“战略警报”。欧元该如何pe回应?
分享经验、交流知识。为什么年轻人如此热衷“技能社会化”?
中国的专利药品可能很快就要说再见了。 “目前还不清楚。”把药物留在家里安全吗?