oppo r827t OPPO r8207
白交 发自 凹非寺
量子位 | 公众号 QbitAI
国产多模态大模型的领导者
,再度迎来新篇章——
云从科技
从容大模型
成功跻身OpenCompass的权威榜单,仅次于GPT-4o和Claude3.5-Sonnet,全球排名第三。
没错,就是那位
AI1.0 四小龙
中最年轻的成员,
科创板AI平台第一股
在国产大模型群雄逐鹿的时刻,云从的从容大模型始终保持低调。
这次它终于低调中见惊艳,呈现出令人瞩目的成绩单。
来深入了解这位多模态领域的新领军者的实力如何。
根据
OpenCompass
的最新评测结果:
从容大模型在这套评估体系中,平均得分为65.5,超越了谷歌的Gemini-1.5-Pro和GPT-4v,仅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9),全球排名第三。
在国内市场,该成绩也超过了InternVL-Chat(61.7)和GLM-4V(60.8),占据了第一的位置。
OpenCompass大模型评测体系由上海AI Lab提供,框架完整且开源可复现。
该体系采用了八个具有代表性的数据集,全面、多视角且客观量化地进行评估。
评估维度包括目标检测、文字识别、动作识别、图像理解及关系推理等多个方面。
此次测评中,从容大模型在六个数据集上表现优异,位列全国第一,涵盖MMBench、MMStar、MathVista、HallusionBench、AI2D、OCRBench等。
特别是在OCRBench测试集上,以827分(总分1000分)取得全球最高分,比第二名GLM-4v高出13分。
这表明,从容大模型在文本识别、视觉问答及关键信息提取等任务中表现优越。
实际上,这也不是从容大模型首次在全球大模型竞赛中名列前茅。
它已经在视觉和跨模态领域多次刷新世界纪录。综合性能评估中,由第三方SuperClue、C-Eval等机构评测,位列全球前五。
云从科技的视觉大模型在Benchmark COCO上,从微软研究院(MSR)、上海AI Lab、智源AI研究院等知名机构中脱颖而出,刷新了世界纪录;
去年11月,在SuperClue测试中,从容大模型在国内大模型中排名第一,仅次于GPT-4和GPT-4 Turbo。
尤其在OPEN测试模块中,包括角色扮演、上下文对话和生成创作等能力均实现了SOTA。
尽管新晋的云从在表态上保持低调,但其大模型和AI进展却充满力量,频频发力。
以从容大模型为代表,来看看云从在AI大模型领域的布局和成果。
去年5月,经过行业的热切期待,从容大模型终于亮相。虽然起步时不算晚,却早早传递出强烈的行业应用信号。
发布会中,除了基座大模型外,云从还展示了多场景下的行业大模型,如政务、金融、制造、教育、游戏等。
同月,云从西部智算中心正式运营,标志着从容大模型生产线的投产。
具备
基座模型
应用生态
智算中心
等多个优势,从容大模型的起点并不低,并且加速明显。
这一年多的迭代和落地中,从容大模型在模型、应用和生态层面全方位发力。
在模型层面,从容大模型经历了1.5和2.0两个版本,目前包括语言、视觉、语音、代码生成和图像生成等多个大模型。
其技术能力频频获得学术界认可。
例如,云从与上海交大、中山大学等团队共同提出的视觉模型自监督学习方法PointCMP,仅需传统1%的数据量或无真实数据,便可达到相同效果,最终被CVPR 2023接收。
其视觉大模型还在ICCV2023细粒度行为检测挑战赛中获奖。
All-in-One大一统
,这一前沿的大模型学术思路,云从早在去年8月便已开展尝试。
他们在多模态领域提出的视觉-语言跟踪大一统模型All-in-One,在跨模态领域(TNL2K, LaSOT, LaSOTExt, WebUAV-3M)刷新了四项世界纪录。
底座大模型的能力不断提升,带动了行业基础大模型的迭代升级和应用落地。
例如在
交通领域
,他们的行人基础大模型在PA-100K、RAP V2、PETA、HICO-DET四个数据集上刷新了世界纪录。
消费领域
,他们的商品基础大模型在MUGE、Product1M两个大型开源中文多模态商品检索数据集上刷新了世界纪录,与百度、快手、京东、OPPO等竞争者同场竞技。
应用层面
,过去一年中,他们在金融、安防、政务、交通、能源、教育、医疗、港口、文娱等领域均有布局。
推出的数字人云月,除了拟人化表现外,还在动作、形象和智力层面接近真人。
为了更广泛的应用,他们还打造了数字人服务平台,实现了从造人、育人到用人的全链条操作。
在个人办公领域,他们推出了内置大模型的
AI鼠标
,支持语音输入、PPT生成、智能问答、智能写作等功能。
仅需一个「AI」键,每个人都拥有了自己的AI助手。
关于AI大模型的应用和落地,除了技术融合,还离不开
生态层面
的支持。
他们早早与华为昇腾合作,推出了
从容大模型训推一体机
,依托国产算力,为企业提供从模型训练到推理应用的一体化解决方案。
该解决方案内置了大模型推理引擎、调优工具和算子加速库,客户开箱即用,无需二次硬件配置,即可进行大型预训练模型的本地化部署。
他们还推出了
变电智巡大模型
,用于自动巡检电力设备,为能源行业的数字化转型提供了新的应用范式。
西部智算中心目前已具备1200P算力资源,可同时进行10个百亿级或2-5个千亿级基础大模型的预训练,以及约100个行业大模型的微调训练。
可以看出,云从的“一鸣惊人”并非一朝一夕的成果,也非孤军奋战。
除了技术实力和应用生态的优势外,他们从一开始便着眼于技术认知的准确性。
从容大模型的几次迭代,瞄准了能够迅速普及应用的刚需能力
例如多模态能力,以提供更优的交互性能;推理与压缩大模型参数,以更低成本实现更快部署。
作为一个注重人机协同操作系统的公司,云从此次的大模型开发无疑为他们带来了新的灵感与模式。
与此新的行业问题也随之而来:AI格局及大模型格局,到底离“确立”还有多远?
目前,行业发展进入了重新审视的关键期。
在过去,业内对新兴大模型创业公司进行了五虎、六小强的分类。
虽然这些团队的技术风格和战略路线各异,但它们都共有一个特点:
势头强劲,资本注入,迅速崛起。
OpenAI
这样的超级独角兽为代表,它们在行业中闪耀着耀眼的光芒。
面对日新月异的科技进步和市场需求,整个AI行业以及大模型的未来依然充满变数。
云从科技的成功并非偶然,而是源自其不断的技术创新和市场适应。每一次技术迭代,云从都在探索如何将大模型的能力更好地应用于实际场景中。
例如,从容大模型在多模态应用的表现优异,特别是在文本识别和视觉问答等方面的出色成绩,显示了它在处理复杂任务中的强大能力。
云从科技不仅关注技术的突破,还积极布局应用生态和技术转化,推动大模型的实际应用落地。
从政府到金融、从交通到医疗,云从的技术应用涉及多个行业,且其创新产品如数字人云月和AI鼠标都获得了市场的高度认可。
云从还通过与华为昇腾等企业的合作,推出了一体化的模型训推解决方案,简化了模型部署和应用的过程,进一步推动了行业的数字化转型。
综合来看,云从科技的成功不仅是技术积累的结果,更是对市场需求的精准把握和技术应用的深刻理解。
随着大模型技术的不断进步和应用场景的扩展,云从科技将继续在AI领域发挥重要作用,推动技术的进一步发展和行业的全面进步。
未来,随着技术的不断演进和市场的不断变化,我们有理由相信,云从科技将继续在全球AI大模型领域中保持领先地位,成为行业的标杆和引领者。
在这一过程中,如何应对不断变化的技术挑战和市场需求,将是云从科技面临的关键问题。
凭借其扎实的技术基础和丰富的行业经验,云从科技无疑具备了继续引领行业发展的实力和潜力。
AI的未来充满未知,但也正因如此,更值得我们期待。