一、动态
1、上海人工智能实验室:大模型评测体系司南OpenCompass2.0发布,年度大模型榜单揭晓,司南合作伙伴计划启动
1月30日,大模型开源开放评测体系司南(OpenCompass2.0)正式发布,旨在为大语言模型、多模态模型等各类模型提供一站式评测服务。OpenCompass2.0全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实的技术支撑。OpenCompass2.0同时揭晓了2023年度大模型公开评测榜单,评测结果显示,GPT-4 Turbo在各项评测中均获最佳表现,智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0紧随其后;大语言模型整体能力仍有较大提升空间,复杂推理相关能力仍是短板;中文场景下国内的模型更具优势,中文闭源大模型接近GPT-4 Turbo的水平,开源模型进步很快,以较小的体量达到较高性能水平,表现出较大的发展潜力。
来源:上海人工智能实验室:大模型评测体系司南OpenCompass2.0发布,年度大模型榜单揭晓,司南合作伙伴计划启动
2、阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库
近日,在国际AI大数据峰会上,阿里云推出了备受业界关注的企业级大模型检索增强生成(RAG)解决方案,可以给大模型装上“专属知识外挂”,企业仅需几次点击即可连接PB级规模数据,让大模型成为洞悉行业和企业知识的专家,大幅提升回答表现。“检索增强生成”简称RAG(Retrieval-augmented Generation),是当下最热门的大模型前沿技术之一。如果将“微调(finetune)”理解成大模型内化吸收知识的过程,那么RAG就相当于给大模型装上了“知识外挂”,基础大模型不用再训练即可随时调用特定领域知识。通过RAG技术,大语言模型在回答问题时,可以从企业知识库中检索最新的相关信息来生成内容,从而提高回答的准确性、关联性和新鲜度,并解决幻觉问题。同时,RAG技术外挂的私有数据不参与大模型训练,保证了企业的数据安全。
来源:阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库
二、他山之石
1、上海曼恒发布首款AI+XR技术产品“海马绘画”平台
曼恒数字正式发布AI产品,曼恒SeaHorse海马绘画平台是一款基于人工智能技术的绘画辅助软件。通过深度学习和图像处理技术,该产品能够将用户提供的草图或文字描述转化为精美的艺术作品。无论是专业的艺术家还是绘画初学者,海马绘画平台都能提供强大的创作支持,帮助用户快速生成独特且富有创意的作品。用户仅需提供简单的草图、文字或短语描述,该平台即可在短时间内生成不同样式的艺术作品,包括动漫、折纸、3D模型、写实等。海马绘画平台适用于各种需要绘画创作的场景,如艺术创作、设计草图、插画制作、海报设计等。无论是专业的艺术家、设计师还是绘画爱好者,海马绘画平台都能为用户提供极大的便利和创意支持。
2、科大讯飞发布首个基于全国产化算力平台训练的全民开放大模型讯飞星火V3.5
1月30日,科大讯飞举行讯飞星火认知大模型V3.5升级发布会,发布首个基于全国产化算力平台训练的全民开放大模型讯飞星火V3.5。在发布会现场,科大讯飞董事长刘庆峰表示,星火认知大模型V3.5已经实现了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力这七大能力的全面提升。其中,语言理解、数学能力已经超过GPT-4 Turbo,代码能力达到GPT-4 Turbo的96%,多模态理解达到GPT-4V的91%。除了星火认知大模型V3.5,科大讯飞还同时发布了星火语音大模型。刘庆峰表示,星火语音大模型语音识别效果达到国际领先水平,在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。据介绍,讯飞翻译机将搭载星火语音大模型,上线多语种自动识别和增强式翻译两个功能。