一、动态
上海AI实验室开源发布书生·浦语数学,计算推理能力刷新上限
1月23日,上海人工智能实验室(上海AI实验室)开源发布新一代数学模型书生·浦语数学(InternLM2-Math)。基于书生·浦语2.0(InternLM2)强大的基础能力,InternLM2-Math仅以中轻量级参数规模,即在多项数学评测中刷新开源模型数学能力上限;此外,InternLM2-Math不仅会“解题”,更会“判题”,突破了传统数学大模型应用局限,将为数学基础研究和教学提供优质应用基座。InternLM2-Math为首个同时支持形式化数学语言及解题过程评价的开源模型,以强大内生计算和推理能力,为技术社区提供强大数学工具和模型范式。秉持“以高质量开源赋能创新”的理念,InternLM2-Math代码和模型完全开源,并支持免费商用。
来源:上海AI实验室开源发布书生·浦语数学,计算推理能力刷新上限
二、他山之石
1、猎户星空百亿参数大模型发布
1月21日,在猎户星空大模型发布会上,猎豹移动董事长傅盛以《AI大潮下企业如何创新?从技术狂欢到企业落地-私有化大模型是王道》做主题分享,正式发布猎户星空大模型,并带来七大场景应用微调模型与大模型应用交钥匙解决方案。猎户星空大模型(Orion-14B)是由猎户星空研发的预训练多语言大语言模型,以其140亿参数规模展现出了性能。Orion-14B模型在一个庞大且多样化的数据集上进行训练,数据集规模达到了2.5万亿token。这一规模不仅覆盖了常见语言,还涵盖了专业术语和特定领域知识,确保模型能够理解和生成多种语境下的文本。作为百亿参数大模型,Orion-14B的基座能力在MMLU、C-Eval、CMMLU、GAOKAO、BBH等第三方测试集上,均为同级别模型SOTA,表现优异;最长可支持320K token超长文本,在三十万文字中任意位置随机隐藏关键信息,对模型进行提问,结果全部正确;通过AWQ Q4量化技术,模型大小减少70%,推理速度提升30%,性能几乎无损(损失小于1%),千元级显卡可流畅运行。
2、广东:云端赋能大湾区:华为云照亮数字化转型之路
为助力本地数字政府建设、特色产业数字化及人才发展,华为云赋能云以创新中心为载体,通过全面洞察广东各区域产业发展动态,充分发挥技术、产业和资源等优势,做厚品牌影响力,引领产业发展方向。截止2024年1月,在湾区这方热土,华为云总共落地了涵盖软件、工业、开发者等领域的24个创新中心,一以贯之地全力推动着大湾区的经济发展和当地企业的数智升级,以及民生福祉的增进提升。基于华为在ICT行业30余年的雄厚积淀,以及长期服务企业级市场的实践经验,华为云赋能云为企业提供了转型所需的基础技术、智能升级、产业协同、转型咨询以及人才培养等服务,已经被产业界公认为数字化转型的“云基座”。通过云、AI、5G等为代表的ICT技术,华为云联合行业领先的合作伙伴,共同聚焦于平台能力及生态优势等方面,为广大企业提供了“贴身”的创新解决方案,满足他们的数字化转型需求。