【2023年9月6日,北京】今日,百川智能在北京召开大模型发布会,正式发布Baichuan2开源大模型,昇腾AI基础软硬件平台正式支持Baichuan2大模型,并在昇思MindSpore开源社区大模型平台上线Baichuan2-7B模型开放体验。
发布会现场,百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其量化版本4bit,面向学术及商业市场提供大模型服务,并且均为免费可商用。

昇思MindSpore版本开源仓链接:
https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md
昇思MindSpore开源社区大模型平台:
https://xihe.mindspore.cn/modelzoo/baichuan2_7b_chat
文理兼备性能优异,全面领先 LLaMA 2
Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于2.6T高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署?槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

本次开源的两个模型在各大评测榜单上的表现优秀,在MMLU、CMMLU、GSM8K等几大权威评估基准中,以绝对优势领先LLaMA 2,相比其他同等参数量大模型,表现也十分亮眼,性能大幅度优于LLaMA 2等同尺寸模型竞品。
更值得一提的是,根据MMLU等多个权威英文评估基准评分 Baichuan2-7b以70亿的参数在英文主流任务上与130 亿参数量的LLaMA 2基本持平。

7B参数模型的Benchmark成绩

13B参数模型的Benchmark成绩
Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。
Baichuan2大模型
Baichuan2大模型是由百川智能开发的一系列开源可商用的大规模预训练语言模型。包含了70亿、130亿、530亿参数的模型。百川智能自成立之初,就将通过开源方式助力中国大模型生态繁荣作为公司的重要发展方向。此次开源的两款Baichuan2大模型,得到了上下游企业的积极响应,华为等众多知名企业均参加了本次发布会并与百川智能达成了合作。
昇腾AI
昇腾 AI 是以昇腾 AI 基础软硬件平台为基础构建的人工智能计算产业。昇腾AI基础软硬件平台包括 Atlas 系列硬件及伙伴自有品牌硬件、异构计算架构 CANN、全场景AI框架昇思 MindSpore、昇腾应用使能 MindX、一站式开发平台 ModelArts 和统一工具链MindStudio 等。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。