ChatGPT的爆火出圈,让大模型走出专业领域,进入更普适的圈层,并引发更多人关注和思考这项技术究竟会如何影响人类社会。最终全社会形成共识:这是一项革命性技术,将充分释放智能生产力,推动人类社会进入到一个全新AI时代。商业机遇来临,谁能率先把握住风口,意味着谁将在下一轮市场竞争中取得优势占位。今年以来,神州数码也积极拥抱大模型带来的全新变化,时刻关注技术发展动态,升级自有知识产权产品,加速布局人工智能算力等领域,切实抓住AIGC时代变革机遇,谋求全新发展。
在刚刚结束的2023数字生态大会上,神州数码副总裁、CTO李刚受邀出席,与多位行业专家就大模型技术的深入应用以及模型评估等话题,进行了深入探讨。本文就李刚讨论内容进行整理编辑,希望能给火爆市场一些启发和思考。
以下为详细内容整理:
大模型发展需重视Native场景,避免路径依赖
大模型与其他新技术出现以后,大家第一反应都是“+”,“大模型+”这个说法并不新鲜,因为之前有互联网+,所以大家从这个角度直接切入是很自然的。
大模型是百年来颠覆性的技术范式转变,我认为它真正的应用场景还没有出现,“+”的场景不是最好的场景,以前互联网爆发的时候,最后跑出来的都是互联网Native的应用,大模型真正的应用场景也应该是Native的场景。我们寻找Native场景,要避免路径依赖,也就是要避免模仿以前的模式和路径来探索大模型的应用场景。
目前大模型技术还没有完全成熟,我们还看不到它未来的发展顶点在哪儿。我认为要关注一个非常大的、Native的场景是多模态,在企业里面,多模态几乎是没有人去想,那多模态会出现什么场景,这个是要关注的。神州数码关注大模型的时候,首先成立了一个追踪团队,组织一帮人关注行业动态,看论文写周报,如果论文内容可验证就第一时间进行验证。其次是做敏捷,模型要想在企业里面用,需要做出一套敏捷平台,让企业去试,同时把客户Involve进来共创。我们现在已经签了一些共创客户,让客户使用敏捷平台,在共创过程中去摸索最适合的场景。最后作为一个科技企业还是要第一性原理,两头跟住,一方面是研究的跟进,一方面是场景的跟进。
大模型评估专业又前沿,注重知识本身和涌现能力
大模型评估本身就是一个非常前沿的领域,虽然现在已经有一些评估方法和标准出现,但站在企业角度,这些方法和标准还不够,所以模型评估本身就是一个研究方向。
目前行业里做模型评估主要围绕两点进行,针对外部模型进行评估,主要是通识能力评估,包括知识本身和涌现能力两部分。在行业大模型方面,它的行业知识评估相对简单,但行业涌现能力,是一个专业性很强的话题。举个例子,我们在金融行业做了一个行业大模型,它的涌现能力是什么呢?通用大模型的涌现能力,比如我们给它一道奥数题,它能够解出来,这就很厉害了。
行业大模型一般来说是通过通用大模型做全参,或者是做fine-tuning,做好了以后出来的这个大模型叫行业大模型。这个做好了以后,是不是说通用能力加行业知识等于行业涌现能力?这是个问题。我们讲风控,如果不是风控应用,而是行业大模型直接提供风控能力,这就是一个非常大的涌现出来的能力。它不是说只是看到了这些东西,他会直接对业务做一个风控评价,那这个就很难。
传统来说,都是用传统的机器学习做成的小模型来做,能不能泛化到大模型里面去做?这个是涌现出来的吗?这就非常难。所以现在是一个选择和共创的问题,选择愿意在大模型里面跟我们一起做研究的,大家一起探索、共创。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。