6月27日,广州市白云区城市管理和综合执法局(下称“广州市白云区城管局”)与华为云举行盘古政务大模型广州实验室合作签约暨揭牌仪式。作为政府部门与华为云盘古政务大模型联创合作,盘古政务大模型广州实验室将以城市治理为核心,在大模型赋能智慧一网统管、大模型联合创新、视频云平台应用升级、城中村高效治理等领域展开全面交流,联合打造智慧城管解决方案,建设盘古政务大模型典型标杆,以数字驱动城市管理高质量发展。
广州市白云区人民政府副区长陈永俊,广州市白云区城市管理和综合执法局党组书记、局长郑柏生,广州市城市管理和综合执法局科信处副处长徐智勇,广州市白云区城市管理和综合执法局党组成员、副局长关代章,广州市白云区政务服务数据管理局副局长郑刚,华为云EI服务产品部部长尤鹏,华为广州总经理田瑞,华为云广东副总经理卓越运营部部长诸旻,华为政企业务广州副总经理、白云区总经理李旺喜等出席签约及揭牌仪式。
现场揭牌合照
近年来,广州市白云区城管局按照白云区委、区政府的部署,认真践行“人民城市人民建,人民城市为人民”重要理念,以人民需求为导向、以解决问题为出发点,按照微架构、小组件的产业化思路,综合运用物联网、云计算、大数据、AI识别等新一代信息技术,构建了集感知、分析、服务、指挥、监察于一体的白云智慧城管平台,推进城市治理服务体系现代化。 同时,“白云智慧城管”模式已在全国多个区县推广落地,成为城市管理的全国优秀示范。
华为云作为华为的云服务品牌,将AI技术与行业知识相结合,推出了系列行业大模型。其中,政务大模型整合NLP、CV、多模态等多种大模型能力,助力政府实现一网统管、一网统感、一网通览、一网通办、一网通服、一网通协,加速政务应用现代化、智能化,赋能城市管理智能升级。
此次政企联合创新合作,广州市白云区城管局与华为云将发挥各自优势,探索盘古大模型在智慧城市领域的创新应用。通过盘古CV大模型,城市管理部门可为所有摄像头加上智慧大脑,7*24小时不间断“慧眼识事”,实现异常事件分钟级自动发现、自动立案,自动审核预结案,提高效率降低成本。通过盘古NLP大模型,以及数据治理、数字人交互技术能力加持,政务热线将拥有强大的工单分类分拨能力,有效实现民情洞察、民情汇聚、话题挖掘、话题关联分析等功能,提升群众办事满意度和政务治理效率。
广州市白云区城管局与华为云“强强联合”,通过盘古政务大模型广州实验室整合双方技术、资源和经验,携手共创集事件汇聚、展示、分析、预警、决策和指挥等功能于一体的智慧城管平台,加速形成告警推送、互联互通、快速反应的城市运行管理中心,赋能城市治理新风貌,推动城市治理高质量发展。
华为开发者大会2023(HDC.Cloud 2023 )将于7月7日在东莞拉开帷幕,同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共同探讨AI浪潮之下的新机会和新可能。大会将重点呈现华为云在“AI for Industries”方面的最新进展。参会链接:https://developer.huaweicloud.com/HDC.Cloud2023.html
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。