近几年,人工智能技术及应用快速深入发展,智能语音、图像识别等AI核心技术在推动产业数字化转型方面发挥出重要作用。其中,智能语音交互更是不断取得突破进展,为工业、教育、医疗、互联网等行业优化产品及服务体验带来明显优势。
日前,在广西玉林市的一家制造业龙头企业“广西玉柴机器集团有限公司”,由联通数科自研的AI智能语音交互引擎正式投入应用,主要提供语音识别(ASR)、自然语言处理(NLP)等核心引擎服务与智能对话,支撑其智能坐席系统建设。
当客服接通电话后,该套系统可将通话语音实时转写成文本,并能针对客户的意图自动为客服人员提供回复提示,大幅提升了服务效率。
落地更多智能交互场景
该系统基于自研的语音识别、语音合成和自然语言处理等核心引擎,提供智能语音质检、智能外呼、智能对话等应用,可广泛应用在电信领域、数字政府、工业互联网、智慧金融、智慧医疗等行业的智能交互场景。

语音交互引擎是自研语音交互产品的核心,主要由语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)三类引擎构成,可实现“听”、“理解”、“说”等功能,性能对标业界,通过API方式提供开发调用服务。
智能语音质检平台,基于自研ASR和NLP技术,面向呼叫中心提供话务质量检测的产品,可帮助用户解决人工质检效率低、无法全量质检等痛点问题。该平台可根据业务场景配置质检规则(如关键词、话术、情绪、静音时长等及其组合),可视化显示客服人员的服务质量。

智能外呼平台,在自研ASR、TTS、NLP基础上打造高度拟人化的智能外呼机器人。平台提供可视化界面进行话术、流程的配置,快速灵活定制通知、回访、问卷调查等多种形式的外呼话术,实现外呼机器人定制,并能够自动完成外呼任务,支持多种维度的呼叫结果分析。

智能对话平台,融合NLP和知识图谱等技术,实现任务型对话和知识型对话等,支持对话知识库配置、对话流程控制等功能,支持钉钉、微信、APP、网站等多种接入通道,广泛适用于智能客服问答、智能办公助理、售前业务咨询等在线/电话客服系统。

联通自研语音识别引擎,支持标准普通话、重口音普通话和中英文混合识别;支持自动切句,自动添加标点,说话人分割等功能;在场景上支持离线识别和流式在线识别两种模式;在模型自定义上支持用户添加自己的热词模型和自定义语言模型。在普通话及重口音数据集上,性能同步业界,在运营商通话数据集上已形成领先优势。
智能语音交互是联通数科自主打造的对话类“职业技能”,致力于提供类人的“听”“理解”“说”等能力,助力各行业呼叫中心、客服机构等提升客户服务效率和服务体验。未来将持续面向客户痛点需求打造更多具备“职业技能”的行业AI,赋能行业数字化转型和智能化升级。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。