2021年7月23日,由PingCAP主办的开发者盛会PingCAP DevCon 2021正式开幕。此次大会以“开放 x 连接 x 预见”为主题,探讨前沿科技与数字化趋势的融合,吸引了众多行业领袖和技术大咖解读行业观点、分享实战经验。
作为PingCAP战略合作伙伴,神州数码深度参与活动,带来开源技术领域的前沿观点与丰富案例,并发表了基于TiDB创新开发的主题演讲,分享对新一代数据库的思考与实践。
深入实践,拓展数据库应用边界
在7月24日的创新生态论坛上,神州数码集团CIO沈旸以“TiDB for PostgreSQL”为主题,分享了神州数码如何基于TiDB源码修改出一款满足PostgreSQL协议的数据库,让基于PostgreSQL的系统在不修改本身业务代码的前提下,快速迁移到分布式数据库上。
沈旸认为,进入数字原生时代,由于资源可以复用,开源又让信息的传递效率更高,让创新的门槛进一步降低。作为开源分布式数据库的领先者,TiDB 以其分布式高可用、高度弹性扩缩容、高性能并行集群处理能力等特性获得越来越多客户的使用。
针对目前TiDB只支持MySQL协议,而很多公司的历史系统依旧以PostgreSQL作为数据库来运行的问题,神州数码通过深入调研工作,对比MySQL与PostgreSQL两种数据库协议的差异,在TiDB源码的基础上进行重构,使其兼容PostgreSQL,解决了PostgreSQL数据库的系统迁移到分布式数据库的难题,为更多想要迁移到分布式数据库系统的用户提供便捷。
通过在TiDB中实现了基本的PostgreSQL 通信协议,并兼容 PostgreSQL 特有语法。目前神州数码基于TiDB打造的PostgreSQL数据库已经实现基本协议、用户登录认证、部分系统表和系统函数等功能。通过后期的深入研发,将继续攻克PostgreSQL 关键字和语法、PostgreSQL 数据库结构、PostgreSQL 系统表和系统函数、PostgreSQL 数据类型、部署运维相关工具等难题。
拥抱开源,打造技术开放生态
开源技术正在成为影响全球科技创新的主要力量。作为国内领先的云及数字化服务商,神州数码在不断提升自身技术创新能力与核心服务能力的同时,积极参与开源生态的建设。
2020年,神州数码与PingCAP成为战略合作伙伴,携手成立联合产品中心,在2021年初正式推出基于TiDB和神州鲲泰服务器的国内首款异构分布式数据库一体机,率先实现X86和ARM架构双循环技术突破,为金融、政府及各行业企业带来高灵活性和高可用性的数据库服务。
开源作为技术发展中一种变革性的方式,推动了无数技术的发展创新,促成了更多前沿领域的探索。神州数码将继续以开源技术作为重要方向,积极构建数字产业和技术生态,赋能产业的数字化转型,推动数字经济高质量发展。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。