数据被称为21世纪的“石油”,对数据进行积累、分析、理解和有效使用所产生的价值在各行各业都已经被验证,而且不再只局限于某些大型企业。不同规模的组织机构、不同岗位上的工作人员都已经深谙这一点。
然而,虽然先进的数据技术被越来越多地使用,使用者的数据素养也不断提高,但仍有一些机构组织掉队了,例如公益组织,而这并非是公益组织缺乏使用数据工具、提高数据素养的意识,而是在能力和工具方面有所欠缺,所以还无法建立以数据为驱动的组织文化。
假设能够充分利用和释放数据的价值,公益组织和其他非营利机构想必能够极大提高运作和项目效率。但由于公益慈善领域通常需要各种审核和存档,这通常成为了公益组织购买数据工具方面的掣肘。
逐渐扩大的数据鸿沟
对公益组织而言,所获得的捐款或其他收入首要任务是回馈社区和人,这就意味着对新技术的投资和吸收高技能员工必须放在第二位。
如同数字鸿沟造成能上网的人比不能上网的人有着更大的优势,数据鸿沟也会对公益组织利用数据做好项目产生深远的影响。换句话说,假使公益组织无法获得数据驱动的洞察力,或无法有效地使用数据,他们的努力可能会受到严重阻碍。虽然这无关业界竞争,但对于利用数据来推动慈善、人道主义事业的进步是大为不利的。
能用、善用数据是关键
虽然有越来越多的公益组织通过数据来推动项目发展,但企业在这方面仍旧更占优势,很多企业已经在采用各种数据驱动型技术,如人工智能、物联网、数据分析等等,这些技术对于环保等项目上都能发挥巨大的用途。埃森哲最近的一份报告显示,有60%的机构在使用人工智能,53% 的机构使用数据分析和物联网来减少排放。要成功部署这些技术需要大量的数据,而且所有部门的员工都要具备数据知识,这样他们才能有效地使用这些工具。
更重要的是,公益组织的预算日渐紧缩,导致这些组织只能限制使用已有数据和工具,因此如何能够将现有数据和工具的价值最大化变得更加关键。如果利用创新工具生成数据的能力继续主要为企业所掌握,那么公益组织就必须专注于提高技能,使拥有的数据更加有效。
于今年年中发布的《中国公益组织互联网使用与传播能力第八次调研报告》显示,在中国公益组织中,有数字化规划和信息化规划的比例达45.25%,但不少机构在数字化和信息化方面投入的预算总体较低,没有预算的组织比例达到了39.36%。超8成机构在2022年并没有计划应用、部署、开发新的信息系统或数字化业务。
报告指出,公益组织的短板在于“数据分析能力”。 仅有23.18%的组织经常或有时对官方网站的数据进行分析(使用百度统计、站长网等工具),多数组织从不或很少对官方网站数据进行分析。同时,对微博、微信、短视频平台的数据及筹款数据的比例都较低。这也是公益组织数字化进程中的一大能力制约因素。
责任当前,谁应该站出来?
公益组织是真正在推动社会发生积极变化的机构,因此帮助他们符合所有人的利益。而企业主要是为了改善其环境、社会和治理(ESG)方面的表现,在商业利益面前,社会利益始终是放在第二位。
这种情况下,政府在向公益组织提供具体支持以提高其数据素养方面可以发挥作用,而且,在数据素养方面,各方有着很大的合作空间。例如,非营利组织可以利用企业的数据专业知识和资源,而合作的同时可以为企业提供机会,将合作纳入企业现有的ESG项目,营造双赢的局面。
总而言之,公益组织需要各方的大力支持,帮助他们释放数据的力量来应对最严峻的全球性挑战。可以设想一下,如果慈善机构和非政府组织能够提高数据素养,充分利用所拥有的信息,他们将能取得怎样的成就?数据技能的缺失,未来可能更广泛的数据鸿沟,将大大阻碍公益组织的工作效率,这是所有人都不愿意看到的。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。