在市场环境瞬息万变的背景下,企业之间的角逐不再单纯局限于产品的品质与功能,以及服务的质量与效率,创新能力已然成为企业角逐市场的关键要素。
当我们把目光聚焦到2024年的科技圈时,如果要探寻这一年最引人瞩目的焦点所在,那么生成式AI无疑会在众多答案中脱颖而出。回首刚刚过去的2024年,诸多行业纷纷探索如何利用该技术提升运营效率、创新能力和市场竞争力。
试水AI遭遇困境
据国际数据公司(IDC)发布的《全球人工智能和生成式人工智能支出指南》预测, 2025年全球企业在AI解决方案上的支出将达到3070亿美元,并且到2028年将增长至6320亿美元,复合年均增长率为29.0%。这一系列数据清晰地展现出,人工智能所蕴含的巨大市场需求与发展潜力,同时也预示着在未来几年,该技术将在各个领域扮演更加重要的角色。
在人工智能飞速发展的当下,一群特殊的参与者值得关注――初创企业,正面临着诸多挑战。由于技术储备不足、资金相对匮乏,以及业务场景适配困难等因素,它们在采用AI技术方面进展缓慢,大多仍停留在测试阶段,或是仅开展一些孤立的项目,也难以将其全面、深入地融入自身业务体系,从而导致AI技术的潜力未能在其业务中得到充分释放。
一面是市场压力如影随形,另一面是采用AI面临困境。初创企业亟需找到破局之法,借助AI技术在激烈的市场竞争中谋得发展契机。
把握AI未来趋势
值得一提的是,Forrester Research的2024年AI现状调查,为我们带来了新的思路与启示。调研显示,三分之二的受访者认为其组织的AI项目投资回报率即使未达到50%,也可以认为是成功的。对于初创企业而言,无疑是一个积极的信号。
不仅如此,NVIDIA在各个行业领域的专家在前不久对未来一年进行了预测。他们指出,下一个即将到来的重要趋势是代理式AI,这种自主或“推理型”AI需要使用多样化的语言模型、精密复杂的检索增强生成堆栈以及先进的数据架构。这一预测或许能为正在探索AI破局之路的初创企业提供新的方向和可能。具体来看:
第一,多样化的语言模型
NVIDIA AI智能体高级研究科学家LINXI(JIM)FAN认为,推理是AI智能体的核心能力。以OpenAI在2024年9月发布的新型大语言模型OpenAI o1(又称 “Strawberry”)为例,该模型经过强化学习训练,可执行复杂推理任务。在回复用户前,会先生成一条长内部思维链,纠正错误同时,将复杂步骤拆解为简单步骤,最后再响应用户。
展望2025年,大量计算将开始向边缘推理转移,这意味着数据的处理和分析将更多地在靠近数据源的设备或边缘节点进行。在这种情况下,应用程序可能需要成千上万个的token来处理单次查询,由于小语言模型能够在微秒内连续进行多次查询直至生成答案,因此变得更加节能,对机器人技术的重要性也日益凸显。借助小型模型,能创造出协助人类完成日常工作的人形机器人和普通机器人,进而推动移动智能应用的发展。
由此可见,大、小模型协同发展已成为人工智能领域的重要趋势。在此背景下,初创企业可借助这一趋势,精准锚定自身业务方向,在不同应用场景中充分发挥大、小模型各自优势,实现差异化竞争。
第二,精密复杂的检索增强生成堆栈
随着企业对AI应用的深度与广度不断拓展,如何进一步提升AI的效率、增强其分析洞察能力以及优化数据利用,成为了亟待解决的关键问题。
在NVIDIA生成式AI软件副总裁KARI BRISKI看来,AI编排器、多步推理及AI查询引擎这三项功能,有望精准解锁当前AI发展困境。
1、AI编排器:企业将部署大量AI智能体,这些智能体是经过训练的半自主模型,能够在企业内部网络进行客户服务、人力资源、数据安全等任务。为了更大限度提高这些任务的效率,预计数量不断增加的AI编排器能够将人类查询流畅地引导至多个智能体,综合结果并加以解释,从而为用户提供建议并采取行动。
编排器能够深入理解内容、具备多语言能力,并能够流畅处理包括PDF、视频流等多种数据类型。BRISKI表示,在自学数据飞轮的驱动下,AI编排器将持续完善对特定业务的洞察。以制造业这一具有代表性的领域为例,实时数据的准确分析对于企业的决策制定和运营效率提升至关重要,AI编排器凭借其强大的数据处理能力,能够对企业生产过程中产生的海量实时数据进行快速、精准且全面地分析,根据生产计划和供应商谈判提出建议来优化供应链。
2、多步推理:随着加速计算和新模型架构的发展,AI模型将应对越来越复杂的问题,并以更高的精准度且更深入的分析作出回答。
借助“多步推理”的功能,大而复杂的问题可以被分解为较小的任务,有时甚至还会进行多次模拟,以便从多个角度解决问题。并且,多步推理还会整合来自各种来源的知识,使AI能够建立逻辑联系,并合成不同领域的信息。
这可能会影响金融、医疗健康、科研和娱乐等多个领域。例如,具备多步推理能力的医疗健康模型可以根据患者的诊断、用药情况和对其他治疗的反应,提出一系列建议供医生参考。
可以肯定的是,多步推理能力必然会在诸多领域掀起一场变革的浪潮。以医疗健康领域为例,具备多步推理能力的先进模型,能够全面综合考虑患者的详细诊断结果、过往用药情况,以及对其他相关治疗手段的反应等多方面信息。通过对这些复杂信息的深度分析与多步推理,提出一系列具有针对性的建议,为医生的临床决策提供重要参考。
3、AI查询引擎:对于拥有PB级数据的企业和研究机构来说,他们所面临的挑战是如何快速访问这些数据并提供可操作的洞察。而AI查询引擎的出现,将为企业挖掘数据的方式带来了革命性的变化。基于AI查询引擎,企业可筛选结构化和非结构化数据,包括文本、图像和视频等,利用自然语言处理以及机器学习来理解用户意图,并提供更加相关且全面的结果。
这将推动更智能的决策流程,增强客户体验并提高各行业的生产力。依靠自身持续学习的能力,AI查询引擎将创造出能进行自我改进的数据飞轮,帮助应用程序变得更加有效。
总的来说,初创企业应积极探索如何将这些先进的AI功能融入自身的业务流程中,以实现更高的运营效率和更优质的客户服务。此外,利用好这些工具还可以帮助他们在竞争激烈的市场中找到自己的独特定位,并加速其成长和发展。
第三,先进的数据架构
算力和网络作为AI发展的两大关键支柱,缺一不可。它们相互依存、相互促进,共同为AI的蓬勃发展提供了坚实的基础和有力的保障。
在算力方面,NVIDIA DGX平台副总裁CHARLIE BOYLE预测,液冷AI数据中心正成为新趋势。当下,大规模设计、部署与运营智能制造会带来沉重财务负担,因此,越来越多企业放弃自建AI基础设施,转而选择在托管设施中部署,或按需租用容量。如此一来,企业无须自行安装与运营,就能充分利用最新的基础设施。
而在另一边,AI工作负载持续增长,为实现性能与能效的最大化,企业纷纷将目光投向液冷技术。这一技术转向,无疑会加速液冷技术在行业内的广泛应用,使其更快成为AI数据中心的主流解决方案。
在网络方面,NVIDIA网络高级副总裁GILAD SHAINER预测,数据中心架构正朝着统一计算网架构(computing fabric)演进。在这一架构下,统一计算网能够让成千上万的加速器借助横向和纵向两种通信扩展方式,利用英里级长度的线缆,实现多个数据中心设施之间的高效通信。
这种统一计算网涵盖面向纵向扩展通信的NVIDIA NVLink网,以及面向横向扩展通信的智能交换机、SuperNIC和DPU。这些组件不仅有助于在加速器之间安全地传输数据,还能在传输过程中执行计算,从而最大限度地减少数据移动。尤其值得一提的是,跨越全网的横向扩展通信对于大规模AI数据中心的部署意义重大,能将AI数据中心从部署到开机运行的时间,从原本的数月乃至数年大幅缩短至数周。
此外,随着代理式AI工作负载的不断增长,AI模型的运行模式也发生了变化,不再依赖单一的本地化模型,而是需要多个相关的AI模型之间进行通信并协同工作。在这种情况下,计算网将成为实现实时生成式AI的关键所在。
因此,初创企业若要在AI领域立足并取得成功,就必须紧跟算力和网络的发展趋势,重视液冷技术和统一计算网架构的应用,积极探索如何利用这些先进技术来优化自身的AI模型训练、部署和运行,从而降本增效。
用好AI关键在人
众所周知,人才是企业的第一资源,其重要性不言而喻。NVIDIA开发者技术总监NADER KHALIL作出预测,到了2025年,提示词(Prompt)工程师和AI个性设计师将变得广为人知。随着企业积极使用AI提高生产力,预计在初创企业和企业中将出现融合新技能和现有技能的新型骨干员工。
具体而言,提示词工程师专注于为聊天机器人与代理式AI开展提示设计的创建、测试及迭代工作,并在此基础上,优化AI训练流程、产出预期结果的精确文本字符串。另外,随着AI智能体的不断普及,企业和初创企业将越来越依赖AI个性设计师为智能体赋予独特的个性。
与此同时,越来越多的初创企业在与投资者及商业伙伴进行交流时,会将 “每位员工的收入贡献”(RPE)纳入重要的洽谈话题。
这背后的原因在于,AI对员工工作的辅助作用,促使初创企业管理者的关注点发生转变,从以往单纯追求 “不惜一切代价实现增长”,转向更加注重新员工如何助力企业内其他员工创造更多收入。在探讨AI投资回报,以及在与大型企业和科技公司激烈争夺人才以填补空缺职位的过程中,RPE成为初创公司的一个很好的切入点。
写在最后:
尽管初创企业在应用AI技术的道路上面临诸多挑战,但只要能够敏锐把握AI发展趋势,充分利用多样化语言模型、精密复杂检索增强生成堆栈、先进数据架构等技术,重视人才培养与引进,就可以有效地利用AI带来的机会,推动业务增长和创新,在竞争激烈的市场中谋得一席之地,为企业的长远发展奠定坚实基础。