当前,市场竞争日趋白热化,企业对于提升效率、优化决策以及创新业务模式的需求越发强烈。与此同时,随着人工智能技术不断走向成熟,以大模型技术为代表的生成式AI技术凭借强大的数据分析能力、精准的预测能力以及高效的智能决策辅助能力,为企业满足这些迫切需求带来了可能性。
然而,实际应用过程中,企业业务千差万别,不同大模型在性能表现、擅长领域等方面各有所长,单一的大模型常常难以全方位满足各类需求。倘若企业试图自行组建团队来开发大模型,不仅要面临高额的研发成本投入,还需应对漫长的开发周期,这期间市场环境可能已发生巨大变化,错过最佳的业务拓展时机。
敏锐捕捉到这一趋势的亚马逊云科技,于2023年4月份发布了Amazon Bedrock,随后快速确立了生成式AI的三层技术栈体系,即基础设施层、模型工具层和应用层,成功树立了云端构建和使用生成式AI的新范式。值得一提的是,Amazon Bedrock 作为生成式 AI 三层技术栈中最为关键的模型工具层,有力地支撑着整个架构的高效运作。
仅仅8个月后,在re:Invent 2024大会上,Amazon Bedrock再度成为瞩目的焦点。此次大会上,Amazon Bedrock一举发布了21项新特性,包括模型选择全面升级,成本、速度、准确率全面优化,私有数据更易使用,以及安全进阶新功能和多智能体协作功能等。
模型选择全面升级,应对不同场景
在模型选择方面,Amazon Bedrock引入了Amazon Nova全家桶、LumaAI的Ray2、poolside的malibu和point、Stable Diffusion 3.5,并通过新推出的Amazon Bedrock Marketplace提供100+热门、新兴及专业模型的访问权限。
其中,Amazon Nova系列模型此次共推出了文生文模型Amazon Nova Micro、成本极低的多模态模型Amazon Nova Lite、功能强大的多模态模型Amazon Nova Pro、用于复杂推理任务的多模态模型Amazon Nova Premier、图像生成模型Amazon Nova Canvas,以及视频生成模型Amazon Nova Reel这六款模型,适用于不同的使用场景,并在多种任务上展现出顶尖智能,且具备行业领先的性价比。尤其是Amazon Nova Micro、Lite和Pro在各自智能类别中,成本比Amazon Bedrock中表现最佳的模型至少便宜75%,同时也是Amazon Bedrock中对应类别速度最快的模型。同时支持Amazon Bedrock的各种新特性。
除此之外,Amazon Bedrock还接入了能够依据文本和图像高效且以电影级质感生成高质量、逼真视频的Ray 2,用于代码生成、测试、文档编制以及实时代码补全的软件工程模型malibu和point,以及能够依据各种风格的文本描述生成高质量图像的文本转图像模型Stable Diffusion 3.5 Large。
不仅如此,亚马逊云科技还推出了Amazon Bedrock Marketplace,接入了上百个受欢迎的新兴模型和专业模型,涵盖Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服务等热门模型,以及众多专业模型,如用于金融行业的Writer的Palmyra-Fin、用于翻译的Upstage的Solar Pro、Camb.ai的文本转音频MARS6以及用于生物学的EvolutionaryScale的ESM3生成模型等。
三大功能更新,多维度降本增效
一般来说,企业在选择模型时,通常会基于性能、功能和成本等方面进行权衡,根据不同场景需求,选择高性能或低成本等不同定位的模型。
针对模型成本优化,亚马逊云科技为Amazon Bedrock推出三项功能更新――提示词缓存、提示词智能路由和模型蒸馏。其中,提示词缓存功能最高可将成本降低90%,并将延迟最多缩短85%。借助Amazon Bedrock上的提示词缓存功能,Adobe发现其响应时间缩短了72%。提示词智能路由功能能够预测每个请求对应的每个模型的性能,并将请求动态路由至最有可能以最低成本提供所需响应的模型。提示词智能路由可在不影响准确性的情况下,将成本降低多达30%。模型蒸馏能把大模型的知识转移到小模型上,同时保留小模型的性价比。借助Amazon Bedrock模型蒸馏功能,任何客户都可以蒸馏出自己的模型,与原始模型相比,被蒸馏模型的速度可以提高500%,运行成本降低75%,在检索增强生成(RAG)等用例中,准确性损失低于2%。
此外,Amazon Bedrock还推出了低延迟优化推理功能,基于Amazon EC2 Trn2实例,利用最新硬件和软件优化,可在多模型上实现更好的推理性能。用户指定推理请求优先级后,平台就可以自动处理,为支持的指定模型提供优化的性能。
知识库功能拓展,实现数据灵活转换
Amazon Bedrock知识库新增对结构化数据和GraphRAG的支持,并能够将非结构化多模态数据转换为结构化数据,从而能够更方便地利用私有数据来定制生成式AI。
具体来看,结构化数据检索功能使客户能够直接查询其生成式AI应用程序中结构化数据的存储位置。借助这项新功能,提示词信息会转换为SQL查询,用于检索数据结果。知识库会依据客户的架构和数据自动调整,从查询模式中学习,并提供一系列定制选项,进一步提高所选用例的准确性。
GraphRAG支持功能可生成更具相关性的响应。凭借对GraphRAG的支持,知识库可让客户无须具备图数据库专业知识,即可使用Amazon Neptune图数据库服务自动生成图谱,并跨数据链接各实体之间的关系。
此外,Amazon Bedrock还新增了Amazon Bedrock Data Automation功能,能够快速且经济高效地从非结构化的数据文件中提取信息,并将其转化为结构化格式,适用于智能文档处理、视频分析以及RAG等场景。该功能可利用预定义的默认设置生成内容,比如视频片段每个场景的描述、音频的转录内容。客户也能根据自身数据架构生成定制化输出,轻松加载到现有数据库或数据仓库。
自动推理检查功能,对抗幻觉的有力武器
尽管生成式 AI 于各领域的迅猛发展举世瞩目,然而,伴随这一技术广泛应用而产生的幻觉问题,正演变为阻碍其进一步推广的棘手难题。
Amazon Bedrock Guardrails提供的自动推理检查功能,可让Amazon Bedrock验证事实响应的准确性,生成可审计的输出,并向客户清晰展示模型得出结果的原因,有效提升了透明度,确保模型响应符合客户的规则和政策。
以某家健康保险提供商为例,该公司采用了生成式AI驱动的客户服务应用程序,提供商无须具备自动化推理方面的专业知识,只需上传其政策信息,Amazon Bedrock便会自动制定必要的规则,并指导客户进行反复测试,以确保模型调整为正确的响应。当保险提供商应用自动化推理检查功能时,Amazon Bedrock会对模型生成的响应进行验证。若响应不正确,比如弄错了免赔额或标记了不在承保范围内的程序,Amazon Bedrock会利用自动化推理检查功能中的信息来建议正确的响应。
多智体协作功能,助力生成式AI落地
Agent智能体是将生成式AI能力应用于现实世界的重要途径。有业内人士预测,2025年Agent智能体会迎来爆发。
此前,亚马逊云科技已经在Amazon Bedrock推出了智能体功能,但考虑到将生成式AI应用于生产,必然需要借助不同Agent与业务结合、与人交互并执行实际任务,这过程中会面临诸多问题。因此,Amazon Bedrock新增了多智体协作功能,客户可以通过为项目的特定步骤创建和分配专用智能体,从而获得更准确的结果,并通过编排多个并行工作的智能体来加速任务。
目前,穆迪公司正利用Amazon Bedrock创建智能体,为每个智能体分配特定的任务,并允许其访问量身定制的数据集,以履行其职责。例如,一个智能体可能会分析宏观经济趋势,另一个智能体可能会使用专有财务数据评估公司特定风险,第三个智能体则考虑竞争和战略定位。这些智能体无缝协作,将输出结果综合成精确、可操作的洞察。这种创新方法使穆迪公司能够提供更快、更准确地风险评估,巩固其作为金融决策领域值得信赖的权威机构的声誉。
据亚马逊云科技CEO Matt Garman透露:“如今,每天都有数以万计的客户在生产应用中使用Amazon Bedrock,仅去年其使用量就增长了近5倍。”
写在最后:
工欲善其事,必先利其器。在生成式AI时代,亚马逊云科技的Amazon Bedrock凭借丰富的模型选择、显著的降本增效功能、灵活的数据转换能力、对抗幻觉的有效机制以及多智体协作助力落地等一系列特性,为企业在复杂多变的市场竞争中提供了强有力的支持,无疑是企业高效发展与创新突破的那把“利器”。