
作者:Gartner研究副总裁陈勇
Gartner管理副总裁孙鑫
中国的AI公司正在通过两个相互强化的杠杆重塑全球AI成本曲线:一个是极具竞争力的托管API定价,另一个是Qwen和DeepSeek等高性能开放权重模型的发布。得益于词元定价,中国API可提供更低的成本,而开放权重模型则使企业能够通过控制托管和部署经济性进一步节省开支。中国AI模型还提供了定制化能力,允许企业针对领域特定需求,对模型进行微调。
中国的AI厂商正通过词元(即token)的形式,越来越多地向全球企业开放其AI能力。中国AI词元的日益普及,要求企业采用组合架构的思维方式。这意味着将AI模型作为可灵活分配的基础设施进行管理,而不是使用“一刀切”的固定解决方案。这种方法有助于企业更好地优化推理成本,并响应延迟和工作负载需求。
采用三层模型路由框架,优化AI部署
随着人工智能日益成为业务运营中不可或缺的一部分,企业机构必须战略性地将AI模型与特定用例相匹配,以优化性能、成本和合规。通过实施三层模型路由框架,企业可将AI能力与其任务的复杂性和敏感性挂钩,从而确保强大且高效的运营。这三层包括:
高级层:前沿模型,用于关键任务。这些模型最适合用于复杂的、受监管或任务关键型发现价值工作负载——在这些场景下,准确性和可靠性是不容妥协的。
均衡层:混合模型集成,用于日常运营。该层模型既支持发现价值工作负载,也支持已知价值工作负载,而这些工作负载需要在性能、成本和语言覆盖之间取得平衡。
实用层:开放权重模型,用于常规工作负载。这些模型主要支持已知价值工作负载——即大体量、重复性和较低风险的任务。
企业应当将模型能力与模型经济性决策分离。CIO应评估中国托管的API或开放权重模型在大幅降低成本的情况下,是否足以应对特定工作负载的需要。这将导致企业AI的决策,从“哪个模型最好?”变为“哪个模型能够在质量、风险状况、成本这三个方面,实现最适合当前任务的平衡?”
实施AI细分策略,以实现企业安全、合规和韧性
随着企业机构越来越多地将人工智能集成到其核心运营中,建立强大的AI细分策略对于保护敏感数据、确保监管合规并保持运营韧性至关重要。明确定义的细分策略可有效应对模型选型、数据隔离和动态路由的复杂性,为安全和敏捷的AI部署提供了框架。其中:
数据隔离:保护敏感工作负载。AI细分的一个关键组成部分是数据隔离。所有涉及知识产权、专有业务信息或个人可识别信息的工作负载都必须保留在企业的安全系统边界内。
模型溯源:确保供应链可靠性。为了进一步加强安全性和可靠性,企业应仅选择在供应链完整性方面享有良好声誉的可信平台的AI模型。
动态路由:提升敏捷性和韧性。将应用逻辑与特定的AI供应商分离,对于运营敏捷性至关重要。
将词元采购纳入日常运营,提升企业AI效率
随着人工智能成为业务价值的核心驱动力,企业必须超越传统的模型选型范畴,制定成熟的词元采购方法。这种运营转变侧重于优化成本,确保服务可靠性,并在多个AI生态系统中保持战略主动权。
基于任务的成本优化:采购流程应优先考虑每项业务任务的成本效率,而不是仅仅基于模型最突出的性能来选择。
涉及多个生态系统的企业级服务等级协议:为了保障运营连续性并维持议价能力,企业应与至少两个不同的AI生态系统(如OpenAI、Anthropic、AWS、Microsoft Azure、DeepSeek或阿里云)签署企业级服务等级协议(SLA)。
Gartner——全球权威的AI评估与洞察提供者
Gartner是企业C级高管与技术提供商实施AI战略,实现核心业务优先事项的过程中,不可或缺的合作伙伴。Gartner洞察的独立性与客观性,为客户决策提供信心保障,助力其充分挖掘AI潜力。众多C级高管客户正通过Gartner专有的AskGartner AI工具,确定如何在其业务中运用AI。凭借逾2500名商业与技术专家、6000份书面洞察以及1000余个AI应用场景与案例研究,Gartner已成为全球AI领域的权威机构。更多信息请访问此处。
关于Gartner
Gartner(纽约证券交易所代码: IT)为企业机构提供切实可行的客观洞察,助力企业机构在最关键的优先事项上做出明智决策,取得出色业绩。欲了解更多信息,请访问http://www.gartner.com/cn。