主页(http://www.zhonghuagame.com):智谱GLM Coding Plan限售20%应对算力紧张
智谱人工智能于1月21日发布公告,宣布自1月23日10:00起,对GLM Coding Plan实行限量发售措施,每日可销售量将调整为当前的20%。此举旨在应对近期因模型版本升级带来的算力资源紧张问题,确保服务的稳定性和公平性。
GLM-4.7版本上线后,用户数量迅速增长,导致平台在高峰时段面临较大的算力压力。据智谱透露,部分用户在工作日15:00至18:00期间,出现了并发访问受限、调用延迟增加等问题。这些问题主要源于模型训练和推理过程中对计算资源的高需求,尤其是在用户量激增的情况下,服务器承载能力受到挑战。
为缓解这一状况,智谱决定采取限售策略,限制每日GLM Coding Plan的销售数量。限售措施将从1月23日10:00开始执行,后续每日10:00将刷新销售额度。值得注意的是,已购买GLM Coding Plan的用户,其自动续订功能将保持不变,不受此次限售政策影响。这一安排有助于保障现有用户的权益,同时控制新增用户带来的资源消耗。
智谱方面表示,限售并非长期措施,具体解除时间将根据算力资源的使用情况另行通知。同时,平台将加大对违规账号的监测与打击力度,防止不合理的算力占用行为。对于恶意刷量、频繁调用等占用资源的行为,智谱将采取包括但不限于限制访问、暂停服务等处理方式,以维护公平的使用环境。
此次限售措施的出台,反映出当前大模型服务在实际应用中所面临的资源调配难题。随着AI技术的快速发展,越来越多的企业和开发者开始使用大模型进行应用开发,这不仅提升了AI技术的普及度,也对底层算力基础设施提出了更高要求。智谱作为国内领先的大模型研发与服务提供商,其应对策略体现了对行业发展趋势的深刻理解和对用户体验的高度重视。
此外,智谱还强调,这一调整是为了在短期内平衡资源分配,确保核心用户和正常业务的稳定运行。长期来看,公司将持续优化模型架构与调度系统,提升算力利用率,探索更高效的资源管理方案。未来,智谱计划通过引入弹性计算、分布式部署等技术手段,进一步缓解算力瓶颈问题。
在当前AI大模型竞争日益激烈的背景下,算力资源的合理配置成为关键因素之一。智谱的限售举措,既是对当前问题的及时应对,也为行业提供了应对资源紧张的参考案例。随着更多大模型的上线和应用,类似的问题或将不断出现,如何在保证服务质量的同时,实现资源的高效利用,将是所有大模型服务商需要持续思考和解决的课题。

