去创作

用微信扫描二维码

分享至好友和朋友圈

词元驱动AI推理侧爆发国产芯片迎替代黄金窗口

在近期举办的GTC 2026大会上,相关行业观点引发了市场深思。AI产业的重心正在从“训练模型”向“推理应用”转移,未来每一秒钟、每一次交互,背后都是海量Token的生成与消耗。而近期中国发展高层论坛2026年年会上,国家数据局为Token正式定名——“词元”,并明确相关定位:“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。中国日均词元调用量在2026年3月已突破140万亿,本年度三个月时间又增长40%以上。

词元产业的应用与发展趋势,或决定了近期半导体周期的发展态势。当市场的焦点还停留在英伟达新一代GPU的市场表现与行业格局时,一个深刻的变化正在发生:推理侧的需求,正以远超训练侧的速度膨胀。这一变化,不仅重塑了AI算力的结构,也有望为中国半导体产业链及科创50相关领域,带来了相应的发展空间。

过去两年,AI算力的核心驱动力是“训练”——巨头们比拼的是谁能用最多的芯片、最快的速度,训练出参数更大的模型。这种模式对芯片的要求近乎苛刻:最先进的制程、最高的单卡算力、CUDA生态应用较为广泛等,英伟达在该阶段占据较高市场应用份额。

但当AI进入应用爆发期,逻辑发生了根本转变。推理,这个将模型能力转化为实际服务的过程,开始占据算力消耗的主导地位。与训练不同,推理场景追求的是“综合成本最低”与“能效比最优”。在一个AI客服、视频平台等规模化的应用场景中,采用高成本的高端GPU开展全部推理任务,经济性与实用性相对有限。这为国产算力提供了重要方向,推理侧的芯片需求呈现出了分层的特征:在金融高频交易、自动驾驶决策等高端场景,对芯片性能要求较高;但在占据绝对多数份额的海量推理场景——比如互联网搜索、内容生成、企业级应用——核心诉求已转变为“够用、便宜、稳定”。而这恰恰是国产芯片通过架构创新(如ASIC、LPU)和成本优化具备发展潜力的领域。

更重要的是,国产芯片的“可用性”正在逐步被验证。众多国产算力厂商产品在FP8算力等关键指标上不断优化提升,且在算力生态上正加速适配国产大模型。当推理需求开始放量,下游应用厂商为了控制成本和保障供应链稳定,倾向于采用性价比更优的国产方案。

更多精彩内容,关注云掌财经公众号(ID:yzcjapp)

以上内容仅供学习交流,不作为投资依据,据此操作风险自担。股市有风险,入市需谨慎! 点击查看风险提示及免责声明
热股榜
代码/名称 现价 涨跌幅
加载中...
加载中 ...
加载中...

二维码已过期

点击刷新

扫码成功

请在手机上确认登录

云掌财经

使用云掌财经APP扫码登录

在“我的”界面右上角点击扫一扫登录

  • 验证码登录
  • 密码登录

注册/登录 即代表同意《云掌财经网站服务使用协议》

找回密码

密码修改成功!请登录(3s)

用户反馈

0/200

云掌财经APP下载

此为会员内容,加入后方可查看,请下载云掌财经APP进行加入

此为会员内容,请下载云掌财经APP加入圈子

云掌财经
扫码下载

更多功能与福利尽在APP端:

  • 精选会员内容实时推送
  • 视频直播在线答疑解惑
  • 达人一对一互动交流
关闭
/