曦望发布新一代推理芯片S3
国产GPU厂商曦望发布新一代推理芯片S3。在算力与存储设计上,S3支持从FP16到FP4的精度自由切换,并率先在国内GPGPU产品中采用LPDDR6 显存方案,显存容量较上一代提升4倍,缓解了大模型推理中常见的显存瓶颈问题。在DeepSeek等主流大模型上,其单位Token推理成本较上一代降低约90%。
国产GPU厂商曦望发布新一代推理芯片S3。在算力与存储设计上,S3支持从FP16到FP4的精度自由切换,并率先在国内GPGPU产品中采用LPDDR6 显存方案,显存容量较上一代提升4倍,缓解了大模型推理中常见的显存瓶颈问题。在DeepSeek等主流大模型上,其单位Token推理成本较上一代降低约90%。