百度昆仑芯3代P800算力是英伟达H20的3倍, 百度昆仑芯P800实测测算力是英伟达A100的1.5倍, 百度昆仑芯P800的显存带宽读写速度高达4TB/s, 百度昆仑芯P800的显存带宽读写速度是英伟达A100的2倍, 百度昆仑芯P800单机8卡就可以跑DeepSeek-R1/V3满血版671B模型。在跑DeepSeek-R1/V3满血版671B模型时, 百度昆仑芯P800单机8卡吞吐量达到了惊人的2437tokens/s, 并发量更是达到了惊人的256, 比国际主流GPU还要快, 百度昆仑芯P800单机16卡的吞吐量更是达到了惊人的4825tokens/s, 并发量更是达到了512, 作为国内最强大的GPU,可谓妥妥的性价比之王#英伟达新中国特供芯片B30曝光# #台积电硬刚美国芯片关税#

