模型名称 | 参数量 | 激活参数量 | 上下文窗口 | 推理资源推荐 |
DeepSeek-V3 | 671B | 37B | 128K | 多机分布式部署,节点数量:2个,单节点配置:HCCPNV6 机型 |
DeepSeek-R1 | 671B | 37B | 128k | 多机分布式部署,节点数量:2个,单节点配置:HCCPNV6 机型 |
DeepSeek-R1-Distill-Qwen-1.5B | 1.5B | – | – | 12C44GB 1卡A10 |
DeepSeek-R1-Distill-Qwen-7B | 7B | – | – | 12C44GB 1卡A10 |
DeepSeek-R1-Distill-Llama-8B | 8B | – | 128K | 12C44GB 1卡A10 |
DeepSeek-R1-Distill-Qwen-14B | 14B | – | – | 16C96G 1卡A100 |
DeepSeek-R1-Distill-Qwen-32B | 32B | – | – | 32C192G 2卡A100 |
DeepSeek-R1-Distill-Llama-70B | 70B | – | 128K | 164C948G 8卡A100 |
在我的厨房里,有一张桌子,上面放着一个杯子,杯子里有一个球。我把杯子移到了卧室的床上,并将杯子倒过来。然后,我再次拿起杯子,移到了主房间。现在,球在哪里?大小模型效果对比
对比范围 | DeepSeek-R1-Distill-Qwen-1.5B | DeepSeek-R1 |
截图示例 |
|
|
# 您可以
# 移到
# 但不
# 在上
# 跳转
# 输入接口
# 为例
# 详情页
# 你对
# 弹出
# 腾讯
# 框中
# 时长
# 完成后
# 您的
# 较小
# 所需
# 请参考
# 命令行
# 开源