近日,DeepSeek推出了其最新版本的模型——DeepSeek-V3-0324,该模型拥有6850亿参数量,相较于之前的V3版本(6710亿参数)有所增加。此次更新还伴随着一项重要变化:DeepSeek将开源协议更改为MIT协议,这意味着开发者可以更自由地进行模型蒸馏和商业应用。
在性能方面,新版本的DeepSeek-V3在编程能力上有了显著提升,尤其是在前端代码生成和UI设计等方面表现尤为突出。经过多个测试显示,新版模型在网站开发效率和审美水平上已与目前全球顶尖的闭源模型(如Claude 3.7 Sonnet)相媲美。
关于训练成本,幻方量化在相关论文中提到,通过算法、框架和硬件的协同优化,假设使用H800 GPU每块2美元/小时的租赁费用,DeepSeek-V3的总训练成本约为557.6万美元(注:此成本仅涵盖正式训练阶段,不包括前期研究和消融实验的相关支出)。
在API服务定价方面,DeepSeek-V3采用了分级收费模式:输入tokens每百万0.5元(缓存命中)/2元(缓存未命中),输出tokens每百万8元。综合计算下来,若按缓存未命中的标准计费,总成本为10元人民币。
与同类产品相比,OpenAI的GPT-4o定价相对较高,输入和输出费用分别为5美元/百万Token和15美元/百万Token,总计约20美元(约合人民币140元)。相比之下,DeepSeek-V3在性能与成本方面展现出更高的性价比。
责编:戴露露