来源:光大证券微信信息来源:光大证券微信信息来源:光大证券
2月5日,蛇年第一个交易日迎来了科技股的全面爆发,软件、媒体、半导体、IT设备等行业集体崛起。特别是AI概念股、DeepSeek概念股、华为计算能力、智能谱AI等主题表现非常强劲,批量DeepSeek概念股涨停。
春节假期,DeepSeek-R1模型带来了人工智能风暴,不仅展示了低成本实现顶级人工智能大模型能力的技术路径,而且全面提高了国内大模型和开源大模型的上限。
正是看到了DepSeek模型的强大实力和广阔的应用空间,国内外主流云服务平台快速推出了DepSeeek模型,帮助用户快速方便地部署R1模型。与此同时,DepSeek应用程序每天活跃用户快速增长,跨越2000万大关,成为许多地区用户热衷的大型应用程序。
早在去年12月26日,深度搜索就发布了DeepSeek-V3,并同步开源。该模型的能力与GPT-4o、Claude-3.5-Sonnet等主流大模型相当,但在训练成本和效率方面具有明显优势。
OpenAI快速推出o3-mini推理模型和Deep,以应对DeepSeek的强大竞争 Research。
1、DeepSeek掀起了开源大模型风暴,AI巨头加速了行业的发展
一直以来,OpenAI、Anthropic等人工智能巨头不断推动闭源大模型的发展。开源大模型也有了很大的进步,但一直被闭源大模型压制。
深度求索(DeepSeek)Deepseek-V3、DeepSeek-R1大模型,平衡开始倾向于开源大模型。更令整个科技界惊讶的是,DeepSeek可以通过低成本的计算能力预算实现更高的模型能力。
春节期间,全球AI巨头全面探索了DeepSeek的技术路线,进一步表明国内AI大模型的综合实力已达到国际先进水平。
1月20日,DeepSeek-R1重磅发布,模型性能堪比OpenAI-o1大模型,在编程、数学操作等复杂任务方面堪比O1正式版。
更让用户惊讶的是,R1模型License统一使用MIT,这意味着该模型完全开源,不限制商业使用。R1模型还允许用户通过蒸馏模型训练其他模型,API服务定价极低,每百万输入tokens 仅需1 元(缓存命中)/ 4 人民币(缓存未命中),每百万输出tokens只需16元,与openAI-o1大模型相比,定价大幅下降。
早在2024年12月,就进行了深度搜索(DeepSeek)新系列模型正式启动并开源 DeepSeek-V3,性能优于Llama-3.1-405B等开源大模型,已堪比GPT-4o、Claude-3.5-Sonnet等主流大模型。
根据深度搜索官方发布的信息,DeepSeek-V3采用混合专家架构(MoE),该架构包含256名专家,每次推理都会动态选择前8名专家参与计算,从而提高计算效率。
DeepSeek-V3模型总参数高达6850亿,每次推理将激活370亿参数。V3在14.8万亿token上进行了预训练,整体训练效率极高,显著降低了训练成本。根据Deepseek披露的数据,DeepSeek-V3大模型训练只花了大约两个月的时间,成本约为558万美元。
Deepseek为大型模型训练创造了一个高速通道,背后有许多创新技术。在框架方面,Deepseek创建了HAI-LLM框架,可以实现16条装配线和64个专家模块的平行,并创新地使用多令牌预测(MTP)。DeepSeek通过设定MTP训练目标,突破了传统大模型训练的束缚。再加上两个阶段的深度打磨:监督微调和强化学习,DeepSeek-V3进一步提高了能力。
随着DeepSeek低成本、高效率的大模型展现出强大的竞争力,未来人工智能大模型将进一步赋予更多的行业权力。
2、deepseek吸引了许多用户,许多国内公司与deepseek合作
1月15日,Deepseek发布了Depsekek APP,DeepSeek模型以其强大的模型能力吸引了大量用户下载和使用。
苹果app1月26日上线 在Store之后,DeepSeek应用程序迅速成为许多国家的热门应用,甚至占据了140个苹果应用程序国家 Store下载排名第一。
在DeepSeek APP发布20天后,应用软件的日常生活规模已超过2000万,性能远好于ChatGPT APP。
国内主流云服务平台也在快速推出DeepSeekek V3和R1模型方便用户快速部署。根据华为云2月1日的消息,在硅基流量和华为云团队的努力下,基于华为云升腾云服务的R1/V3推理服务正式启动,使模型在大规模生产环境中稳定运行。
随后,腾讯云还宣布将DeepSeek-R1模型部署到腾讯云HAI(腾讯云高性能应用服务)。用户可以节省一系列繁琐的步骤,如购买卡、安装驱动程序和配置网络。R1模型只需3分钟即可调用。
360数字安全表示,通过加强学习等技术训练,大型安全模型正式接入DeepSeek,“DeepSeek版”安全模型。
2月3日,百度智能云和阿里云也宣布正式上架DeepSek-R1和 DeepSeek-V3模型,方便用户快速调用。
除国内科技厂商外,国际科技巨头也积极拥抱DeepSek模型。1月底,英伟达宣布NIM微服务推出DeepSekek R1 预览版671b。微软还将DeepSeek-R1集成到其企业AI服务平台,亚马逊云平台也可以使用该模型。AMD和SGLang、DeepSeek团队紧密合作,迅速将DeepSeek-V3集成到Instinctinct MI300X 在GPU中。
根据iFind金融数据终端,Deepseek概念股包括:海光信息、360、杭钢、万兴科技、天宇数科、日常互动、梦网科技、美格智能、安恒信息、安凯微、青云科技等。
(本文于2025年2月5日首发)
(来源金融界)责编:戴露露