一年之前的国内春节假期期间,OpenAI在当地时间2024年2月15日发布了文生视频大模型Sora,在几段sora生成的视频中,丝滑的运镜和几可乱真的呈现效果,让当时仍处于模仿和跟随阶段的国产大模型界陷入巨大的震惊和悲观情绪中。一时之间“投降论”甚嚣尘上,投资人和大厂们纷纷出来劝说创业者们放弃幻想,转攻应用,大模型创业是“死路一条”。
谁又能想到,在短短一年之后的这个春节,大家讨论的是一款名叫DeepSeek国产大模型。除了科技圈的讨论和刷屏之外,其应用开始深入千家万户,有更多的普通人开始使用DeepSeek定制减肥食谱、编辑节日祝福、写藏头诗,甚至算命。
到现在为止,DeepSeek一共推出了三代模型。去年5月,幻方量化旗下的DeepSeek发布了DeepSeek-V2,能力号称对标GPT-4,价格却仅为GPT-4的近1%,低廉的价格引发了国产大模型长达一整年的价格战;到了12月,DeepSeek发布了新大模型DeepSeek-V3,将训练成本降到几百万美元,被誉为“价格屠夫”;而这次发布的DeepSeek-R1,直接对标OpenAI o1.其中“深度思考”和“联网搜索”功能的上线,让DeepSeek成功登顶中美两区免费榜第一。
您已阅读32%(521字),剩余68%(1109字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。