
新闻中心
时间: 2025-02-17 14:29:24 来源:新闻中心
近来,我国杭州的Deepseek公司在全球AI界掀起了一场震动,令人瞩目的新模型DeepSeek-v3横空出世,敏捷登顶开源模型排行榜。该模型的功能到达与国际顶尖闭源模型如GPT-4o及Claude-3.5-Sonnet互不相让的境地,引发了海外同行的广泛重视。
最为人称道的是,DeepSeek-v3的练习本钱仅为600万美元,较以往下降了惊人的10倍。正如某出资组织负责人所称,这份长达53页的技能论文简直是“黄金”。Deepseek的中文名为“深度求索”,是量化巨子幻方量化的子公司,已为量化买卖范畴铸造了强壮的AI硬件根底。
自本年5月发布的DeepSeekV2因其史无前例的性价比在业界一跃成名后,半年之间,Deepseek便施行了更进一步的技能腾跃。准备好迎候新一轮的技能革命吗?在Launch的12月26日,DeepSeek-v3的首个版别完结上线,并揭露开源,其评测成果逾越了包含Qwen2.5-72B和Llama-3.1-405B等其他首要开源模型,尤其在百科知识、长文本、代码及数学才能等范畴体现尤为杰出。有多个方面数据显现,DeepSeek-V3在美国数学比赛(AIME2024,MATH)及全国高中数学联赛(CNMO2024)中尤为超卓,轻松超过了一切竞爭对手。
此外,该新模型在生成吐字速度上也完结了质的腾跃,从20 TPS提升至60 TPS,增加了整整三倍的功率。有必要留意一下的是,Deepseek还调整了API服务价格,计划经过超值体会期为广阔开发者供给更人性化的费用计划。
天使出资人Balaji对此表明特别震动,以为DeepSeek新开源模型的发布,不只技能上具高端才能,其练习预算的低价亦是史无前例。Andrej Karpathy也对该模型的奇特练习功率表明认可:在之前,相似才能的大模型往往需求不计其数的GPU,而DeepSeek仅用280万GPU小时完结练习,真可谓高效应对资源应战。
此外,Deepseek创始人梁文锋则重申了他们下降价格的初衷是为了让更多的人可以进入AI范畴,并让技能创新惠及更广泛的集体,以推进整个生态的持续生长。作为我国AI界最低沉的隐形巨子,Deepseek一路生长并不断为职业带来冲击。好像其姓名“深度求索”中所蕴涵的精力,Deepseek显然在探究人工智能的更深层次可能性上未停步。
不管外界的竞赛形势怎么改变,Deepseek或许将持续在这一竞赛白热化的职业中引领风流。回来搜狐,检查更加多
扫一扫,关注我们