根底技能研究有限公司于1月20日发布最新模型DeepSeek-R1,并因其杰出的功能体现、远低于同行的本钱优势,引发全球AI职业重视。
据报道,DeepSeek-R1在第三方基准测验中体现优异,优于OpenAI、Meta和Anthropic等美国抢先的公司。在AIME 2024数学基准测验中,DeepSeek-R1的得分率到达79.8%,逾越了OpenAI发布的推理模型OpenAI-o1。DeepSeek-R1的另一大亮点是其开源战略,将练习技能悉数揭露,答使用户借此练习其他模型,一起官方供给的服务完全免费,任何人可自行下载与布置,而且支撑联网查找。
“DeepSeek-R1在后练习阶段大规模运用了强化学习技能,在仅有很少标示数据的情况下,极大提升了模型推理才能。”DeepSeek在官方介绍中称。
DeepSeek的练习本钱低。据DeepSeek介绍,其2024年12月发布的DeepSeek-V3仅运用2048块英伟达H800 GPU芯片,在两个月内完成了6710亿参数模型的练习,本钱约为557.6万美元,仅为OpenAI GPT-4o模型练习本钱的不到十分之一。
业界以为,这一本钱优势使得DeepSeek在商场上的竞争力明显地增强,可能对现有商场格式发生严重影响。
DeepSeek大模型的开发团队来自杭州深度求索人工智能根底技能研究有限公司,建立时刻仅一年半,为闻名量化资管巨子幻方量化创建的大模型公司。开创人为梁文峰,结业于浙江大学信息与通信工程专业,小组成员大多来自国内顶尖高校和研究机构。
今天上午,A股商场上,DeepSeek概念股体现出色。到上午收盘,、、、、均涨停。
据悉,作为数据智能服务商,与幻方量化的DeepSeek在用户行为语料、算力协作以及营销客户推行方面存在协作。浙江东方经过旗下杭州东方嘉富基金参加了DeepSeek天使轮出资。经过华金领越基金参加DeepSeek Pre-A轮融资。
旗下超擎数智为DeepSeek供给光模块和交换机,助力其模型的研制与运用。
1月27日,称,正加快开发DeepSeek-R1模型在端侧落地运用及端云结合全体计划。