中国研究人员刚刚在两个月内建立了一个开源竞争对手。硅谷被吓坏了。

中国为Openai的Chatgpt发布了便宜的开源竞争对手 ,它让一些科学家感到兴奋和硅谷担心 。

DeepSeek是该创新背后的中国人工智能(AI)实验室,于2024年12月下旬推出了其免费的大型语言模型(LLM)DeepSeek-V3,并声称它在两个月内接受了558万美元的培训 ,并获得了培训。其硅谷竞争对手所需的时间和成本的一小部分。

紧随其后的是一个更新的模特 ,名为DeepSeek-R1,周一(1月20日)发行 。在第三方基准测试中,DeepSeek-V3与OpenAI的GPT-4O和Anthropic的Claude Sonnet 3.5的功能相匹配 ,而在包括Meta的Llama 3.1和Alibaba的Qwen2.5的同时,在包括解决问题,编码和数学的任务中 。

现在 ,R1在许多相同的测试中还超过了Chatgpt的最新O1型号。这种令人印象深刻的表现在其他模型的一小部分,其半开放源性的性质以及对图形处理单元的明显较少培训(GPU)的培训使AI专家赞叹不已,并提高了中国AI模型的幽灵 ,超过了美国的AI模型。

Openai的战略合作伙伴Microsoft的首席执行官Satya Nadella于1月22日在瑞士的世界经济论坛上说:“我们应该非常非常重视中国的发展 。”

有关的: AI现在可以复制自己—一个让专家恐惧的里程碑

AI系统使用从人类输入中获取的培训数据学习,这使他们能够根据该培训数据集中出现的不同模式的概率生成输出。

对于大型语言模型,这些数据是文本。例如 ,在2023年发行的OpenAI的GPT-3.5接受了大约570GB的文本数据培训,该文本数据是从存储库Common Crawl&Mdash进行的 。大约3000亿个单词—取自书籍,在线文章 ,Wikipedia和其他网页。

推理模型(例如R1和O1)是标准LLM的升级版本 ,使用称为“思想链 ”回溯和重新评估其逻辑的方法,这使他们能够以更高的精度处理更复杂的任务。

这使推理模型在寻求将AI融入其工作的科学家和工程师中很受欢迎 。

但是,与Chatgpt的O1不同 ,DeepSeek是一种“开放权重”模型(尽管其培训数据仍然专有)使用户可以在内部凝视并修改其算法。同样重要的是,它的用户价格降低了;比O1少27倍。

除了表现外,DeepSeek周围的炒作源于其成本效率 。与竞争对手为培训竞争对手培训的数千万到数亿至数亿到数亿至亿万的预算相比 ,该模型的预算很小。

此外,美国出口控制措施限制了中国公司访问最佳AI计算芯片,迫使R1的开发人员构建了更智能 ,更节能的算法,以弥补其缺乏计算能力。据报道,Chatgpt需要10,000名NVIDIA GPU来处理其培训数据 ,DeepSeek工程师说,他们获得了相似的结果,而仅超过2,000 。

这将转化为有用的科学和技术应用 ,或者DeepSeek是否只是为ACE基准测试训练其模型 ,还有待观察 。科学家和AI投资者正在密切关注。

本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://mzwhys.cn/jyan/202506-1205.html

(7)

文章推荐

  • 石器时代“ CSI”:考古学家确定了大约6千年前在房屋大火中丧生的家庭

    一项新的研究发现,从5700年前开始烧毁和殴打人类骨骼,暗示一群可能在乌克兰的房屋大火中丧生的一群石器时代的人。但是,为什么两个人受到剧烈的头部受伤,以及为什么一个人比其他所有人晚一个世纪死了一个世纪之久。“我们只能推测大火与致命暴力行为之间是否存在联系,即杀死房屋中的人们,离开尸体,将房子着火

    2025年06月09日
    8
  • 2025年最酷的太空任务

    今年将是太空任务的激动人心的时刻。2025年在一月份进行了两次月球着陆尝试,随后是SpaceX的大胆示威,以在低地轨道和Mdash的两辆星际飞船车之间转移推进剂。测试公司使用航天器到达月球和火星的能力的关键步骤。2025年晚些时候,欧洲将开设一个未剥削的机器人实验室,NASA的Juno航天器可能

    2025年06月09日
    9
  • DJI推出了最便宜的FPV护目镜–这使得新方式对身临其境的飞行会议更负担得起

      蒂姆(Tim)是Techradar的相机编辑。他在照片视频行业享受了15年以上的历史,其中大多数是技术新闻界的人。在担任业余摄影师的副技术编辑期间,蒂姆(Tim)是TechRadar的自由职业者和编辑,他与相机开发了深刻的技术知识和实践经验,并通过新闻,评论和功能对他人进行教育。他还与佳能(C

    2025年06月11日
    6
  • 通过这项Peloton自行车交易节省200美元。

    寻找一辆时尚而有力的自行车,它会帮助您在锻炼中保持动力吗?Peloton自行车目前正在亚马逊市出售仅在有限的时间内减少了200美元。 我们为我们的自行车在我们的最好的运动自行车和减肥的最佳锻炼机列表,以最高位置加冕。如果您还不知道为什么这辆自行车如此受到追捧,我们会解释为什么自己对自

    2025年06月12日
    4
  • 由金属探测者在波兰发掘的4,000年历史的铜匕首

    一位金属探测者发现了一只拥有4000年历史的铜匕首,可能是来自一位精英战士,在波兰东南部科列尼卡村附近的森林中。“到目前为止,科尔塞尼卡匕首是在波兰东南部发现的最古老的金属匕首,”波兰Orsetti房屋博物馆的考古学家MarcinBurghardt说,分析了匕首。Burghardt告诉Live

    2025年06月12日
    7
  • NASA重新建立了与Voyager 2探测后的完全接触

    更新:8月4日,美国国家航空航天局(NASA)确认,在两周的无线电台黑暗中,该机构已重新建立了与Voyager2调查的完整通信。 后检测“心跳”信号从8月1日的调查中,NASA的JET推进实验室(JPL)的科学家向调查发出了“喊叫”,试图手动将其天线朝向地球。大约37个小时;NASA的信号

    2025年06月13日
    8
  • 埃及的古代新年景象在2200年历史的寺庙的屋顶上发现了

    在埃斯纳(Esna&Mdash)的天花板上恢复艺术品的研究人员发现了一个令人惊叹的新年一幕。一座大约2200年前建造的寺庙大约在2,000年前进行了重大翻新,当时罗马人控制了埃及。这些绘画显示了埃及神灵的猎户座(也称为SAH),索托斯和Anukis在附近的船上,天空女神坚果吞咽了他们上方的夜空。

    2025年06月13日
    10
  • 梅的完整“花月”今晚以微月份升起。这就是这意味着什么,以及如何观看。

    今晚(5月12日,星期一),五月的满月,被称为花月,将在黄昏期间出现在东方,整夜闪耀,并随着黎明出现而在西部。月亮周二(5月13日)也将显得明亮而充满。但是,下一个满月看起来可能比平均水平小一点。那是因为它将是“微小月”,这是“超级月亮”的对立面。“micromoon”的技术术语是顶月座。

    2025年06月13日
    7
  • CRISPR编辑的小鼠肿瘤。科学家说,总有一天,它可以在人中起作用。

    编者注:以下所述的研究现已发表在《期刊》上自然生物技术。现场科学涵盖了2023年的预印本。脂肪从身体中吸出来,并用基因编辑工具CRISPR可用于治疗癌症,这是对小鼠和移植人体组织提示的研究。但是,实验疗法在人们中是否安全有效,还有待观察。你可能喜欢这项新研究发现,从体

    2025年06月14日
    5
  • NordVPN发布B2B产品

      本尼迪克特(Benedict)在白金汉大学(UniversityofBuckingham)期间首先关注地缘政治和国际关系已有7多年的历史。在此期间,他研究了新闻学的BA政治,为此,他获得了二等荣誉(上层),然后在研究生一级继续学习,在MA安全,情报和外交方面取得了区别。本尼迪克特加入Tech

    2025年06月14日
    4

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月14日

    我是东辰文化的签约作者“admin”!

  • admin
    admin 2025年06月14日

    希望本篇文章《中国研究人员刚刚在两个月内建立了一个开源竞争对手。硅谷被吓坏了。》能对你有所帮助!

  • admin
    admin 2025年06月14日

    本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享

  • admin
    admin 2025年06月14日

    本文概览:中国为Openai的Chatgpt发布了便宜的开源竞争对手,它让一些科学家感到兴奋和硅谷担心。DeepSeek是该创新背后的中国人工智能(AI)实验室,于2024年12月下...

    联系我们

    邮件:东辰文化@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们