📰 本频道不定期推送科技数码类新资讯,欢迎关注!
©️ 发布的内容不代表本频道立场,和你意见不一样的话欢迎在评论区留言表达,但请注意言辞,面斥不雅。
🔗 博客: https://yummy.best
💬 群组: @GodlyGroup
📬 投稿: @GodlyNewsBot
🪧 广告合作: @yummybest_bot.
©️ 发布的内容不代表本频道立场,和你意见不一样的话欢迎在评论区留言表达,但请注意言辞,面斥不雅。
🔗 博客: https://yummy.best
💬 群组: @GodlyGroup
📬 投稿: @GodlyNewsBot
🪧 广告合作: @yummybest_bot.
知情人士向The Information透露,DeepSeek已决定使用华为的AI芯片来训练其部分模型,此举反映其正在减少对英伟达芯片的依赖。
此前,DeepSeek暗示国产芯片有望大规模使用
via 匿名
LINUXDO 网友发帖发现 DeepSeek V3.1 模型在输出中会随机出现 “极” 字,最开始在第三方 API 上出现了这个问题,火山、chutes 等第三方都可能出现这个问题。作者表示此 bug 严重影响到编程或日常使用。
作者经测试后,官网同样存在这个问题。作者表示一旦出现问题,后续会更加频繁。
作者认为,是数据集没有清理干净的问题,这也和 “极速” 等词并列出现合理。通过查看分词,作者发现 “极” 对应的 token 2577 和省略号 2576 相邻,这可能是导致该 bug 的原因。也有可能和模型偷懒有关系。但也存在部分情况无法解释。
目前结论,官网出现 “极” 字概率最低,但不是没有。第三方概率显著增加,可能和第三方量化、部署配置、设备差异相关。
via 匿名
DeepSeek暗示国产芯片有望大规模使用
8月21日晚间,杭州深度求索公司(DeepSeek)悄然于大模型资源网站HuggingFace上线 “DeepSeekV3.1” 版本。
同时,该公司宣称其模型版本使用适配国产芯片结构的参数精度,暗示国产芯片未来有望得到大规模使用。
🗒 标签: #DeepSeek #AI #芯片
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
8月21日晚间,杭州深度求索公司(DeepSeek)悄然于大模型资源网站HuggingFace上线 “DeepSeekV3.1” 版本。
同时,该公司宣称其模型版本使用适配国产芯片结构的参数精度,暗示国产芯片未来有望得到大规模使用。
DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、APP、小程序测试,API 接口调用方式保持不变。
新版 DeepSeek 能一次性记住和处理的文本长度更长,上下文容量大提升,对长文档分析、代码库理解、长对话保持一致性都更有帮助。
不过,这只是常规更新,和大家期待已久的 R2 没关联。按照过去的经验,R2 发布前应该会先更新 V4 模型。
上周市场曾传出下一代大模型 DeepSeek-R2 将在 8 月下旬发布的消息,但消息来源并不可靠。
据接近 DeepSeek 人士透露, DeepSeek-R2 在 8 月内并无发布计划。
via 匿名
DeepSeek发布Prover-V2模型,参数量达6710亿
DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。
据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。
在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。
同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。(新浪科技)
🗒 标签: #DeepSeek #AI
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。
据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。
在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。
同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。(新浪科技)
DeepSeek官方辟谣:R2发布为假消息
针对DeepSeek将在3月17日发布下一代R2模型的传闻,DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”。(蓝鲸财经)
🗒 标签: #DeepSeek
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
针对DeepSeek将在3月17日发布下一代R2模型的传闻,DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”。(蓝鲸财经)
据《华尔街日报》的报道, 美国政府正考虑对中国人工智能初创公司 DeepSeek 采取限制措施,包括禁止其聊天机器人在政府设备上使用,因国家安全疑虑引发全球科技界高度关注。
美国政府的应对措施不仅限于内部设备。知情人士表示,官员们正在讨论另外两项可能的行动:一是禁止 DeepSeek 应用程序在美国应用商店上架,二是限制美国云服务提供商向客户提供 DeepSeek 的 AI 模型。
不过,这些讨论仍处于初步阶段,尚未敲定具体方案。
微软的人工智能大师希望独立于OpenAI。但说起来容易做起来难
微软测试由马斯克旗下xAI等向其Copilot提供支持。 微软正在尝试Anthropic、DeepSeek、Meta等的模型。(The Information)
DeepSeek今日宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。
在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。DeepSeek称,鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。
报道称,DeepSeek正在加速推出其R2人工智能模型,其最初计划在五月推出,但目前正在努力尽快推出。
🗒 标签: #DeepSeek
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
2月24日周一,DeepSeek宣布启动“开源周”,首个开源的代码库为Flash MLA,目前已投入生产。
据介绍,FlashMLA的灵感来自 FlashAttention 2&3 和 cutlass 项目,是针对英伟达Hopper架构的GPU优化的高效MLA解码内核,主要在变长序列 (variable-length sequences) 的场景进行了深度优化,能够显著提升大模型推理效率。
FlashMLA在CUDA 12.6环境下,H800 SXM5内存受限配置下可实现3000 GB/s的带宽,计算受限配置下则可达580 TFLOPS的算力。
因此,可以将FlashMLA理解为:DeepSeek专门针对英伟达H800这一代高端加速卡做的深度优化。
中国人工智能初创企业深度求索(DeepSeek)计划从下周开始向公众发布关键代码和数据,相比OpenAI等竞争对手,DeepSeek罕见地准备对外开放更多核心技术。
此举可能刺激美国和中国的人工智能竞赛升级。通过无偿分享代码秘密,DeepSeek将推动人工智能技术得到更广泛的应用。
DeepSeek 2月21日在X上发帖称,“接下来一周,会陆续开源5个代码库,毫无保留地分享我们微小但真诚的进展”。
网易《逆水寒》手游今日宣布,将会在2月21日更新由DeepSeek驱动的AI智能NPC“沈秋索”,届时热门AI语言大模型Deepseek将正式入驻逆水寒江湖。
官方表示,这是DeepSeek首次进入游戏、首次拥有虚拟形象、首次成为虚拟智慧生命体。除了App/网页版DeepSeek能做的事情之外,游戏中的沈秋索能看得懂你的一言一行,能察觉到你的心情变化,能与你唠嗑、分享江湖经历,甚至能与你进行深度情感交流。
via 匿名
腾讯元宝 App 今日发布更新,宣布 DeepSeek R1 模型联网、满血上线。
官方表示,腾讯元宝是依托于腾讯混元、DeepSeek 大模型,基于跨知识领域和自然语言理解能力的大模型 AI 产品。其支持对用户的提问进行深度思考、逻辑推理和详细回答,同时也支持联网搜索信息,以提高推理和回答的时新性和权威性。
而在本月早些时候,腾讯的 QQ 音乐宣布旗下自研 AI 助手已完成对 DeepSeek-R1 完整版大模型部署,这也是 DeepSeek 首次在音乐平台的应用。
via 匿名
日媒:丰田三菱软银等多家日企禁用DeepSeek
日本媒体报道称,丰田汽车、三菱重工业、软银等禁止在企业内部使用中国生成式人工智能(AI)深度求索(DeepSeek)。
据日本共同社星期三(2月12日)报道,由于担心将信息泄露给中国政府,越来越多的日企开始禁用DeepSeek。
丰田表示:“从信息安全角度来看存在担忧,因此禁止使用。”三菱重工称,即使员工提出内部使用申请,目前也不会予以批准。软银也限制员工从公司内部进行访问,并禁止在业务终端下载和使用。
DeepSeek爆火后,已有多个国家和地区对使用该程序采取限制措施。意大利1月30日以隐私问题为由屏蔽DeepSeek。台湾数发部1月31日发表公告,禁止公务机关与关键基础设施使用该程序。澳大利亚2月4日以国家安全为由,禁止在政府设备上使用DeepSeek服务。韩国多个政府部门2月5日开始屏蔽DeepSeek。
🗒 标签: #DeepSeek
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
日本媒体报道称,丰田汽车、三菱重工业、软银等禁止在企业内部使用中国生成式人工智能(AI)深度求索(DeepSeek)。
据日本共同社星期三(2月12日)报道,由于担心将信息泄露给中国政府,越来越多的日企开始禁用DeepSeek。
丰田表示:“从信息安全角度来看存在担忧,因此禁止使用。”三菱重工称,即使员工提出内部使用申请,目前也不会予以批准。软银也限制员工从公司内部进行访问,并禁止在业务终端下载和使用。
DeepSeek爆火后,已有多个国家和地区对使用该程序采取限制措施。意大利1月30日以隐私问题为由屏蔽DeepSeek。台湾数发部1月31日发表公告,禁止公务机关与关键基础设施使用该程序。澳大利亚2月4日以国家安全为由,禁止在政府设备上使用DeepSeek服务。韩国多个政府部门2月5日开始屏蔽DeepSeek。
ai.com 现在自动跳转到 chat.deepseek.com
所有者仍在蹭热度,借此抛售域名。此前, 该域名曾跳转到 ChatGPT.com
🗒 标签: #AI #ChatGPT #DeepSeek
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
所有者仍在蹭热度,借此抛售域名。此前, 该域名曾跳转到 ChatGPT.com
本接口调用 DeepSeek 系列模型限时免费。
即日至北京时间2025年2月25日23:59:59,所有腾讯云用户均可享受 DeepSeek-V3、DeepSeek-R1 模型限时免费服务,单账号限制接口并发上限为5。在此之后,模型价格将恢复至原价。
特朗普称:"DeepSeek 不会对国家安全构成威胁,这是一项正在发展的技术……实际上,我认为——我认为我们将从中受益。”
🗒 标签: #DeepSeek
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot