News list for "训练"

DeepSeek推出NSA,用于超快速的长上下文训练和推理

2月18日讯,DeepSeek推出NSA。DeepSeek称,NSA是一种与硬件一致且本机可训练的稀疏注意力机制,用于超快速的长上下文训练和推理。通过针对现代硬件的优化设计,NSA加快了推理速度,同时降低了预训练成本,而不会影响性能。在一般基准测试、长上下文任务和基于指令的推理上,它的表现与完全注意力模型相当甚至更好。

clock
2025-02-18 08:34:43
OpenAI 尝试 “解除对 ChatGPT 的审查”

OpenAI 在一项新政策中表示,正在改变训练人工智能模型的方式,以明确拥护 “知识自由…… 无论一个话题多么具有挑战性或争议性”。因此,ChatGPT 最终将能够回答更多问题,提供更多视角,并减少这款人工智能聊天机器人不愿谈论的话题数量。此前OpenAI 宣布对其《模型规范》进行更新,在一个名为 “共同探寻真相” 的新章节中,OpenAI 表示希望 ChatGPT...

clock
2025-02-16 18:08:35
1. 李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型。2. 特斯拉正式招聘工程师...

1. 李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型。2. 特斯拉正式招聘工程师等岗位,为量产机器人做准备。3. “反击”黄仁勋言论,谷歌计划5年内发布商业量子计算应用。4. 印度成为OpenAI全球第二大市场,阿尔特曼称要协助该国布局低成本AI。5. OpenAI升级o3-mini模型思维链,提高AI推理透明度。6. 亚马逊CEO:AI成本将因DeepSeek等模型的出现而降低。7. IBM CEO:DeepSeek证明我们是正确的,小型且高效的模型同样能有实际成果。8. 联想集团正与DeepSeek探讨更多深入合作。9. 华为AI模型量化相关专利公布,可减少模型占用内存。10. 商周算力:DeepSeek-R1、V3、Coder等系列模型已上线郑庆哈算力调度服务平台。11. 钉钉AI助理接入DeepSeek:可选R1、V3等三种模型,支持深度思考。12. 国家邮政局:持续推进国家邮政快递枢纽和“绿盾”工程等建设、人工智能和低空物流等规模化发展。

clock
2025-02-07 04:09:47
外媒:DeepSeek 报告的 600 万美元 AI 训练成本具有误导性,真实支出为 10 亿美元

DeepSeek 报告的 600 万美元 AI 训练成本具有误导性,因为它仅涵盖最后阶段,而遗漏了大量的基础设施和开发费用。报道称,DeepSeek 的总支出估计接近 10 亿美元,这揭示了他们投资的真实规模。

clock
2025-02-01 00:14:00
Nodepay最终空投查询现已上线

1月9日消息,去中心化 AI 训练和开发平台 Nodepa 在 X 平台发文表示,最终空投查询现已上线,用户可以查询第 0、1 和 2 季的代币分配。代币总供应量为 10 亿枚。 同时其表示,对于在第 2 季期间参与的用户,需要在 12 月 31 日截止日期之前获得 Proof of Humanity 奖牌并连接 Solana 钱包。代币 claim 并未开放,用户仅能在仪表板内检查更新后的分配情况。

clock
2025-01-09 10:18:15
整理:过去24小时融资信息一览(12月20日)

1.AI训练平台FLock完成300万美元战略轮融资,DCG领投; 2.链上DePIN项目Silencio Network完成250万美元种子轮融资; 3.比特币储蓄应用开发公司BitDCA完成200万美元Pre-Seed轮融资; 4.去中心化AI代理支付协议Skynet完成120万美元Pre-Seed轮融资; 5.闪电网络质押层UTXO Stack已完成新一轮融资,估值达5000万美元。

clock
2024-12-19 23:59:55
AI训练平台FLock完成300万美元战略轮融资,DCG领投

去中心化 AI 训练平台 FLock 宣布完成 300 万美元战略轮融资,累计融资共 1100 万美元。本轮融资由灰度母公司数字货币集团 DCG 领投,Lightspeed Faction 追投一轮,Animoca Brands、Fenbushi Capital、GnosisVC、GSR Ventures、OKCoinJapan、Bas1s Ventures 和 A41 等战略合作伙伴参投。此轮次融资将使 FLock 推进民主化 AI 模型开发...

clock
2024-12-19 13:46:37
1. 苹果考虑使用亚马逊AI芯片来预训练其Apple Intelligence模型。2. OpenAI任命前Coinbase...

1. 苹果考虑使用亚马逊AI芯片来预训练其Apple Intelligence模型。2. OpenAI任命前Coinbase CMO Kate Rouch为首位首席营销官。3. OpenAI从谷歌DeepMind挖角三名高级工程师,专注于多模态AI研发。4. 外媒:微软的AI软件销售和OpenAI交易成为美国联邦贸易委员会调查目标。5. 美国哥伦比亚大学研究:ChatGPT的新闻搜索结果经常不准确。6. 亚马逊推出“自动推理检查”工具,对抗AI幻觉。7. Meta计划在美国增加1-4吉瓦核能发电容量,以支持AI和环保目标。8. 字节跳动AI助手豆包上线图片理解功能,上传图片即可“读图”。9. 商汤:完成战略组织架构重组,集团将聚焦生成式AI等核心业务。10. 日本文化厅将建立AI系统检测盗版网站,以避免数十亿美元经济损失。11. 韩国成为全球首个用工业机器人取代10%劳动力的国家:每万名员工中有1102台机器人。

clock
2024-12-04 03:56:40
全军合成训练现场会召开 张又侠出席并讲话

10月22日讯,经习近平主席批准,全军合成训练现场会20日至22日在河北张家口召开。中共中央政治局委员、中央军委副主席张又侠出席会议,观摩示范课目演练和夜间实弹检验性演习,参加合成训练交流总结并讲话,强调要深入学习贯彻习主席关于加强军事训练的重要指示,探索合成训练新模式,蹚出部队作战能力生成新路径。

clock
2024-10-22 10:02:30
字节跳动大模型训练遭实习生攻击 知情人士否认损失超千万美元

10月19日讯,向字节跳动方面求证此事,截至目前,官方未进行回应。从知情人士处获悉,该实习生攻击的并不是豆包大模型,而是商业化技术团队的模型训练任务,影响了该技术团队的一些业务进展,但整体对公司造成的损失并没有传闻中的超过千万美元那么大。(界面)

clock
2024-10-19 03:47:21
Disclaimer:
1. The information provided does not constitute investment advice. Investors should make independent decisions and bear all risks themselves.
2. The copyright of this content belongs to the original author. The views expressed herein are solely those of the author and do not represent the stance or position of this website.