近日,谷歌DeepMind科学家Jacob Austint在X上, 发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。
大二时,他对人工智能产生了浓厚兴趣,投入到计算机视觉领域的研究中;大三暑假,跟着全球著名计算机视觉专家朱松纯从事相关研究。加入xAI之后,他的研究方向主要聚焦于如何优化AI训练效率,并提升模型的稳定性。
美国AI云服务商Together AI宣布完成3.05亿美元B轮融资,估值高达33亿美元!该公司押注开源模型,提供包括DeepSeek-R1在内的200多个模型API服务,并出租GPU算力,年收入已超1亿美元。
此外,若这些系统已经在人类不自知的情景下,奖励那些对人类有害的结果(例如短视频成瘾),从而更有效地遵循其预设目标(获得更多用户时长),可能使结果进一步偏离人类偏好,这就是本文要讨论的AI的「隐性对齐」。
为进一步推动央国企高质量数字化转型,中国信通院联合业内多家数字化转型头部企业共同发起了《央国企数智化转型发展报告2025》(下文简称“报告”)的编写,并于2024年12月26日举办的“2024政企数智化转型与企业级AI成果发布会暨企业数字化发展共建共享平台(EDCC)年会”上正式启动编制工作。此次报告,中国信通院将联合来自通信、互联网、能源、交通、制造、金融等多个行业的企业及科研院所60余家单位, ...
据首席运营官布拉德·莱特卡普周四在X平台上的帖子称,OpenAI的ChatGPT周活跃用户已突破4亿大关,这一里程碑彰显了该公司在消费者和企业市场日益扩大的影响力。
谷歌的 Project Zero 和 Mandiant 网络安全团队近日联合发布了针对 Palo Alto Networks PAN-OS OpenConfig 插件中的一个高严重性命令注入漏洞(CVE-2025-0110)的概念验证(PoC)代码。该漏洞经身份验证的管理员能够通过伪造的 gNMI 请求在防火墙上执行任意命令,并提升权限至 root 访问级别。
S1 是一个 8000 万参数的交叉注意力编码器 - 解码器 Transformer,负责低级控制。它依赖于一个完全卷积的多尺度视觉骨干网络进行视觉处理,该网络完全在模拟环境中进行预训练初始化。虽然 S1 接收与 S2 ...
由于噪声 - 无条件模型很少被考虑,专门为这种未充分探索的情况设计模型是有价值的。为此,研究者从 EDM 模型中提出了一个简单的替代方案。在没有噪声条件的情况下,该变体可以实现很强的性能,在 CIFAR10 数据集上的 FID 得分达到 ...
Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」!它能将PyTorch代码自动转换为高度优化的CUDA内核,速度比PyTorch原生实现快10-100倍。
其中S1是一个80M参数的交叉注意力(cross-attention)编码器-解码器Transformer,负责低层控制。它依赖于一个全卷积的多尺度视觉主干网络进行视觉处理,该网络完全在模拟环境中预训练初始化。
一夜之间,游戏产业要变天了!微软公布全球首个世界与人类行动模型,名为Muse,可秒生游戏画面,精准预测玩家操作。未来,游戏开发或将从数月压缩至几分钟,千亿美金游戏市场或被颠覆。
Some results have been hidden because they may be inaccessible to you
Show inaccessible results