文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
OpenAI 希望特朗普政府于 7 月公布 AI Action Plan 时通过宣布使用版权材料训练 AI 属于合理使用去解决相关版权分歧,从而为 AI 公司不受限制获取训练数据铺平道路,OpenAI 声称这对于在 AI 竞赛中打败中国至关重要。包括 OpenAI 在内的众多 AI 公司都遭到起诉被控侵犯版权,法庭正在斟酌 AI 训练是否属于合理使用,而版权方主张基于创意作品训练的 AI 模型可能在市场上取代它们,削弱人类整体的创意产出。OpenAI 主张是:OpenAI 的模型经过训练不会复制作品提供给公众消费,相反模型会从作品中学习并提取模式、语言结构和上下文见解,这意味着 AI 模型训练符合版权和合理使用原则的核心目标,利用现有作品创造全新而不同的东西,不会损害现有作品的商业价值。
Google 发布了新的多模模型 Gemma 3,开放权重,允许负责任的商业用途,128K 个令牌上下文,支持超过 140 种语言,提供了 10 亿、40 亿、120 亿、270 亿参数规模的模型可供选项。Google 称,Gemma 3 的 Elo 得分相当于 DeepSeek AI R1 模型的 98%,分别为 1338 分和 1363 分。但 DeepSeek 需要 32 张英伟达 H100 GPU 才能达到这一分数,而 Gemma 3 只需要一张 H100 GPU。Google 宣称 Gemma 3 是能在单张 GPU 或 TPU 上运行的最强大模型。
Meta 开始测试第一款自研 AI 训练芯片,此举旨在减少对英伟达 AI 芯片的依赖。英伟达是最大的 AI 芯片供应商。Meta 在 2025 年的资本支出预计高达 650 亿美元,绝大部分是投向 AI 基础设施。Meta 的新训练芯片是一种专用加速器,只能处理特定于 AI 任务,但比 GPU 更节能。芯片由台积电代工。Meta 希望到 2026 年用自研 芯片训练 AI 系统。
西班牙政府批准了一项法案,对未能明确标记 AI 生成内容的公司处以最高 3500 万欧元或其全球营业额 7% 的巨额罚款。西班牙数字化转型部长 Oscar Lopez 表示,法案采用了欧盟 AI Act 法的指导方针,对高风险 AI 系统施加严格的透明度义务。他说,AI 是一种强大的工具,能用于改善生活,但也能用于传播虚假信息和攻击民主。他指出每个人都容易受到“深度伪造”的攻击。法案还禁止利用难以察觉的声音和图像去操纵弱势群体,比如 AI 聊天机器人煽动成瘾者去赌博或者鼓励儿童做有危险性的挑战。法案还禁止使用 AI 通过生物特征数据对人进行分类评价以发放福利或评估犯罪风险。
Hugging Face 联合创始人兼首席科学家 Thomas Wolf 表示,AI 长于遵循指令,但并没有突破知识的界限。他分析了 AI 的局限性,AI 领域制造出的是“过度顺从的助手”而不是革命者。AI 目前并没有创造新知识,它只是在现有事实之间填补空白——他称之为“流形填充(manifold filling)”。他认为,AI 要真正推动科学突破,需要不能限于检索和综合信息。AI 应该能质疑自己的训练数据,采用反直觉的方法,从最少的输入中产生新的创意,提出意想不到的问题开辟新的研究路径。对于 AI 科技公司高管预言 AI 将加速科学进步,在 5 到 10 年内获得原本需要百年才可能完成的发现。Wolf 认为如果不改变研究方法这是不可能做到的。
微软据报道正在开发与 OpenAI 和 Anthropic 模型进行竞争的大模型 MAI。MAI 可能代表 Microsoft artificial intelligence,或者可能指的是微软内部开发的 AI 芯片 Maia 100。Maia 100 使用台积电 5 纳米工艺制造,有 1050 亿个晶体管,用于加速 AI 计算任务,以避免依赖单一供应商英伟达供应 AI 芯片。微软内部对 MAI 测试表明,它能与 OpenAI 和 Anthropic 的模型进行竞争。微软工程师正在评估将 MAI 集成到该公司的 AI 助手 Copilot 中,暗示 MAI 可能是通用模型而不是推理模型。微软据报道正在开发为推理任务优化的大模型系列。
OpenAI 目前将其用户账户分成三个级别:免费、20 美元月费的 Plus 和 200 美元的 Pro。OpenAI 据报道准备为其不同能力水平的智能体(AI Agent)推出一种分级定价结构:月费 2000 美元的智能体,针对高收入知识工作者;月费 1 万美元的软件开发智能体;月费 2 万美元的博士水平研究智能体。OpenAI 目前的年收入大约为 40 亿美元,该公司向投资者表示其智能体产品未来可能占到收入的 20-25%。
美国计算机学会(ACM)宣布 2024 年图灵奖授予了奠定强化学习概念和算法基础的计算机科学家 Andrew G. Barto 和 Richard S. Sutton。在 1980 年代发表的一系列论文中,Barto 和 Sutton 介绍了强化学习的主要思想,构建了数学基础,发展了重要算法——强化学习是构建智能系统的最重要方法之一。虽然算法是几十前发展的,但过去 15 年,通过结合强化学习与深度学习算法,推动了深度强化学习技术的出现。
欧洲刑警组织在 Operation Cumberland 行动中逮捕 25 名分享 AI 创作儿童色情的用户。欧洲刑警组织成为最新一个认为 AI 生成的 CSAM(Child Sexual Abuse Material) 仍然是 CSAM 的组织。全世界的警方都发出警告,AI 生成的 CSAM 正充斥着互联网,而区分由真实儿童构成的 CSAM 和 AI CSAM 日益困难。虽然 AI 生成的 CSAM 刻画的可能是虚构的儿童,但已经发现有 AI 模型使用了真实的 CSAM 进行训练。欧洲刑警组织称 ,AI 生成的 CSAM 仍然会鼓动儿童的物化和性化。
OpenAI 周四开始向部分开发者和支付 200 美元月费的用户提供其新一代模型 GPT-4.5 的访问,下周开放给 ChatGPT Plus 订阅用户。GPT-4.5 原计划去年推出,但因为开发挑战而推迟。OpenAI CEO Sam Altman 称原因是 GPU 耗尽了。Altman 称在让更多用户访问 GPT-4.5 前需要增加数以万计的 GPU。因为其规模,GPT-4.5 价格非常昂贵,模型输入每百万个 token 收取 75 美元,模型生成每百万个 token 收取 150 美元,这一收费标准分别是 GPT-4o 模型的 30 倍和 15 倍。
Y 孵化器支持的 AI 公司 Optifye.ai 的产品是利用监控探头为工厂实时监视工人的工作情况,该公司刚刚发布了一则演示其工作方式的视频,结果引发了广泛批评,最终导致视频被撤下。在视频中,公司联合创始人 Kushal Mohta 扮演了一家服装厂的老板,向主管(由另一位联合创始人 Vivaan Baid 扮演)询问一位编号为 17 的工人的表现。Baid 随即通过监控探头与 17 号工人当面对质,这位工人回答他整天在工作。但监控仪表盘显示这名工人的工作效率过去半个月都很糟糕。主管对工人进行了批评。这段视频在社交媒体上引发了将工人非人化的批评,认为该公司的服务是“血汗工厂即服务”。在 Y 孵化器的论坛 Hacker News 上该演示视频也引发了争议和批评。
皮尤研究中心周二公布的一项调查发现,55% 的美国工人很少或从未在工作中使用 AI 工具,29% 的人对其一无所知。只有 16% 的工人报告经常用 ChatGPT、Gemini 或 Copilot 等 AI 聊天工具,使用率最高的是年轻工人,18-29 岁工人中 23% 使用,而研究生学历的工人有 26% 使用。AI 工具主要被用于研究(57%)、编辑内容(52%)和起草报告(47%)。四成的人认为 AI 工具提高了工作速度,但只有 29% 的人认为它显著改进了工作质量。在不使用 AI 工具的工人中,36% 认为它与工作不相关是主要原因。雇主对使用 AI 持中立态度,半数既不鼓励也不阻止。科技业雇主有 36% 积极鼓励使用 AI 聊天机器人,其次是金融服务业的 24%。
Google 发布了免费版编程助手 Gemini Code Assist,而且其免费额度足够大部分人使用。Gemini Code Assist 基于微调过的 Gemini 2.0 模型,程序员每个月可以用它完成 18 万次辅助编程。相比之下 GitHub Copilot 免费版每个月只有 2000 次。它能集成到 Visual Studio Code、JetBrains IDE 和 GitHub 等流行开发环境中。Gemini Code Assist 的上下文窗口最多 128,000 个令牌,能用于较大的代码库,使用只需要有 Gmail 帐户不需要信用卡。Google 声称逾四分之三的开发者在日常工作中使用 AI,有四分之一的新代码是在 AI 帮助下生成的。
AI 创业公司 Anthropic 发布了首个混合推理模型 Claude 3.7 Sonnet,既能产生近实时的响应,也能产生逐步思考的过程。Claude 3.7 提供了一个展示推理过程的“便笺簿”,DeepSeek 也有类似功能,它可以帮助用户理解模型如何解决问题,以便于用户修改或改进提示词。Anthropic 同时发布了针对程序员的辅助编程工具 Claude Code。
OpenAI 研究员发现即使是最先进的 AI 模型也无法解决大部分它们没见过的编程问题。研究报告发表在预印本平台 arXiv。研究人员利用了一个新开发的基准测试 SWE-Lancer,该测试是基于自由职业网站 Upwork 上的逾 1,400 道软件工程问题,测试针对了三个大模型:OpenAI 的 o1 推理模型和 GPT-4o,以及 Anthropic 的 Claude 3.5 Sonnet。大模型被禁止联网,以免拷贝网上已经发布的类似问题答案。结果显示,Claude 3.5 Sonnet 的表现更出色,然而它的大部分答案也都是错误的。研究人员称,大模型需要提高可靠性才能被信任去完成现实中的编程问题。大模型在处理未知问题上仍然远逊色人类工程师。
OpenAI 首席运营官 Brad Lightcap 披露 ChatGPT 周活跃用户突破 4 亿。ChatGPT 于 2022 年 11 月上线,2023 年 1 月月活用户达到一亿,2024 年 8 月周活跃用户超过 2 亿。全世界大约有 80 亿人口,4 亿相当于总人口数的 5%。杭州深度求索 DeepSeek 上个月发布的开源大模型一度引发了 OpenAI 能保持其领先位置的质疑。OpenAI 的回应是将简化 ChatGPT,用户无需选择哪种推理模型响应输入,将更快的向客户提供新一代的 GPT-4.5 和 GPT-5 模型。
微软去年底为其经典应用记事本(Notepad)引入了 AI 文本重写功能,用户可选择文本然后右键菜单里选择重写或者使用快捷键 Ctrl + I。现在微软已将该功能置于付费墙之后,要求用户订阅了 Microsoft 365 Personal 或 Family 方案才能访问该功能。使用记事本的 AI 重写功能将需要用户登录账号并且其订阅计划包含足够的“AI 积分”。如果用户不订阅微软的服务,他们可选择禁用该功能并隐藏其图标。
百度宣布将在未来几个月中陆续推出文心大模型 4.5 系列,6 月 30 日起正式开源。此举可能是受到了 DeepSeek 成功的刺激。百度此前一直坚持闭源战略。去年 7 月,百度创始人、董事长兼首席执行官李彦宏在世界人工智能大会上表示,没有应用,基础模型一文不值,商业化闭源模型最能打,“很多人拿开源模型来改款,以为这样可以更好地服务自己的个性化应用,殊不知这是创造了一个孤本模型,既无法从基础模型持续升级当中获益,也没办法跟别人去共享算力。”李彦宏表示,同样参数规模下,闭源模型的能力比开源模型要更好,而如果开源想要能力追平闭源,就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。在李彦宏看来,当处在一个激烈竞争的市场环境中时,还是要闭源大模型,闭源才有真正的商业模式,才能聚集人才和算力。开源模型只在某些场景下有价值,例如学术研究。
OpenAI 更新了其聊天机器人 ChatGPT 如何表现以及如何响应用户请求的指导方针 Model Spec,允许在适当的上下文下生成成人级内容如色情和血腥内容。OpenAI 称 ChatGPT 不应该生成色情、非法或非自愿性行为的描述、或极端血腥的内容,除非是在科学、历史、新闻、创意,或者其它敏感内容合适的上下文中。用户的测试显示 ChatGPT 确实放宽了其内容过滤器。OpenAI 强调儿童色情仍然是禁止的。
用 Rust 开发的文本编辑器项目 Zed 宣布引入编辑预测功能。该功能是基于开源大模型 Zeta,而 Zeta 是基于阿里巴巴的模型 Qwen2.5-Coder-7B。Zeta 是一个开源模型,包括开源数据集,开发者欢迎通过向数据集贡献数据帮助改进 Zeta。通过编辑预测,Zed 能预测使用者的下一次编辑,用户只需按 Tab 键即可应用。一旦接受预测,使用者可以通过反复按 Tab 键执行多个后续编辑,节省时间和按键次数。编辑预测目前可以免费测试,但开发者警告不会永远免费。