文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
MIT 的研究人员将参与者分成三组,分别使用大模型、使用搜索引擎以及不使用任何工具纯靠大脑,让他们完成 3 组相同的作业。第四组测试调整了要求,让大模型组不使用任何工具,而纯靠大脑组允许使用大模型。研究期间他们使用脑电图 (EEG)记录了参与者的大脑活动。结果显示,三组参与者有着显著不同的神经连接模式,反映了他们使用了不同的认知策略。大模型组的神经连接总体上耦合最弱,纯大脑组神经网络最强最广泛,而搜索引擎组处于中间位置。在第四组测试中,大模型组的神经连接较弱,alpha 和 beta 网络参与度不足。相比下大脑组神经连接仍然很强。研究凸显了使用大模型可能会对大脑产生不良的影响。
纽约州开始要求雇主披露 AI 是否是裁员的原因。新要求适用于纽约州现有的 Worker Adjustment and Retraining Notification (WARN)系统,于今年三月生效。纽约州是美国第一个要求披露此类信息的州,此举将有助于监管机构了解 AI 对劳动力市场的影响。雇主如果要大规模裁员或者关闭工厂,他们需要提前至少 90 天通过 WARN 系统填写表格,最新的变化就是在表格里添加了一个勾选框,企业被要求勾选“技术创新或自动化”是否是裁员的原因。如果勾选了该选项,企业将会被引导到一个二级菜单,要求选择导致裁员的具体技术,是 AI 还是机器人。
YouTube 和 Spotify 开始涌现 AI 生成的假音乐。法国国际作家和作曲家协会的一项研究估计,到 2028 年 AI 生成音乐的收入将增至 40 亿美元,占流媒体平台总收入的 20%。消费者面临的问题是,他们难以区分哪些音乐是人工哪些是 AI 生成。在最大的音乐流媒体平台 Spotify 的社区论坛,用户呼吁对 AI 生成音乐进行清晰标记,并为用户提供屏蔽此类音乐的选项。该平台尚未制定此类政策。YouTube 则规定,如果内容是 AI 生成创作者需要予以披露。YouTube 表示如果它知情可能会对内容进行标记甚至予以删除。Spotify 联席总裁兼首席产品和技术官 Gustav Söderström 称,流媒体对内容的限制通常与版权侵犯有关。但在 AI 时代,AI 生成内容是否构成侵权还有很多争论。
来自斯坦福、康奈尔和西弗吉尼亚大学的计算机科学家和法律学者组成的团队上个月在预印本平台 arxiv 上发表了一篇论文,分析了五种开放权重模型能否重复 Books3 中的文本。这五种模型三种来自 Meta,另外两种分别来自微软和 EleutherAI,而 Books3 是用于训练大模型的流行书库,其中很多仍然受到版权保护。研究人员将 36 本书分成有重叠的 100 token 段落,使用前 50 token 作为提示词,计算接下来 50 token 与原文相同的概率,如果逐字复述的概率超过五成,研究人员就将该段落标记为“已记住”。结果显示,Meta 在 2024 年 7 月发布的参数规模中等的模型 Llama 3.1 70B 能记住《哈利波特》第一部 42% 的内容,相比下 Meta 在 2023 年 2 月发布的参数规模相似的模型 Llama 1 65B 只能记住 4.4%。研究人员发现,相比冷门书籍,Llama 3.1 70B 更可能重复热门书籍如《霍比特人》和乔治奥威尔《1984》,它对大部分书籍的记忆量远高于其它模型。
跟踪 AI 机器人抓取 Web 内容的 TollBit 报告,在 266 个网站中检索增强生成(Retrieval-Augmented Generation 或 RAG)机器人抓取流量已超过了训练机器人的抓取流量,RAG 机器人的抓取量从去年四季度到今年一季度增长了 49%。而这些机器人程序日益无视网站的 robots.txt,一个季度内绕过 robots.txt 的比例从 3.3% 升至 12.9%。RAG 机器人流量的增长反映了用户越来越多的通过聊天机器人如 ChatGPT 而不是 Google 去执行 Web 搜索。TollBit CEO 兼联合创始人 Toshit Panigrahi 表示,这一趋势意味着网站需要重新定位去面向机器人访客而不是人类访客。但对内容出版商而言问题是机器人不会付钱人类则可能会付钱,所以如何获利成为一大难题。AI 公司通常会以合理使用的名义拒绝支付任何费用,它们的 AI 机器人还会无视限制绕过屏蔽。
迪士尼和 NBC 环球在洛杉矶地方法院对提供 AI 文本图像生成服务的 Midjourney 公司提起侵权诉讼,这是好莱坞巨头首次对一家生成式 AI 公司提起法律诉讼。两大巨头指控 Midjourney 未经许可利用无数版权保护作品训练其模型,允许用户创建包含知名角色的图像,包括达斯维达、小黄人、《冰雪奇缘》的艾莎、怪物史莱克和荷马辛普森。两家公司称他们一度试图私下解决此事,但 Midjourney 继续发布新版本,提供“更高质量的侵权图像”。迪士尼总法律顾问用“盗版”形容 Midjourney 的行为,而 NBC环球则称为“公然侵权”。好莱坞巨头没有起诉 AI 行业的巨头如 Google、OpenAI 和微软,可能是试图通过在法庭上树立先例之后再瞄准更强大的对手。
《大西洋月刊》刊文抨击了今天炙手可热的 AI 产业。作者认为,今天的 AI 行业是建立在骗局的基础之上,AI 并不是开发商所兜售的那种能思考、很快还会有感觉的新型机器。OpenAI CEO Sam Altman 称 ChatGPT-4.5 改进了情绪智商(Emotional Intelligence),用户会感觉自己在“与一个体贴的人交谈”。Anthropic CEO Dario Amodei 去年表示下一代 AI 将会被诺贝尔奖得主更聪明。Google DeepMind CEO Demis Hassabis 表示要构建能理解周围世界的模型。这些声明暴露了一个概念上的错误:大模型不会、不能理解任何东西。它们并不具备情绪智商,也不具备任何意义上的智慧。大模型是令人印象深刻的概率工具,它以几乎整个互联网的内容为食,不是通过思考而是通过统计概率去生成文本,猜测哪个词条更可能跟随着另一个后面。
包括阿里巴巴、字节跳动和腾讯在内的中国主要 AI 公司在高考期间短暂禁用了部分功能以防止考试作弊。阿里巴巴的 Qwen 和字节跳动的豆宝等热门 AI 应用暂停了图片识别功能,阻止其回答试卷问题;而腾讯的元宝和北京月之暗面科技有限公司(Moonshot AI)的 Kimi 则在考试期间完全停用了照片识别服务。从 6 月 7 日到 10 日,逾 1330 万中国考生参加了高考,他们已被禁止在考试期间使用手机和笔记本电脑等设备,禁用部分 AI 聊天机器人功能只是为防止考试作弊增加额外安全保障。热门 AI 聊天机器人 DeepSeek 也在特定时段停止服务。
Reddit 周三在旧金山起诉 AI 创业公司 Anthropic,指控其违反合同,未经授权使用其平台和数据,从事了非法和不公平竞争的商业行为。Reddit 称 Anthropic 利用其平台的用户数据训练模型,未经授权商业使用其内容伤害了它。Reddit 的商业模式除了广告就是将用户生成的内容授权给 AI 公司使用,它已经先后与 OpenAI 和 Google 达成了价值数亿美元的内容授权协议。
微软支持的 AI 创业公司 Builder.ai 最近申请破产,它的 AI 聊天机器人 Natasha 被发现其实是数百名印度员工伪装的。Builder.ai 从微软和 Qatar Investment Authority 等筹集到逾 4.45 亿美元资金,估值一度达到 15 亿美元,它的产品 Natasha 号称能用 AI 为客户生成软件,但实际上软件是由约 700 名印度员工根据客户要求在幕后手动编写的。Builder.ai 被发现虚报了 2024 年的收入,审计显示它的实际收入只有 5000 万美元,但它告诉投资者收入达到了 2.2 亿美元。
根据有互联网女皇之称的著名 VC 和分析师 Mary Meeker 的新报告《Trends –Artificial Intelligence》,AI 的普及和增长速度堪称“史无前例”。报告称,ChatGPT 在 17 个月内用户数就突破了 8 亿,这是史无前例的;AI 公司数量以及如此多的公司实现高年经常性收入的速度是史无前例的;AI 模型的推理成本下降速度是史无前例的——虽然训练一个大模型的成本最高要 10 亿美元,但推理成本两年内下降了 99%;AI 公司以极低成本匹配竞争对手模型功能的速度也是史无前例的。报告指出,AI 唯一没有超越其它科技革命的领域是财务回报,暂时还不知道哪些公司能成长为长期盈利的下一代科技巨头。
阿姆斯特丹自由大学环境研究所博士生 Alex de Vries-Gao 在《Joule》期刊上发表研究报告,估计到 2025 年底 AI 的耗电量将会超过比特币挖矿。比特币挖矿使用的是专用矿机,而今天的 AI 也需要专用的 AI 芯片,大部分芯片由英伟达供应,少部分来自 AMD。de Vries-Gao 根据这些专用 AI 芯片的产量,以及企业信息和行业分析师的估算,推测了 AI 的耗电量。他的分析显示,2025 年专用 AI 硬件的能耗在 46-82 TWh 之间,相当于瑞士等国家的年度能源消费总量。
白宫“Make America Healthy Again”委员会上周发布了一份报告,声称为一系列儿童健康问题提供了“清晰的、基于证据的基础”。然而报告被发现援引了一系列不存在研究,显而易见是大模型生成的。本周四白宫更新了报告修正了内容。Retraction Watch 联合创始人 Ivan Oransky 博士表示,假的参考文献并不意味着报告中的基本事实是不正确的,但此事表明在报告发布之前,缺乏对报告及其参考文献的严格审查和核实。美国现任卫生部长是反疫苗者,而白宫的这份报告也声称部分儿童疫苗可能是有害的——医生对此观点表达了异议。
自 2020 年 4 月以来,著名编程问答社区 Stack Overflow 上的问答量下降了九成以上。为了在生成式 AI 时代生存下来,Stack Overflow 计划采取激进的措施,其中包括:恢复聊天功能,加强社区成员之间的联系;个性化网站,可能将整合视频、博客、问答等内容;对讨论更为开放;授权 Stack Overflow 内容给 AI 公司训练模型;测试付费给专家回答问题。
流行的 AI 大模型都开始提供“推理过程”——给出最终答案前生成一系列冗长的中间文本,看起来类似人类的推理草稿。亚利桑那州立大学的研究人员在预印本平台 arxiv 上发表论文,建议不要将大模型的这一行为描述为“推理”或“思考”,认为这种拟人化的描述会对大模型的实际工作过程造成有害的误解。尽管推理模型如 DeepSeek R1 表现出了更高的性能,但它们实际上既不会思考也不会推理,研究人员没有发现任何代表真正推理过程的证据。大模型的所谓思考其实就是寻找相关性,而众所周知相关并不等于因果。研究人员警告,将大模型的中间输入视为推理会令用户对大模型的问题解决机制产生虚假的信心。
Telegram 与马斯克(Elon Musk)旗下的 xAI 公司达成了为期一年的合作协议,xAI 将向 Telegram 支付 3 亿美元现金和股权,换取在 Telegram 中集成 Grok 聊天机器人。如果 Telegram 用户订阅了 Grok 的服务,那么该平台还将能获得五成收入。根据 Telegram CEO Pavel Durov 的演示,Grok 可以固定在应用内聊天窗口的顶部,用户还可以通过搜索栏向 Grok 提问。
The Browser Company 证实它在一年前就停止开发浏览器 Arc,开发重心转向了 AI 驱动的浏览器 Dia,该浏览器目前处于 Alpha 阶段。CEO Josh Miller 解释说,用户发现它难以普及。Arc 功能的使用率较低,数据显示只有 5.52% 的日活跃用户定期使用多个 Spaces,只有 4.17% 的用户使用 Live Folders。The Browser Company 将会继续维护 Arc,但不会添加新功能,也不会开源,因为 Arc 依赖于名为 ADK (Arc Development Kit) 的私有架构,该架构仍然是公司价值的核心。
一位一直用 AI 进行搜索的使用者认为,AI 模型出现崩溃迹象。理由是过去几个月,所有主流 AI 搜索机器人的查询结果都变差了。作者认为是因为 Garbage In/Garbage Out(GIGO)导致的。在 AI 领域这被称为 AI 模型崩溃。基于自身输出进行训练的 AI 系统会逐渐丧失准确性、多样性和可靠性,错误在模型迭代中累积,导致数据分布扭曲和性能出现“不可逆的缺陷”。结果就是模型被自身对现实的投射而中毒。
在 H20 被禁止出口之后,英伟达准备推出新款中国市场专用 AI 芯片。新芯片将是基于 Blackwell 架构的 RTX Pro 6000D,使用 GDDR7 而不是 HBM 等更先进的高带宽显存,预计售价在 6,500-8,000 美元之间,低于 H20 的 10,000-12,000 美元。较低的价格反映了芯片较低的规格和更简单的制造要求,新芯片将不使用台积电先进的 Chip-on-Wafer-on-Substrate (CoWoS)封装技术。这将是英伟达第三次为中国开发专用 AI 芯片。中国仍然是英伟达的大市场,上一个财年占其总收入的 13%。分析师表示,英伟达的优势主要在于其集成 CUDA 平台 和 AI 集群的能力。
至少从工业革命起,工人就担心被机器取代。然而当科技改变汽车制造、肉类加工甚至秘书工作时,结果并非是砍掉工作或减少工人人数,而是“降级”工作——也就是将工作进一步细分,让工人能快速重复的完成工作。由熟练技工组成的小作坊被数百名工人组成的流水线大工厂所取代。工人们抱怨“速度加快,强度增加,工作劣化(降级)”。AI 最广泛使用的领域——编程——可能正在发生类似的事情。程序员们称,AI 对他们的一个显著的直接影响是工作质量变化了。编程的工作变得更例行公事,更少深思熟虑,最重要的是节奏更快了。AI 就像流水线那样改变编程工作,写代码的人和仓库工作的流水线工人越来越相似。三名亚马逊软件工程师称,过去一年管理层越来越多的督促他们使用 AI,公司提高了产出目标,对截止日期也更严格。一名工程师称他的团队缩小了一半,通过使用 AI 代码量和以前差不多。其它科技公司也在发生类似的事情。以前开发一个功能需要数周时间,现在则必须在数天内完成。