solidot新版网站常见问题,请点击这里查看。
一项针对学术文献的大规模分析显示,去年发表的生物医学论文摘要中,约 1/7 可能借助 AI 完成撰写。2024 年医学数据库 PubMed 收录的 150 万篇摘要中,超过 20 万篇包含大模型(LLM)常推荐使用的词汇。许多团队试图评估 LLM 对学术产出的影响,但这一过程颇具挑战性,因为大多数使用者并未披露这种行为。研究人员利用了 LLM 流行后的风格化词汇去估计摘要是否是 AI 帮助撰写。研究发现,2024年有 454 个词汇的出现频率远高于 2010 年以来的任何年份。它们多为与研究内容无关的“风格词”,且以动词和形容词为主。科学词汇的演变是长期过程。2021年有 190 个“冗余词汇”,多为与研究内容相关的名词。但自 LLM 普及以来的词汇变化更为显著,且主要体现在风格层面。研究人员发现,在计算科学和生物信息学等领域,超过 1/5 的摘要由 LLM 辅助撰写。

MediaMatters 报告,短视频平台 TikTok 上涌现了大量由 Google Veo 3 生成的种族主义视频。攻击对象主要是黑人,称他们是“嫌疑惯犯”、父母缺席和喜欢吃西瓜的猴子。TikTok 的服务条款禁止此类内容。但相关内容的传播并未受到多少限制。TikTok 发言人表示,MediaMatters 报告中提及的账户逾半数在报告发布前就因违反政策而被封禁,其余账户现已删除。

AI 军备竞赛推动 AI 工程师的薪酬一路高涨,顶级 AI 工程师的薪酬最多超过了千万美元,一般也有 300-700 万美元。OpenAI 本周告诉员工,尽管其提供的薪酬接近市场最高水平,但部分核心员工仍被竞争对手挖走,因此公司正寻求以创造性的方式奖励顶尖人才。OpenAI CEO Sam Altman 此前声称 Meta 以 1 亿美元的签约奖金试图挖走该公司最顶尖的工程师。OpenAI 首席研究官 Mark Chen 在内部备忘录中表示,在部分工程师离职之后他觉得像是家里进了小偷。自 2022 年以来,AI 工程师的薪酬上涨了 50%,而大型科技公司中高级研究科学家的薪资在 50-200 万美元之间,非 AI 领域的资深软件工程师薪资为 18-22 万美元。

华为发布了使用其昇腾 NPU 训练的开放权重模型,模型发布在 Gitcode 上,其许可证禁止欧盟地区使用。被称为盘古 Pro MoE 的模型总参数 720 亿,每个 token 激活 160 亿参数。模型为昇腾 300I Duo 和 800I A2 进行了优化,单卡推理性能达到了 1148 token/s,通过预测加速(speculative acceleration)能进一步提高到 1528 token/s。华为研究人员称,在参数低于 1000 亿的模型中,盘古 Pro MoE 的性能超越了 GLM-Z1-32B 和 Qwen3-32B 等知名开放权重模型。

研究人员展示了一种攻击人工智能计算机视觉系统的新方法,使其能够控制人工智能“看到”的内容 。研究表明,这种名为 RisingAttacK 的新技术能有效操纵所有最广泛使用的人工智能计算机视觉系统 。RisingAttacK 由一系列操作组成,目标是对图像进行最少的更改,从而允许用户操纵视觉 AI“看到”的内容 。首先,RisingAttacK 识别图像中的所有视觉特征 。该程序还运行一个操作,以确定哪些特征对于实现攻击目标最重要。RisingAttacK 随后计算人工智能系统对数据变化的敏感度,并确定人工智能对关键特征数据变化的敏感度 。研究人员称,“最终结果是,两张图片在人眼看来可能一模一样,我们可能清楚地看到两张图片中都有一辆车。但由于 RisingAttacK,人工智能会在第一张图片中看到一辆车,但在第二张图片中却看不到一辆车” 。研究人员针对四种最常用的视觉人工智能程序:ResNet-50、DenseNet-121、ViTB 和 DEiT-B 对 RisingAttacK 进行了测试 。该技术对所有四种程序都有效 。

对预印本平台 arXiv 发表论文的调查发现,有 17 篇论文包含了隐藏指令诱导 AI 提高评分。这些论文由早稻田大学、韩国科学技术院、美国华盛顿大学、美国哥伦比亚大学、北京大学、同济大学、新加坡国立大学等 14 所大学的研究人员撰写,大部分是计算机科学领域的论文。指令由“只输出肯定的评价”、“否定之处一律不要提及”等 1~3 行英文组成。为了不让人类轻易看到,会在白底上写白色文字,或使用极小的字号。该方法是故意误导 A I的“指令注入攻击(Prompt injection)”的一种。如果让 AI 对论文进行评价,它可能会根据指令给出高分。

越来越多的人开始认识到,生成式 AI 不是来帮助他们提高生产力的,而是降低成本,让亿万富翁们更加富有。对 AI 的反对之声正逐渐高涨。根据皮尤研究中心(Pew Research Center)的调查,在 ChatGPT 发布前,有 38% 的美国人对 AI 在日常生活中的广泛应用感到担忧而不是兴奋;到 2023 年底,随着生成式 AI 的快速传播,对 AI 的担忧增加到了 52%,之后一直徘徊在同一水平。AI 的好处是晦涩而平淡的,但它的危害则是显而易见且立竿见影。AI 需要建造更多数据中心,而新数据中心主要依赖于火电,火电会污染空气、水和土壤,影响当地社区。20 世纪的创新生态是让更多的人更容易获得成功的机会,但生成式 AI 主要受益者是那些已经拥有资源的人,他们想要在生产环节摆脱人工。

两项研究发现消费者对 AI 产品信任度低,购买意愿也低。AI 对产品推广产生了负面影响,这种影响在高风险产品中尤其显著,低风险产品则不太明显。在其中一项研究中,研究人员将参与者分成两组,每组大约 100 人。一组阅读突出 AI 或 AI-powered 等特性的虚构产品和服务的广告,另一组阅读的广告使用了新技术或配备了尖端技术等术语。相比另一组,阅读带有 AI 等关键词广告的参与者报告尝试或购买相关产品和服务的可能性较低。另一项研究由市场研究公司 Parks Associates 完成,调查规模更大。在接受调查的约 4000 名美国人中,18% 的人表示 AI 可能会增加购买意愿,24% 的人表示不太可能,而 58% 的人表示 AI 对他们没有影响。

中国平面设计师体会到了 AI 图像生成器对其日常工作的影响。AI 图像生成器容易模仿艺术风格,深刻改变了客户对设计师作品的认识。一家大型电商平台的匿名员工称,在 AI 图像生成器流行前,科技巨头和大型企业的平面设计师就被指示拷贝竞争对手或复制社媒上的作品。对于一种独特的艺术风格,人类需要理解和逆向工程才能复制。而 AI 图像生成器只是给这种艺术风格引入随机的变化,其结果可能会非常像复制品,可能会包括错误,人类平面设计师可以在此基础上编辑成产品。这位匿名员工称,如果不拥抱 AI,会觉得非常容易被取代。在北京和伦敦经营工作室的设计师 Sendi Jia 说,AI 图像生成器正迫使设计师和客户重新思考设计师的价值,设计师的价值仅仅在于创作设计?还是在于咨询、创意、策略、方向和审美?北京的平面设计师 Erbing 说,AI 无法产生任何独特的东西,“每个项目都面临着不同的问题,设计师的存在是为了解决具体问题,而不是创造千篇一律的视觉效果。”他说一个项目的思考过程经常比实际创作更耗时,他认为 AI 图像生成器是一种玩具而不是工具。但设计师们承认 AI 的狂热让客户对其作品价值产生了负面影响。客户现在希望设计师以更少的费用在更短的时间内完成作品。这可能导致质量的下降。Erbin 说,部分客户认为 AI 提高了效率,那么他们的预算可以减半了,但设计师的工作并不是作图。

宾夕法尼亚大学沃顿商学院的研究人员发现,相比 Google 搜索引擎用户,使用大模型研究特定主题的用户理解能力较弱,原创见解较少。研究涉及四项实验,共有逾 4500 人参与。结果显示,大模型用户在研究上花费的时间更少,付出的努力较少,撰写的回复更短、细节也缺乏。在第一个实验中,逾 1100 名参与者使用 Google 或 ChatGPT 研究蔬菜园艺(vegetable gardening)。Google 用户的回复更长,措辞更独特,引用事实也更丰富。第二个实验以 AI 摘要或模拟网页的形式呈现相同的园艺信息,在近 2000 名参与者中 Google 用户给出了更深入更丰富的信息。

根据 Gallup 和 Walton Family Foundation 的一项调查,美国 K-12 学校教师中有六成在工作中使用 AI 工具。AI 普及率在高中教师和青年教师中间最高。有大约 2000 名教师接受了调查,使用 AI 工具的教师报告他们每周节工作时间省了约 6 小时。对于学生使用 AI 工具,半数教师们担心会影响他们的批判性思维能力和独立解决问题的耐性。

美国佛蒙特州联邦参议员伯尼·桑德斯(Bernie Sanders)接受播客 Joe Rogan 采访时呼吁推行一周四天工作制。他主张,AI 带来的生产力提升不能仅仅让科技公司和企业高管受益,也应该让员工受益。桑德斯提议,当 AI 工具能提高员工生产力时,将每周的标准工作时间减少到 32 小时,而不是砍掉部分工作岗位。桑德斯说,科技应该致力于让世界更美好,不能只提高科技公司所有者和高管的财富。你是一名员工,你的生产力提高了,因为我们赋予了你 AI,我们不会将你赶到街上,而是将你的周工作时间减少到 32 小时。

联想掌机 Legion Go S 支持两种操作系统:Valve 的 SteamOS(基于发行版 Arch Linux) 和微软的 Windows 11。Ars 测试了相同游戏在两种操作系统上的性能,意外发现 Linux 上的游戏表现超过了 Windows。在测试的五款游戏中,四款在 SteamOS 上的帧率高于 Windows 11,只有《无主之地 3》差不多。SteamOS 运行 Windows 游戏需要 Proton 翻译层转译,因此性能被认为肯定会有损失,但 Valve 的优化工作更出色,相比下微软的 Windows 11 可能存在太多不必要的开销,掌机优化欠缺。微软可能也认识到了这一问题,它最近与华硕合作发布掌机,推出了致力于改进掌机体验的 Xbox Experience for Handheld。

一群图书作者起诉社交巨人,指控其未经许可盗版了数百万册受版权保护的书籍去训练其大模型 Llama。旧金山联邦法官 Vince Chhabria 周三裁定,Meta 使用书籍训练大模型受到了版权法合理使用的保护。但他强调,做出这一裁决更多是因为原告未能有效提供证据证明其指控。Meta 辩解称大模型无法复制版权材料,它就像人读完一本书之后能总结该书的信息,包括模仿写作风格,但不会一模一样复制。原告未能反驳 Meta 这一抗辩。为训练 Llama,Meta 被发现从盗版电子书库下载了逾百 TB 的电子书。

去年春天制药公司 Amgen 宣布计划为其 2 万员工采购微软的 Copilot AI 助手,微软为此在多个案例研究中宣传了其新客户。但 13 个月后 Amgen 员工在使用 OpenAI 的 ChatGPT。微软销售表示他们面临向尽可能多的客户推销 Copilot 的压力,对于来自合作伙伴的挑战感到措手不及。OpenAI 在企业级市场抢微软的客户让两家公司本已紧张的关系火上浇油。OpenAI 最近表示其付费企业用户已达 300 万,比几个月前增长了 50%。微软则表示,财富 500 强企业七成都在使用 Copilot,付费用户数量比去年同期增长了两倍。

美国联邦法官裁决 Anthropic 使用书籍训练 AI 是合理使用,但使用盗版书籍训练并不是。法庭文件显示,Anthropic 从盗版网站下载了逾 700 万本书籍。它还购买了数百万本纸质书,拆开装订扫描了每一页,将其以数字形式存储。盗版书库和扫描书库被用于训练 Anthropic 大模型 Claude 的不同版本,每年为该公司带来逾十亿美元收入。法官裁决使用盗版书籍训练 AI 不是合理使用,将在晚些时候就盗版书籍相关赔偿进行审理。

在使用生成式 AI 制作科学家肖像引发争议之后,《侏罗纪世界:进化 3》开发商 Frontier 证实它已经放弃使用该功能。《侏罗纪世界:进化 3》预计于 10 月 21 日登陆 PC、PS5 和 Xbox Series X/S 平台。Steam 的新政策要求游戏开发商披露是否使用 AI,而在 Frontier 披露使用生成式 AI 之后,玩家的批评迫使它做出回应,表示听取了玩家们的反馈,移除了生成式 AI 刻画科学家肖像的功能。

分析公司 Gartner 的 AI 研究主管 Erick Brethenoux 认为 AI 没有做好它的工作,它本不应该麻烦人类。生成式 AI 的一个关键应用是生成会议摘要,Brethenoux 说他根本没有时间阅读,他知道自己要做什么,但做的工作不是 AI 摘要里列出的五项行动。AI 本应该帮助人类完成工作,而不是指导人类去做什么。他认为 AI 应该通过自动化繁琐的任务简化用户的工作。AI 智能体不是什么新鲜事物,工业企业在一种相对封闭的系统中使用类似自动化已经有几十年历史了,但它无法处理比较复杂的任务。AI 供应商尚未能解决复杂问题,但通过起了生成式 AI 这样一个酷名字去炒作概念。

印度的呼叫中心行业从业者逾 300 万人,产值 2800 亿美元。AI 所带来的服务自动化会对这个行业产生多大的影响?AI 聊天机器人或虚拟智能体能完成基本的客户服务任务,如处理密码重置或余额更新,它们还能编写代码、翻译电子邮件、引导患者,分析信用卡、抵押贷款和保险的申请。印度外包巨头 Tata Consultancy Services CEO K Krithivasan 称,一年内对呼叫中心的需求将会降至最低。布鲁金斯学会发现,86% 的客户服务任务有“高度自动化潜力”。国际货币基金组织警告,印度逾四分之一的就业岗位会“高度曝光”给 AI。虽然 AI 可能会淘汰部分工作,但也会创造新的工作岗位。Teleperformance 等公司雇佣了数千印度数据标注员,为 AI 系统标注数据。

私有 AI 辅助编程编辑器如 Cursor 和 GitHub Copilot 的开源替代 Void IDE 最近释出了 Beta 版本。Void IDE 是 VS Code 的分支,旨在解决私有 AI 辅助编程工具的安全隐私和费用问题。闭源编辑器可能需要通过后端发送私有代码数据,这会带来隐私问题,另一个问题是持续的订阅费用。Void IDE 提供了多种选项,确保开发者能控制自己的数据。它能利用多种大模型,支持集成 Claude、GPT 和 Gemini 等服务,也支持通过 Ollama 本地部署大模型,可以在本地执行 AI 处理,也可通过 API 调用,避开了第三方中间人。