solidot新版网站常见问题,请点击这里查看。
Adobe 宣布它更新了服务条款,澄清不会使用客户的作品训练 AI。此前它发送给 Creative Cloud Suite 用户的服务条款更新引发了广泛争议,该条款声称它可以使用机器学习用客户的内容训练去改进其产品和服务,以及用户体验。Adob​​e 数字媒体总裁 David Wadhwani 表示,新服务条款将于 6 月 18 日推出,澄清对此前条款的解读。他说,Adobe 从未用客户的内容训练生成式 AI,从未拥有客户作品的所有权,除了法律所允许的它不会访问客户的内容。

世界最大的无人驾驶汽车试验正在武汉繁忙的街道上进行。一个由 500 辆出租车组成的车队由电脑导航,在街头穿梭,通常没有安全驾驶员作为后备。运营这些出租车的百度上个月表示,将在武汉再增加 1000 辆所谓的机器人出租车。在中国,已经有至少 16 座城市允许公司在公共道路上测试无人驾驶汽车,至少有 19 家中国汽车制造商及其供应商正竞相在该领域建立全球领导地位。没有哪个国家在采取如此激进的行动。汽车咨询公司 JD Power 的调查发现,中国司机比美国人更愿意相信电脑能引导他们的汽车。6 月 4 日北京授权九家中国汽车制造商——包括蔚来、比亚迪和上汽——开始测试先进的辅助驾驶系统。至少在最初阶段,测试将在限制区域进行,而不是在公共道路上。中国汽车工程学会预测,到 2030 年,在中国销售的汽车中,20% 将是完全无人驾驶汽车,另外 70% 将采用先进的辅助驾驶技术。

苹果宣布了它的生成式 AI Apple Intelligence,将深度集成到 iOS 18、iPadOS 18 和 macOS Sequoia 中。苹果称,Apple Intelligence 的一条底层逻辑就是在设备端处理任务,所用到的模型也有很多全程仅在设备端运行。但在处理更加复杂、需求更多处理能力的请求时,将调用 Private Cloud Compute 拓展智能化能力。Private Cloud Compute 能帮助 Apple Intelligence 灵活配置和扩充计算资源,运用容量更大型的基于服务器的模型处理更复杂的请求。苹果还将 ChatGPT 整合至 iOS 18、iPadOS 18 和 macOS Sequoia,使用 GPT-4o 模型。用户无需创建账号便可免费使用,ChatGPT 订阅用户则可在绑定已有账号后直接使用付费功能。

大模型如 OpenAI 的 Chatgpt 彻底改变了 AI 与人类互动的方式,它能生成类似人类写作的流畅文本。尽管其能力令人影响深刻,但大模型也以其不准确性著称,它犯下的错误被称为 AI 幻觉。根据发表在《Ethics and Information Technology》上的一篇论文《ChatGPT is bullshit》,格拉斯哥大学 Michael Townsen Hicks 等人认为,这种不准确性应该被称为胡说八道。大模型是旨在生成类似人类文本的复杂程序,其实现方法是通过分析大量语料使用统计技术按顺序预测下一个特定单词的可能性。它们能对提示生成连贯且上下文恰当的响应。人类大脑有着丰富的目标和行为,大模型与之不同,它只有单一的目标,即生成与人类语言极为相似的文本。这也意味着它们的主要功能是复制人类语言和写作的模式和结构,不是理解或传递事实信息。AI 幻觉这一形容词暗示大模型有理解和传达真实的意图,但实际上它并没有。AI 不在乎正确性,只在乎内容是否能说服人或符合特定叙述。它们只是在胡说八道。如果生成的信息是正确的,那只是巧合罢了。

荷兰警方考虑在毒品实验室突搜中使用 AI 驱动的机器狗,以避免警员面临犯罪分子、危险化学品和爆炸的威胁。如果模拟场景的测试进展顺利,警方将在真实行动中使用。荷兰警方每周执行至少在 3-4 次毒品实验室突击搜查行动,从 2021 年开始使用波士顿动力的 Spot 用于搜查和监视。Spot 并不具有自动行驶能力,而是通过远程控制,技术的巨大进步促使荷兰警方探索 Spot 完全自主行动。

资金正在涌向生成式 AI 初创企业。该领域的“独角兽”(估值 10 亿美元以上的未上市公司)截至 4 月底达到 37 家,过去一年里翻了一番。截至 2023 年 4 月底,美国企业占据了 AI 独角兽的9成,但在最近 1 年内成为独角兽的 17 家企业中,有 10 家在美国以外设立主要基地。法国 Mistral AI 和加拿大 Cohere 就是代表性案例。在中国,最近 1 年内诞生了 5 家 AI 独角兽。李开复等人创立的中国零一万物在最近的融资中获得了 10 亿美元的企业估值。在过去一年成为独角兽的17家企业中,英伟达向 Cohere 等 7 家企业出资,Alphabet 向涉足视频生成的 Runway 等 4 家企业出资。来自中国的 5 家AI独角兽企业均获得阿里巴巴集团投资。

DuckDuckGo 推出了一项匿名 AI 聊天服务 AI Chat,允许用户匿名使用热门 AI 模型,包括 GPT-3.5、Claude 3 以及开源 Llama 3 和 Mixtral。用户不需要任何注册,可通过网站、DuckDuckGo 搜索引擎或在搜索框加入“!ai”或“!chat”快捷方式访问 AI Chat。DuckDuckGo 称,聊天是匿名的,元数据和 IP 地址被移除,防止追溯到个人。DuckDuckGo 称与 AI 模型提供商达成协议,确保在 30 天内完全删除所有保存的聊天记录,其聊天记录不会被用于训练或改进模型。

阿里巴巴发布了最新的 Qwen 2 模型。Qwen 2 包含了 5 个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。阿里巴巴称,在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据及训练方法的优化。

企业据称正考虑用 AI 取代员工,但 CEO 之类的高管职位呢?高管们的核心任务主要是分析新市场和识别市场趋势,而这两项任务 AI 也很擅长。他们花费大量时间与员工沟通,而 AI 能将这一任务自动化。他们有时需要做出困难的决定,然而没有什么人能比 AI 更能保持冷静了。高管的薪水都很高,取代他们能省下一大笔钱。事实上有些公司已经在做了。网龙网络在 2022 年 ChatGPT 尚未流行时任命了一名虚拟 AI 助手唐钰担任公司轮值 CEO,半年后该公司的股价表现超过了恒生指数。CEO 们对于自己被取代的可能性似乎是听天由命。EdX 平台去年就此调查了数百名 CEO 和其他高管。47% 的高管认为大多数或所有 CEO 的职责应完全自动化或由 AI 取代。甚至高管都认为高管是多余的。

根据下周递交到澳大利亚联邦议会的新法律提案,分享数字修改过的深度伪造色情图像将面临六年监禁,制作深度伪造色情图像则面临七年监禁。新法律将未经同意分享使用 AI 等技术制作的色情图像定义为刑事犯罪行为。一旦该法律通过,无论是公开还是私下分享未经同意的深度伪造色情图像都将是违法的。

AI 革命似乎方兴未艾,但有人认为它已处于衰落中,理由包括:改进速度放缓;应用范围比预期的要小;构建和运营成本过于昂贵。可用于训练大模型的数据也在减少,我们只有一个互联网,AI 公司很难找到新的训练数据来源。ChatGPT 之类的 AI 在早期进步迅速,但过去 14 个月进展甚微。科技行业在 2023 年从英伟达公司购买了 500 亿美元的芯片训练 AI,但只带来 30 亿美元的收入。这种投入产出比是难以长期维系的。生成式 AI 即使添加广告可能也是得不偿失,它每次搜索答案所需的费用可能比广告费用还高。无论是 Google 还是微软都面临这一问题。生成式 AI 作为一种商品被高估了。

大模型正变得越来越强大,但对计算和电力的需求也越来越大。大模型如果要变得廉价、快速而且环保,它们需要大幅缩小规模,以便于能在类似手机的设备上本地运行。研究人员正致力于寻找方法实现这一目标。类似所有神经网络,大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。有两种压缩网络的通用方法,其一是训练后量化(PTQ),其二是量化感知训练(QAT),研究人员更青睐前者。哈工大的车万翔称,PTQ 相对于 QAT 的优点是不需要收集训练数据,不需要重新训练,训练过程更稳定。QAT 的优点则是模型可能更精确,因为量化从一开始就内置在模型中。去年微软亚洲研究院的研究团队创造了第一个 1 位 PTQ 大模型 BBitNet 1.58b,每个参数占大约 1.5 比特内存,有 30 亿参数的 BitNet 在各种语言任务中的表现和相同参数规模的全精度 LLaMA 模型一样出色,但速度是 2.71 倍,用的 GPU 内存少 72%,GPU 能耗低 94%。

路透研究院和牛津大学的研究人员调查了阿根廷、丹麦、法国、日本、英国和美国六国的 12,000 人,发现普通大众并不常用 ChatGPT 等热门 AI 产品,18-24 岁的年轻人是例外。研究旨在衡量普通大众对过去两年火热无比的生成式 AI 的看法,结果显示:多数人预测生成式 AI 未来五年会对社会产生重大影响,新闻、媒体和科学领域受影响最大;多数人认为生成式 AI 将改善自己的生活;关于生成式 AI 对社会的影响多数人普遍悲观。虽然多数人都听说过生成式 AI,但有 20%-30% 的人对此一无所知;ChatGPT 是使用率最高的生成式 AI 产品,比 Google Gemini 和 Microsoft Copilot 高出 2-3 倍;18-24 岁人群中有 56% 至少用过 ChatGPT 一次,55 岁及以上人群中这一比例为 16%;大部分人将生成式 AI 用于获取信息、创建媒体如文本、图像、音频和视频,有 5% 的人将其用于获取最新信息。

法国 AI 创业公司 Mistra 发布了它的代码生成 AI 模型 Codestral。Codestral 使用了逾 80 种语言的数据集训练,其中包括了流行语言如 Python、Java、C、C++、JavaScript 和 Bash。Codestral 有 220 亿参数,上下文长度 32K,能完成代码函数、写测试和补完代码,用写英文回答代码库问题。Mistra 称 Codestral 是开放权重模型,代码可以在 Hugging Face 上下载,使用的是非商业许可证,许可证明确禁止在业务活动中使用,原因可能是使用了不同许可证授权的代码训练。

华盛顿大学团队开发出一种 AI 系统,让佩戴耳机的用户盯着说话的人三到五秒进行“锁定”。被称为“Target Speech Hearing”的系统随后会消除环境中的所有其它声音,只实时传送标记的说话者的声音,即使用户在嘈杂的地方走动且不再面对说话者。该系统可以在现有耳机上使用,概念验证代码发布在 GitHub 上,使用了非商业使用许可证,系统本身尚未发售。系统使用了机器学习软件学习选定的说话者的声音模式,然后锁定说话者的声音。

前 OpenAI 董事 Helen Toner 接受采访时表示,公司董事也是通过 Twitter 才知道 ChatGPT 的。她表示董事会没有提前收到通知。这一信息突出了董事会与公司日常运营之间的脱节。去年 11 月 17 日公司董事会突然解雇 CEO Sam Altman 时给出的一条理由是他在不沟通时不坦诚。Toner 称 Sam Altman 没有告知董事会他拥有 OpenAI 创业基金,他多次声称作为独董与公司没有经济利益。他还向董事会提供了不准确的安全流程信息。两位高管向董事会报告受到了他的“心理虐待”,他的领导风格被指在公司内部催生了“有毒气氛”。对于 Sam Altman 在被解雇五天之后再次重新控制公司,Toner 说员工们认为没有他公司会崩溃,而如果不支持他可能会遭到报复。

为改进 Windows 11 在 Arm 设备上的游戏性能,微软宣布了 AI 驱动的图像超分辨率技术 Auto SR。其工作方式类似现有的超分辨率技术如 DLSS 和 FSR。Auto SR 存在很多限制,目前只支持高通的 Snapdragon X SoC 和 Windows 11 v24H2 或更高版本,以及原生 ARM 游戏和特定的 DirectX11 和 DirectX12 游戏。10 位格式的 DX11 和 DX12 游戏以及 OpenGL、Vulkan 和 DirectX 9 或 8 游戏都不支持。Auto SR 和 HDR 不能同时启用,不支持 1080p 以下的显示分辨率,等等。

彭博社报道,苹果与 OpenAI 达成协议为 iOS 18 提供 AI 聊天功能。苹果将在下个月举行的 WWDC 开发者大会上公布相关消息。苹果不想将所有鸡蛋都放在一个篮子,它仍然在寻求与 Google 达成协议,将搜索巨人的 AI 模型 Gemini 作为 OpenAI 的替代,但预计到下个月的 WWDC 上不会公布相关消息。苹果还在开发自己的 AI 模型 Ajax,用于设备上的文本分析、智能回复和摘要。ChatGPT 等 OpenAI 技术预计将会用于分析长文本、图像生成等高要求任务。

AI 的火爆以及人才的短缺推动了 AI 软件工程师的薪水远高于非 AI 的同行。根据薪资数据网站 Levels.fyi 的数据,截至 2024 年 4 月,美国 AI 软件工程师的平均薪水接近 30 万美元,比非 AI 领域的软件工程师高出约 10 万美元。两者的薪水差距在 2022 年中就达到了 30%,如今进一步扩大到了 50%。数据科学家 Alina Kolesnikova 称,企业愿意为 AI 技能支付溢价薪水,无论你处于什么级别。在部分企业 AI 工程师和非 AI 工程师的薪水差异更为巨大,例如无人出租车公司 Cruise 支付给 AI 工程师的中位数薪水是 68 万美元,比非 AI 工程师高 18.55 万美元。

OpenAI 宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI 将能在 ChatGPT 中显示新闻集团旗下媒体的内容并用于回答用户的问题。同时新闻集团将分享新闻专业知识,以帮助确保 OpenAI 的产品达到最高的新闻标准。知情人士称,该交易为期五年,交易价值或超过 2.5 亿美元,包括现金形式以及使用 OpenAI 技术的信用额度。OpenAI 此前已与 Reddit、《金融时报》、美联社、《世界报》等多家媒体达成内容协议。