solidot新版网站常见问题,请点击这里查看。
一项全球调查显示,高管们对 AI 仍然十分热衷,但办公室员工对其热情在逐渐降温,全世界对 AI 的热情下降了 6 个百分点。2023 年 9 月到 2024 年 3 月,全球 AI 普及率从 20% 增长到 32%,但过去三个月普及率开始停滞,法国仅增长了两个百分点,从 31% 增加到 33%;美国仅增长了一个百分点,从 32% 增加到 33%。AI 热呈现明显的上热下冷:99% 的高管表示将投资 AI,97% 的高管表示迫切需要将 AI 整合到业务中;48% 的办公室员工不愿意向经理承认使用 AI 完成常见的工作,他们担心这会被视为作弊或能力不足或懒惰;员工希望 AI 能让他们专注于更有意义的事情,但怀疑 AI 会导致他们更忙碌,工作量增加;61% 的办公室员工总共花了不到 5 个小时学习如何使用 AI。

OpenAI 在 9 月完成了内部代号 Orion 的新大模型的初步训练,该公司希望新模型能大幅超越旧版本。但内部人士透露训练结果并未达到预期,性能与现有模型相差不大。OpenAI 不是唯一一家遭遇瓶颈的公司。Google 的 Gemini 模型新版本也未达到预期。Anthropic 推迟了其大模型 Claude 3.5 Opus 的发布。三家业内最领先的 AI 公司面临着重重挑战,它们越来越难以找到新的高质量、人造数据源。知情人士表示,Orion 编程性能不佳的一个重要原因缺乏足够的编程数据进行训练。这些问题对科技行业的 AI 信念发出了挑战。科技公司相信更多的算力和数据,以及更大的模型将为 AI 能力的巨大飞跃铺平道路。AI 初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 认为,AI 泡沫在逐渐破灭,可能需要不同的训练方法才能让 AI 模型在不同任务上良好工作。

基于大模型的 AI 系统如 GPT-4 和 Gemini 1.5 Pro 能以九成以上的正确率完成传统数学测试问题。但如果设计出一种全新的、大模型不可能训练过的数学难题呢?包括菲尔兹奖得主陶哲轩和 Timothy Gowers 在内的 60 多名数学家合作编写了数百道原创研究级数学难题,推出了新的高等数学基准测试 FrontierMath。这些问题非常具有挑战性,陶哲轩称需要相关领域研究生级别的专业人士合作才能完成。问题被设计为防猜测,如果没有正确的数学推理能力,它们是不可能解出的。顶级的 AI 系统只能完成不到 2% 的 FrontierMath 问题,显示它们的推理能力有局限性。

Red Hat 收购了专注于优化 AI 模型以运行在商用 CPU 和 GPU 的创业公司 Neural Magic。交易条款未披露。Neural Magic 由 MIT 研究科学家 Alex Matveev 和教授 Nir ​​Shavit 创办于 2018 年,其软件能让在 CPU 和 GPU 运行 AI 模型的性能与专用处理器如 TPU 相当。该公司此前从 Andreessen Horowitz 等风险投资人手中筹集到了 5000 万美元。其产品包括了 DeepSparse 和 nm-vllm 等。Red Hat 表示会开源 Neural Magic 的专有技术,具体计划要等未来几个月确定。Neural Magic 已经更新了网站,宣布 AI 的未来是开源。

自 ChatGPT 风靡全球的后,从中受益的科技公司相信大模型越大越好。但在遭遇训练瓶颈和困难之后,OpenAI 联合创始人、Safe Superintelligence (SSI,安全超级智能)联合创始人伊利亚·苏茨克维(Ilya Sutskever)表示,扩大预训练的结果已经达到了平台期。“2010 年代是规模扩大的时代,现在人们又回到了奇迹和发现的时代。每个人都在寻找下一个东西。”现在对正确的事情“扩大规模”比以往任何时候都更重要。他拒绝透露其团队在解决这个问题时的更多细节,只表示 SSI 正在研究一种扩大预训练规模的替代方法。大模型吞噬了海量数据,耗尽了世界上所有容易获取的数据,模型训练需要大量芯片,成本高昂,电力短缺也阻碍了模型训练。这可能会改变人工智能硬件的竞争格局。

披头士乐队的《Now And Then》成为首个获格莱美奖提名的 AI 辅助创作的歌曲,它赢得了最佳唱片和最佳摇滚表演奖提名。《Now And Then》是乐队解散逾五十年后,四名披头士成员约翰·列侬、保罗·麦卡特尼、乔治·哈里森和林戈·斯塔尔合作的最后一首歌。约翰在 1980 年被枪杀,乔治在 2001 年因肺癌去世,因此这首歌是在数字技术的帮助下完成的。披头士乐队是 20 世纪最有影响力也是唱片销量最高的乐队。《Now And Then》由彼得·杰克逊(Peter Jackson)的团队制作,此前他们制作了披头士的音乐纪录片。《Now And Then》最初是以练习磁带的形式录制在约翰的家中。杰克逊的团队开发出一种机器学习技术,能从模拟录音中分离出单个人或乐器的声音。保罗和林戈分别录制了他们的新版本,团队雇佣了一位弦乐编曲家和一位吉他手分别编排弦乐部分和吉他部分,最后完成了这首歌。

虽然大模型输出的结果令人印象深刻,但 MIT 的一项研究发现它并不能连贯的理解世界。举例来说,一种流行的生成式 AI 模型能正确提供纽约市的逐向导航路线,但不能正确形成纽约市内地图。模型虽然能正确导航,但当研究人员关闭部分街道以及增加绕行线路,其导航能力会显著下降。研究人员进一步发现,大模型还会隐式的在网格之间生成不存在的街道,弯曲和连接遥远的交叉口。

微软官方博客宣布,它向 Windows 11 预览版用户(Windows Insiders)推送了新版本的画图和记事本,为两款经典程序加入了流行的生成式 AI 功能。Paint (version 11.2410.28.0)加入了生成式填充(暂时仅限于 Copilot+ PC)和生成式擦除(所有用户);Image Creator in Paint 预览版提供给更多国家和地区(中国大陆不包括);Notepad (version 11.2410.15.0)支持在生成式 AI 帮助下重写内容,选择文本然后右键菜单里选择重写或者使用快捷键 Ctrl + I,该功能目前只提供给美国、法国、英国、加拿大、意大利和德国地区用户。

亚马逊流媒体服务 Prime Video 推出了工具 X-Ray Recaps,使用生成式 AI 为观众概述正在观看的剧集内容。X-Ray Recaps 能创建整季节目、单集,甚至剧集片段的内容概述。该工具通过分析视频片段,结合字幕或对话,生成关键事件、地点、时间和对话的详细描述。为避免剧透和保持简洁,亚马逊还应用了“护栏”。X-Ray Recaps 目前处于 beta 测试阶段,首先支持 Fire TV 设备,年底前支持其它设备。

Google/Alphabet CEO Sundar Pichai 在三季度财报电话会议上宣布,该公司逾四分之一新代码是由 AI 生成的。他表示使用 AI 提高了编程的生产力和效率,他强调 Google 的员工会对 AI 生成的代码进行审查。Google 内部可能使用了类似 Github Copilot 的辅助编程工具。在 2024 年三季度,Alphabet 报告收入为 883 亿美元,包括搜索在内的 Google 服务收入 765 亿美元,同比增长 13%;Google Cloud 收入为 114 亿美元,同比增长 35%。Google 服务的经营收入达到 309 亿美元,高于去年的 239 亿美元,Google Cloud 达到 19.5 亿美元,远高于去年的 2.7 亿美元。YouTube 的广告和订阅总收入过去四个季度首次超过 500 亿美元。

GitHub Copilot 此前只使用 OpenAI 的 GPT 模型,未来几周它将加入 Anthropic 的 Claude 3.5 Sonnet 和 Google 的 Gemini 1.5 Pro 模型。首先加入的是 Claude 3.5,之后是 Gemini。它原先使用的 OpenAI 的 GPT 模型也将引入推理性能更强大的 GPT o1-preview 和 o1-mini。不同模型在特定任务可能有更好的表现,GitHub CEO Thomas Dohmke 表示没有一种大模型能统治所有使用情景。用户可以通过 Copilot Chat 的 Web 和 VS Code 界面选择使用不同的大模型。

Meta 正在开发一个 AI 的搜索引擎,减少对 Google 和微软的依赖。新搜索引擎将在 Meta AI 聊天机器人中提供 AI 生成的时事搜索摘要。目前 Meta AI 聊天机器人使用 Google 和微软 Bing 提供时事搜索摘要。过去几个月 Meta 的爬虫一直在抓取信息为其 AI 聊天机器人构建信息数据库。上周 Meta 宣布与路透社达成了一项多年协议,允许其 AI 聊天机器人使用路透社的新闻进行回答。

印度是俄罗斯获取英伟达 AI 芯片的关键中间商,而马来西亚则是这些芯片的来源地。印度公司 Shreya Life Sciences 在 2024 年 4-8 月间向俄罗斯出口了 1111 台配备英伟达 AI 芯片的 Dell PowerEdge XE9680 服务器。这批服务器价值约 3 亿美元。因潜在军用用途,西方禁止向俄罗斯出口此类商品。但印度正成为此类未禁商品的重要中间商。在印度与俄罗斯做生意并不违法,因为印度政府没有参与对俄罗斯的制裁。Shreya Life Sciences 自 1995 年成立以来就与俄罗斯有关联,它最初专注于医疗药品供应,现在还出口工艺设备。数据显示,该公司向未受美国制裁的俄罗斯公司 Main Chain 出口了戴尔服务器,这些服务器进口自马来西亚。Main Chain 还向另一家印度公司购买了价值 4.34 亿美元的高科技产品。

Linus Torvalds 接受采访谈论了最近两年火热无比的 AI,认为九成是营销一成才是现实。他认可 AI 的潜力,但不认同它现在会改变世界,他讨厌围绕 AI 的炒作,因此他目前对 AI 的立场是基本无视它。他认为也许五年后情况会发生改变,我们会看到 AI 在实际工作中的日常应用。

Google 正在开发名为“Project Jarvis”——名字来自于漫威电影《钢铁侠》——的 AI 项目。它将运行在 Chrome 浏览器上,是一个面向消费者而不是企业的项目,能执行浏览器上的日常任务。和 Anthropic 和微软的AI 项目类似,它的工作原理也是快速截取屏幕内容,对其进行解读,然后执行单击按钮或在文本框输入文字等任务。Google 计划最早在 12 月推出预览,以及 Gemini 大模型的下一个版本。

1984 年 10 月 26 日卡梅隆(James Cameron)执导的《终结者》在北美上映,40 年后这部电影对 AI 的刻画仍然塑造着我们对 AI 的看法。《终结者》讲述了超级 AI 天网通过核武器试图消灭人类,而人类抵抗军在领袖约翰·康纳的领导下成功反击,于是天网派遣了 T-800 终结者回到 1984 年去杀死约翰未来的母亲莎拉·康纳。今天随着 ChatGPT 的流行,人类对 AI 的热情从未如此强烈。但很多人认为,《终结者》对 AI 危及人类生存的刻画分散了 AI 所带来巨大好处的关注。美国已经表示,AI 永远不会用于在部署核武器上做出决策。但将 AI 与自主武器系统结合起来是完全可能的。自主选择和攻击目标的武器系统已经存在,并不一定需要 AI。英国知名计算机科学家 Stuart Russel 主张禁止所有致命的完全自主武器,包括使用 AI 的武器。他认为风险不在于类似天网的失控,而是自主武器是否能正确执行人类的指令。

AI 有多火爆,最大 AI 芯片供应商英伟达的市值是最明显的体现。英伟达周五短暂取代苹果成为全球市值最高的企业。英伟达的市值一度达到 3.53 万亿美元,略高于苹果的 3.52 万亿美元。这不是英伟达第一次成为全球市值最高的企业。它在今年 6 月也一度称雄全球市值,但之后被微软和苹果超越,三家公司的市值过去几个月处于不相上下的胶着状态。周五收盘时英伟达的市值未能维持其峰值,跌至 3.47万亿美元,苹果仍然是第一的 3.52 万亿美元.

根据最近的盖洛普民意调查,美国多达八成的人认为在最重要价值观上存在严重分歧。公众两极分化的问题包括了移民、医疗保健、身份政治、跨性别权利,是否应该支持乌克兰等。欧盟和英国也存在类似的政治极化。为逆转这一趋势,Google DeepMind 构建了一个帮助解决分歧的 AI 系统。它以德国哲学家 Jürgen Habermas 的名字命名为 Habermas Machine,这位哲学家认为当理性人以平等的、相互尊重的和完美沟通的方式进行讨论时总能在公共领域达成一致。他的哲学基础思想是人们之所以无法达成一致的原因在于基本程序而不是讨论的问题本身。没有不可调和的问题——只是我们用于讨论的机制存在缺陷。他认为,如果我们能创建一个理想的沟通系统,我们就能解决所有问题。

Google 开源其 AI 水印系统 SynthID,源代码采用 Apache License 2.0 托管在 Github 上。Google 是在今年 5 月宣布了 SynthID,为 AI 生成内容嵌入人眼无法识别但能被算法识别的水印。Google 称,生成式人工智能 (GenAI) 可以以前所未有的规模生成更多种类的高度多样化内容。虽然大多数此类用途都是出于合法目的,但我们担心这可能会导致虚假信息和归因错误问题。水印旨在减轻这些潜在影响。SynthID 是 Google DeepMind 的一项技术,可直接将数字水印嵌入到 AI 生成的图片、音频、文本或视频中,从而为 AI 生成的内容添加水印并识别这些内容。SynthID 文本已开源,让开发者可以为文本生成添加水印。

Anthropic 发布了一个 AI 工具,可用于控制用户的鼠标光标去执行基本任务。该工具被直截了当的命名为 Computer Use,通过 API 与 3.5 Sonnet 大模型一起使用,能像人类一样——查看屏幕、移动光标、单击按钮和键入文本——去完成计算机上的任务。Computer Use 是通过快速连续截屏去执行操作,它要求用户授权其软件必要的访问权限,查看屏幕截图,计算移动光标到正确位置所需的垂直或水平像素数,它无法执行拖放之类常见鼠标操作。Anthropic 表示该工具有很多限制,容易出错,比如没有完成编程任务就去浏览黄石公园的照片。