solidot新版网站常见问题,请点击这里查看。
美国政府花费了 25 万美元委托一家四人公司 Gladstone AI 撰写了一份研究报告《An Action Plan to Increase the Safety and Security of Advanced AI》。报告督促美国政府立即采取行动以避免 AI 带来的重大国家安全风险。报告认为在最糟糕的情况下 AI 构成了对人类的灭绝级威胁。报告的建议包括:国会应该对超过特定算力训练 AI 模型为非法,该算力阈值由新设立的 AI 机构设定。报告举例说,可以参考目前最先进的模型 OpenA GPT-4 和 Google Gemini 使用的算力。报告还建议政府应该禁止在开源许可证下公开大模型的权重,违反者将面临监禁。政府还应该进一步加强对 AI 芯片制造和出口管制。

Midjourne 无限期禁止竞争对手 Stability AI 公司的雇员使用其服务。在这之前,它监测到怀疑是 Stability AI 雇员试图批量抓取提示和图像的类僵尸网络活动。发生在 3 月 2 日的活动导致其服务宕机 24 小时。Midjourne 的调查将多个付费账号与一名试图抓取数据的 Stability AI 数据团队雇员联系起来。Stability AI CEO Emad Mostaque 回应了这一报道,表示发生的任何事情都绝非故意。他称他们的调查发现没有人在抓取图像,但一名团队成员运行了一个机器人程序,为个人项目收集提示。如果是这一行为导致了 Midjourne 宕机,他们对此表示道歉。Mostaque 称他的公司不需要 Midjourne 的数据,该公司最新的 Stable Diffusion 3 模型优于 Midjourne 等竞争对手的模型。

马斯克 (Elon Musk) 的 AI 创业公司 xAI 将于本周开源其 AI 聊天机器人 Grok。xAI 是 OpenAI 聊天机器人 ChatGPT 的竞争对手,于去年底发布,其特性包括能访问实时信息以及其观点不受“政治正确”规范的限制。Grok 是付费服务,X/Twitter 用户需要每月支付 16 美元才能访问该服务。马斯克正在起诉 OpenAI 及其首席执行官奥尔特曼(Sam Altman),理由包括该公司为了利润停止共享其 AI 技术。马斯克是 OpenAI 联合创始人之一,但几年前就完全退出了。OpenAI 回应诉讼称马斯克最初同意创建盈利性实体,同意逐渐放弃开源发布计划,他试图完全控制 OpenAI 但最终失败了。自马斯克收购 Twitter/X 平台以来,其日活用户减少了约十分之一。 

英伟达被控未经授权使用版权作品训练其 NeMo 模型。三位作家 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 表示,NeMo 使用了包含有约 196,640 本书的数据集进行训练,他们的作品就包含其中,去年 10 月因举报侵权移除。三位作者在集体诉讼中表示删除行为表明英伟达知道侵权的存在。他们寻求英伟达为过去三年使用美国作家的版权作品训练大模型支付金额未知的赔偿金。英伟达拒绝置评。这起诉讼标志着英伟达加入了越来越多有关 AI 公司侵犯作家版权训练生成式 AI 的案件中。

美国司法部指控一名中国籍前 Google 工程师从公司窃取了逾 500 份文件,其中包含该公司 AI 机密信息。38 岁的工程师丁林葳(Linwei Ding)周三在加州 Newark 被捕,被控四项盗窃商业机密罪名,每项罪名最高 10 年徒刑和 25 万美元罚款。检方称丁林葳在 Google 工作期间秘密受雇于两家中国公司融数联智和至算科技。丁是在 2019 年受雇于 Google,开发与机器学习和 AI 应用相关的软件。2022 年 5 月,丁开始将机密信息从 Google 网络上传到个人 Google Cloud 帐户。他试图隐藏其行为,首先将被盗文件拷贝到笔电中的 Apple Notes 应用,将其转换为 PDF 文件,然后将其上传到个人 Google Cloud 帐户。不到一个月后他收到了融数联智 CEO 的邮件,邀请他担任 CTO。他还前往中国帮助该公司筹集资金,一年后创办了自己的公司至算。2023 年 12 月 Google 监测到丁在中国期间试图将更多文件从公司网络上传到个人帐户。丁告诉公司调查人员,上传这些文件是作为他为 Google 工作的证据。在接受调查人员询问一周后,丁预订了一张飞往北京的单程机票,向 Google 递交了辞职信。Google 在获悉其在至算科技中的角色后暂停了他对公司网络的访问。FBI 之后展开了调查。

两年前 OpenAI 研究员 Yuri Burda 和 Harri Edwards 试图找到方法让大模型做基本算术。他们想知道需要多少两数相加的例子才能让大模型能完成任意两数相加的算术。一开始,他们进展不是很顺利。大模型能记住例子但无法解决新的加法。他们意外的让部分实验运行数天时间而不是预期的数小时。结果他们发现实验成功了,大模型能完成任意加法,只是所需的时间超出任何人的想象。他们和同事对这种现象展开了研究,发现在特定情况下大模型会突然从无法完成任务到能完成任务,他们称之为“领悟(grokking)”。领悟是让 AI 研究员摸不着头脑的多个现象之一。这突出了深度学习背后的一个引人注目的事实:没人知道它是如何工作,或为什么它能工作。现在最大的模型是如此复杂,以至于研究人员像研究奇特的自然现象那样研究它们,他们进行实验并试图解释结果。很多观察结果违背了经典统计学。

马斯克(Elon Musk)上周末在旧金山高等法院起诉 OpenAI 及其首席执行官奥尔特曼(Sam Altman)等人,称其为了利润而非“人类的利益”开发人工智能,并要求该公司共享技术。OpenAI 通过官方博客回应了马斯克的诉讼。OpenAI 强调,公司的使命是“确保通用人工智能(AGI)造福于全人类”,而在实现这个目标的过程中,公司意识到构建 AGI 需要的资源比最初的计划要多得多。因此埃隆和当时的公司高层意识到,为了获取这些资源,OpenAI 需要有一个盈利实体。OpenAI 还附上了马斯克的五封邮件文案,以证明马斯克同意 OpenAI 筹集更多的资金,并逐渐放弃旗下产品的开源发布计划。在确定 OpenAI 将建立一个盈利实体后,马斯克曾在 2017 年年末提出要获得该实体的多数股权和对初始董事会的控制权,并成为 CEO。而在这些讨论进行的过程中,马斯克暂停了对 OpenAI 的资金支持。OpenAI 依靠 Reid Hoffman 的帮助筹集资金。

日本的一项调查发现,三成日本大学生回答经常用 ChatGPT 等生成式 AI 工具,46.7% 的学生回答“曾经使用过”。对于 ChatGPT 等工具的用途,学生们表示最常用的是“论文与报告写作参考”,其次是“翻译和外语作文”,“咨询和聊天对象”。这次调查是在去年 10-11 月在网上进行的,来自 30 所大学的约 1 万名本科生做出了答复。

AI 创业公司 Anthropic 宣布了它的最新一代的模型 Claude 3,按性能从低到高分为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,其中 Sonnet 和 Opus 已可在 claude.ai 上使用,Haiku 则需要等待一些时间。Anthropic 称它最先进的模型 Claude 3 Opus 在基准测试中超过了 OpenAI 的 GPT 4 和 Google 的 Gemini Ultra,称在复杂任务上达到了接近人类的理解能力和流畅性,引领通用智能的前沿。Opus 专为需要高级推理的复杂任务设计;Sonnet 是中档模型,为企业提供更具有成本效益的日常数据分析和知识工作解决方案;Haiku 设计更快且更经济,适用于面向消费者的 AI 聊天机器人等应用。

印度政府改变了它对 AI 模型不干涉的立场,发出意见书要求科技公司发布新模型前先获得政府批准。它还要求科技公司确保其服务或产品“不允许任何偏见或歧视,或危及选举过程的完整性”。印度电子信息技术部是在上周五向企业发布了这一意见书的,虽然目前它不具有法律约束力,但副部长 Rajeev Chandrasekhar 表示这代表着监管的未来。他在周一表示该意见针对的是在印度互联网上部署未经测试的 AI 平台,不针对创业公司。印度创业公司和风险投资公司则表示对政府发布的监管意见感到震惊,认为会阻碍印度公司的竞争力,而印度已经在全球竞争中落后了。

马斯克(Elon Musk)在旧金山高等法院起诉 OpenAI 及其首席执行官奥尔特曼(Sam Altman)等人,称其为了利润而非“人类的利益”开发人工智能,并要求该公司共享技术。诉讼文件称,奥尔特曼和 OpenAI 联合创始人格雷格·布罗克曼 2015 年与马斯克接洽,并同意成立一个非营利实验室,为“人类的利益”开发通用人工智能。实验室将开放其技术,这意味着共享其底层软件代码。起诉书称,这家公司创建了一个营利性业务部门,并限制他人对其技术的使用。在新董事会的领导下,该公司正在开发和完善通用人工智能,以最大限度地提高微软的利润,其出发点不是“人类的利益”。OpenAI 已转变为微软事实上的一个闭源子公司。马斯克指控 OpenAI 和奥尔特曼违反合同以及信托义务,并存在不公平的商业行为。布罗克曼也被列为被告。马斯克要求 OpenAI 开放其技术,并要求奥尔特曼等人偿还他提供的资金。

欧盟正在调查微软对法国 AI 创业公司 Mistral 的 1500 万欧元投资。Mistral 由 Google DeepMind 和 Meta 研究员于 2023 年创立,已从 Andreessen Horowitz 和 Lightspeed 等风投筹集到逾 3.85 亿欧元,其估值约为 18 亿欧元。本周一,Mistral 宣布了其最新的大模型 Mistral Large,宣布与微软合作,通过微软的云服务 Azure 提供其大模型的访问。这笔交易引起了欧盟监管机构的注意。它担心 AI 与科技巨头之间的合作会巩固其权力遏制创新,使科技监管和小公司的竞争变得更困难。

Tumblr 和 WordPress.com 母公司 Automattic 正与 OpenAI 和 Midjourney 磋商出售用户帖子训练 AI 模型。 Automattic 计划发布一个设置,允许用户退出与第三方的数据共享。它已经抓取了 Tumblr 上 2014-2023 年发布的所有公开帖子,其中错误包含了部分非公开帖子,目前还不清楚它如何处理这些数据,哪些数据会发送给 OpenAI 和 Midjourney 训练模型。在这之前,Reddit 与 Google 签订了每年 6000 万美元的协议,使用其平台上的用户数据训练 Google 的 AI 模型;Shutterstock 则与 OpenAI 签署了协议用其照片库训练模型。

微软与法国 AI 创业公司 Mistral 达成协议,收购后者的少数股权。Mistral 宣布了其最先进的大模型 Mistral Large 首次通过微软的云服务 Azure 提供。Mistral 的大模型是开源的,相比下 OpenAI 是闭源的,数据和代码都不向外公开。Mistral 的大模型是目前最先进的开源大模型,测试显示 Mistral Large 仅次于 OpenAI 的 GPT-4。它去年 12 月融资时的估值为 20 亿欧元。

AI 创业公司 Stability AI 宣布其最新一代的文本图像模型 Stable Diffusion 3 开放预览。感兴趣的用户可以申请加入等候名单。Stability AI 称开放预览是为了在正式发布前收集与性能和安全性相关的用户反馈。Stable Diffusion 3 模型的参数规模从 8 亿 到 80 亿不等,其架构组合了 diffusion transformer 和 flow matching,技术报告将在晚些时候公布。

在引发争议之后 Google 周四暂停了 Gemini 的图像生成功能。在这之前用户在社交媒体抱怨,Google 的 AI 工具将历史人物如华盛顿生成为有色人种。Google 表示它将很快发布一个改进版本。Gemini 产品高级总监 Jack Krawczyk 称,历史背景对 AI 聊天机器人而言有更多细微玄妙之处,他们将对其展开进一步的调整。

李开复的 AI 初创公司 01.AI 去年 11 月跃居开源人工智能系统能力排行榜的榜首。它的部分技术是基于 Meta 公司开源的大模型 LLaMA。李开复对此在邮件中表示,他的初创公司的人工智能模型是建立在 LLaMA 上的,就像“其他大多数 AI 公司一样”,并补充说,使用开源技术是一种标准做法。他说,他的公司使用自己的数据和算法,从零开始训练人工智能模型。这些都是 01.AI“表现出色”的“主要决定因素”。Meta 发言人表示,公开分享该公司的 AI 模型有助于传播其价值观和标准,进而有助于确保美国的领导地位。一位投资公司的合伙人称,中国公司从零开始建立的 AI 模型“不是很好”,所以许多中国公司经常使用“西方模型的微调版”。

OpenAI 的名字中有 Open,但它的大模型不开放也不开源,如今开源大模型主要来自于巨头如 Meta 和 Google。Google 宣布了它最新的开放大模型 Gemma。Gemma 由 Google DeepMind 等团队开发,是轻量级的大模型,有两个版本:Gemma 2B 和 Gemma 7B。Google 称这两个版本在各自的参数规模上展现了最佳的性能,甚至超过规模更大的模型。在基准测试中,Gemma 7B 的得分与目前最优秀的开源大模型 Mistral 7B 差不多或更好。

苹果准备推出类似 GitHub Copilot 的辅助编程工具,使用生成式 AI 帮助补充完成代码。该工具将作为下一个 Xcode 大版本的一部分推出,苹果已在该项目上工作了一年时间,预计最快今年推出,苹果最快在 6 月举行开发者大会 WWDC 上宣布这一新工具。微软的 GitHub Copilot 是在 2021 年推出的,能根据自然语言查询生成代码。

易于使用的模型管理应用 Ollama 发布了 Windows 预览版,Windows 用户可以在本地创建和运行大模型。目前该版本只支持英伟达的 GPU,需要 CPU 支持 AVX 和 AVX2 等指令集。开发者表示对 AMD GPU 的支持还在开发之中,如果用户有能力可以直接从源码去构建支持 AMD GPU 的版本。