solidot新版网站常见问题,请点击这里查看。
美国 50 个州和 4 个领地的总检察长周三致函国会,呼吁对 AI 生成的儿童色情图像采取行动。Stable Diffusion 之类的开源文本图像模型让 AI 生成色情图像比以往任何时候都容易。由于开源模型是可公开访问的,可以在本地运行,因此没有任何方法能阻止一个人生成儿童色情图像。闭源的商业模型如 Midjourney、DALL-E 和 Adobe Firefly 都内置了过滤器禁止生成色情图像。总检察长们呼吁,扩大现有的针对儿童色情材料(child sexual abuse material 或 CSAM)的法律,涵盖 AI 生成的材料。虽然 AI 生成的儿童色情图像是假的,但总检察长们认为这仍然会对儿童及其家人带来风险。

对 213 名美国计算机科学教授的调查显示,AI 专家们倾向于设立一个 联邦 AI 部门或全球性组织去监管 AI,而不是将其交给国会、白宫或私营部门。专家们对 AI 何时或是否会脱离人类控制存在分歧,但多认为应对其进行监管。只有六分之一的人认为 AI 不应该或者不能受监管,只有少数人相信私营部门能自我监管。五分之一的人预测 AI 能一直被人类控制。其余一半人认为 AI “可能”或“肯定”会脱离人类的控制,另一半人则认为“可能不会”。被调查者认为在处理 AI 问题上总统拜登比 Sundar Pichai、Elon Musk、Sam Altman、Mark Zuckerberg 和 Donald Trump 更值得信任。

Meta Platforms 的大模型 Llama 和 Llama 2 作为 OpenAI 和 Anthropic 私有模型的开源替代而备受好评,但对大部分参与该项目的科学家和工程师来说,称赞来得太迟了。知情人士透露,参与 Llama 项目的研究人员很多已经离职了,原因是与公司另一个研究团队在计算资源上的内斗。另一个相竞争的模型已被 Meta 放弃。生成式 AI 需要大量的计算资源,需要专用芯片,而芯片是不会免费提高的。科技巨头通常比其它公司拥有更多的计算资源。但即便如此,它们的计算资源也是有限制的。人才外流凸显了大型科技公司在留住 AI 研究人员上面临的挑战。知情人士称,2 月发表的 Llama 论文的 14 名作者中,一半以上已经离开公司,其中几位加入了 AI 创业公司或其它大公司。

Gizmodo 母公司 G/O Media 上周解雇了其西班牙语网站 Gizmodo en Espanol 的员工,内容从部分原创和部分翻译转到用 AI 翻译英文版文章。Gizmodo en Espanol 于 2012 年推出,它有一支小而精干的团队,其工作主要是为西班牙语读者撰写原创文章,以及翻译 Gizmodo 上的英文文章。如今该网站的新文章都是机器翻译,附有原始文章链接以及免责声明,表示机器翻译的文章可能与原文存在略微差异,用户可以点击浏览原文。目前 G/O Media 的 AI 翻译系统还存在诸多问题,比如有的文章只翻译了一半,其余又变成了英文。专家表示,AI 翻译目前还无法完全取代人工翻译,会存在很多影响内容质量的错误。

百度 CEO 李彦宏周二表示,中国至今已发布逾 70 个 10 亿以上参数的大语言模型。在获得监管机构批准之后,中国多家企业最近向公众开放访问其生成式 AI 机器人,其中包括了百度的文心一言(Ernie)。李彦宏称,文心一言最新版本 Ernie 3.5 是之前版本的两倍,效率提升了五成。他还透露百度将在近期推出新版本。

AI 的先驱们正在为这项技术的哪种危险最可怕而争论不休。末日论者担心,被训练来寻求奖励的 AI 系统最终可能会有隐藏的追求权力的冲动,在执行我们的愿望时无意中伤害人类,或者干脆超越人类,掌握我们的命运。AI 伦理与公平领域的专家们担心的是这些工具如何无意或有意地剥削工人、加深数以百万计人的不平等。他们希望科技公司和监管机构执行培训标准和技术,以减少这种威胁。一些伦理学研究者表示,他们并不完全否定有关人类生死存亡的风险,只是认为应该把这作为有更明确定义的现有问题的一部分来解决。一些末日论者认为,通向灾难的道路很可能来自伦理学界所强调的问题,比如大量炮制的虚假信息导致政府被推翻或引发战争的后果。双方都希望能够揭开 AI 思考方式的黑箱,即所谓的可解释性问题。

OpenAI 的 ChatGPT 使用了海量数据训练,其中包括许多作家的作品。有多位作家提起了集体诉讼,指控 OpenAI 侵犯版权、违反 DMCA、不公平竞争、不当得利、ChatGPT 的每条回复都是衍生作品等等。OpenAI 逐一驳斥了这些主张。OpenAI 认为,作家们误解了版权保护的范围,没有考虑限制和合理使用等例外,版权的限制和例外为大模型等创新留出了空间。创新者以变革的方式使用版权材料并没有侵犯版权。版权法的目的是促进科学和实用艺术的进步,而不是作者所表达想法本身。OpenAI 还以 Google Books 诉讼为例,指出图书中的词频、句法模式和主题标记等统计信息超出了版权保护的范围。

Nala Ginrut 写道:AIGC 被认为是未来的基础物料,就如同水电一样存在普遍需求。可是高昂的算力成本已然成为 AIGC 进一步推进的阻碍。SymeCloud 在探索低成本 AI 方案的方向上更进了一步,最近他们发布了一个超廉价的 Chatbot 云方案,仅需 4.99 美元/月,是目前世界上最便宜的付费方案。该方案在 HackerNews 上引起了热议。

Google 宣布了其自己设计自己使用的新一代 AI 芯片 TPU v5e,它的 TPU 芯片只通过 Cloud TPU 云服务提供给客户。Google 是在 2016 年推出了第一代 TPU(tensor processing unit),2021 年发布 TPU v4。相比上一代 TPU v4,TPU v5e 每一美元的训练性能提高 2 倍,每一美元的推理性能提高 2.5 倍,而成本不到 TPU v4 的一半,使得更多组织能够训练和部署更大更复杂的 AI 模型。TPU v5e 最多允许 256 个芯片互连,总带宽超过 400 Tb/s,支持八种不同的虚拟机配置。根据速度基准测试,在 TPU v5e 上训练和运行 AI 模型时速度提高了 5 倍。

美国限制英伟达向中东地区出口的其旗舰 AI 芯片 H100 和 A100 GPU,原因是为了防止这些芯片转售到中国。美国已经限制英伟达向中国出售 H100 和 A100 GPU,英伟达为此专门开发了降低性能的型号 H800 和 A800。中东的阿联酋和沙特都是英伟达的大客户,而这两个国家同时也与中国关系密切,其中沙特还与中国在 AI 项目上展开合作。美国担心英伟达的 H100 和 A100 GPU 可能会从中东国家转手到中国,或者中国会在中东国家训练 AI 模型然后将技术带回本国。

一家与阿布扎比统治家族有关联的 AI 集团 G42 推出了据称是世界上质量最高的阿拉伯语 AI 软件。阿联酋和沙特此前大规模购买了英伟达的 GPU,正竞相在海湾地区率先应用生成式 AI。名为 Jais 的大模型(LLM)是一种基于海量阿拉伯语和英语数据的开源双语模型,面向全球逾 4 亿讲阿拉伯语的人。它有 130 亿个参数,使用了 1160 亿阿拉伯语 tokens 和 2790 亿英语 tokens 训练。今天最流行的大模型如 OpenAI ChatGPT 使用的 GPT-4、Gogogle Bard 使用的 PaLM,以及 Meta 的开源模型 LLaMA,都具有理解和生成阿拉伯语文本的能力。但 G42 的 AI 负责人 Andrew Jackson 表示现有模型中的阿拉伯元素“被稀释了”。在阿拉伯语的准确性上,Jais 的表现胜过了 LLaMA 等模型。

多个国产大模型向用户开放使用。使用这些模型都需要实名注册。
商汤科技宣布其“商量SenseChat”即日起全面向用户开放服务。其基模型为商汤联合多家国内顶级科研机构发布的书生·浦语 InternLM-123B,拥有 1230 亿参数。
北京智谱华章科技宣布其智谱AI智能助手“智谱清言”全面开放。智谱清言已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力,未来还将开放多模态等生成能力。用户可通过苹果商店 App Store、安卓主流商店(包括华为、OPPO、vivo 及小米等)进行下载,或在微信小程序中搜索“智谱清言”体验其功能。
百度宣布旗下“文心一言”向全社会全面开放,用户可在应用商店下载“文心一言APP”或登录“文心一言官网”体验。百度还将开放一批经过全新重构的AI原生应用,让用户体验生成式AI的理解、生成、逻辑、记忆四大核心能力。

Google DeepMind 发布了标记图像是否是 AI 生成的水印工具 SynthID,目前它只支持 Google 自家的 AI 图像生成服务 Imagen。用户在使用 Imagen 生成图像时可选择是否添加水印,帮助其他用户识别 AI 生成图像或者帮助保护版权。传统的水印是在图像上覆盖一层可见的信息或者在图像元数据中添加信息。但这种水印方法太容易被编辑掉。SynthID 使用了两个神经网络,其一从原始图像生成一幅几乎相同但有部分像素略作修改的图像。它创造了一种人眼不可见的模式。第二个神经网络能识别该模式,告诉用户是否检测到水印。这种水印无法通过编辑或者截图等方法编辑掉。

OpenAI 宣布推出企业版 ChatGPT(ChatGPT Enterprise),与最大投资者微软的 Bing Chat Enterprise 展开直接竞争。企业版 ChatGPT 基于 GPT-4 模型,速度提升两倍,没有任何使用限制,支持 32k 上下文, 允许处理四倍长的输入或文件。企业版 ChatGPT 还提供了 Code Interpreter 等先进数据分析功能。OpenAI 表示不会用企业客户的数据训练模型或改进服务。

AI 技术是十分耗电的。IBM 研究院的研究人员在《自然》期刊上发表论文,报告了他们的模拟 AI 芯片原型,能以十四分之一的功耗处理自然语言 AI 任务。为 AI 推理设计的模拟芯片使用相变存储器 (PCM),PCM 不是记录数字系统中的 0 或 1,而是非晶态和晶态之间的连续值。该值被称为突触权重(synaptic weight),可存储在每个 PCM 装置的物理层原子配置中。存储器是非易失性的,关闭电源权重仍会保留。PCM 可将神经网络的权重直接编码到物理芯片上。IBM 的原型芯片能编码 3500 万个 PCM 装置,能支持最多 1700 万参数的模型。

加州圣迭戈的研究人员报告,GPT-4 生成的代码 62% 包含 API 误用。大模型展现出了非凡的自然语言理解和代码生成能力。如今软件工程师在遇到编程问题时不是去问 StackOverflow 而是去问大模型如 GPT-4。但大模型生成的代码未必安全,在软件开发环境中实际使用其生成的代码可能会带来严重的安全隐患。其中 API 误用可能会导致资源泄露和程序崩溃等种种问题。而使用大模型生成代码的用户最有可能是新人,不熟悉 API,难以分辨其中的 API 误用。研究人员从 StackOverflow 收集了 1208 个与 Java API 相关的编程问题,评估了流行的大模型,发现即使是 GPT-4,其生成的代码中有 62% 包含 API 误用。

纽约时报(NYT)、CNN、路透社、澳大利亚广播公司(ABC)、芝加哥论坛报、以及 Australian Community Media 旗下的坎培拉时报和纽卡斯尔先驱报等媒体都屏蔽了 OpenAI 的网络爬虫 GPTBot 抓取其网站上的内容。大语言模型需要海量数据进行训练,但数据的版权问题引发了很多争议。这些媒体公司都是本月内在 robots.txt 文件中禁止了 GPTBot 的访问。部分媒体还屏蔽了另一个被用于 AI 项目的爬虫程序 CCBot。CNN 证实它屏蔽了 GPTBot,但没有评论是否就其内容被 AI 系统使用采取进一步的行动。

阿里巴巴周五开源了能理解图像和完成更复杂对话的 AI 模型 Qwen-VL 和 Qwen-VL-Chat。阿里巴巴称,Qwen-VL 基于 Qwen-7B,可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,它使用了约 1.5B 的图文数据训练。在四大类多模态任务的标准英文测评中上,Qwen-VL 均取得同等通用模型大小下最好效果;支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;支持多图输入和比较,指定图片问答,多图文学创作等;相比于目前其它开源 LVLM使用的 224 分辨率,Qwen-VL 是首个开源的 448 分辨率的 LVLM 模型。更高分辨率可以提升细粒度的文字识别、文档问答和检测框标注。Qwen-VL 和 Qwen-VL-Chat 使用名为 Tongyi Qianwen LICENSE AGREEMENT 的许可证,有限制条件,如果商业使用,则需要从阿里巴巴获得授权。

Meta 发布了它的代码生成 AI 模型 Code Llama。类似 GitHub Copilot 和 Amazon CodeWhisperer,以及 StarCoder、StableCode 和 PolyCoder 等开源 AI 代码生成模型,Code Llama 支持为 Pytho、C++、Java、 PHP、Typescript (Javascript)、C# 和 Bash 等编程语言补完代码和调试。Code Llama 是 Llama 2 的编程专用版本,有 7B、13B 和 34B 参数三个版本,使用 500B tokens 的代码和代码相关数据进行训练。其中 7B 参数的版本可以单张 GPU 上运行,7B 和 13B 参数版本更适合实时代码补完之类的任务,而 34B 参数版本更适合作为编程助手使用。Code Llama 采用和 Llama 2 相同的许可证,可作为研究和商业使用。

一家机器人创业公司的 CTO 今年初表示,他们起初以为要费很大劲才能构建机器人用的 ChatGPT,结果发现很多情况下 ChatGPT 可以直接给机器人用。在 ChatGPT 等大语言模型流行起来前,AI 模型是一种专用工具。在机器人等特定领域使用 AI 模型,需要投入大量时间和金钱创建一个专用的 AI 模型,而且 AI 模型只能在该领域使用。举例来说,Google 的 AlphaFold 是一个预测蛋白质折叠的 AI 模型,用蛋白质结构数据进行训练,也只能与蛋白质结构一起工作。因此这位 CTO 根据以往经验认为,要让机器人受益于生成式 AI,他们需要为机器人创建专门的生成式 AI 模型。结果他的团队发现,在很多情况下,可以用现成的 ChatGPT 去控制机器人,甚至不需要专门训练。从医疗保险到半导体设计,很多领域的技术专家都得出了类似的结论。ChatGPT 如何将生成式 AI 变成万能工具的?