文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
以色列国防军(IDF)开始使用 AI 系统选择空袭目标和组织战时后勤工作,以应对与伊朗等国的紧张局势。据彭博社报道,目前以色列军方主要使用两个人工智能系统参与军事作战。一个是用于处理大量数据并选择空袭目标的系统;另一个是用于计算弹药装载量并制定突袭计划的人工智能模型。军方官员表示,现在可以在数分钟内选择空袭目标并实施袭击,这是前所未有的速度。支持者认为,这些先进的算法可能超越人类的能力,帮助军方最大限度地减少伤亡,而批评者则警告说,过度依赖越来越自主的系统可能会带来致命的后果。以色列官员表示,除了使用人工智能系统处理大量数据并选择空袭目标,军方正在通过另一个名为“火力工厂(Fire Factory)”的人工智能模型快速实施随后的突袭,该模型根据军方批准的空袭目标数据来计算弹药装载量,对数千个目标进行优先级排序并将其分配给飞机和无人机,并制定时间表。赋予人工智能对军事行动的高度控制权引发了大量争议和讨论。以色列国防军的一位官员表示,这两个系统的每一个目标和空袭计划目前均由人类操作员监督和审核,但这项技术目前还没有受到任何国际或国家层面的监管。
微软今年早些时候宣布了 Microsoft 365 Copilot,类似 GitHub Copilot,使用 AI 帮助办公软件用户提高生产力。365 Copilot 可以按照用户要求生成文档和演示文稿,分析 Excel 数据,摘要 Outlook 邮件,总结 Teams 中的讨论要点,自动化重复性工作,等等。当时软件巨人未披露价格。现在微软公布了让大部分小企业和普通用户难以接受的定价:在 Microsoft 365 E3 等付费版本的基础上每人每月额外支付 30 美元。而 Microsoft 365 E3 的订阅费用为每人每月 36 美元,最新定价相当于把费用增加了一倍。
Meta 宣布了它的新一代大模型 Llama 2。Llama 2 有 70 亿、130 亿和 700 亿参数三个版本,它的预训练模型使用了 2 万亿 tokens 训练,比上一代的 Llama 多 40%,上下文长度增加了一倍,微调模型使用了逾百万人类注释训练。基准测试显示 Llama 2 在很多方面都接近甚至超过了 OpenAI 的 GPT-3.5。GPT-3.5 有 1750 亿个参数,而 GPT-4 有超过1 万亿个参数,相比下 Llama 的参数规模要小得多。Llama 2 采用了非常有针对性的授权:如果月活用户数超过 7 亿,企业必须从 Meta 申请许可证,而 Meta 会对此类授权进行严格设限。月活用户逾 7 亿的平台就那么几家——亚马逊、苹果、Google、字节跳动,微软刚刚宣布与 Meta 在 Llama 2 上展开合作,可能不在受限范围。
开源文本图像生成模型 Stable Diffusion 的开发商 Stability AI 发布了一个将草图瞬间变成真实图像的在线工具 Stable Doodle。Stability AI 称它既适合专业人士也适合新手,无论他们熟悉不熟悉 AI 工具。只要有基本的绘图技能,能上网,就能在数秒内生成高质量的原创图像。Stable Doodle 也支持基于用户输入的文字描述提示词去生成图像,它目前支持 14 种艺术风格。
有多个项目实现了在浏览器上直接运行开源文本图像生成模型 Stable Diffusion。这些项目都利用了 WebGPU,因此都需要浏览器支持 WebGPU,而 WebGPU 目前尚不稳定,AI 大模型又过于庞大,因此未必能正常工作。目前唯一实验性支持 WebGPU 的浏览器是 Chrome,它需要数 GB 的可用内存,在内存有限的机器上会加载缓慢。
威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。
一方面 ChatGPT 的流量在下降,另一方面用户抱怨 ChatGPT 的回答质量变差了。根据 SimilarWeb 的数据,上个月 ChatGPT 的流量下降了近 10%。ChatGPT 的 iOS 应用的下载量也在下降。GPT-4 的付费用户同时在抱怨 OpenAI 的聊天机器人最近输出速度变快了,但代价是输出质量下降了。一位用户打了一个比喻说,前一个月 GPT-4 的使用体验就像是驾驶一辆法拉利,但这个月它变成了像是驾驶一辆破旧皮卡。AI 社区猜测 OpenAI 设计理念发生了改变,它将大模型分解成几个在特定领域训练的小模型,此举旨在降低成本。还有一种可能性是互联网开始充斥着 AI 生成内容,而如果用 AI 使用 AI 生成的数据集进行训练,它的质量会下降。
网络犯罪分子正将生成式 AI 工具用于 Business Email Compromise (BEC) 攻击。以 OpenAI 聊天机器人 ChatGPT 为代表的生成式 AI 能生成类似人类的文本,网络罪犯可利用它自动创建高度可信的钓鱼邮件,对收件人高度定制,增加攻击的成功率。在地下黑客论坛,网络罪犯演示了利用生成式 AI 改进网络钓鱼或 BEC 攻击所用邮件的潜力。即使攻击对象使用的语言不是攻击者的母语,在生成式 AI 的帮助下攻击者将可以轻而易举的伪造可信的邮件。网络罪犯甚至创建了专门用于恶意目的的工具 WormGPT。WormGPT 是基于 2021 年开发的大模型 GPTJ,它的功能包括无限字符支持、聊天记忆保留和代码格式化等。开发者声称 WormGPT 使用了恶意程序相关的数据进行训练。
从互联网诞生之初,垃圾信息就是使用者面临的一大难题。如何从无数信息中寻找到有用信息?搜索引擎的需求由此而来。早期的垃圾信息都是由人工生成,因此其数量受制于人类工作的局限性。但随着生成式 AI 的到来,大批量生成将使得垃圾信息的量级远超过去。五月初,新闻评级公司 NewsGuard 发现有 49 个假新闻网站使用 AI 生成内容。到 6 月底,这个数字增加到了 277。这些 AI 生成内容网站旨在通过 Google 的广告获利。
Meta 的大语言模型 LLaMA 过去几个月推动了开源大模型的快速发展,但 LLaMA 目前不支持商业使用,而是在非商业授权下提供给社区和研究人员使用。Meta 现在准备推出 LLaMA 的商业版本,允许开发者和企业在 LLaMA 基础上构建商业应用。LLaMA 有 70 亿、130 亿、330 亿和 650 亿参数多个版本,相比下 ChatGPT 使用大模型 GPT-3.5 有 1750 亿个参数,而新一代的 GPT-4 据报有超过 1 万亿个参数。
Google 宣布了其 AI 聊天机器人 Bard 的重大更新:对全世界大部分国家开放访问(不包括中国大陆和香港),支持阿拉伯语、中文、德语、印度语和西班牙语在内的四十多种语言。此前因为欧盟的隐私要求,Google 推迟了向欧盟地区提供 Bard,最新更新包含了额外的隐私功能,而 Bard 也正式提供给了整个欧洲地区。新功能包括:固定和重命名对话,导出代码到更多地方,与朋友分享 Bard 聊天记录,可在提示中上传图像,目前只支持英文,未来会支持更多语言。
美国联邦贸易委员会(FTC)正在调查 OpenAI 的 ChatGPT 是否因发布有关人们的虚假信息而对他们造成了伤害,意味着该款热门应用面临潜在的诉讼风险。FTC 表示,该机构对 ChatGPT 的调查重点是 OpenAI 是否“从事了与消费者受伤害的风险有关的不公平或欺骗性行为,其中包括名誉损害”。FTC 向 OpenAI 提出的一个问题是,要求该公司“详细描述其在多大程度上采取了措施来应对或降低风险,即该公司的大语言模型产品可能会生成关于真实个人的虚假、误导或诋毁性陈述的风险”。在发给 OpenAI 的民事传票中,FTC 提出了有关该公司数据安全操作的详细问题。FTC 援引了 2020 年的一起事件,当时 OpenAI 披露了一个漏洞,该漏洞可以让用户查看其他用户的聊天信息和一些与支付相关的信息。FTC 传票提出的其他问题还包括 OpenAI 的营销活动、AI 模型的训练做法以及该公司对用户个人信息的处理。
网信办等七部门发布了《生成式人工智能服务管理暂行办法》,2023 年 8 月 15 日起施行。《暂行办法》规定:
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。
Google 在早些时候的年度开发者大会 Google I/O 上宣布了一款设计帮助人们更快学习的新笔记本 Project Tailwind。周三它宣布了 Project Tailwind 的正式名字 NotebookLM。Google 还没有向公众开放其使用,感兴趣的用户可加入等待名单。NotebookLM 来自 Google Labs,其核心是一个语言模型,因此名字里包含了 LM。NotebookLM 能自动生成添加的 Google Doc 文档的摘要,上传文档后用户能要求笔记本回答文档相关的各类问题,它还能帮助用户提出创新的新想法。Google 同时警告 NotebookLM 仍然可能存在大语言模型常见的“幻觉”(或者说虚构内容),因此用户需要事实核查,它会通过回复中的相关引文简化核查。
马斯克(Elon Musk)宣布成立了一家新 AI 公司 xAI,其宗旨是理解宇宙的真实性质。xAI 招募了曾在 DeepMind、OpenAI、Google 研究院、微软研究院、特斯拉和多伦多大学工作过的研究人员。xAI 在一篇官方博客文章中称,它的团队曾参与并领导了 AI 领域最重大突破的研发,其中包括 AlphaStar、AlphaCode、Inception、Minerva、GPT-3.5 和 GPT-4。马斯克曾是 OpenAI 的联合创始人,但早在 ChatGPT 火热前就已经退出。
英伟达已成为 AI 革命早期的领跑者,但大大小小的竞争对手已经在奋起直追。AMD 和英特尔等重量级企业正花费数以十亿美元计的资金扩充 AI 产品组合,另一方面初创企业正吸引那些渴望捕捉下一个潜在芯片巨头的投资者。与此同时,亚马逊和谷歌等云计算公司也在开发自己的芯片,成为这一赛道上的大块头选手。从 AI 软件架构的角度来看,英伟达的一众竞争对手或许有能力挑战英伟达。英伟达的软件是专有的,这意味着软件开发者不能自由地对其进行调整。英特尔和 AMD 提供开源的替代方案,一些客户可能会发现这种选择很有吸引力。
AI 创业公司 Anthropic 宣布了新大语言模型 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问,它同时推出了面向公众的 beta 网站 claude.ai(尚未对中国大陆开放)。Anthropic 称,Claude 2 在律考多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%;相比申请研究生院的大学生,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,数量推理得分与申请者的中位数相当。Anthropic 表示,Claude 2 的企业 API 价格与 Claude 1.3 相同。
OpenAI 今年初公布的新一代大模型 GPT-4 的技术细节泄露,它有 1.8 万亿个参数,利用了 16 个混合专家模型(mixture of experts),每个有 1110 亿个参数,每次前向传递路由经过两个专家模型。它有 550 亿个共享注意力参数,使用了包含 13 万亿 tokens 的数据集训练,tokens 不是唯一的,根据迭代次数计算为更多的 tokens。GPT-4 预训练阶段的上下文长度为 8k,32k 版本是对 8k 微调的结果。如果是在云端进行训练,以 每 A100 小时 1 美元计算,那么一次的训练成本就高达 6300 万美元。不过今天的训练成本能降至 2150 万美元。
喜剧演员 Sarah Silverman 以及两名作家 Richard Kadrey 和 Christopher Golden 向旧金山联邦法院提起集体诉讼,指控 Meta 和 OpenAI 使用受版权保护的材料训练 AI 聊天机器人。诉讼凸显了生成式 AI 工具所面临的法律风险。Silverman、Kadrey 和 Golden 指控 Meta 和 OpenAI 未经授权使用其书籍开发大语言模型。在针对 Meta 的诉讼中,原告称泄露的该公司 AI 业务信息显示他们的作品未经许可被使用。针对 OpenAI 的诉讼称,ChatGPT 生成的原告作品摘要表明它接受了受版权保护内容的训练。
在 AI 热潮下,经历数个月裁员的旧金山科技行业企业恢复了招聘。5 月份,旧金山市和毗邻的圣马特奥县(San Mateo County)科技行业新增加了 2800 个岗位。旧金山首席经济学家 Ted Egan 表示,自 2022 年底科技业大规模裁员以来,新增加的职位意味着当地恢复了 38% 的就业岗位。Egan 称,大型科技巨头的股价今年表现出色,这一趋势通常是增加招聘的领先指标。他预计大部分招聘来自 AI 行业。AI 公司如 OpenAI 和 Anthropic 都在旧金山。