文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
社交网站 Reddit 有一个论坛叫 r/AskDocs,用户提出各种医学问题由经过身份认证的医疗专业人士进行回复。加州圣迭戈的研究人员从该论坛上随机选择了 195 个问题和答案,让 AI 聊天机器人 ChatGPT 根据问题撰写回复。由三名专业人士组成的团队评估了人类医生和 ChatGPT 的答案,他们没有被告知哪个答案是医生写的哪个是 ChatGPT 写的。结果显示,79% 的情况下 ChatGPT 的答案被认为质量更高更富有同情心。
美国民主党和共和党的四名参议员联合宣布了一项议案《The Block Nuclear Launch by Autonomous Artificial Intelligence Act》,禁止允许 AI 或没有人类控制的自治系统做出发射核武器的决策。参议员 Edward Markey 在新闻稿中称,我们生活在一个日益数字化的时代,需要确保人类而不是机器人掌握着指挥、控制和发射核武器的权力。参议员 Don Beyer 表示,美国军队使用 AI 用于加强国家安全目的是合适的,但在没有人类指挥控制链的情况下使用 AI 部署核武器是鲁莽的和危险的,应被禁止。
腾讯云推出了自助式数智人生产平台。它的数智人实际就是 Deepfake(深伪技术)。只需要 3 分钟真人口播视频、100 句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在 24 小时内制作出与真人近似的“数智人”,其费用只需要千元。数智人产品总经理陈磊表示,数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。
ChatGPT 等 AI 聊天机器人的成功受益于两种训练范式:指令微调和基于人类反馈的增强学习(RLHF)。目前缺乏同时应用这两种范式的开源模型,大部分模型因 RLHF 的复杂性而只应用了指令微调。AI 创业公司 Stability AI 宣布发布第一种应用 RLHF 训练的大型开源聊天机器人 StableVicuna,基于 Vicuna v0 13b,而 Vicuna v0 13b 则是基于 Meta 的大语言模型 LLaMA 13b(130 亿参数)。LLaMA 模型目前不支持商业使用。
根据欧盟一项新的立法草案,ChatGPT 等 AI 工具的开发商将被要求披露在构建其系统时使用的版权材料。该草案将成为西方首套管理 AI 推广的全面规则。这一规则将给出版商和内容创作者一个新的武器,当他们的作品被 ChatGPT 等工具用作 AI 生成内容的原始材料时,他们可以寻求利润分成。
美国国家经济研究局发表研究报告《Generative AI at Work》,发现生成式 AI 将生产力提高了14%,并减少了工作压力,增加了从事客户支持工作的员工保留率。从自动化中受益最大的是那些新入职的和缺乏经验的员工。客户支持是一项工作压力很大的工作,工作人员需要吸收客户的沮丧情绪,克制自己的情绪反应。生成式 AI 能充当智能助手,输入客户聊天记录,实时提供移情反应和问题解决建议。生成式 AI 减少了客户希望将问题反馈到主管的可能性。这只是一项初步研究结果,还无法就此得出明确结论。
META 披露了最新季度财报,收入 286 亿美元,比上年同期增长 3%,此前它连续三个季度收入下降。CEO 扎克伯格告诉投资者,“我们正在探索 WhatsApp 和 Messenger 的聊天体验,Facebook 和 Instagram 帖子和广告的视觉创作工具,随着时间的推移,视频和多模态体验也在探索。”ChatGPT 的空前成功使生成式人工智能成为当今的技术趋势,大小企业都在竞相打造应用。虽然 Meta 在今年早些时候向研究人员发布了人工智能语言模型 LLaMA,但它还没有以一种可广泛使用的方式推出类似于 ChatGPT 的东西。扎克伯格表示,由于商业模式不同,预计 Meta 将采用比谷歌、微软和亚马逊等公司更开源的方法介入生成式人工智能。他表示将在未来几个月内发布生成式人工智能产品。他说,生成式人工智能“实际上将触及我们的每一个产品”。
通用汽车旗下的自动驾驶子公司 Cruise 透露开始在旧金山全天提供无人出租车服务,并计划其业务未来扩大到更多城市,其中之一可能是达拉斯。Cruise 于 2013 年成立,总部位于旧金山,今年 2 月公司总裁、CEO 兼联合创始人 Kyle Vogt 表示,其无人出租车无人驾驶的行驶里程超过百万英里。旧金山多山,地形复杂,是无人出租车的理想试验场。
被用于在网站上抓取图像构建用于训练 AI 模型的数据集的下载工具引发了争议。网站抱怨抓取工具不遵守他们在 robots.txt 中列举的要求,而抓取工具 img2dataset 的作者 Romain Beaumont 则宣称所有人能在未来受益于 AI。他要求不想被抓取图像的网站主动在 HTTP 头文件中添加 X-Robots-Tag: noai 和 X-Robots-Tag: noindex 等标记,否则他的工具将会不管不顾的抓取图像。他说,一部分人不理解 AI 和开放 AI 的潜力,还因此决定与之对抗。
美国众议院开始在内部试用 OpenAI 的聊天机器人 ChatGPT。众议院最近成立了一个 AI 工作组,在国会办公环境中测试和分享 AI 工具。众议院数字服务部门从 OpenAI 获得了 40 个 ChatGPT Plus 的许可证,以先到先得的原则提供给各个国会办公室。数字服务部将无限期支付每月 20 美元的订阅费用。工作人员不建议使用国会数据或敏感内部信息查询 ChatGPT。
OpenAI 宣布了允许 ChatGPT 用户更好的控制其数据的新政策:用户可以关闭聊天记录,可以选择退出将聊天记录用作 AI 训练数据,以及可以导出聊天历史。这些新的控制选项可以在设置中找到。在永久删除前 OpenAI 将保留聊天记录 30 天时间,该公司表示需要用于监控滥用。此前 ChatGPT 用户的聊天记录会被用于微调 AI 模型,用户可以定期清除聊天记录,但数据仍然会被用于微调。这对企业而言是一个严重的隐私问题,因为员工可能会输入敏感数据。
知乎发表了一份声明,将对 AI 生成内容设限。声明称,“创作者在发布包含 AIGC 生成的内容时,应主动使用「 包含 AI 辅助创作」的标签进行声明,帮助读者进行区分。对发布时未主动声明的内容,平台将采取适当措施进行流通限制并添加相关标识,以提醒读者该内容是由 AI 生成的。在 AIGC 内容集中出现的场景,为保障用户消费体验,平台将对由 AI 生成的内容进行展示干预...创作者应当对其发布的 AIGC 类内容的真实性、准确性负责...打击批量发布 AIGC 类内容的帐号...”
AI 创业公司 OpenAI 向美国专利商标局(USPTO)申请了 GPT 商标。GPT 代表 Generative pre-trained transformers,是一种深度神经网络架构,基于 Google 研究人员释出的深度学习架构 Transformers。OpenAI 申请的是商标,而不是版权,它没有限制其他人构建类似 GPT 的 Transformers 模型,但禁止这些人将其模型称为 GPT 5 或后缀为 GPT 之类的名字。
在德国汉堡郊区的一栋房子前,邮箱上涂了一个单词 LAION。LAION 代表 Large-scale AI Open Network,是高中教师 Christoph Schuhmann 的一个业余爱好项目。他在业余时间和一群志愿者建立了世界上最大的开源 AI 数据集。该数据集被 Google Imagen 和 Stable Diffusion 等用于训练文本图像模型。Schuhmann 常去 Discord 上的一个 AI 狂热者聚集的群组,当时 OpenAI 的第一代 DALL-E 模型刚刚发布,他既受鼓舞也感到担忧,担心这可能会鼓励科技巨头不开放数据。他和该群组的成员因此创建了一个开源数据集帮助训练文本图像模型 diffusion。仅仅三个月时间,他们发布了一个包含 4 亿对图像及其文字描述的数据集。今天这个数字超过了 50 亿,是世界最大的免费图像和文字描述数据集。当 Emad Mostaque 在 2022 年创建 Stability AI 时,他使用 LAION 训练了模型 Stable Diffusion,还雇佣了两位该组织的研究人员。一年之后,该公司的估值接近 40 亿美元,很大程度上要感谢 LAION 提供的数据。 Schuhmann 没有从中获得任何收入,他也没有兴趣这么做,他想要保持独立。
计算机科学家 Jaron Lanier 在《纽约客》发表文章《There Is No AI》,提出应停止对人工智能的神化,而将其作为一种创新的社会协作形式来看待。他反对最近呼吁停止训练更高级人工智能的联署信,并再次提出“数据尊严”概念:结束人工智能黑箱,记录比特的来源,“人们可以为他们创造的东西获得报酬,即使这些东西是通过大模型过滤和重新组合的”,“当一个大模型提供有价值的输出时,数据尊严的方法将追踪最独特和有影响力的贡献者。”
盖茨(Bill Gates)预言 AI 聊天机器人能在 18 个月内教儿童如何阅读和磨练写作技能。对计算机而言,教学生如何写作是一项十分困难的工作。教师对学生的作文会从叙事结构和清晰度等方面进行反馈,这是一项高级认知的任务,很难在代码中实现。但 AI 聊天机器人改变了这一切。盖茨相信随着 AI 聊天机器人技术的进步,它将能成为学生的私人辅导老师,而大部分学生是请不起家教的,因为家庭教师对他们而言太昂贵了。
在 Reddit 之后,编程问答社区 Stack Overflow 也将对科技巨头们使用其数据训练 AI 收费。和 Reddit 类似,Stack Overflow 也有着高质量的问答语料库,它有 2000 万注册用户,5000 万问题和答案。Stack Overflow 的内容所有权属于原作者,采用了 CC BY-SA 授权,也就是使用时要求署名。CEO Prashanth Chandrasekar 称,使用该平台数据集训练大语言模型的公司违反了该许可证,在将模型出售给客户时无法为每一个问题和答案归属,违反了 CC 许可证。无论是 Stack Overflow 或 Reddit 都没有公布收费价格。也许 Twitter 的定价可以作为参考:每月 4.2 万美元。
美国国土安全部将成立一个特别工作组研究如何使用 AI。国土安全部部长 Alejandro Mayorkas 介绍了如何使用 AI 优化该部门的工作,其一在其系统中部署 AI 帮助筛选出使用强迫劳动生产的产品,其二是使用 AI 更好的检测出运到美国的芬太尼,识别和阻止生产该毒品的前体化学品的流动。美国国防部也在加强 AI 的使用,它雇佣了 Google AI 云端服务的前总监,担任首位 AI、机器人、云计算和数据分析顾问。
加拿大魁北克大学的研究人员在预印本网站 arXiv 上发表论文,分析了 ChatGPT 所生成代码的安全性。研究人员表示结果令他们倍感担忧。ChatGPT 生成的部分代码甚至达不到最低安全标志,而当你问它时它还知道代码是不安全的。研究人员让 ChatGPT 使用 C、C++、Python 和 Java 四种语言生成了 21 个程序和脚本。研究人员称,ChatGPT 似乎知道它生成的代码是不安全的,但就是不说,除非你问它。ChatGPT 拒绝生成攻击性代码,但却会生成有漏洞的代码,这在道德上是不一致的。
过去九年,27 岁的肯尼亚人 Collins 靠给美国大学生当论文枪手谋生。他撰写的论文主题包括了心理学、社会学和经济学。他偶尔还被允许直接访问大学网站入口,递交测试和作业,参与小组讨论,使用学生身份与教授交谈。2022 年他每月的收入在 900-1200 美元。如今他的月收入降至了 500–800 美元。他认为原因是生成式 AI 如 ChatGPT 的流行。去年的这个时间他能收到 50-70 份作业,作业比较短通常只需要 150 个字;如今他只收到 30-40 份作业。在线学习平台 Study 在今年 1 月的调查发现,逾 89% 的学生表示曾用 ChatGPT 帮助完成家庭作业。近半数人承认用 ChatGPT 完成家庭测试或测验,53% 的人用它写论文,22% 写论文大纲。Collins 担心 AI 的崛起会大幅降低学生对他们这些枪手的依赖,他自己也同时也用 ChatGPT 去生成以前外包给其他枪手的内容。