solidot新版网站常见问题,请点击这里查看。
AI 图像生成公司使用了数以亿计的版权图像训练模型,然后生成具有独特风格的新图像,图像艺术家则没有从中获得任何好处。部分艺术家已对此采取法律行动。Joseph Saveri 律所代表一组艺术家在旧金山递交了集体诉讼,起诉 Stability AI、Midjourney 和 DeviantArt 等 AI 公司,指控它们侵犯了 DMCA 法,违反形象权和非法竞争。这些艺术家寻求在其职业被基于其作品的计算机程序淘汰前结束这种公然的侵权。用户使用 Stability AI 的 Stable Diffusion、Midjourney 或 DeviantArt 的 DreamUp 等工具,可以通过输入短语生成与现有艺术家作品相似的图像。创造 DALL-E 图像合成模型的 OpenAI 没有被列为被告,它没有披露其训练数据集的具体内容,它的部分训练数据有商业许可授权。

过去十年,机器学习软件开发框架经历了巨大变化。虽然大部分框架严重依赖于英伟达 CUDA,在 英伟达 CUDA 上有最佳性能。但随着 PyTorch 2.0 和 OpenAI Triton 的到来,英伟达 CUDA 对机器学习的垄断地位正逐渐瓦解。几年前,Google 的 TensorFlow 框架及专用加速器 TPU 具有先发优势,Google 被认为有望在机器学习行业占据主导地位。然而 Google 未能将先发优势转变为行业主导地位。PyTorch 赢了。没有使用 PyTorch 和 GPU 的 Google 孤立于机器学习社区。Google 偏爱自己软件栈和硬件,甚至于以典型的 Google 风格,它还开发了第二个框架 Jax 与自家的 TensorFlow 展开直接竞争。PyTorch 的一大优势是其灵活性,而即将到来的 2.0 将能更容易的利用不同硬件资源。PyTorch 2.0 改进英伟达 A100 GPU 训练性能达 86%,CPU 推理性能提升 26%,显著减少了训练模型所需的计算时间和成本。它还可以扩展到 AMD、英特尔、Tenstorrent、Luminous Computing、特斯拉、Google、亚马逊、微软、Marvell、Meta、Graphcore、Cerebras、SambaNova 等公司生产的 GPU 和加速器上。OpenAI 的 Triton 同样对英伟达的机器学习闭源软件护城河产生冲击,它可以跳过闭源 CUDA 库如 cuBLAS,使用开源库如 cutlass。优化 CUDA 需要对底层硬件有深入了解,而 Triton 能让高级语言达到与使用低级语言相当的性能,提高了可用性。OpenAI Triton 目前只支持英伟达 GPU,但未来将会支持其它硬件制造商。

科技新闻网站 CNET 已经用 AI 撰写了数十篇文章。文章的署名者都是 CNET Money Staff,内容与个人财务有关,每篇文章底部都有免责声明,“这篇文章使用自动技术生成,由编辑部的编辑进行彻底的编辑和事实核查。”CNET 主编为用 AI 编写文章辩护,称这种做法为“AI 辅助”,表示虽然 AI 引擎编写了故事草稿或收集了一部分信息,但 CNET 上发表的每一篇文章都经过了具有相关专业知识的编辑的审查、事实核查和编辑。CNET 将增加透明度,对于文章是否由 AI 编写上给出更明确的信息。

根据发表在预印本平台 bioRxiv 上的一篇论文,科学家也无法分辨 ChatGPT 生成的论文摘要。OpenAI 的聊天机器人 ChatGPT 能根据用户提示生成逼真的、乍一看充满智慧的文本。在这项研究中,研究人员让 ChatGPT 根据 JAMA、The New England Journal of Medicine、The BMJ、The Lancet 和 Nature Medicine 期刊上挑选的医学论文撰写 50 篇摘要,然后让一群医学研究人员区分 AI 生成的摘要和原始论文摘要。ChatGPT 的摘要通过了抄袭程序的检查,认为全部是原创没有发现抄袭。而人类审稿人只识别出 68% 的 AI 生成摘要和 86% 的原始摘要,也就是错误认为 32% 的 AI 生成摘要是真实的,14% 的真实摘要是 AI 生成的。部分科学家对此现象表达了担忧,但普林斯顿大学的计算机科学家 Arvind Narayanan 指出,AI 生成内容的准确性是受质疑的,因此任何严肃的科学家不太可能使用 AI 去生成摘要,所以能否检测出来是无关紧要的。

OpenAI 通过其官方 Discord 频道宣布,它正在考虑如何货币化近期炙手可热的聊天机器人 ChatGPT,以确保其长期生存能力。付费版本的 ChatGPT 将被称为 ChatGPT Professional,其优势包括不再有不可用窗口,没有限流,ChatGPT 的信息数量不受限制——至少是每日限额的两倍。OpenAI 称递交等待名单的人可能会被挑选参与 ChatGPT Professional 的试用。该计划现阶段不会广泛推广。

去年感恩节这天,在旧金山的海湾大桥上,一辆特斯拉 Model S 向左变道,然后就突然放慢速度停车了,而它的前方没有任何障碍物。突然停车导致了后车追尾,发生了 8 车连环撞的事故,导致了 9 人受伤。The Intercept 通过 California Public Records Act 递交公开信息请求,获得了监控探头拍摄的车祸视频和相关记录。特斯拉司机证实汽车启用了 Full Self-Driving 模式,这个名字具有误导性,它其实是一种 L2 级半自主驾驶系统。这起车祸凸显了半自主驾驶的缺陷,事故原因可能是系统看到了假象,在没有障碍物的情况下以为有障碍物,因此尝试停车。

微软正在洽谈向 OpenAI 投资百亿美元,对这家炙手可热的 AI 创业公司的估值达到了 290 亿美元。OpenAI 开发了聊天机器人原型 ChatGPT 和文本图像创作工具 Dall-E。根据融资条款,一旦 OpenAI 找到方法从 ChatGPT 等产品上赚钱,微软将获得利润的四分之三,直到收回初始投资。之后微软将拥有 OpenAI  的 49% 的股份,其他投资者获得另外 49% 股份,OpenAI 的非营利母公司获得 2% 的股份。微软此前已经向 OpenAI 投资了 10 亿美元,并计划在其搜索引擎 Bing 中整合 ChatGPT 功能。

担心学生交出由 ChatGPT 撰写的作文的教师有了新工具。普林斯顿大学 22 岁的大四学生 Edward Tian 开发了一款应用能帮助识别作文是否是 AI 撰写。Tian 主修计算机科学,辅修新闻学,他利用寒假时间创建了 GPTZero,能快速高效破译一篇文章是人类还是 ChatGPT 撰写。他在 1 月 2 日发布 GPTZero 之后,很多教师联络他称测试产生了积极的结果。GPTZero 推出一周内有逾 3 万人试用。它如此受欢迎以至于崩溃了。托管商后来提供了资源。GPTZero 是基于两个指标——perplexity 和 burstiness 判断文章是否是 AI 撰写。perplexity 衡量了文章的复杂性,AI 生成的文章通常复杂性较低;burstiness 衡量了文章中句子的变化,人类写的文章通常混合了长短句,AI 生成的文章则更统一。

2022 年 12 月 21 日第十四届春兰杯半决赛战罢,中国棋手李轩豪完胜韩国第一人申真谞后,李轩豪的队友、围棋世界冠军杨鼎新次日凌晨在朋友圈提出了作弊方面的质疑。几天后,事件发生了“反转”。对于杨鼎新提出的质疑,中国围棋协会进行了调查,并最终认定这一指控没有证据。协会根据国家体育总局相关规定和国家队管理条例,对杨鼎新作出了处罚:除未完成的 LG 杯世界赛决赛外,停止杨鼎新一切个人比赛六个月。即便如此,杨鼎新直指队友利用人工智能(AI)作弊的做法,还是将战火烧到赛场之外,甚至引起日韩媒体的广泛关注,也将 AI 时代的诸多新课题呈现于公众视野。

纽约市教育部门以“安全和准确性”的理由禁止学生和教师使用聊天机器人 ChatGPT。ChatGPT 能生成令人难以分辨真假的文本。最新禁令适用于教育部门的设备和网络,部分学校可以以研究 AI 和科技教育等理由申请豁免。纽约市教育部门在一份声明中表示,该工具能快速提供简单问题的答案,但它并不能培养批判性思维和解决问题的能力,这些能力对学术和终身成功至关重要。部分教师对学生使用 ChatGPT 在作业中作弊感到恐慌。有媒体让教师区分 ChatGPT 生成的写作样本和学生的写作文本,结果显示他们难以可靠的分辨 AI 和人类的作品。

为了吸引用户使用它的搜索引擎,微软考虑在必应中加入 OpenAI 的聊天机器人 ChatGPT。微软仍在权衡聊天机器人回答问题的准确性和将其整合到搜索引擎的速度有多快。该功能一开始可能只提供给少部分用户。微软必应的市场份额要远小于 Google,据知情人士的消息微软已经测试了 ChatGPT 几个月时间。软件巨人此前向 OpenAI 投资了 10 亿美元。过去两个月 ChatGPT 吸引了广泛关注,被认为有可能部分取代搜索引擎。但它回答问题的准确性仍然备受质疑,OpenAI CEO Sam Altman 上个月表示,在任何重要的问题上依赖 ChatGPT 是错误的。

OpenAI 的新通用聊天机器人原型 ChatGPT 展现出了令人称奇的问题解决能力和问题回答能力(答案未必正确),它能帮助你撰写论文,从而引发对学生利用 ChatGPT 作弊的担忧。学者、高等教育顾问和认知科学家建议大学开发新的评估模式以应对 AI 对学术诚信构成的威胁。本周大约 130 所大学的代表出席了英国慈善组织 JISC 举办的研讨会。防剽窃软件开发商 Turnitin 的高管 Annie Chechitelli 表示正在开发帮助评估作业中是否存在 AI 辅助痕迹的工具,她同时警告与生成式 AI 展开军备竞赛是没有好处的,教师应该鼓励学生发展批判性思维。此外有研究表明过度依赖此类在线工具可能会影响创造力。

根据发表在《科学》期刊上的一项研究,DeepMind 的 AlphaCode 在编程竞赛中达到了人类水平。AlphaCode 首先使用了 GitHub 上的庞大代码库进行训练,熟悉语法和编码规范。然后收集编程竞赛的数千个问题,训练它将问题描述翻译到代码。举个例子,要求编写程序确定长度为 n 的二进制字符串(0 和 1 序列)中没有任何连续 0 的数量。当遇到新问题时,AlphaCode 会用 Python 或 C++ 编写出候选的编程方案,过滤掉不好的。AlphaCode 能生成多达百万个候选编程方案。为了过滤掉如此多的编程方案,它只保留通过测试用例的 1% 程序。为了进一步缩小范围,它会根据程序的输出与虚拟输入的相似性分群,从最大的群开始逐一递交程序,直到找到成功的程序或达到最大递交限额的 10 个程序。这让它能测试广泛的编程策略。经过训练 AlphaCode 解决了 34% 的指定问题。在至少 5000 人参加的在线编程竞赛中,它的表现超过了 45.7% 的程序员。

上周旧金山市理事会以 8 票对 3 票通过了致命机器人政策,允许警方在避免更多伤亡的情况下使用遥控机器人携带炸弹移动到枪手或自杀式炸弹袭击者面前,瘫痪或杀死嫌疑人。这一政策引发了广泛争议和抗议,本周旧金山市理事会在第二次投票中以 8 票对 3 票明确禁止警方使用遥控机器人发动致命打击。这是一次 180 度的转弯。理事会的第二次投票通常是仪式性质的,不会改变第一次投票结果。制定该政策的委员会可以对条款进行重新修订,或者完全撤回。如果有新版本,理事会预计会在下周再次对此进行投票。

DeepMind 的 AI DeepNash 在西洋陆军棋(Stratego)中达到了专业级人类玩家的水平。Stratego 是一款需在信息缺失情况下进行战略思考的棋盘游戏。它要比此前 AI 掌握的国际象棋、围棋或扑克复杂得多。在游戏中,双方各有 40 枚棋子,且彼此看不到棋子的真实“身份”。双方轮流移动棋子,来消灭对手的棋子,最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此,玩家需要进行战略部署、收集信息,并与对方博弈。一局 Stratego 游戏中会有 10^535 种可能的布局。相比之下,围棋的布局有 10^360 种可能。此外,在 Stratego 中,AI 需要推理对手超过 10^66 种部署策略,这使德州扑克中初始的 10^6 种可能情况相形见绌。DeepNash 以提出纳什均衡的数学家约翰·纳什的名字命名。DeepNash 将强化学习算法与深度神经网络相结合,以找到纳什均衡。

Adobe 的商业图片库将销售 AI 程序如 Dall-E 和 Stable Diffusion 帮助生成的图像。当一部分人将新兴的 AI 创作工具视为工作的威胁或法律雷区或兼而有之,Adobe 则大力拥抱。Adobe 认为生成性 AI 将会在未来的内容创作中扮演重要角色,它不认为 AI 将会替代人类艺术家,而是作为一种补充。它现在允许销售 AI 帮助生成的图像,条件是这些图像必须明确标明。Getty Images 等商业图片库则在早些时候宣布不接受 AI 生成的图像。
OpenAI 的新通用聊天机器人原型 ChatGPT 过去几天风靡一时,它在解决各种问题上的能力使其可以成为 Google 等搜索引擎和 Stack Overflow 等编程问答社区的部分替代。Stack Overflow 上也涌入了大量用 ChatGPT 生成的问题答案。Stack Overflow 社区现在发表了一则声明,宣布临时封杀 ChatGPT。Stack Overflow 称 ChatGPT 答案的正确率非常低,因此对整个网站以及寻求正确答案的用户来说是有害的。如果用户被发现使用 ChatGPT 回答问题,他们可能会受到禁止继续发帖的惩罚。

OpenAI 发布了一个通用聊天机器人的原型 ChatGPT,能与用户展开各种主题的对话。ChatGPT 是基于 OpenAI 的 GPT-3.5 模型,能像人类一样流畅对话,展现了聊天机器人过去几年的巨大进步。它也展现了聊天机器人的缺陷,将错误或虚假的信息作为事实呈现。AI 研究人员解释说,聊天机器人仍然是某种“随机鹦鹉”,其知识来自于训练数据中的统计规律,对世界的理解与人类不同。它能帮助用户调试代码,带着某种随意的语气说某个循环条件出错了,或者像黑帮成员那样解释冒泡算法,它还能写情景喜剧的剧本,解释不同科学概念,写学术论文,拥有着广博的知识。但它仍然是典型的聊天机器人,会回避敏感主题的讨论。

迪斯尼研究人员演示了能改变演员年龄的新神经网络。它能自动化修改演员视觉年龄,比旧方法成本更低时间更短。旧的修改年龄的方法需要视觉特效的工作人员或者使用 3D 扫描和 3D 建模,或者使用类似 Photoshop 的工具对演员脸部的 2D 逐帧修饰,这一过程通常需要耗费数周甚至更长时间。迪士尼的新神经网络被称为 Face Re-aging Network (FRAN),将整个过程自动化。迪士尼的研究人员首先用 StyleGAN2 随机生成数千张 18-85 岁的合成脸部数据进行训练,了解人的脸部如何随年龄变化的一般规律,然后逐帧应用于真实的演员。论文递交到了本月举行的 2022 ACM SIGGRAPH 会议。

Google 一个秘密项目是利用机器学习训练 AI 写代码、修代码和自我更新。该项目是 Google 生成式 AI 计划的一部分,可能会对开发者编写代码产生深远影响。它最初属于 Alphabet 的研发部门 X,代号 Pitchfork,今年夏天转入 Google 的 Labs 群组,这意味着其重要性在提高。Pitchfork 现在属于 Google Labs 的 AI Developer Assistance 小组,由 Olivia Hatalsky 负责, 她曾参与 Google Glass 等项目,是 X 的资深员工,随 Pitchfork 一起迁到 Google Labs。Pitchfork 设计通过学习编程风格写出新的代码。