solidot新版网站常见问题,请点击这里查看。
OpenAI 名字里有 Open,一开始也是以非盈利的名义开发 AI ,但自从 2019 年去除非盈利状态之后它就走向了闭源。OpenAI 的聊天机器人 ChatGPT 使用的模型 GPT-3.5 并没有开源。据 The Information 援引知情人士的消息报道,OpenAI 准备发布一个新的开源模型。看起来 OpenAI 在目睹了以 LLama 为代表的开源大模型(但商业使用受限)短时间内取得惊人进展之后重新对开源产生了兴趣。

OpenAI CEO Sam Altman 呼吁美国国会为先进 AI 系统制定许可和安全标准,目前两党议员正开始推动对消费者使用的强大新 AI 工具进行监管。Altman 周二在参议院小组委员会听证会上谈到 AI 技术时说,他理解人们担心 AI 会如何改变人们的生活方式,如果这项技术出了问题,可能就会是很大的问题。他呼吁成立一个新的机构,对能力超过一定规模的项目颁发许可,并可以取消许可证,确保符合安全标准。他说,与此同时,OpenAI会预先测试并不断更新其工具,以确保安全。他认为,让公众广泛使用这些工具,实际上有助于该公司识别和降低风险。

AI 模型的训练需要大量的算力,而美国的技术出口限制让中国无法进口最先进的硬件。为了集中力量办大事,北京市发布了《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,意见截止日期 19 日。征求意见稿提出,“加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员,明确供给技术标准、软硬件服务要求、算力供给规模、优惠策略等,向在京高校院所和中小企业公布一批优质算力供应商。将新增算力建设项目纳入算力伙伴计划,加快推动海淀区“北京人工智能公共算力平台”,朝阳区“北京数字经济算力中心”等项目建设,快速形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发...”

美国专利商标局(USPTO)正征求与 AI 技术和发明权相关的意见。USPTO 询问 AI 如何应用于发明创造,以及它在发明创造中的贡献是否有资格被视为是共同发明人。如果 AI 系统对一项发明的贡献与被视为共同发明人的人类处于同等程度,那么根据当前的专利法该发明是否可授予专利?是否存在一种情况 AI 对发明的贡献不属于任何实体因此属于公有领域的一部分?搜索巨人 Google 递交了它的意见书,认为根据美国专利法 AI 技术不应该视为发明人。

AI 公司 Anthropic 宣布它类似 ChatGPT 的语言模型 Claude AI 能在一分钟内分析整本书。它将 Claude 的上下文窗口扩大到了 100,000 tokens,或相当于 7.5 万字。Claude 是类似 OpenAI GPT-4 的大语言模型,tokens 是简化 AI 数据处理的最小文本单元,上下文窗口类似短期记忆——大模型一次能处理的输入数据。更大的上下文窗口意味着大模型能一次性处理图书或持续数小时或数天的漫长对话。Anthropic 称,普通人阅读 7.5 万字需要大约 5 小时,之后还需要时间消化、记忆和分析,Claude 能在不到一分钟内做到。《了不起的盖茨比(The Great Gatsby)》有 72K tokens,他们将其输入 Claude,修改了一行字,将原书中的叙述人 Nick Carraway 的背景改为“在 Anthropic 从事机器学习的软件工程师”,让模型找不同。Claude 花了 22 秒钟找到了差异。

Google 发布了实验性的 AI 文本音乐生成工具 MusicLM。用户现在可通过 AI Test Kitchen 应用试用。Google 是在今年初宣布了 MusicLM,该模型使用了 28 万小时的音乐数据集进行训练,学习从复杂的文本描述中生成连贯的歌曲。当时 Google 没有公开测试,原因是需要解决 AI 生成音乐相关的伦理问题。过去几个月 Google 称它一直和音乐家合作,举办了研讨会,以“弄清楚这项技术如何赋权创意过程”。结果是公开的 MusicLM 版本无法生成特定艺术家或特定音乐作品的音乐。

DeepMind 联合创始人 Mustafa Suleyman 认为政府需要制定政策帮助因 AI 失业的人,提供某种形式的援助如全民基本收入(universal basic income 或 UBI)。Suleyman 称需要物质类的补偿。今年早些时候,高盛发表研究报告认为,在十年内生成式 AI 能取代全球 3 亿全职工作岗位,美国和欧洲三分之二的工作面临某种程度的 AI 自动化。Suleyman 对此表示,在五到十年内,白领的很多工作任务将会和今天有显著的差异。

欧洲议会两个委员会通过《人工智能法(The AI Act)》提案的谈判授权草案。草案就对 ChatGPT 等生成式人工智能大模型的一系列要求达成一致,标志着欧盟对人工智能实施强监管方面又迈出了一步。新文本将严格禁止“对人类安全造成不可接受风险的人工智能系统”,包括有目的地操纵技术、利用人性弱点或根据行为、社会地位和个人特征等进行评价的系统等。草案提出了新的保障措施,并禁止各种危险用例,包括禁止在公共场所进行大规模面部识别程序,以及禁止使用预测性警务系统(即 AI 犯罪预测系统)。草案还要求建立一个公共数据库,记录政府部门部署的“高风险”人工智能系统,公开数据,以便公民能够了解他们将何时以及如何受到这项技术的影响。这一草案将于 6 月中旬提交欧洲议会全会表决,之后欧洲议会将与欧盟理事会就法律的最终形式进行谈判。欧洲议会的声明说,一旦获得批准,这将成为全世界首部有关人工智能的法规。

AI 创业公司 Stability AI 发布了 Stable Animation SDK,帮助艺术家和开发者实现最先进的 Stable Diffusion 模型生成 AI 动画。用户可以通过多种途径去生成动画,如利用纯文本提示,基于原始图像或视频。Stability AI 提供了三种生成动画的方式:文本到动画;文本输入+初始图像输入;输入视频+文本输入。

过去几个月,软银将其在阿里巴巴的持股几乎全部套现。阿里巴巴是软银创始人孙正义 40 多年职业生涯中最成功的一笔投资。2000 年,他在阿里巴巴刚刚起步时就进行了投资,到了 2021 年年中,软银在这家中国公司持有的股份价值已接近 1000 亿美元。套现阿里巴巴股票帮助该公司挺过了过去一两年的巨额亏损。在告别阿里巴巴之际,软银正在转向 AI 领域,该公司准备推出日本版的 ChatGPT。

Google 宣布向逾 180 个国家的英语用户开放其 AI 聊天机器人 Bard,用户不再需要加入等候名单。Google 还为 Bard 增加了新功能,包括支持日语和韩语,简化文本导出,可视化搜索和暗色模式,未来还将支持 Adobe 的 AI 图像生成,整合第三方 Web 服务如 ZipRecruiter、Instacart、Wolfram 和 Khan Academy。Google 表示正在升级 Bard 以利用最新的语言模型 PaLM 2,升级后的聊天机器人将能更好的处理代码查询,包括调试和解释逾 20 种编程语言的代码块。Google 还发布了一个用于测试其准备推出的新产品新功能的应用 Search Labs。

澎湃报道,4 月 25 日,甘肃平凉市公安局崆峒分局网安大队在日常网络巡查中发现,某百度账号出现一篇标题为“今晨甘肃一火车撞上修路工人 致 9 人死亡”的文章,初步判断为信息虚假不实。网安民警随即开展工作,发现共计 21 个百度账号均在同一时间段发布该文章,文章内容地点除平凉市崆峒区外还涉及兰州、陇南、定西、庆阳等地,文章点击量已达1.5万余次。经查,涉案百度账号均为广东深圳某自媒体公司所有,公司法人代表洪某弟有重大作案嫌疑。5 月 5 日,专案民警在广东东莞嫌疑人住处对其使用的电脑及百家号进行取证。经审讯,犯罪嫌疑人洪某弟通过微信好友获知网络赚取流量变现方法,并购买大量“百家号”。同时使用“易撰”网页版,在全网搜索近几年社会热点新闻,为规避百家号查重功能,洪某弟通过近期火爆的 ChatGPT 人工智能软件将搜集到的新闻要素修改编辑后,使用“海豹科技”软件上传至其购买的百家号上非法获利。

由自由声优、音乐家等组成的日本艺人协会举行记者会,称 AI 的发展导致表达的技术被剥夺,许多人面临失业的风险。协会共有会员约 5.2 万人,除声优等之外,还包括美术家、演员、舞台工作人员等。协会指出,无需声优和演员等实际参演,AI 就能制作动漫、电影、音乐等作品,从事制作的工作人员很可能面临失业。协会要求完善法律,对声音与演技相关权利作出新的规定,并使 AI 制作作品时参照的表演者等能要求适当的报酬。

根据 Similarweb 的估计,去年 11 月底发布的 AI 聊天机器人 ChatGPT 的流量增长开始放缓。ChatGPT 在去年 12 月吸引了约 2.66 亿次访问,与 Yahoo News 相近,之后 1 月流量增长 131.6%,2 月 62.5%,3 月 55.8%,到了 4 月增长 12.6% 至 17.6 亿次,指数级增长势头开始消退。它的流量超过了 bing.com、nytimes.com 和 cnn.com,但仍然只有 google.com 的 2%。ChatGPT 在美国地区的访问量为 1.876 亿次,环比增长 17.5%,bing.com 在美国的流量仍然高于 ChatGPT,其 4 月访问量为 3.778 亿,环比下降 5%,bing.com 全球的访问量下降 9.7% 至 13 亿次。

AI 创业公司 Hugging Face 和 ServiceNow 发布了免费的代码生成模型 StarCoder。类似 DeepMind 的AlphaCode、亚马逊的 CodeWhisperer 和 GitHub 的 Copilot(基于 OpenAI 的 Codex),StarCoder 使用 Apache License 2.0 许可证,允许任何人免费使用,但严格意义上不是开源模型,它禁止用户使用该模型生成或传播恶意代码。StarCoder 使用了开源代码数据集 The Stack 训练,有 150 亿参数。其数据集包括了逾 80 种不同语言和来自 github issues 和 commits 的文本。

OpenAI CEO Sam Altman 表示该公司不再使用 API 客户的数据去训练 ChatGPT 模型。他说客户明确不想要用他们的数据训练,所以他们改变了计划。根据互联网档案馆时光机器(Wayback Machine)的记录,OpenAI 是在 3 月 1 日修改了服务条款。Altman 表示该公司已经有一段时间不用任何 API 数据训练模型。OpenAI 的商业客户如微软主要是通过 API 使用其大语言模型。OpenAI 的新服务条款只保护使用 API 的客户,对于用户直接与 ChatGPT 对话的数据 OpenAI 仍然会将其用于训练。包括亚马逊在内的企业已经警告员工不要在 ChatGPT 中输入机密信息。

数字科技人才方面,我国人才基数大但高层次人不足,且严重落后于美国。全球数字科技人才总量为77.5万人,我国占17%有12.8万人,是位居第二美国的1.5倍。但高层次人才只有0.7万人,占全球总量的9%,仅为美国的(2.1万人,占全球25%)的35%。中国高层次人才集中在高校,而美国高科技公司人才储备不逊色于顶尖高校。中美学者合作从2018年开始处于下降态势。全球数字科技顶尖科研团队基本被美国机构包揽。同时,报告根据2012年-2021年数字科技领域Top 1核心论文筛选出了数字科技领域十大热点前沿技术。他们是:生物大数据、生成式对抗网络算法(Generative adversarial networks,GANs)、沉浸式扩展现实(Extended Reality,XR)、量子计算机、AI 破解蛋白质和基因结构、移动边缘网络、可解释的AI、联邦学习、混合计算和能源区块链技术。查看全文

Google 通知员工将选择性的发表 AI 论文。Google 最近合并了它的 AI 研究部门 Brain 和 DeepMind,合并后的部门将会继续发表新 AI 研究,但对于什么能公开发表将会更具有选择性。Google AI 部门资深高管 Jeff Dean 在今年 2 月向研究人员通知了新的论文发表政策,Dean 此前像大学那样管理着 AI 部门,鼓励研究人员尽可能多的发表学术论文。自 2019 年以来 Google 研究人员发表了近 500 项研究。但 OpenAI ChatGPT 的发布改变了这一切,而 ChatGPT 是基于 Google 关于 Transformer 的研究。所以 Google 决定改变它的政策,它计划只在 AI 变成产品之后才公开相关论文。搜索巨人一直被认为是 AI 研究领域的领导者,但它现在进入了防御模式,需要保护其核心的搜索业务抵御来自 AI 竞争对手的挑战。它现在将注意力集中在可以商业化的大语言模型和产品上。

根据一份泄露的内部备忘录,Google 声称它和 OpenAI 都未建立 AI 的护城河,开源 AI 将会是最后的赢家。该文件被匿名人士公布在 Discord 上。文件称,在 Google 和 OpenAI 展开 AI 军备竞赛的同时,代表开源的第三方正在吞食其阵地。Google 和 OpenAI 的模型在质量上仍然稍微占优,但差距正在快速缩小。开源模型更快,定制性更高,隐私保护更好,同等规模时性能更强。130 亿参数的开源模型训练只需要 100 美元,而 Google 和 OpenAI 有 5400 亿参数的模型训练要花费 1000 万美元。大语言模型不存在什么秘方,参数太多的大模型反而造成拖累,最佳的模型是能快速迭代的。Google 备忘录认为关注开源模型的开发有助于避免重新发明轮子。

除了在 OpenAI 上下注外,微软投资开发了自己的 AI 芯片。据彭博社报道,微软和 AMD 合作开发了内部代号为雅典娜(Athena)的 AI 芯片。这一合作始于 2019 年。雅典娜设计作为英伟达 AI 芯片的廉价替代。英伟达目前在 AI 芯片领域处于统治地位,但其芯片价格十分昂贵,微软的 AI 聊天机器人 Bing chatbot 如果完全靠英伟达的芯片提供动力那么成本会令人难以接受,因此软件巨人迫切需要廉价替代。有数百人参与了雅典娜项目,微软至今已经在该项目上投资了 20 亿美元。