奇客资讯网

solidot新版网站常见问题，请点击这里查看。

科技: Mozilla Firefox 支持英伟达的 RTX Video

Mozilla Firefox 加入了对英伟达的 RTX Video AI 视频分辨率增强技术的支持。RTX Video 由两部分组成。RTX 视频超分辨率可提升低分辨率视频的分辨率，以获得更加清晰锐利的图像。其工作原理是对低分辨率视频进行分析，然后通过深度学习来推测更高分辨率的版本应该是什么样子。然后，该算法会将推测出来的图像与传统的上采样版本相结合，以减少或消除压缩伪影并锐化最终输出的图像。RTX Video HDR 则会更进一步：启用后，它会通过 AI 神经网络分析标准动态范围 (SDR) 下的视频内容，以便添加高动态范围 (HDR10) 信息，进而增强视觉效果，并使视频更加精细、生动。使用该技术需要英伟达显卡以及兼容 HDR10 的显示器或电视。

科技: 北京互联网法庭准备审理首例 AI 视听作品侵权案

全国首例 AI 视听作品侵权案”于 5 月 15 日下午在北京互联网法院进行一审庭前谈话。原告陈坤使用 GPT4 和 Midjourney 等软件制作了基于《山海经》的《山海奇镜》预告片。2024 年 1 月 18 日，陈坤发现抖音账户名为“文刻创作”的账号，未经他的许可完全复制使用了他创作的《山海奇镜》预告片的文案、配音、音乐。他提起了侵权诉讼，请求判令被告赔偿原告经济损失及合理支出 50 万元。被告方表示该作品发布后并未有任何盈利行为，且在得知涉嫌侵权后已即时删除该视频。被告不接受索赔 50 万元的要求。

科技: Reddit 与 OpenAI 达成内容授权协议

在 Google 之后，社媒平台 Reddit 与 OpenAI 达成了内容协议，这一消息推动其股价上涨逾十分之一。根据该协议，OpenAI 将获得 Reddit 内容的访问权限，同时它将为 Reddit 提供 AI 驱动功能。和 Stack Overflow 类似，Reddit 的内容都是用户创造和管理的，它的高质量内容应该早就被 OpenAI 抓取并被用于训练大模型。OpenAI 等 AI 公司正面临来自众多版权所有者的诉讼，通过与 Reddit 等公司达成协议，AI 公司正试图合法化其训练数据。

科技: AI 推动微软排放量增加近三分之一

微软在 2020 年承诺将到 2030 年实现负碳(carbon-negative)，但到了 2024 年微软报告因为 AI 的需求它的碳排放量增加了近三分之一，实现负碳的目标岌岌可危。微软总裁 Brad Smith 表示 2020 年制定目标时 AI 尚未大爆发。利用在新兴的生成式 AI 市场的早期领先优势，微软成为全世界市值最高的公司，同时也意味着加大对产生污染的资产的投资。生成式 AI 需要数据中心等耗电巨大的基础设施。微软计划从 2023 年 7 月到今年 6 月间投资逾 500 亿美元扩建数据中心，以满足 AI 不断增长的需求。而未来 12 个月的投资金额将会更庞大。微软总裁声称 AI 带来的好处将会超过其对环境的影响。微软的 AI 竞争对手 Google、Meta 和亚马逊的碳排放也都在增加。

科技: 华为否认其大模型演示造假

最近华为鲲鹏昇腾开发者大会的一次大模型演示中，出现了 python 代码 time.sleep(6)，其意思是程序睡眠 6 秒钟，因此华为的演示过程中被怀疑其实是事先做好的，并非实时执行。但仅仅凭借几行代码并不能证明整个演示过程是完全操纵的。华为在一份声明中否认了造假，声明称，“5 月 10 日，在鲲鹏昇腾开发者大会的一场技术讨论上，我们演示了 mxRAG SDK 功能。本次演示面向开发者，展示如何通过十几行代码即可完成 RAG 应用开发。现场图片为实时生成，调用的是开源大模型。代码中有 time.sleep(6) 等表述，是命令等待读取外部开源大模型实时生成的图片，并非调取预置图片。本次展示的均为真实代码，也将在昇腾社区上开放，欢迎开发者使用并提出宝贵建议。”它尚未公开代码。

科技: Google 发布了它的生成式 AI 视频模型 Veo

Google 在 I/O 开发者大会上宣布了它的生成式 AI 视频模型 Veo，能以不同视觉和电影风格生成长度超过 1 分钟的 1080p 分辨率视频。Google 称，Veo 具有自然语言的高级理解能力，能理解“延时拍摄（timelapse）”或“空中镜头（aerial shots of a landscape）”等电影术语，用户可用文本、图像或基于视频的提示导向他们想要的输出。Veo 的视频输出更一致和连贯，能展现人和物的更真实运动。类似 OpenAI 的 Sora，Veo 将首先提供给电影制作人和内容创作者试用。

科技: OpenAI 发布新的免费模型 GPT-4o

OpenAI 发布了最新的基础模型 GPT-4o，以及 ChatGPT 桌面应用。GPT-4o 提供给所有免费用户使用，支持输入文本、音频和图像的任意组合，能输出文本、音频和图像的任意组合。它能在最短 232 毫秒平均 320 毫秒的时间内响应音频输入，OpenAI 称这类似于人类对话的响应时间。它的英语文本和代码性能与 GPT-4 Turbo 接近，非英语文本性能也有显著提高，API 访问速度更快费用也降低了一半。模型能实时响应、检测情绪并相应的调整声音。

科技: IBM 开源 Granite 代码模型

IBM 开源了它用于辅助编程的 Granite 代码模型，源代码托管在 GitHub 上，采用 Apache License 2.0 许可证，允许商业使用。与其它 AI 模型不同的是，IBM 致力于避免模型的版权问题，使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型，可用于修 bug、解释代码和生成代码文档，使用了 116 种编程语言的代码进行训练，参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。

科技: 富士通等发布增强日语能力的大模型 Fugaku-LLM

日本东京工业大学、理化学研究所、富士通等发布增强日语能力的大模型 Fugaku-LLM，移植了 Megatron-DeepSpeed 深度学习框架，源代码托管在 GitHub 上，公众可通过 Fujitsu Research Portal 网站试用。Fugaku-LLM 有 130 亿参数，日语 MT-Bench 平均分 5.5，其人文和社会科学得分高达 9.18 分。Fugaku-LLM使用了日本最强大的 ARM 超算富岳进行了训练。

科技: Mozilla Llamafile 新版优化 AVX2 性能显著改进速度

Mozilla 创新实验组 Ocho 的一个创新产品是 Llamafile，它旨在简化大模型的部署，让用户和开发者更容易访问大模型。Llamafile 支持跨平台，支持 CPU 和 GPU 执行，其最新版本 v0.8.2 合并了多个 AVX2 优化补丁。AVX2 或 Advanced Vector Extensions 2 指令集扩展已被英特尔和 AMD 的 CPU 的广泛支持，新的优化包括了更快的 AVX2 提示处理，Q5_K_M 等量化方法的速度改进达到了之前的 1.4~2.3 倍。

科技: OpenAI 预计下周一发布 AI 驱动的搜索引擎

路透社援引两位知情人士的消息报道，OpenAI 预计将在 Google I/O 2024 前一天宣布其 AI 驱动的搜索引擎。Google I/O 2024 将在 5 月 14 日下周二举行，即下周一 OpenAI 将宣布它与搜索巨人竞争的产品。OpenAI 的搜索产品将是 ChatGPT 的扩展，能直接从 Web 拉取信息进行引用。ChatGPT 自 2022 年底诞生以来就被视为是搜索引擎的一个替代，虽然在提供精确和实时信息上还不如搜索引擎。

科技: OpenAI 考虑允许 ChatGPT 用户生成成人内容

OpenAI 考虑允许其聊天机器人 ChatGPT 和文本图像服务 DALL-E 的用户生成成人内容。OpenAI 称它考虑允许开发者和用户“负责任的”通过其产品创造 NSFW 内容，这将包括色情、极端血腥和脏话。OpenAI 是在最新公布的 Model Spec 文件中披露与 NSFW 内容相关的新讨论。起草文件的 OpenAI 员工 Joanne Jang 强调，深度伪造仍然是被禁止的。

科技: GitHub Copilot 真的能提高工作效率？

X11 合成器 picom 作者 Yuxuan Shui 免费使用了 GitHub Copilot 一年，最终决定放弃，认为它并不能提高工作效率，主要原因是其不可预测性和响应缓慢。他解释说，你无法判断 GitHub Copilot 何时会做好其辅助编程的工作。原因可能是他是在开发 X11 合成器，Copilot 缺乏相关项目代码的训练。如果是 Python 或 JavaScript 之类的流行语言，Copilot 预计会表现更好。另一个问题是 Copilot 的响应需要 2-3 秒才会显示，比 Clangd C 语言服务器的即时建议慢得多，即使它的建议没有帮助，它也不会影响其开发流程，Copilot 如果响应了大量代码，浪费的时间会更多。

科技: Google AlphaFold 3 能预测生物分子的结构和相互作用

每一个植物、动物和人类细胞内都有数以十亿计的分子机器。它们由蛋白质、DNA 等分子组成，它们不能单独发挥作用。只有理解了它们如何在数百万种可能组合中相互作用，我们才能真正理解生命的过程。Google DeepMind 和 Isomorphic Labs 的研究人员在《自然》期刊上发表论文，介绍了他们的最新 AI 模型 AlphaFold 3。AlphaFold 3 能以惊人的精度预测所有生命分子的结构和相互作用。对于蛋白质与其它分子类型的相互作用，AlphaFold 3 比现有方法至少提高了 50%。

科技: Stack Overflow 冻结抗议与 OpenAI 交易的用户账号

编程问答平台 Stack Overflow 本周与 OpenAI 达成了交易，将用户免费生成的内容货币化。反对这一交易的社区用户试图通过删除其发表的答案和问题进行抗议，但他们发现高赞的答案和问题无法删除，因为 Stack Overflow 认为这会删除集体知识。于是有用户修改了答案内容，将其转变为抗议信息。结果是 Mod 在一小时内恢复了原答案，将用户的账号冻结了 7 天。

科技: 微软报告称筋疲力尽的白领用 AI 减轻工作压力

微软和 LinkedIn 公布的报告称，筋疲力尽的白领用 AI 减轻工作压力。报告发现，四分之三的办公室职员已在工作中使用 AI，过去半年用 AI 的人数几乎翻倍。绝大多数人都是自己学着用，而不是等待公司指导他们使用。报告基于对 31 个国家 31000 名白领的调查，综合了 LinkedIn、Microsoft 365 以及财富 500 强公司的数据。近七成的受访者表示，他们挣扎于工作节奏和工作量，近半数的人感到精疲力尽。

科技: OpenAI 和 Stack Overflow 合作用该平台信息训练 ChatGPT

OpenAI 和编程问答平台 Stack Overflow 宣布建立合作关系，OpenAI 将用其平台上丰富的编程相关数据训练 ChatGPT 使用的大模型。但和 Reddit 等平台类似，Stack Overflow 上的内容都是由用户免费创造的，社区成员要求提供双方合作的更详细信息，但未收到有效回复。ChatGPT 训练使用的数据集显然包含了抓取自 Stack Overflow 的问题和答案，现在通过合作 OpenAI 可以直接通过 API 访问 Stack Overflow 的数据。

科技: 逾四万 AI 配音的有声读物涌入 Audible

亚马逊的有声读物平台 Audible 新加入了逾四万种 AI 配音的有声读物。对广大图书作者这是好事，但对人类专业配音者而言这是警钟。对于不想支付高额专业配音费但想要进入利润丰厚的有声读物市场的独立作家来说，亚马逊免费的虚拟旁白工具是游戏规则改变者。一位博主称，使用 AI 配音工具将电子书转换为有声读物只花了 52 分钟。一位叫 George Steffanos 的作者表示更喜欢人类作品而不是 AI 生成作品，但其作品的微薄销量负担不起聘请专业配音者的费用。HarperCollins 等出版商已与 AI 语音公司签署了协议利用 AI 制作有声读物。苹果公司去年也开始销售使用 AI 配音的有声读物，而 AI 使用的声音被认为是基于真实演员的表演，引起了这些演员的抗议。

科技: 微软新模型能与 Google 和 OpenAI 的最先进模型相抗衡

微软内部开发了一个新模型能与 Google、Anthropic 和 OpenAI 的最先进模型相抗衡。该模型内部被称为 MAI-1，由前 Google DeepMind 联合创始人 Mustafa Suleyman 负责，Suleyman 此前担任了 AI 创业公司 Inflection 的 CEO，微软在今年 3 月以 6.5 亿美元收购了其知识产权，雇佣了大部分员工。MAI-1 是微软的全新模型，不是继承自 Inflection，但可能使用了来自 Inflection 的训练数据和其它技术。知情人士称，MAI-1 的参数规模远大于微软此前发布的开源 AI 模型，需要更多的算力和训练数据，成本也更昂贵。MAI-1 将有大约 5000 亿个参数，可进行调整以决定模型在训练期间学习哪些内容。相比下，OpenAI 的 GPT-4 有逾万亿个参数， Meta 和 Mistral 等目前发布的开源模型只有 700 亿个参数。

科技: 愈来愈多的科学家使用 AI 撰写论文

对科学论文中特定单词使用频率的分析显示，愈来愈多的科学家使用 AI 撰写论文。伦敦大学学院 Andrew Gray 在 3 月发表的一项研究表明，2023 年发表的论文中有 1% 至少部分是由 AI 撰写的。斯坦福大学团队于 4 月发表的第二项研究称，这一数字可能在 6.3%-17.5% 之间，具体取决于论文主题。两项研究都是寻找论文中大模型常用的单词，如 intricate、pivotal 和 meticulously。在 Gray 的研究中，从 2019-2023 年，控制组的单词如 red、conclusion 和 after 的使用频率发生了几个百分点的变化，相比下 meticulous、commendable 和 intricate 等大模型常用词的使用频率分别增加了 59、83 和 117%，而在 2019-2022 年间它们的使用频率几乎没有变化。斯坦福大学的研究发现，realm、showcasing、intricate 和 pivota 单词的使用频率比 2021 年和 2022 年分别增加了 80%、80%、120% 和近 160%。研究表明，缺乏时间和写作的需求会鼓励使用大模型，大模型有助于增加研究者的论文数量。

上一页 25 26 27 28 293031 32 33 34 下一页

'; var end = '

'; _this.html(start + '

' + end); $.ajax({ type: "POST", url: "/user/userinfo", data: "user=" + $(this).attr('id'), success: function (data) { var data = eval("(" + data + ")"); var content = ''; if (data[0] == -2) { content += '

暂无个人简介

'; } else { content += '

' + data[0][0] + data[0][1] + '

'; content += '

关系：'; if (data[1] == -1) { content += '自己'; } else if (data[1][0] == 0) { content += '普通修改关系'; } else if (data[1][0] == 1) { content += '朋友修改关系'; } else if (data[1][0] == 2) { content += '敌人修改关系'; } content += "

"; if (data[2] != undefined) { content += '

签名：' + data[2] + '

'; } } _this.html(start + content + end); } }) } else _this.removeClass('hiden') }).mouseout(function () { $(this).children('div.user_box').addClass('hiden') })

关注我们：

Solidot 公告

投票

热门评论

快速链接

科技: Mozilla Firefox 支持英伟达的 RTX Video

科技: 北京互联网法庭准备审理首例 AI 视听作品侵权案

科技: Reddit 与 OpenAI 达成内容授权协议

科技: AI 推动微软排放量增加近三分之一

科技: 华为否认其大模型演示造假

科技: Google 发布了它的生成式 AI 视频模型 Veo

科技: OpenAI 发布新的免费模型 GPT-4o

科技: IBM 开源 Granite 代码模型

科技: 富士通等发布增强日语能力的大模型 Fugaku-LLM

科技: Mozilla Llamafile 新版优化 AVX2 性能显著改进速度

科技: OpenAI 预计下周一发布 AI 驱动的搜索引擎

科技: OpenAI 考虑允许 ChatGPT 用户生成成人内容

科技: GitHub Copilot 真的能提高工作效率？

科技: Google AlphaFold 3 能预测生物分子的结构和相互作用

科技: Stack Overflow 冻结抗议与 OpenAI 交易的用户账号

科技: 微软报告称筋疲力尽的白领用 AI 减轻工作压力

科技: OpenAI 和 Stack Overflow 合作用该平台信息训练 ChatGPT

科技: 逾四万 AI 配音的有声读物涌入 Audible

科技: 微软新模型能与 Google 和 OpenAI 的最先进模型相抗衡

科技: 愈来愈多的科学家使用 AI 撰写论文

关注我们：

Solidot 公告

投 票

热门评论

快速链接

科技: Mozilla Firefox 支持英伟达的 RTX Video

科技: 北京互联网法庭准备审理首例 AI 视听作品侵权案

科技: Reddit 与 OpenAI 达成内容授权协议

科技: AI 推动微软排放量增加近三分之一

科技: 华为否认其大模型演示造假

科技: Google 发布了它的生成式 AI 视频模型 Veo

科技: OpenAI 发布新的免费模型 GPT-4o

科技: IBM 开源 Granite 代码模型

科技: 富士通等发布增强日语能力的大模型 Fugaku-LLM

科技: Mozilla Llamafile 新版优化 AVX2 性能显著改进速度

科技: OpenAI 预计下周一发布 AI 驱动的搜索引擎

科技: OpenAI 考虑允许 ChatGPT 用户生成成人内容

科技: GitHub Copilot 真的能提高工作效率？

科技: Google AlphaFold 3 能预测生物分子的结构和相互作用

科技: Stack Overflow 冻结抗议与 OpenAI 交易的用户账号

科技: 微软报告称筋疲力尽的白领用 AI 减轻工作压力

科技: OpenAI 和 Stack Overflow 合作用该平台信息训练 ChatGPT

科技: 逾四万 AI 配音的有声读物涌入 Audible

科技: 微软新模型能与 Google 和 OpenAI 的最先进模型相抗衡

科技: 愈来愈多的科学家使用 AI 撰写论文

投票