奇客资讯网

solidot新版网站常见问题，请点击这里查看。

科技: 美国官员督促中俄承诺不用 AI 控制核武器

美国国务院军控局的首席副助理国务卿 Paul Dean 在一封声明中表示，美国、英国和法国都发表声明，承诺将核武器完全控制在人类而不是 AI 手中，欢迎中国和俄罗斯也发表类似的声明。他说，我们认为这是一种极重要的负责任行为规范，有五大常任理事国的支持会非常受欢迎。美国国务卿 Antony Blinken 上周访问了中国，讨论了核武器和 AI 相关问题。Blinken 称，双方同意未来几周就 AI 问题举行首次双边会谈。

科技: 苹果挖走 Google 员工组建 AI 团队

对数百份 LinkedIn 资料和 AI 论文作者的分析发现，搜索巨人是苹果 AI 专家的最大单一来源。苹果至少从 Google 挖走了 36 名 AI 专家，其中包括 2018 年雇佣 John Giannandrea 担任其 AI 团队负责人。Giannandrea 在 Google 工作了八年，领导了其 AI 研究部门。苹果 AI 团队的大部分成员在加州和西雅图工作，在收购了瑞士苏黎世的两家 AI 创业公司——FaceShift 和 Fashwell——之后，苹果在当地建立了一个被称为 Vision Lab 的实验室。苹果还为苏黎世的两处办公室招募雇员。竞争对手微软、Google 和亚马逊都在生成式 AI 上投资了数十亿美元，而苹果一直对其 AI 计划守口如瓶，但随着股价的下跌，该公司也面临越来越大的压力。业内人士称，苹果正专注于在移动设备上部署 AI 模型，让生成式 AI 应用在本地而不是依赖于云端运行。但在手机上运行大模型对硬件性能提出了更高的要求。

科技: 中国创业公司发布类似 Sora 的文本视频模型 Vidu

清华大学联合生数科技发布了 Sora 的文本视频生成模型 Vidu。该模型采用 Diffusion 与 Transformer 融合的架构 U-ViT，支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。Vidu不仅能模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。清华大学教授、生数科技首席科学家朱军表示，与 Sora一致，Vidu 能够根据提供的文本描述直接生成长达 16 秒的高质量视频。除了在时长方面的突破外，Vidu 在视频效果方面实现显著提升，主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。朱军表示，Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术 U-ViT 架构由团队于 2022 年 9 月提出，早于 Sora 采用的 DiT 架构，是全球首个 Diffusion 与Transformer 融合的架构，完全由团队自主研发。目前使用 Vidu 需要申请。

科技: 微软的 AI Explorer 将读取屏幕上的所有内容

微软 Windows 24H2 将包含名为 AI Explorer 的新工具。walkingdog 写道： AI Explorer 的更多功能细节已经流出：AI Explorer 依赖 Windows 设备的 NPU 在后台进行运行，AI Explorer 会理解屏幕上所有应用和画面产生的行为并将它们记录为“记忆”，这些记忆可通过后续的搜索来进行调用，AI Explorer 的大多数计算工作都是在本地进行。AI Explorer 通过记忆提供多种交互方式：AI 搜索和基于上下文的应用操作。通过 AI Explorer 搜索框搜索设备上的记忆，搜索功能完全支持自然语言。比如：找回几天前在网页上看到的有关某些动物的内容，只需要在搜索框中输入“给我展示几天前我在网页上看到的关于某个动物的页面内容”即可。AI Explorer 可以让不同应用之间的内容进行交互协同，比如：在屏幕上打开两份文档，让 AI Explorer 进行对比分析并草拟邮件给出分析结果；在浏览图片时 AI Explorer 会提示一些图片编辑操作（移除背景）等。基于上下文的应用操作不需要开发者专门适配，完全由 AI Explorer 通过理解和学习屏幕内容而给出操作建议。

科技: 校长被 AI 生成的种族主义言论陷害

Pikesville High School 前体育指导员 Dazhon Darien 周四被捕，被控多项罪名，其中之一是伪造了校长 Eric Eiswert 的声音，在社交媒体上发布了种族主义言论，导致了校长被停职。警方称，Darien 制作 AI 语音是为了报复校长，因为校长已对学校资金可能被不正确处理发起调查。他制作的语音模拟校长的声音贬低了黑人学生和犹太社区，该语音在社交媒体上广泛传播。校长被停职，社交媒体传播着一波又一波仇恨信息，学校收到了大量电话。Darien 被捕时正准备飞往休斯顿，他随身携带了武器。

科技: 如果 PC 未达到支持 AI 的硬件标准 Windows 11 将显示水印

Windows 11 的一个预览版本 Insider Build 26200 被发现包含了一个 AI 硬件规格检测工具 AI Explorer。如果你的 PC 硬件未达到标准，它将显示水印形式的警告。目前的 AI Explorer 针对的是 Windows 11 的 ARM64 版本，要求系统配备 NPU 以及 16 GB 内存和 225 GB 系统存储空间。x86 版本目前所知的是 Windows 11 24H2 强制性要求 CPU 必须支持 SSE4.2 指令集，而今天几乎所有 x86 CPU 都支持该指令集。

科技: 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B

阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称，Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美，在 Chat 评估中表现出色，包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似，采用了相同的Transformer 解码器架构。它包含了分组查询注意力（GQA），在模型推理时更加高效。该模型支持 32K tokens 的上下文长度，同时它仍然是多语言的，支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

科技: Adobe 新 AI 模型能让模糊视频变成高清视频

Adobe 研究人员发表了一篇预印本论文，介绍了一种新的生成式 AI 模型 VideoGigaGAN，它能让将视频分辨率提升到原始分辨率的八倍。研究人员称 VideoGigaGAN 优于其它视频超分辨率(Video Super Resolution 或 VSR)重建方法，能提供更细粒度的细节，不会引入任何 AI 制造的幻影。现有的 VSR 方法如 GAN（Generative Adversarial Networks）能有效提升静态图像的分辨率，但提升视频的分辨率则容易引入闪烁或伪影；其它 VSR 方法能避免这些问题，但清晰度或细节不够。VideoGigaGAN 能综合现有方法的长处，有更高的图像/视频质量，同时能减少闪烁或失真问题。

科技: 苹果发布可在本地运行的开放模型 OpenELM

苹果发布了它的开放模型 OpenELM，可以在本地设备而不是云端运行。OpenELM 的权重、训练的不同检查点（checkpoints）、预训练评估微调等的指南都公布在 Hugging Face 平台上。示例代码许可并不禁止商业使用或修改，只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM 由一组旨在高效执行文本生成任务的小模型组成，共八个模型，四个预训练四个指令微调，参数规模从 2.7 亿到 30 亿。

科技: 微软发布其轻量级模型 Phi-3

微软发布了其轻量级模型 Phi-3，其中最小版本 Phi-3 Mini 的权重已发布在 Hugging Face 上。Phi-3 有三个版本：Phi-3 Mini 有 38 亿参数，未来计划发布的 Phi-3 Small 有 70 亿参数，Phi-3 Medium 有 140 亿参数。微软高管称 Phi-3 Mini 的性能与 GPT-3.5 接近，但参数规模要小得多。相比参数规模更大的模型，小模型运行开销更低，在个人设备如手机和笔记本上表现更好。

科技: AI 需要大量的电以至于科技公司进入了能源行业

AI 需要消耗大量的电，以至于为满足电力需求科技公司进入了能源行业。OpenAI CEO Sam Altman 最近投资了用太阳能为数据中心供电的公司 Exowatt，OpenAI 的合作伙伴微软正寻求获得核能批准，以帮助运营 AI 服务。去年 AI 公司 Anthropic 的主要投资者亚马逊表示投资了逾 100 个可再生能源项目，使其“连续第四年成为全球最大的可再生能源企业买家”。

科技: Linus Torvalds 谈 AI 炒作

Linus Torvalds 与 Verizon Open Source Program Office 负责人 Dirk Hohndel 谈论了近期火热无比的 AI。Torvalds 讽刺的说，“看起来很搞笑！也许我会被 AI 模型取代！”Hohndel 认为今天的 AI 只是一种更强大的自动修正工具。Torvalds 认为需要再等十年才能知道 AI 会走向何处。Torvalds 已经注意到 AI 狂热对内核的影响——作为 AI 热的最大受益者英伟达公司，其开发者与内核开发者之间的沟通更频繁，该公司正在改进内核的内存管理，因为它需要 Linux 更高效的运行 AI 大模型。Torvalds 对 AI 产生的错误信息表达了谨慎，Hohndel 开玩笑的说这是美丽科学，“美丽科学进，美丽科学出。”

科技: 微软的 VASA-1 模型根据一张照片和一条音轨生成该人的说话视频

微软亚洲研究院发布了 VASA-1 模型，该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator，它使用了机器学习分析静态图像和音频片段，然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语，提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频，它潜在可用于深度伪造，研究人员没有公开模型源代码。

科技: 美国测试 AI 驾驶战斗机与人类飞行员缠斗

美国空军试飞院和 DARPA 宣称在机器学习上取得突破，它演示了 AI 软件控制的 F-16 战斗机能与人类飞行员展开近距离缠斗。演示是基于 X-62A VISTA，该试验机是修改版的 F-16 战斗机，集成了飞行模拟器，能让 AI 或者称为机器学习代理（ML-Agents）控制飞机。AI 首次驾驶 X-62A 是在 2022 年 12 月，2023 年 9 月 AI 驾驶的 X-62A 与人类驾驶的 F-16 进行了模拟空战。DARPA 认为，X-62A 团队的成就将被视为类似 AlphaGo Zero 对国际象棋、将棋和围棋的影响，作为军事和商业应用的自主驾驶验证。

科技: Meta 发布了 80 亿和 300 亿参数版本的 Llama 3

Meta 发布了 80 亿和 300 亿参数版本的 Llama 3 模型，有 4050 亿参数的版本还在训练之中，将在未来几个月发布，将支持多模和多种语言间的交流，以及更长的上下文窗口。Llama 3 是开放模型，源代码和权重托管在 GitHub 和 Hugging Face 上。Meta 还开放了它的 AI 聊天服务 Meta AI，类似 OpenAI 的 ChatGPT，访问 Meta.ai 也无需注册，但如果要保留聊天记录需要登陆。Meta AI 支持美国、澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦等国家和地区的用户访问，可能因为欧盟的法律限制该服务目前不对欧盟用户开放。

科技: 印度总理称 AI 帮助制定了国家 25 年计划

印度总理莫迪(Narendra Modi)接受该国亚洲国际新闻社（ANI）采访时表示利用 AI 制定了 25 年发展蓝图。他的团队收集了 150 万人的意见，然后用 AI 精炼和分类。莫迪正寻求连任，竞选第三个总理任期，预计会轻松获胜。他没有透露发展路线图的细节，表示会在大选之后实施。他领导的印度人民党周二公布了竞选宣言，承诺利用 AI 打击非法毒品贸易，改善交通管理。其中包括投资 12.4 亿美元支持 AI 发展，构建基础设施，建造至少有 1 万个 GPU 的超算，以及推动构建本土大模型，等等。

科技: 研究者澄清弱智吧语料训练效果最佳论

中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集，旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清，他们只使用了弱智吧的标题，没有使用用户评论，“因为我们的目标是构建符合大模型指令微调质量需求的数据，而贴吧中网友的评论通常不适合直接作为微调数据，因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释：“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’，的确为大模型提供了角度清奇的高质量指令。但是帖子的回答，却有很多冒犯性表述甚至事实性错误，许多回答就是抖机灵、玩梗的，而GPT-4的回答基本上都‘很正经’，经过人工筛选基本上能得到较为可靠的回答。”

科技: Mistral 宣布最新开放大模型 Mixtral 8x22B

法国 AI 创业公司 Mistral 宣布了其最新的开放大模型 Mixtral 8x22B，公布的测试显示它是目前最先进的开放模型。Mistral 称 8x22B 是真正开放的模型，使用 Apache 2.0 许可证，允许任何人不受限制的使用。它是一种稀疏 Mixture-of-Experts (SMoE)模型，有 1410 亿参数，但活跃参数仅为 390 亿，在其规模下提供了无与伦比的成本效率。Mixtral 8x22B 的优点包括：精通英语、法语、意大利语、德语和西班牙语，具有强大的数学和编码能力，原生能函数调用，64K 令牌上下文窗口。

科技: 微软亚洲研究院开源然后移除了新 AI 模型

微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B，权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说，原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示，微软的 AI 政策要求，在发布任何 AI 模型前，必须首先获得公司委员会 Deployment Safety Board 的批准，该委员会将测试模型是否能执行有害任务，如生成暴力或令人不安的内容。WizardLM-2-7B 模型能完成文本生成、代码建议、翻译不同语言，或解决数学问题等任务。

科技: 李彦宏声称开源大模型更昂贵

今天流行的开源大模型主要由 Meta 和 Google 之类的巨头发布，而 OpenAI 等则转向了闭源，此外中国很多 AI 公司的大模型是在 Meta 的 Llama 开源模型基础上开发的。在深圳举行的 Create 2024 百度 AI 开发者大会上，百度 CEO 李彦宏站在了 OpenAI 闭源这边。他认为，开发者通过文心 4.0 降维裁剪出来的更小尺寸模型，要比直接拿开源模型调出来的模型，同等尺寸下效果明显更好；同等效果下，成本明显更低。“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后。”但开源模型一直在发展中，并非停滞不前。

上一页 26 27 28 29 303132 33 34 35 下一页

'; var end = '

'; _this.html(start + '

' + end); $.ajax({ type: "POST", url: "/user/userinfo", data: "user=" + $(this).attr('id'), success: function (data) { var data = eval("(" + data + ")"); var content = ''; if (data[0] == -2) { content += '

暂无个人简介

'; } else { content += '

' + data[0][0] + data[0][1] + '

'; content += '

关系：'; if (data[1] == -1) { content += '自己'; } else if (data[1][0] == 0) { content += '普通修改关系'; } else if (data[1][0] == 1) { content += '朋友修改关系'; } else if (data[1][0] == 2) { content += '敌人修改关系'; } content += "

"; if (data[2] != undefined) { content += '

签名：' + data[2] + '

'; } } _this.html(start + content + end); } }) } else _this.removeClass('hiden') }).mouseout(function () { $(this).children('div.user_box').addClass('hiden') })

关注我们：

Solidot 公告

投票

热门评论

快速链接

科技: 美国官员督促中俄承诺不用 AI 控制核武器

科技: 苹果挖走 Google 员工组建 AI 团队

科技: 中国创业公司发布类似 Sora 的文本视频模型 Vidu

科技: 微软的 AI Explorer 将读取屏幕上的所有内容

科技: 校长被 AI 生成的种族主义言论陷害

科技: 如果 PC 未达到支持 AI 的硬件标准 Windows 11 将显示水印

科技: 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B

科技: Adobe 新 AI 模型能让模糊视频变成高清视频

科技: 苹果发布可在本地运行的开放模型 OpenELM

科技: 微软发布其轻量级模型 Phi-3

科技: AI 需要大量的电以至于科技公司进入了能源行业

科技: Linus Torvalds 谈 AI 炒作

科技: 微软的 VASA-1 模型根据一张照片和一条音轨生成该人的说话视频

科技: 美国测试 AI 驾驶战斗机与人类飞行员缠斗

科技: Meta 发布了 80 亿和 300 亿参数版本的 Llama 3

科技: 印度总理称 AI 帮助制定了国家 25 年计划

科技: 研究者澄清弱智吧语料训练效果最佳论

科技: Mistral 宣布最新开放大模型 Mixtral 8x22B

科技: 微软亚洲研究院开源然后移除了新 AI 模型

科技: 李彦宏声称开源大模型更昂贵

关注我们：

Solidot 公告

投 票

热门评论

快速链接

科技: 美国官员督促中俄承诺不用 AI 控制核武器

科技: 苹果挖走 Google 员工组建 AI 团队

科技: 中国创业公司发布类似 Sora 的文本视频模型 Vidu

科技: 微软的 AI Explorer 将读取屏幕上的所有内容

科技: 校长被 AI 生成的种族主义言论陷害

科技: 如果 PC 未达到支持 AI 的硬件标准 Windows 11 将显示水印

科技: 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B

科技: Adobe 新 AI 模型能让模糊视频变成高清视频

科技: 苹果发布可在本地运行的开放模型 OpenELM

科技: 微软发布其轻量级模型 Phi-3

科技: AI 需要大量的电以至于科技公司进入了能源行业

科技: Linus Torvalds 谈 AI 炒作

科技: 微软的 VASA-1 模型根据一张照片和一条音轨生成该人的说话视频

科技: 美国测试 AI 驾驶战斗机与人类飞行员缠斗

科技: Meta 发布了 80 亿和 300 亿参数版本的 Llama 3

科技: 印度总理称 AI 帮助制定了国家 25 年计划

科技: 研究者澄清弱智吧语料训练效果最佳论

科技: Mistral 宣布最新开放大模型 Mixtral 8x22B

科技: 微软亚洲研究院开源然后移除了新 AI 模型

科技: 李彦宏声称开源大模型更昂贵

投票