文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
随着大模型的日益普及,批判性地检查其固有的局限性也日益重要。幻觉是大模型最常见的问题之一,我们是否可能通过改进大模型去减少或阻止幻觉的产生?United We Care 的三名研究人员在预印本平台 arXiv 上发表研究报告,他们从数学上证明,幻觉是不可避免地,也是不可能消除的。幻觉源自大模型的数学和逻辑结构,不可能通过改进架构、增强数据集或事实核查机制消除。根据哥德尔的第一不完备定理,研究人员证明大模型的每一个阶段,从训练数据搜集到事实检索、意图分类和文本生成,每个阶段产生幻觉的几率都不是零。
Google 开始向所有 Android 用户免费提供 AI 语音聊天功能 Gemini Live。用户需要下载 Gemini 移动应用,需要有个人 Google 账号,现阶段不会提供给用工作或教育账号登录的用户,年龄需要 18 岁以上,第一语言需要是英语。Google 表示,利用 Gemini Live 用户可以大声提问,可以在 AI 回应时打断其回答。OpenAI 此前在发布 GPT-4o 时也推出了语音聊天,但只提供给少数用户,专家猜测可能是语音聊天需要的计算资源太多。
AMD 高级副总裁兼计算图形业务组总经理 Jack Huynh 在接受采访时谈论了该公司下一代上采样技术 FidelityFX Super Resolution 4.0(或 FSR4)将是完全由 AI 驱动,类似英伟达的 DLSS。Jack Huynh 以掌机华硕 ROG Ally 或联想 Legion Go 为例说,这些掌机的最大问题是电池续航时间过短,你想要玩 3 个小时的悟空,但电池只够你玩不到一个小时,帧生成和帧插值技术有助于延长电池续航时间。FSR 上采样技术此前的版本如 FSR2 和 FSR3 是基于分析和过滤器,下一代将是完全基于 AI,AMD 工程团队已在该项目上投入了近一年时间。AMD 的首要目标是最大程度的提高电池续航。
一项研究发现,与训练有素的 AI 聊天机器人进行对话有助于减少阴谋论信仰。研究调查了 GPT-4 Turbo 等大模型 (LLM) 是否能利用其巨大的信息获取能力以及使用直接针对相信者提出的对具体证据的定制反驳来有效地揭穿阴谋论。在一系列涵盖 2190 名相信阴谋论者的实验中,参与者与 LLM 进行了几次个性化互动,分享了他们的阴谋论信仰以及他们认为的支持这些信仰的证据。LLM 也会类似地通过定制的、事实的和基于证据的反驳直接驳斥这些说法。一位受雇评估 GPT-4 Turbo 所作声明准确性的专业事实核查员报告说,在这些声明中,99.2% 被评为“真实”,0.8% 被评为“误导”,0 被评为“虚假”;并且没有发现任何声明包含自由派或保守派偏见。研究人员发现,由 AI 驱动的对话能使参与者的被误导的信念平均减少 20%。这种效应持续了至少 2 个月,并且在各种不相关的阴谋论以及各个人口统计类别中均被观察到。这些发现挑战了这样一种观念,即某人一旦采信了阴谋论,证据和论据就无效了。他们还质疑了社会-心理学理论,该理论将心理需求和动机作为阴谋论信念的主要驱动因素。
OpenAI 发布了新 AI 模型 o1。其中 o 代表 Orion,o1 是 OpenAI 下一代推理模型中的第一个,它比旧模型更擅长推理,价格也更贵,速度也更慢。ChatGPT Plus 和团队用户即日起便可以访问 o1 预览版和 o1-mini,而企业和教育用户将在下周初获得访问权限。OpenAI 表示,它计划让 ChatGPT 的所有免费用户都能访问 o1-mini,但尚未确定发布日期。对开发者来说,访问 o1 的成本比之前要高出很多:通过 API 使用 o1 预览版,输入每百万 token 要收费 15 美元,输出每百万收费 60 美元。相比之下,GPT-4o 的百万 token 输入收费只有 5 美元,输出为 15 美元。OpenAI 没有透露 o1 太多细节。
Google 联合创始人和前 Alphabet 总裁 Sergey Brin 在 All-In Summit of AI 上首次公开确认,他几乎每天都会回 Google 总部工作,因为他对 AI 最近取得的进展非常兴奋,不想要错过。Brin 称 AI 是一个快速发展的庞大领域,能为人类带来巨大的价值。他还认为训练更强大的 AI 模型并不需要相应的更大规模的算力,过去几年 AI 算法的改进所带来的进步超过了投入到 AI 模型的算力的增长幅度。
法国 AI 创业公司 Mistral AI 发布了其首个多模模型 Pixtral 12B,具有语言和视觉处理能力,它能识别图像但不能生成图像。用户可通过 Hugging Face 和 GitHub 访问其源代码,源码采用 Apache 2.0 许可,用户可以不受限制的下载、微调和使用。Pixtral 12B 有 120 亿参数,模型大小 24GB。它是基于文本模型 Nemo 12B,应该能执行为图像添加文字描述和计算照片中物体数量等任务。Mistral 没有披露使用了哪些图像去训练模型。
《金融时报》报道,英伟达 AI 芯片在中国的租赁费用比美国便宜。一台基本配置为 6 个英伟达 A100 芯片的服务器,四家小型云提供商收取的费用为每小时约 6 美元,相比下美国小型云提供商是每小时 10 美元。业内人士表示这表明中国的英伟达芯片供应充足。美国在 2022 年秋季开始禁止英伟达向中国出口 A100 芯片,从未允许出口 H100 芯片。但业内人士表示 A100 和 H100 在中国社交媒体和电商平台上都能公开出售,价格略高于国外价格。阿里巴巴和字节跳动等大型云服务商对 A100 的租赁价格 2-4 倍于小型云服务商,折扣后的套餐价格与亚马逊 AWS 的价格相当,AWS 的收费为每小时 15-32 美元。一家中国创业公司创始人表示,大型公司需要考虑合规性,不能使用走私芯片,小型服务商则没有这么多顾虑。他估计中国境内有逾 10 万块 H100 芯片。一家小型云服务商负责人表示,国内的低成本可以抵消为购买走私芯片而支付的高价,他说工程师便宜,电力便宜,竞争激烈。
提供呼叫中心服务的 Alorica 推出了一款 AI 翻译工具,让公司员工能用 200 种不同语言与客户交谈。Alorica 不会裁员,它还在积极招聘。Alorica 等公司的经验表明,AI 不会成为人类的职业“杀手”,导致大规模失业。AI 可能会像蒸汽机、电力、互联网等技术突破一样,在消除部分工作的同时创造新的工作,使得人类的工作总体上效率更高,让工人、雇主和经济都从中受益。人们曾经以为,AI 聊天机器人将会取代客服,但这种情况目前并没有发生,可能永远也不会发生。白宫经济顾问委员会上月表示,他们发现几乎没有证据表明 AI 会对整体就业情况产生负面影响。目前科技行业的大规模裁员与 AI 几乎没有关联,科技巨头不是因为 AI 会节省资金或导致工作岗位不再需要而裁员的。
The Information 援引知情人士的消息报道,OpenAI 高管考虑对高级语言模型提供高级订阅服务,月费最高可能高达 2000 美元。OpenAI 的 ChatGPT 运营成本高昂,此举反映了支付大模型运营成本的担忧日益加剧。ChatGPT 目前的月订阅费为 20 美元,OpenAI 每年的订阅收入大约 20 亿美元。更先进的模型如专注于推理的 Strawberry 以及 Orion 可能需要额外的算力,可能会增加开支。
大模型能比人类更快的概述一篇长文,因此很多用户和企业尝试用它去概述冗长的文档以方便阅读。澳大利亚证券和投资委员会(ASIC)对此展开了研究,他们测试了开源大模型 Llama2-70B,发现它提供的概述相比人类提供的差很多。Llama2-70B 不是目前最先进的大模型,这一结果不太能够推广到最先进大模型的概述能力。尽管如此,研究表明,大型组织在将大模型的输出集成到现有工作流前需要三思。ASIC 发现,大模型生成的概述太笼统,还常常包含不正确的信息,语法正确,但幻觉无法避免。对比测试发现,AI 的平均得分为 7/15,而人类是 12.2/15。
Google 高管 James Manyika 警告,尽管预测 AI 的经济潜力高达万亿美元,但它未必能提升生产力。Manyika 是 Google 负责研究、科技和社会的高级副总裁,他指出生成式 AI 对生产力的提升是难以保证的,需要大量的工作。AI 聊天机器人可能会变得随处可见,但它没有从根本上改变经济。用生成式 AI 起草代码是不够的,美国科技行业的工人只占总劳动力的 4%,即使他们所有人都用 AI,从生产力的角度看也是无关紧要的。要改变生产力需要劳动力密集的行业如如医疗保健和零售业普及 AI。而护士和医生等职业都不可能被 AI 取代,最多能提供协助。
OpenAI 透露 ChatGPT 周活跃用户突破了 2 亿,两倍于去年的数字。OpenAI 表示,92% 的财富 500 强企业在使用其产品,自 7 月发布 GPT-4o mini 以来,自动化的 API 使用量翻倍。CEO Sam Altman 在一份声明中表示,该公司的工具已成为日常生活的一部分,在医疗保健和教育等领域发挥着真正的作用。
大韩商工会议所和产业研究院发布的一份调查结果显示,韩企的 AI 使用率仅为30.6%。它本月初调查了 500 家韩企。结果显示,“为提高企业生产能力并降低成本需要 AI 技术”的企业占 78.4%,但实际使用 AI 技术的企业仅占 30.6%。制造业的 AI 使用率为 23.8%,金融业 57.1%,信息技术(IT)55.1%。按企业规模看,大企业 48.8%,中坚企业 30.1%,中小企业 28.7%,企业规模和 AI 使用率成正比。
今年 2 月,由于生成了不符合历史事实的人类图像而引发争议,Google 暂停了生成人类图像的功能。时隔半年之后,Google 官方博客宣布其 Imagen 3 模型将在未来几天向 Gemini Advanced、Business 和 Enterprise 用户提供人类图像生成功能。为避免生成受争议图像,Imagen 3 包含了安全保护措施,不支持生成照片级写实主义图像、可识别个人、描述未成年人或过度血腥、暴力或性爱场景的图像。举例来说,Google AI 会拒绝“拜登总统打篮球”之类图像生成要求。
2022 年 11 月,OpenAI 公司推出 ChatGPT,这款 AI 工具,能通过学习和理解人类的语言来进行对话,并且有很强的自然语言生成能力。近两年,国内的 AI 通用大模型例如文心一言、通义千问、Kimi 等也陆续进入市场。AI 离日常生活越来越近,不可避免地入侵到毕业论文。2024 届毕业生,也成为第一波在论文中大规模使用 AI 的群体。一名大学生称,不管是课程论文还是毕业论文,使用 AI 几乎成了学校里「公开的秘密」。高校教师们也逐渐感受到了 AI 的入侵。在社交媒体上,一边是学生们的使用攻略,另一边也不乏老师们的观察。中国政法大学人文学院的老师王敬雅发现,由 AI 生成的论文最大的特点,就是容易出现「假大空的车轱辘话」,给出一个论点,得到三个分论点;拿其中的分论点追问,再次得到三个分论点。但往往没有什么研究意义。王敬雅平时和同事们交流时,大家还提起,如今马克思主义学院成了 AI 的「重灾区」,其他专业的作业、论文也同样,越是标准化、程式化的内容,学生越容易用 AI 替代完成。
数学软件 Mathematica 的作者、计算知识引擎 Wolfram Alpha 的创始人、数学家和计算机科学家 Stephen Wolfram 认为需要哲学家参与 AI 相关重要问题的讨论。他的母亲是牛津大学的哲学教授。Wolfram 年轻时对哲学这一主题兴趣缺乏,但年长的他认为哲学的严谨性对 AI 研究越来越重要。他举例说,当开始讨论给 AI 设置护栏时,这个问题本质上就是一个哲学问题。当科技行业的人说要给 AI 设置这个或那个,让 AI 做正确的事情。但什么是正确的事?这是一项决定道德选择的问题,是哲学练习之一。他说,科学家通常难以用哲学术语思考问题,因为科学是一种渐进发展的领域,不会遇到需要用完全不同的思考方法。如果哲学主要用于回答存在主义的重大问题,那么随着 AI 的影响日益深远我们将迎来哲学的黄金时代。我们面临的很多 AI 问题事实上都曾是传统哲学论的核心问题。Wolfram 认为哲学家可能比科学家更有能力应对 AI 带来的范式转变。
尽管美国的制裁旨在限制中国在 AI 上取得进展,但中国科技巨头今年在 AI 基础设施上大举投资,资本支出翻了一番。阿里巴巴、腾讯和百度今年上半年合计资本支出 500 亿元人民币,而去年同期为 230 亿元人民币。这几家集团表示,支出重点是购买处理器和基础设施,为 AI 的大型语言模型训练提供支持,包括它们自己的模型和其他公司的模型。TikTok 母公司字节跳动也增加了 AI 支出,它是非上市公司,不受投资者审查,拥有逾 500 亿美元现金储备。阿里巴巴上半年资本支出 230 亿元人民币,比去年同期增长 123%。尽管美国限制向中国出售最先进的 AI 芯片,但中国科技公司正大量采购允许出口的芯片如英伟达的 H20。英伟达未来几个月将向中国公司出口逾百万个价格在 1.2-1.3 万美元的 AI 芯片,它主要的客户是字节跳动。字节跳动除了购买 H20 用于中国的数据中心,还在马来西亚的 Johor 与合作伙伴建造数据中心。腾讯今年上半年资本支出 230 亿元人民币,同比增长 176%。百度的 AI 支出相当克制,它上半年支出 42 亿元人民币,同比增长 4%。
咨询公司 Gartner 警告,AGI 至少需要 10 年才可能实现,可能永远无法实现,甚至不值得去追求。AGI 是过去几年的热门主题,OpenAI 等大模型构建者大胆宣称已经建立了一条通往类人智能的道路。但认知科学领域的专家对此不以为然,认为大模型所采用的方法是不充分的。Gartner 认为 GenAI 即将迎来幻灭期,人们对它的期望过高,但现实远远达不到这一期望,至少短期内不可能实现。道路将会是曲折的。生成式 AI 不会消失,但投资的热情将会削弱,AI 专家认为一个重大挑战是生成式 AI 的“幻觉”问题缺乏强有力的解决方案。
愈来愈多的投资者担心 AI 并不能带来他们所寻求的巨额利润。过去几周,驱动 AI 革命的几家西方公司的股价下跌了 15%。观察家们开始质疑大模型的局限性。大型科技公司已在 AI 上投入了数百亿美元,并承诺未来会投入更多。数据显示,只有 4.8% 的美国公司在产品和服务中使用 AI,相比下年初这一比例高达 5.4%。AI 会改变世界还是今天的 AI 狂热只是昙花一现,目前还难以判断。科技巨头们面临的一大挑战是证明 AI 能帮助实体经济。今天的 AI 热也许“来的容易去的也快”。