您当前位置: 首页 - 科技资讯 - OpenAI定义通用人工智能五大阶梯,自评即将迈入“推理者”第二阶段

OpenAI定义通用人工智能五大阶梯,自评即将迈入“推理者”第二阶段

文章来源:互联网 作者:肉团资源网 发布时间:2025-01-02 14:25:38

7月12日消息,全球瞩目的人工智能研究公司OpenAI,今日在其内部会议中分享了一项重要成果——AI进化五阶段标准体系。这套标准旨在科学界定人工智能的发展阶段,以量化方式展现AI技术向通用智能迈进的进程。

OpenAI定义通用人工智能五大阶梯,自评即将迈入“推理者”第二阶段

通用人工智能(AGI、Artificial General Intelligence),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。

附 OpenAI 提出的等级标准:

第一级:聊天机器人,具有会话语言的人工智能

第二级:推理者,解决人类水平问题的人工智能

第三级:代理,能够代表用户采取行动的人工智能

第四级:创新者,能够帮助发明的人工智能

第五级:组织者,能够完成组织工作的人工智能

据介绍,OpenAI 一直致力于构建 AGI,目前此类系统尚不存在。OpenAI 首席执行官 Sam Altman 曾表示,预计 2030 年之前可以实现 AGI。

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

据悉,全球知名的人工智能研究实验室OpenAI已与半导体巨头博通达成深度合作,双方正全力投入到首款AI芯片的开发项目之中。与此同时,手机行业也有新动态,雷军针对小米15的价格发声,直言其“高价自有其因”。

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

放弃7万亿芯片帝国梦?OpenAI计划“缩水”,携手博通开发首款AI芯片

今年2月,OpenAI CEO Sam Altman筹资7万亿美元打造芯片帝国的消息震惊全球。最近的消息显示,OpenAI选择了一条更务实的路,先拉来合作伙伴做一款自有芯片,而不是建立一个芯片工厂网络。报道称,鉴于建立芯片工厂网络所需的成本和时间,OpenAI目前已放弃雄心勃勃的芯片工厂计划,转而计划专注于内部芯片设计工作。(全天候科技)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

小米15起售价比上一代贵了200-500元 雷军称“贵得有理由”

小米15系列发布,起售价较上一代贵200-500元,原因包括上游供应链成本上涨和研发投入增加。小米集团创始人雷军强调,小米15依旧物超所值,涨价有理由。小米15搭载骁龙8 Elite芯片和小米澎湃OS 2系统,全系取消8GB版本,内存12GB起步,强调AI能力提升和系统融合。小米积极争夺高端市场,希望在苹果市占率下滑的背景下扩大份额。(腾讯新闻深网)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

消息称标准版iPhone 17首次在印度研发,高端机型仍在中国进行

苹果计划首次在印度工厂进行iPhone 17标准版的前期研发制造,展示其在供应链多元化方面的新进展,并对印度工程师团队充满信心。尽管印度工厂的不良率高于中国,但随着需求增长,苹果在印度市场收入大幅提升。(腾讯科技)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

马斯克:脑机接口植入总体费用将在5000美元左右,手术仅10分钟

马斯克表示,Neuralink脑机接口设备有望量产后价格降低至1000至2000美元,与智能手机相近,通过自动化手术,预计总费用在5000美元。他强调脑机接口可通过修复大脑电路解决多数疾病,计划2026年完成1000例临床试验。(澎湃新闻)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

神舟十九号载人飞船发射成功

据央视新闻消息,2024年10月30日04时27分,长征二号F运载火箭搭载神舟十九号载人飞船顺利升空并取得圆满成功,发射地点位于我国酒泉卫星发射中心。神舟十九号载人飞行任务是我国载人航天工程的第14次载人飞行任务。(腾讯太空)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

Grok图像理解功能上线,单挑ChatGPT结果惊人!无地标照片秒定位

Grok被马斯克官宣具图像理解功能,引各界讨论。虽解笑话能力欠佳,但在推测照片拍摄地等任务表现优异。然与ChatGPT差距仍存,用户期待其功能改进。(新智元)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney

“red_panda”神秘模型登顶文生图竞技场,引发广泛猜测。其生成效果优异,胜率高达79%。网友对其来源众说纷纭,猜测包括Midjourney V7、中杯Stable Diffusion 3.5、甚至OpenAI的DALL-E 4,以及中国厂商的可能性。目前,red_panda仍占据榜首,备受关注。(量子位)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

狂揽资本!马斯克xAI寻求400亿估值 成立至今不到16个月

据媒体报道,知情人士透露,埃隆·马斯克的人工智能初创企业xAI正在寻求新一轮融资,融资后公司估值将达到约400亿美元。这位消息人士表示,融资谈判尚处于初期阶段,细节仍有可能发生变化,并存在谈判破裂的可能性。(科创板日报)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

OpenAI最新数据公布:ChatGPT周活2.5亿,收入75%来自订阅用户

OpenAI首席财务官Sarah Friar表示,ChatGPT周活跃用户达2.5亿,付费转化率5%-6%。公司75%业务由用户订阅构成,企业版付费用户突破100万。尽管收入增加,AI系统运营支出也大。OpenAI完成66亿美元融资,流动资金超100亿美元,致力于保持技术前沿。(华尔街见闻)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

台积电:高雄厂建设工程进展良好,2nm将于2025年如期量产

台积电高雄厂首座2nm厂即将完工,预计11月26日举行进机典礼,12月1日起展开装机。高雄厂将使用100%再生水生产,2nm制程研发进展顺利,将于2025年量产。P1厂最快明年Q2试产,预计吸引苹果等客户。(IT之家)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

AI动力十足!谷歌三季度云收入劲增35%,总营收意外提速,盘后涨超6%

美东时间10月29日周二美股盘后,Alphabet公布截至2024年9月30日的公司第三财季(下称三季度)财务数据,各主要业务收入全线超预期增长,包括二季度拖后腿的YouTube广告,人工智能(AI)技术应用对云业务的推动更是超出华尔街预期,助谷歌云收入更迅猛增长,增速超过30%。(全天候科技)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

时隔13年再合作:京东商城目前已开通支付宝支付

支付宝确认京东商城开通支付宝支付,两家公司时隔13年再度合作。支付宝将持续开放,与不同平台探索合作,互联网大厂间“拆墙”动作频繁。(澎湃新闻)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

微软炮轰谷歌:采用不正当手段打击微软

微软指责谷歌利用不正当手段打击其云服务,称谷歌游说全球监管机构对微软和AWS施加限制。谷歌回应称,微软的反竞争行为影响网络安全和创新。(第一财经)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

中国移动内部人士回应裁员超过10%传闻:消息不实

中国移动澄清裁员传闻不实,并发布2024年第三季度财报。前三季度营收7915亿元,同比增长2%,净利润1109亿元,净利润率14%。移动客户达10.04亿,其中5G客户5.39亿。资本开支将控制在1730亿元以内并持续下降。(手机中国)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

2024胡润百富榜发布:张一鸣成为中国首富,宗馥莉为中国女首富

胡润研究院发布《2024胡润百富榜》,上榜企业家数量和总财富均减少。字节跳动张一鸣成首位“80后”中国首富,农夫山泉钟睒睒退居第二。女企业家比例下降,宗馥莉成女首富。(界面新闻)

每日科技早报|据悉OpenAI携手博通全力开发首枚AI芯片,雷军表态小米15“高价自有其因”

OpenAI O3 AI模型推理大跨越背后:成本急剧膨胀,“没钱”根本玩不起

12月24日消息,科技媒体发表了一篇博文,对OpenAI的o3模型进行了深入探讨。文章指出,尽管o3模型在ARC - AGI等测试中表现耀眼,成绩斐然,但该模型背后所隐藏的高昂计算成本,却如同一个难以逾越的鸿沟,这使得它在短期内想要在实际应用场景中广泛普及变得极为困难。

OpenAI O3 AI模型推理大跨越背后:成本急剧膨胀,“没钱”根本玩不起

o3 性能

o3 的新功能之一是可以调整推理时间,分为低、中、高三种计算级别,计算级别越高,o3 的任务执行性能越好。

而 o3 是 OpenAI 是迈向该目标的重要一步,在 ARC-AGI 基准测试中,o3 在高计算设置下获得了 87.5% 的分数,在低计算设置下得分为 75.7%,性能是 o1 的三倍。

在 EpochAI 的 Frontier Math 基准测试中,o3 解决了 25.2% 的问题(其他模型均不超过 2%),创造了新纪录。

o3 模型成本过高

ARC-AGI 基准测试的创建者 François Chollet 在博文中写道,OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破,但成本着实太高。

根据 ARC-AGI 测试的性能图标,o3 的高分版本每项任务都使用了价值超过 1000 美元(当前约 7303 元人民币)的计算资源,o1 模型每个任务使用约 5 美元的计算资源,而 o1-mini 仅使用几美分。

这意味着 OpenAI 虽然获得了将近 88% 的高分,但却消耗了 170 多倍的计算资源,而高计算版本 o3 整个测试下来,调用资源成本超过 1 万美元(当前约 73033 元人民币),只有财力雄厚的机构和个人才能负担得起 o3 模型的使用成本。

o3 模型的高计算成本使其更适合处理复杂问题,例如长期战略决策,而非日常小问题;更高效的 AI 推理芯片和更具成本效益的 AI 芯片可能是未来降低 o3 模型使用成本的关键。

OpenAI发布SimpleQA开源新基准,针对性解决大模型生成不准确问题

10月31日消息,OpenAI 宣布于当地时间 30 日推出一个名为 SimpleQA 的新基准工具,并计划将其开源。这一工具旨在评估语言模型在回答简短的事实性问题时的准确性。

OpenAI发布SimpleQA开源新基准,针对性解决大模型生成不准确问题

AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。能够生成更准确、更少幻觉的回答的语言模型更为可靠,可以用于更广泛的应用领域。

OpenAI 表示,目标是使用 SimpleQA 创建一个具备以下特点的数据集:

高正确性:问题的参考答案由两名独立的 AI 训练师验证,以确保评分的公正性。

多样性:SimpleQA 涵盖广泛主题,从科学技术到电视节目与电子游戏应有尽有。

前沿挑战性:与 TriviaQA(2017 年)或 NQ(2019 年)等早期基准相比,SimpleQA 更具挑战性,尤其针对如 GPT-4o 等前沿模型(例如,GPT-4o 的得分不足 40%)。

高效用户体验:SimpleQA 问题与答案简洁明了,使操作快速高效,并可通过 OpenAI API 等进行快速评分。此外,包含 4326 道问题的 SimpleQA 在评估中应具有较低的方差。

SimpleQA 将是一个简单但具有挑战性的基准,用于评估前沿模型的事实准确性。SimpleQA 的主要限制在于其范围 —— 尽管 SimpleQA 准确,但它只在短查询的受限设置中测量事实准确性,这些查询是事实导向的,并且有一个可验证的答案。

OpenAI 表示,模型在短回答中表现出的事实性是否与其在长篇、多事实内容中的表现相关,这仍是个悬而未决的研究课题。其希望 SimpleQA 的开源能够进一步推动 AI 研究的发展,使模型更加可信并富有可靠性。

复制本文链接 攻略文章为肉团资源网所有,未经允许不得转载。