·

让球盘

让球盘

滚球app官网下载 公开版Mythos上线, Claude最强模子开动分层发售

发布日期:2026-06-11 17:08 来源:未知 作者:admin 浏览次数:

滚球app官网下载 公开版Mythos上线, Claude最强模子开动分层发售

Anthropic终于把Mythos推向了公开市集,但分层发售。

凌晨,Anthropic精良发布Claude Fable 5和Claude Mythos 5。前者面向普通用户绽开,后者则不时死心在“受信任的安全引诱伙伴”范围内。

新模子的定名不错说很相宜Claude一贯的立场。

从Haiku(俳句)到Sonnet(十四行诗)再到Opus(艺术巨著),Anthropic一直在用文体和艺术见解给模子分层,到了Mythos,名字如故从文体作品推广到“传说”本人。

Fable来自拉丁语fabula,艳羡是“被阐扬之物”,和希腊语mythos同源,直译过来的话一般被称为“寓言”。这个名字正如新模子的定位,一个“Mythos级”的模子,一个“公开的传说”。

按照Anthropic的描摹,Fable 5和Mythos 5分享归拢个底层模子,仅仅被装进了更妥贴公开分发的安全壳里。在官方给出的模子才略上,它们两个被放在归拢个位置。

但跑分归跑分,淌若Fable和Mythos的推崇实足一样,我念念应该也毋庸分红两个名字了。

01

被改写的“传说”

传说被改写、被压缩、被加上资历之后,造成了寓言。

按照官方文档,Fable 5是公开版块。它面向普通用户和开采者绽开,但在相聚安全、生物、化学以及模子蒸馏等高风险领域,会由特等的安全分类器介入。一朝系统判断肯求可能触及这些敏锐场合,回话就不会由Fable 5不时完成,而是自动回退到Claude Opus 4.8。

Mythos 5基于相同的底层模子,但在部分领域打消了Fable 5的护栏。Anthropic称,Project Glasswing里的相聚安全引诱伙伴不错使用“满血版”Mythos 5;改日,部分人命科学征询者也可能通过受信任看望办法,使用打消生物和化学死心的版块。

用不到的Mythos咱们暂时不提,先看点实在的东西。

领先是订价,一个字,贵。

Fable 5的订价是输入10好意思元/百万token,输出50好意思元/百万token。开采者现时就不错通过Claude API调用claude-fable-5(模子名)。

这个价钱刚好是Opus 4.8的两倍,和Opus 4.8的fast mode疏浚,Anthropic明显把它放在了比Opus更高一档的价钱层级里。

不外Anthropic称,这一价钱不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非公开API模子,官方并未给出头向公众的尺度价,这句话也无从考据。

Anthropic在官方说明中提到,6月23日以后,即使用户如故订阅Claude,Fable 5也可能根据算力情况按量提供,不一定会平直包含在基础订阅做事中。

这公司越来越吝惜了,不外好赖还留了小半个月试用期。官方也留了少许余步:淌若6月23日以后算力资源弥散,Anthropic会尽量把Fable 5不时包含在Pro、Max等订阅做事里。

订价高本人并申斥以阐明,但它最佳保证它的才略配得上它的价钱。

从跑分上看,Fable 5/Mythos 5基本是Anthropic现时公开内外最强的一档。

不外官方表格有一个说明,Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点(除了带星号的相聚安全、生物连络测试),是以内外理解的是两者更高的分数。这少许很难不让东谈主念念要吐槽。

Anthropic把Fable 5的要点放在几个场合:软件工程、常识使命、视觉、长险峻文记挂和人命科学征询。

软件工程是最凸起的场景之一,根据表格,Fable/Mythos 5在SWE-Bench Pro上达到80.3%,明显高于Opus 4.8的69.2%;在更难的FrontierCode Diamond上,它拿到29.3%,而Opus 4.8只须13.4%,GPT-5.5只须5.7%。

常识使命和视觉任务上,Anthropic给出了两类左证。

一类是尺度化benchmark。官方表格理解,Fable/Mythos 5在GDPval-AA上得分1932,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro;在GDP.pdf这种带视觉阐明的文档任务上,它达到29.8%,也跳跃其他主要模子。

另一类是早期客户测试。Anthropic称,Fable 5在Hebbia的高等金融推理基准上获取最高分,上风齐集在文档推理、图表和表格阐明、问题求解;IMC也响应,它在往复分析评估中险些全面通过。

为了展示Fable 5的视觉才略,Anthropic举的例子是:此前Claude模子需要复杂扶持器具才能玩《宝可梦 火红》,而Fable 5只靠视觉输入就不错通关。

长任务和记挂才略上,Anthropic称,Fable 5不错在数百万token的遥远任务中保执专注,并期骗我方的条记矫正输出。

在《夷戮尖塔》这类需要连结方案和遥远战略的游戏里,淌若给Fable 5接入执久文献记挂,让它能记载前边的接收和资历,它的推崇会明显晋升。晋升幅度是Opus 4.8的三倍,到达最终关卡的次数也提高了三倍。

趁机一提,Fable亦然一款经典RPG游戏的名字,汉文译作《神鬼寓言》——大略某天咱们能看到Fable玩《Fable》。

开云体育中国官方网站入口

另外,滚球app 相聚安全才略方面,Fable/Mythos 5在ExploitBench Cap%上达到78.0%,跳跃Claude Mythos Preview的69.0%,接近Opus 4.8的两倍。

这里用的应该是Mythos 5的得分,因为Fable 5在高风险肯求上会回退到Opus 4.8。

02

重大的模子必须分层

Anthropic此次把模子才略的直不雅展示放到了一个访佛”作品集“的滑页里,而况每个demo只给了一小段精良。

比如,Fable 5写了一个太阳系模拟,从物理第一性旨趣推导行星轨谈通顺,并用它量度日食。

又比如,它不错自主玩《异星工场》。这是一款工程师很爱的工场自动化游戏,玩家要相聚资源、缱绻坐褥线、搭建物流和动力系统。

Anthropic用这个例子说明,Fable 5不错在一个绽开环境里制定战略,并执续推动一个复杂系统的开采。

在另一个demo里,Fable 5先作念了一个基于浏览器的CAD剪辑器,然后又使用这个由我方开采的CAD器具,联想了一个不错3D打印的完满模子。这个剪辑器里还内置了AI copilot,用来扶持建模。

这个demo的要点在于Fable 5完成了一个闭环:先创造器具,再使用器具,终末完成一个实体联想任务。

终末一个demo,Anthropic展示了一个由Fable 5写出来的流体模拟,通顺节律和一段古典音乐EDM remix同步。官方还故意提到,音乐亦然Fable 5用代码生成的。

这些案例看起来挺花哨,但艳羡是一样的:Fable 5很擅长把代码、视觉、物理、联想和遥远缱绻混在一齐作念任务。

淌若说这部分展示的如故Fable 5在开采者手里能作念到什么进度,后头的部分说的即是Mythos 5在征询者手里能作念什么——以及Anthropic为什么要把Fable和Mythos分开。

Anthropic称,在里面卵白联想大家的评估中,Mythos 5把药物联想进程中的部分门径加快了约莫10倍。其中一个案例里,Mythos 5接入卵白联想和生物信息学器具、莫得东谈主类匡助,就不错匹配致使跳跃熟悉东谈主类操作员。

在该任务中,Mythos 5作念的不是简便问答,而是完成一整套科学使命流:接收结合位点,接收并运行卵白联想器具,在失败后我方复原。官方称,在这项征询的14个卵白靶点中,有9个产生了强候选分子,现时正在进一步征询。

Anthropic还提到,Mythos 5不错踏实建议新颖、有引诱力的分子生物学假定。在和Opus级模子的盲测对比中,里面科学家约莫80%的时候更偏好Mythos建议的假定,其中一些如故插足践诺评估。

与此同期,Mythos 5的一个对于大肠杆菌卵白的新机制的假定,在另一家孤立征询归拢问题的践诺室的征询中得到了说明。

它致使还作念了一项基因组学征询。

Anthropic称,Mythos 5在一周多的时刻里,险些自主完成了一项新的基因组学征询。它整理了横跨138种动物、数百万个细胞的单细胞数据,并联想、教训了一个定制机器学习模子,用来识别不同物种中扩充疏浚扮装的细胞。

更夸张的是,Anthropic称,Mythos 5教训出的模子性能跳跃了近期发表在《Science》上的一个模子,尽管它的限制只须后者的百分之一。Anthropic暗示,办法在改日几个月发表这些成果。

诚然,这部分还需要恭候论文和外部复核。但淌若只看Anthropic官方给出的信息,Mythos 5在人命科学里展示的才略如故接近科研Agent:能读问题、用器具、管理数据、教训模子、建议假定,并把一项征询推动到不错发表的进度。

而一朝模子不错在药物联想、病毒载体、卵白联想、基因组学征询这些场合里实在推动任务,它就自然具备双重用途。

不错以为,人命科学这部分不是Fable 5的普通功能演示,而是Mythos 5的才略上限展示。

但它被展示出来,是为了说明Anthropic手里的这套底层模子,如故强到了必须通过受信任看望来分发。

有艳羡的是,往时的模子发布更像是一件时代产物的事:参数、跑分、价钱、险峻文长度、API称号。强即是强,发布即是发布。

但到了Mythos这里,事情开动变得复杂。归拢个底层模子被分为两个版块,普通用户拿到的是Fable 5,安全征询者和部分人命科学征询者拿到的是Mythos 5;前者被装进更严格的护栏里,后者则需要受信任看望。

模子才略不再只须险峻之分,也开动有权限、场景和背负之分。

某种意旨上来讲,不错看作前沿模子生意化插足新阶段的信号——越强的模子,越不可能平直扔给统共东谈主。它们会被拆成不同版块,放进不同安全界限,再交给不同类型的用户。

Anthropic先这样作念了,因为它们的模子“强到不可实足公开”。改日其它念念要讲故事的公司滚球app官网下载,念念要说明我方的模子也很强,大略也会效仿这种花式。(作家/袁心玥)