丁香五月天新版Llama 3 70B反超405B！Meta开卷后观察，谷歌马斯克都来抢镜

发布日期：2024-12-08 05:30 点击次数：147

克雷西发自凹非寺量子位 | 公众号 QbitAI丁香五月天

OpenAI“双12”刚进行到第二天，就把大模子圈搅得好不淆乱！

一边是Meta没预报就发布了Llama 3.3，70B版块就能结束往日405B的性能。

另一边的Gemini也上线了新的执行版模子，再一次登上大模子竞技场榜首。

有网友惊奇，o1、Llama 3.3和新版Gemini接连发布，马斯克的Grok3也要来，还有GPT-4.5初露线索……这几乎是最棒的一个圣诞季。

Llama 3.3：70B结束405B成果

Llama 3.3现时只消70B一个型号。

但在指示顺从（IFEval）、数学（MATH）、推理（GPQA Diamond）等界限，水平都卓著了七月份发布的Llama 3.1 405B。

在话语（MMLU）、代码（HumanEval）、长文本和多语种技艺上，收获也和Llama 3.1 405B相比接近。

而在用具使用（BFCL）上，和405B的差距则显得稍大一些。

不外，Llama 3.3的使用老本要比Llama 3.1 405B低得多。

天然Llama自己是免费的，关联词各个大模子平台的处事价钱也可以当作揣度老本的一个参考。

在Meta谐和的平台当中，Llama 3.3最低廉的价钱是0.1/0.4好意思元每百万输入/输出Token。

而Llama 3.1 405B，则是1好意思元每百万输入token，是Llama 3.3的10倍，输出token为1.8好意思元，是Llama 3.3的4.5倍。

Meta生成式AI团队指示者Ahmad Al-Dahle暗意，Llama 3.3能用70B结束405B的成果，主淌若“讹诈了后观察期间的最新融会”，并点名其中包括在线偏好优化（online preference optimization）。

Meta AI官方账号也提到，Llama 3.3的跳跃归功于新的对都流程和在线强化学习期间的跳跃。

现时，Llama 3.3的模子权重已在官网和Hugging Face上怒放下载。

Gemini迎来周岁寿辰

Gemini 1206上线的这天，刚好是Gemini的一周岁寿辰。

不外，从节拍和以日历定名的形式来看，Gemini更像是一次例行更新（上一个版块是1121）。

天然收获也曾很可以的，胜利登上了lmsys大模子竞技场的榜首。

并且不仅仅总收获夺冠，贫窭请示词、代码、数学、创意写稿等各个单项排行也都是第一。

内容上，Gemini此前有个1114版块，也当了一周的“榜一衰老”，自后被更新的GPT-4o给比了下去。

现时的最新版块，又让Gemini再行回到了榜单上的王座。

此外，谷歌AI Studio居品认真东说念主（原OpenAI开拓者社区掌握）Logan先容，Gemini 1206领有2百万token的凹凸文窗口，现时可通过谷歌AI Studio和Gemini API免费使用。

谷歌首席科学家Jeff Dean暗意，获取这么的收获是对Gemini寿辰最佳的庆祝形式。

不外也有网友给谷歌泼了盆冷水，暗意o1还没出现时这个榜单上，并且GPT-4.5就要来了，谷歌第一的位置就怕很快又会被OpenAI夺走。

One More Thing

除了谷歌和Meta，马斯克xAI也被哄传行将发布Grok 3。

有网友发现，正在测试的Grok 2 mini隐没了，以为这是要发Grok 3的征兆。

除了对Grok 3的料想，还有一条更详情的音书——此前要充会员技艺用的Grok，现时可以免用度了。

不外免用度户用量相比有限，每两小时只可处罚10条音书，而图片分析一天只可处罚三张。

有真理的是，咱们试了试盘问Grok我方，它也暗意Grok 3决议在这个月上线。

但握马的是，点进后头援用的音书源，发现这名博主亦然问Grok之后发的帖子……

小二先生调教

那么，在这个发布密集的十二月，你最钟意能够最期待哪一款居品呢？

参考齐集：[1]https://x.com/AIatMeta/status/1865079067390956006[2]https://x.com/Ahmad_Al_Dahle/status/1865071436630778109[3]https://x.com/lmarena_ai/status/1865080944455225547

上一篇：91porn 91porn 合肥中山外科病院：痴肥东说念主群为什么易患痛风？
下一篇：taylor swift ai换脸点名曝光！官方公开通报！

热点资讯