中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 11|回复: 0
打印 上一主题 下一主题

Grok 4.1 到底好不好用?

[复制链接]
跳转到指定楼层
1#
发表于 10 小时前 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
@零重力瓦力


xAI 刚发布了 Grok 4.1,在 LMArena 上,Grok-4.1-thinking 以 1483 分成为榜首。但是,这样的基准测试到底靠不靠谱,模型到底好不好用,作为 AI 模型测评达人的 Alex Finn 有不同的看法。他对 Grok 4.1 做了较为全面的测试,表示这款模型的优缺点都十分明显。

Grok 4.1 最大的优点是,能实时获取 X 平台的最新信息。问它热点话题、网络舆情、新闻动态,它都能直接给出新鲜推文和具体内容,这点很实用,特别适合做舆情分析、跟踪网络事件,或者需要拉取实时数据的应用。

它的 API 成本也较低,上手简单。如果你做的应用开发,需要实时获取 X 上发生的事,用 Grok 4.1 比较合适。

Grok 4.1 的短板也很明显。速度慢,尤其是 “Thinking” 模式,生成内容很拖沓。写代码的能力很一般,遇到稍复杂的编程任务,结果经常出错,还跑不起来。做创意写作、商业构思的时候,给的点子不实用,风格也很不自然,与它交流的感觉比较生硬。

如果你想用 AI 写代码、做产品规划、头脑风暴。 Alex Finn 认为 ChatGPT 5.1、Sonnet 4.5 这些模型依然是更好的选择。做图片、视频生成,Google 的 Veo、Nano Banana 也更强。

简单来说,Grok 4.1 适合需要最新网络信息和实时数据的场景。其它大多数 AI 应用,还是建议用更成熟的模型。它现在还在 Beta 阶段,后面能不能提升,还有待观察。



Grok 4.1 到底好不好用?
https://weibo.com/tv/show/1034:5234311704543256?from=old_pc_videoshow&mark_id=999_reallog_mark_ad%3A999%7CWeiboADNatural
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-11-22 10:49 , Processed in 0.248488 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表