Grok 4.1 到底好不好用？

sowang · 发表于 2025-11-22 00:12:07

@零重力瓦力

xAI 刚发布了 Grok 4.1，在 LMArena 上，Grok-4.1-thinking 以 1483 分成为榜首。但是，这样的基准测试到底靠不靠谱，模型到底好不好用，作为 AI 模型测评达人的 Alex Finn 有不同的看法。他对 Grok 4.1 做了较为全面的测试，表示这款模型的优缺点都十分明显。

Grok 4.1 最大的优点是，能实时获取 X 平台的最新信息。问它热点话题、网络舆情、新闻动态，它都能直接给出新鲜推文和具体内容，这点很实用，特别适合做舆情分析、跟踪网络事件，或者需要拉取实时数据的应用。

它的 API 成本也较低，上手简单。如果你做的应用开发，需要实时获取 X 上发生的事，用 Grok 4.1 比较合适。

Grok 4.1 的短板也很明显。速度慢，尤其是 “Thinking” 模式，生成内容很拖沓。写代码的能力很一般，遇到稍复杂的编程任务，结果经常出错，还跑不起来。做创意写作、商业构思的时候，给的点子不实用，风格也很不自然，与它交流的感觉比较生硬。

如果你想用 AI 写代码、做产品规划、头脑风暴。 Alex Finn 认为 ChatGPT 5.1、Sonnet 4.5 这些模型依然是更好的选择。做图片、视频生成，Google 的 Veo、Nano Banana 也更强。

简单来说，Grok 4.1 适合需要最新网络信息和实时数据的场景。其它大多数 AI 应用，还是建议用更成熟的模型。它现在还在 Beta 阶段，后面能不能提升，还有待观察。

Grok 4.1 到底好不好用？
https://weibo.com/tv/show/1034:5234311704543256?from=old_pc_videoshow&mark_id=999_reallog_mark_ad%3A999%7CWeiboADNatural

		自动登录	找回密码
密码			禁止注册