中文搜索引擎指南网

标题: Grok 4.1 到底好不好用? [打印本页]

作者: sowang    时间: 10 小时前
标题: Grok 4.1 到底好不好用?
@零重力瓦力


xAI 刚发布了 Grok 4.1,在 LMArena 上,Grok-4.1-thinking 以 1483 分成为榜首。但是,这样的基准测试到底靠不靠谱,模型到底好不好用,作为 AI 模型测评达人的 Alex Finn 有不同的看法。他对 Grok 4.1 做了较为全面的测试,表示这款模型的优缺点都十分明显。

Grok 4.1 最大的优点是,能实时获取 X 平台的最新信息。问它热点话题、网络舆情、新闻动态,它都能直接给出新鲜推文和具体内容,这点很实用,特别适合做舆情分析、跟踪网络事件,或者需要拉取实时数据的应用。

它的 API 成本也较低,上手简单。如果你做的应用开发,需要实时获取 X 上发生的事,用 Grok 4.1 比较合适。

Grok 4.1 的短板也很明显。速度慢,尤其是 “Thinking” 模式,生成内容很拖沓。写代码的能力很一般,遇到稍复杂的编程任务,结果经常出错,还跑不起来。做创意写作、商业构思的时候,给的点子不实用,风格也很不自然,与它交流的感觉比较生硬。

如果你想用 AI 写代码、做产品规划、头脑风暴。 Alex Finn 认为 ChatGPT 5.1、Sonnet 4.5 这些模型依然是更好的选择。做图片、视频生成,Google 的 Veo、Nano Banana 也更强。

简单来说,Grok 4.1 适合需要最新网络信息和实时数据的场景。其它大多数 AI 应用,还是建议用更成熟的模型。它现在还在 Beta 阶段,后面能不能提升,还有待观察。



Grok 4.1 到底好不好用?
https://weibo.com/tv/show/1034:5234311704543256?from=old_pc_videoshow&mark_id=999_reallog_mark_ad%3A999%7CWeiboADNatural




欢迎光临 中文搜索引擎指南网 (http://sowang.com/bbs/) Powered by Discuz! X3.2