Elon Musk’s ‘Scary Smart’ Grok 3 Release— What You Need to Know

30 丨1周前

根据xAI的报告,Grok 3的开发得益于其仅用八个月时间建成的Colossus超级计算机。该系统由100,000个Nvidia H100 GPU驱动,提供了2亿个GPU小时的训练时间,是前一版本Grok 2的十倍。计算资源的大幅提升使得Grok 3能够更高效地处理大型数据集,缩短训练时间并提高准确性。

除了计算能力的增强,xAI还对训练方法进行了调整,以进一步提升Grok 3的表现。新的模型整合了合成数据集、自我修正机制和强化学习,进一步增强了其性能:

合成数据集:这些数据集是通过人工生成,而非从现实世界收集的。它们用于模拟多种场景训练AI模型,确保数据集的多样性和可控性,从而提高学习效率并解决数据隐私问题。

自我修正机制:该技术使模型能够识别并修正自身错误。通过对比其输出和已知正确响应,模型能够随着时间推移改进答案,减少错误并提升准确性。

强化学习:这种机器学习方式通过奖励或惩罚来引导AI模型学习。系统通过反复试验优化结果,提升决策能力。
根据xAI和马斯克的说法,这些改进使得Grok 3能够通过多个验证步骤减少错误响应(称为“幻觉”),通过与可靠来源对照信息来提升逻辑准确性,并通过持续自我评估和学习实现更好的适应性。

此外,xAI还加入了人工反馈循环和情境训练,以确保生成更自然、更精准的响应。

人类反馈循环:这是一种训练方法,其中AI模型从人类审阅者那里获得直接反馈,帮助它改进响应的准确性、相关性和实用性,从而逐步提高模型的表现。

情境训练:这种训练方法教导AI理解并根据不同情境调整回应,考虑先前的交互、用户意图和周围信息,从而生成更精准、相关的答案。

xAI表示,Grok 3旨在生成具有深度洞察力和意外解决方案,使其成为更高效的解决问题工具。早期测试显示,Grok 3在复杂的推理任务中超过了其竞争对手,包括OpenAI的ChatGPT和谷歌的DeepMind Gemini。在2月11日至13日于迪拜举行的世界政府峰会上,马斯克在视频采访中表示:“这可能是人工智能历史上最后一次有一个比Grok更好的模型。”


转载来源“达拉斯华人资讯网”
编译:shanshan

达拉斯

0
0
他的发布
其他相关
0
发送