全球六大主流大语言模型(LLM)各发1万美元 ,丢进同一真实市场实盘厮杀,会发生什么?
上周六(10月18日),美国人工智能研究实验室nof1.ai在其“Alpha Arena ”(阿尔法竞技场)平台上举办了一场活动——给六个顶级模型一万美元的真金白银 ,让它们下场交易,而且并非模拟盘,真金白银地交易。
这六大模型分别为Anthropic的Claude 4.5 Sonnet 、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5 、xAI的Grok 4和阿里通义的Qwen 3 Max 。
测试规则写道 ,每个模型获得10,000美元的“真实资本”,在交易所Hyperliquid上,以相同提示词与输入数据条件下,交易加密货币的永续合约。所有的对话都在nof1.ai网站上公开可见。
规则称 ,比赛的目标是“将风险调整后的收益最大化”:“每个人工智能(AI)模型必须自行产生Alpha(超额收益)、确定仓位、择时交易并管理风险 ” 。
系统会告诉AI模型当前的时间 、账户信息、持仓情况,然后附上实时价格、指标等数据。 然后,要求模型做出决策:如果持有仓位 ,是继续持有还是平仓;如果空仓,是买入还是继续观望。
经过近60小时的激战后,截至北京时间周一(10月20日)17:18 ,DeepSeek的持仓总市值接近1.4万美元,收益率约40%,最高时一度接近1.5万美元 ,是当前表现最好的模型 。
Grok 4实力次之,目前持仓总市值在1.33万美元附近。具体来看,DeepSeek和Grok 4都依靠做多比特币和以太坊获利。
Claude主要交易瑞波币和以太坊 ,Qwen则专注于以太坊,两者收益位列三四,但也整体跑赢比特币现货的走势。
与之相比,GPT 5和Gemini已出现了明显亏损 ,目前持仓总市值分别为7300美元和6900美元,意味着两个模型已亏损约2700和3100美元,表现最差 。
nof1.ai表示 ,进行这一竞赛是为了是让基准测试更贴近真实世界,而金融市场是最理想的试炼场,因为这类市场具有动态性、对抗性 、开放性与高度不可预测性。
“这些特质能以静态测试无法企及的方式 ,真正挑战人工智能,”nof1.ai没有提到本次竞赛的结束时间,只写道“第一季将运行数周 ,随后推出重大更新的第二季”。
有分析认为,市场早已期待在DeFAI(DeFi + AI)方向上出现杀手级应用,让LLM参与链上博弈有很大的想象空间 。
(文章来源:财联社)
股票杠杆最低多少:交易杠杆什么意思-OpenAI新模型o3“抗命不遵” Claude Opus 4威胁人类!“失控”背后:AI应该“踩刹车”了?
炒股配资服务:股票玩杠杆是什么意思-跳水 加密货币市场集体走低!超20万人爆仓
炒股的杠杆什么意思:股票哪里可以开户-“折戟”中国市场后 Manus最新回应!AI智能体变天!
炒股的杠杆是什么意思:股票配资哪-DeepSeek、智谱大模型接连上新 华为、寒武纪等国产芯片火速适配意味着什么
手机股票交易:股市里的杠杆是什么意思-从重金扶持到有序退出:大基金一期投资北方华创10年豪赚40亿
股票杠杆是什么意思啊:炒股怎么杠杆-全球市场:美股三大指数集体收跌 道指跌近2% 大型科技股多数下跌
在线炒股配资看必选-线上配资炒股-股票配资公司提示:文章来自网络,不代表本站观点。
【隔夜行情】•周五(2025年3月21日),A股三大指数集体下跌,截至收盘,截止收盘,沪指跌1.29%,报收33...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
3月24日,海洋王照明科技股份有限公司(以下简称“海洋王”,002724.SZ)早盘一字跌停,此后股价拉涨,尾盘封涨停板...
近日,开源证券大连分公司遭大连证监局处罚,暂停其办理需要合格投资者认定相关业务六个月。该惩处力度在近年来券商分支机构中并...
宏观要闻市场监管总局发布《公平竞争审查条例实施办法》市场监管总局发布《公平竞争审查条例实施办法》,将于4...