
Специалисты проекта Nof1 испытали GPT-5, Gemini 2.5 Pro, Grok-4, Claude Sonnet 4.5, DeepSeek V3.1 и Qwen3 Max на бирже Hyperliquid. Моделям выделили по 10 тыс. долларов и дали одинаковые промпты.
В первые дни наблюдений в лидеры вышли DeepSeek и Grok — они прибавили треть к выданной сумме. Китайская и американская нейросети выбирали длинные позиции «с плечом» и торговали BTC, ETH, XRP, Solana, Dogecoin и Binance Coin. В Nof1 установили, что модели «похоже, лучше понимают структуру рынка», а конкретно Grok «заработал» во всех раундах. Капитал Claude Sonnet 4.5 увеличился примерно на четверть.
Gemini же сначала выбирала только короткие позиции, потом стала сочетать их с длинными и в итоге потеряла больше остальных — 32%. GPT-5 «потратил» чуть меньше — 27%. Китайская Qwen Max, по словам авторов эксперимента, «почти сдалась» а самом начале и «просто десять часов смотрела на графики», после чего таки вложилась в «крупную» позицию BTC, заработав 9% от пула.
Ранее агентство Bloomberg сообщало, что OpenAI — в рамках собственного проекта Mercury — наняла сотню бывших сотрудников JPMorgan, Morgan Stanley и Goldman Sachs для обучения ИИ финансовым моделям. Компания платит консультантам по 150 долларов в час за написание ясных промтов к разным типам сделок, а кандидатов на эту должность отбирает LLM самого вендора. Цель — заменить в перспективе младших банкиров ботами.