OpenAI и Paradigm запускают EVMbench для обеспечения AI-Крипто Экономики

18 февраля 2026 года OpenAI и Paradigm представили EVMbench, новую систему бенчмаркинга, разработанную специально для оценки и обеспечения производительности AI-агентов в экосистеме Ethereum Virtual Machine (EVM).

Bankless

Bankless

+1

Обзор EVMbench

Этот бенчмарк отвечает на растущую необходимость в безопасности и надежности, поскольку автономные AI-агенты все чаще используются для управления крипто-токенами и выполнения смарт-контрактов.

arXiv

arXiv

+1

Целевая Безопасность: Он предоставляет стандартизированную структуру для тестирования того, насколько хорошо AI-модели могут ориентироваться в условиях высоких ставок и враждебных блокчейн-средах.

Обнаружение Уязвимостей: Система оценивает способность агента идентифицировать эксплойты смарт-контрактов, аналогично недавним усилиям в отрасли, которые выявили миллионы потенциальных убытков через автоматизированный аудит.

Метрики Производительности: Он измеряет способности "выживания и поиска правды", выходя за рамки простого завершения задач, чтобы гарантировать, что агенты могут безопасно работать без "угадывания" или "проб и ошибок" на финансовых рынках.

Anthropic

Anthropic

+4

Контекст Отрасли

Запуск следует за серией разработок в области AI-безопасности в начале 2026 года:

Экономика AI-Агентов: Появление автономных "крипто AI-агентов" потребовало новых стандартов управления идентификацией и протоколов "Нулевое Доверие", чтобы предотвратить инъекции через API.

Конкурентная Среда: Конкуренты, такие как Anthropic, также выпустили бенчмарки с фокусом на безопасность (например, SCONE-bench), чтобы количественно оценить общую стоимость смоделированных украденных средств, подталкивая отрасль к более надежному автоматизированному аудиту.

Расширение OpenAI: Этот фокус на безопасности соответствует более широкому плану OpenAI на 2026 год, который включает в себя разработку агентов следующего поколения после приобретения ключевых талантов из проекта OpenClaw

#OpenAI #CryptoSecurity #SmartContracts #OpenClawFounderJoinsOpenAI #Web3AI