OpenAI и Paradigm запускают EVMbench для обеспечения AI-Крипто Экономики
18 февраля 2026 года OpenAI и Paradigm представили EVMbench, новую систему бенчмаркинга, разработанную специально для оценки и обеспечения производительности AI-агентов в экосистеме Ethereum Virtual Machine (EVM).
Bankless
Bankless
+1
Обзор EVMbench
Этот бенчмарк отвечает на растущую необходимость в безопасности и надежности, поскольку автономные AI-агенты все чаще используются для управления крипто-токенами и выполнения смарт-контрактов.
arXiv
arXiv
+1
Целевая Безопасность: Он предоставляет стандартизированную структуру для тестирования того, насколько хорошо AI-модели могут ориентироваться в условиях высоких ставок и враждебных блокчейн-средах.
Обнаружение Уязвимостей: Система оценивает способность агента идентифицировать эксплойты смарт-контрактов, аналогично недавним усилиям в отрасли, которые выявили миллионы потенциальных убытков через автоматизированный аудит.
Метрики Производительности: Он измеряет способности "выживания и поиска правды", выходя за рамки простого завершения задач, чтобы гарантировать, что агенты могут безопасно работать без "угадывания" или "проб и ошибок" на финансовых рынках.
Anthropic
Anthropic
+4
Контекст Отрасли
Запуск следует за серией разработок в области AI-безопасности в начале 2026 года:
Экономика AI-Агентов: Появление автономных "крипто AI-агентов" потребовало новых стандартов управления идентификацией и протоколов "Нулевое Доверие", чтобы предотвратить инъекции через API.
Конкурентная Среда: Конкуренты, такие как Anthropic, также выпустили бенчмарки с фокусом на безопасность (например, SCONE-bench), чтобы количественно оценить общую стоимость смоделированных украденных средств, подталкивая отрасль к более надежному автоматизированному аудиту.
Расширение OpenAI: Этот фокус на безопасности соответствует более широкому плану OpenAI на 2026 год, который включает в себя разработку агентов следующего поколения после приобретения ключевых талантов из проекта OpenClaw
#OpenAI #CryptoSecurity #SmartContracts #OpenClawFounderJoinsOpenAI #Web3AI