Ученые разработали академический экзамен, который не смог сдать ни один AI
Международная команда почти из 1000 ученых и специалистов из более чем 500 организаций в 50 странах создала новый тест для проверки искусственного интеллекта(AI) — и ни одна из существующих моделей не смогла пройти его даже наполовину. Тест получил название «Последний экзамен человечества» (Humanity’s Last Exam, HLE) и претендует на роль нового стандарта оценки реальных возможностей AI. Причина появления HLE — стремительный прогресс языковых моделей. Современные системы ИИ начали набирать почти максимальные баллы в стандартных академических тестах, в частности в широко используемом Massive Multitask Language Understanding (MMLU). Это поставило исследователей перед очевидным вопросом: если модель набирает 90%+ в тесте, означает ли это, что она действительно понимает предмет — или просто научилась распознавать шаблоны? Вывод оказался неудобным: старые тесты больше не позволяют точно оценить возможности AI. Нужен был экзамен принципиально другого уровня. 2500 вопросов, на которые нет готового ответа в интернете В финальный экзамен вошло 2 500 вопросов из самых разных областей знаний: математика и естественные науки;гуманитарные дисциплины;древние языки;узкоспециализированные научные темы. Каждый вопрос имеет один точный проверяемый ответ. При этом задания были составлены так, чтобы исключить возможность найти решение простым поиском в интернете. Некоторые задачи требуют перевода древних пальмирских надписей, определения мелких анатомических структур птиц или анализа особенностей произношения библейского иврита. Методология отбора вопросов тоже нетривиальна: разработчики проверяли каждое задание с помощью современных систем AI. Если какая-либо модель давала правильный ответ, вопрос исключали из теста. В финальную версию попали только те задания, с которыми не справилась ни одна из существующих моделей. Всего в ходе отбора было зафиксировано более 70 000 попыток — и около 13 000 вопросов, с которыми модели не справились, перешли на этап экспертной проверки. Чтобы привлечь к созданию теста ведущих специалистов, организаторы сформировали призовой фонд в $500 000: авторы лучших 50 вопросов получали по $5 000, следующие 500 участников — по $500 каждый. Когда экзамен прошли ведущие модели искусственного интеллекта, цифры оказались весьма скромными: GPT-4o дал около 2,7% правильных ответов; Claude 3.5 Sonnet — 4,1%; OpenAI o1 — около 8%. Более новые модели показали несколько лучшие результаты — Gemini 2.5 Pro и Claude Opus 4.6 достигли точности в районе 40–50%. Однако даже этот результат означает, что половина заданий так и не была решена верно. Отдельного внимания заслуживает то, как именно модели ошибаются. Исследователи измерили не только точность, но и так называемую ошибку калибровки: насколько уверенность модели в ответе соответствует реальной вероятности его правильности. У большинства протестированных систем этот показатель превысил 70% — это означает, что модели раз за разом давали неверные ответы с высокой степенью уверенности, не распознавая границы собственных возможностей. По словам одного из участников проекта, профессора Тунга Нгуена (Tung Nguyen) из Техасского университета A&M, задача экзамена — не доказать превосходство человека над машиной. «Интеллект — это не только распознавание шаблонов. Важны глубина понимания, контекст и специализированные знания», — отметил он. Часть вопросов уже опубликована в открытом доступе, однако большинство заданий остаются скрытыми — чтобы модели AI не могли просто выучить ответы. Такой подход призван обеспечить долгосрочную актуальность теста как инструмента измерения реального прогресса. Разрыв между возможностями AI и уровнем человеческих экспертов по-прежнему велик — и HLE впервые дает исследователям инструмент, позволяющий отслеживать, как этот разрыв сокращается. По мере того как будущие модели будут приближаться к отметке в 80–90%, индустрия получит более четкое представление о том, что именно стоит за понятием «экспертное знание» применительно к искусственному интеллекту. #AImodel #AI #Write2Earn #BinanceSquare $BTC
Czy warto teraz kupować Bittensor (TAO), NEAR i ICP wśród wiodących AI-tokenów?
Rynek kryptowalut pozostaje stabilny nawet w obliczu wojny, a bitcoin szybko się odbudował po spadku. Obecnie bitcoin utrzymuje się w okolicach 70 tys. dolarów, co również wzmocniło zaufanie inwestorów do altcoinów. Po publikacji lutowego raportu NVIDIA kryptowaluty z sektora AI, w tym TAO, NEAR, ICP, RENDER, FET i Virtuals, zaczęły wykazywać zwiększoną zmienność. W najbliższych tygodniach szczególnie ważne będzie obserwowanie, jak zachowają się te AI-tokeny.
Nastroje wokół Solany przechodzą próbę, mimo wzrostu presji zakupowej o 100%
Cena Solany w ciągu ostatnich 24 godzin wzrosła o około 5%. To dodało rynkowi trochę optymizmu. Ruch nastąpił po pojawieniu się byczego sygnału na impulsie i gwałtownym wzroście akumulacji ze strony średnioterminowych posiadaczy. Na pierwszy rzut oka odbicie wygląda całkiem pewnie.
Trump znowu organizuje galę dla posiadaczy memcoina po spadku ceny
Donald Trump będzie głównym mówcą na wydarzeniu na Florydzie dla największych posiadaczy jego memcoina. Wiadomość pojawiła się na tle tego, że token niedawno zaktualizował historyczne minimum. Po ogłoszeniu cena memcoina Donalda Trumpa nieco odbiła się od swojego najniższego poziomu. Zespół projektu poinformował, że najwięksi posiadacze tokena będą mogli spotkać się z prezydentem na zamkniętym wydarzeniu.
Twórca Litecoina ostrzegł o ryzyku dla bitcoinów Satoshiego z powodu ataków kwantowych
Około 1,1 mln bitcoinów, które są związane z Satoshi Nakamoto, mogą stać się jednym z pierwszych celów dla ataków kwantowych. Tak powiedział twórca Litecoina Charlie Lee. Według jego słów, problem nie dotyczy tylko technologii, ale także tego, że wokół tych monet pojawia się złożony problem dla całej społeczności Bitcoin.
Может ли конфликт с Ираном усилить аргументы в пользу стратегического резерва Bitcoin в США
Военный конфликт между США и Ираном уже начал влиять не только на геополитику, но и на финансовые рынки. По оценкам, первая неделя боевых действий обошлась американскому бюджету более чем в $11 млрд. Для сравнения — это почти половина стоимости всех биткоинов, находящихся в распоряжении правительства США. На этом фоне аналитики вновь обсуждают идею стратегического резерва в Bitcoin и его возможную роль в финансовой системе страны. Военные расходы сравнили с государственным запасом Bitcoin По имеющимся данным, государственные структуры США контролируют около 328 тыс. BTC, которые оцениваются примерно в $23 млрд. Основная часть этих активов была получена через конфискацию в рамках расследований. Если сравнить эти цифры с текущими расходами на военные операции, получается показательная картина. Уже за первую неделю конфликта было потрачено почти 49% стоимости этого криптовалютного запаса. При сохранении такого темпа расходы могли бы сравняться со стоимостью всего резерва примерно за две недели. Это сравнение активно обсуждается в финансовых кругах. Оно показывает, насколько быстро могут расти военные расходы и как относительно небольшим выглядит даже крупный запас цифровых активов. Общая стоимость войны может быть значительно выше При этом $11 млрд — лишь предварительная оценка. Она не включает весь спектр расходов, связанных с военной операцией. Некоторые чиновники в Конгрессе уже говорят о возможных затратах на уровне $50 млрд или выше. В ближайшее время администрация может запросить дополнительное финансирование. Параллельно законодатели требуют более подробной информации о масштабах конфликта и его возможной продолжительности. Биткоин-резерв создавался как долгосрочный актив Государственный запас Bitcoin был сформирован на базе конфискованных активов и закреплён специальным указом. Основная идея заключается в том, что эти монеты не должны продаваться, даже в периоды кризиса. Фактически речь идёт о долгосрочном стратегическом резерве. Он рассматривается как актив, который может сохранить стоимость в условиях финансовой нестабильности. Поэтому сравнение с военными расходами лишь подчёркивает потенциальную роль Bitcoin как нового типа резервного актива. Геополитика резко подняла цены на нефть Военный конфликт уже оказал влияние на энергетические рынки. После закрытия Ормузского пролива цена нефти резко выросла. Стоимость Brent на пике поднималась примерно до $119 за баррель. Такой скачок усилил опасения по поводу новой волны инфляции. Для финансовых рынков это важный фактор. Высокие цены на энергию часто приводят к ужесточению условий для экономики и повышают волатильность на рынках. Bitcoin показал устойчивость на фоне турбулентности На фоне нестабильности традиционных рынков криптовалюты демонстрируют относительно устойчивую динамику. Bitcoin вырос примерно на 8% с момента первых ударов, тогда как фондовые индексы оказались под давлением. Цена цифрового актива держится около $72 тыс., что указывает на формирование сильного уровня поддержки. Это говорит о том, что часть инвесторов рассматривает Bitcoin как альтернативный защитный актив. В регионе растёт спрос на цифровые активы Отдельным фактором роста аналитики называют ситуацию на Ближнем Востоке. Жители крупных финансовых центров региона начали активнее интересоваться криптовалютами. Причина проста: в условиях возможной эскалации конфликта люди опасаются временного закрытия банков или ограничений на движение капитала. Биржи и банковская инфраструктура могут приостанавливать работу, тогда как сеть Bitcoin продолжает функционировать круглосуточно. Это делает его удобным инструментом для быстрой защиты капитала. Военные расходы могут поддержать рост криптовалют Некоторые аналитики считают, что сами военные расходы могут стать фактором роста для Bitcoin. Крупные конфликты часто сопровождаются увеличением государственного долга и стимулирующими мерами со стороны центральных банков. Это может привести к снижению процентных ставок и росту денежной массы. Исторически такие условия благоприятны для рискованных активов, включая криптовалюты. Bitcoin выигрывает при любом сценарии По мнению ряда аналитиков, Bitcoin может оказаться в выигрышной позиции независимо от того, как закончится конфликт. Если война затянется, инвесторы будут искать защитные активы. В этом случае спрос на Bitcoin может усилиться. Если же напряжённость быстро спадёт, восстановление уверенности на рынках также может привести к притоку капитала в цифровые активы. В долгосрочной перспективе криптовалюты получают преимущество ещё по одной причине — они не контролируются ни одним государством и имеют ограниченное предложение. Что это означает для идеи стратегического резерва Обсуждение роли Bitcoin в государственном резерве постепенно выходит из теоретической плоскости. Сравнение стоимости криптовалютного запаса с военными расходами лишь усилило этот разговор. Для некоторых аналитиков это пример того, как цифровые активы могут стать частью финансовой архитектуры будущего. Однако пока идея стратегического резерва Bitcoin остаётся предметом политических и экономических дебатов. #BTC #IranUSAConflict #Write2Earn #BinanceSquare $BTC
ETF na Ethereum ze stakingiem od BlackRock pokazał $15,5 mln obrotu w pierwszy dzień
Produkt inwestycyjny oparty na Ethereum z wbudowanym stakingiem od największego zarządcy aktywami BlackRock rozpoczął handel na giełdzie Nasdaq z obrotem wynoszącym około $15,5 mln. Nowy fundusz otrzymał nazwę iShares Staked Ethereum ETF (ETHB) i stał się pierwszym kryptowalutowym ETF firmy, w którym przewidziano uzyskiwanie dochodów poprzez staking.
Komputery kwantowe zagrażają wszystkim bitcoinom, a nie tylko jednej trzeciej monet
Powszechnie uważa się, że pod bezpośrednim zagrożeniem ze strony komputerów kwantowych znajduje się około 6,8 mln BTC — około 32% całej emisji — monety przechowywane na adresach z otwartymi kluczami publicznymi. Jednak rzeczywisty zakres problemu jest znacznie szerszy: przy wystarczającym poziomie rozwoju technologii kwantowych każdy bitcoin w obiegu okaże się podatny na atak.
Cena LINK wzrosła po integracji Data Streams na giełdzie Jupiter dla rynków prognoz
Giełda Jupiter, największa zdecentralizowana platforma na blockchainie Solana, zintegrowała infrastrukturę danych Chainlink dla swoich niedawno uruchomionych rynków prognoz. Ta wiadomość o współpracy już wpłynęła na rynek. Na tle integracji tokena LINK zauważalnie wzrosła jego cena, co wywołało nową falę optymizmu wśród inwestorów.
Związek bitcoina z Nasdaq osiągnął maksimum w ostatnich latach
Bitcoin często nazywany jest „cyfrowym złotem”. Jednak w praktyce jego dynamika coraz częściej przypomina akcje firm technologicznych. W ostatnich miesiącach kryptowaluta często porusza się razem z indeksem Nasdaq i innymi amerykańskimi indeksami. To wywołało nową dyskusję na rynku: czy bitcoin naprawdę stał się aktywem technologicznym?
Szef Nvidii: infrastruktura AI będzie wymagać trylionów dolarów i milionów pracowników
Założyciel Nvidii Jensen Huang (Jensen Huang) oświadczył, że sztuczna inteligencja (AI) stworzy ogromną liczbę miejsc pracy, a nie je zlikwiduje, ponieważ masowe wdrożenie infrastruktury dla AI dopiero się zaczęło i będzie wymagać kolosalnej liczby specjalistów. Huang napisał, że AI stało się „podstawową infrastrukturą – taką jak elektryczność i internet”. Produkcja chipów, montaż serwerów i budowa centrów danych, według niego, tworzą „największy projekt infrastrukturalny w historii ludzkości”. Przy tym, według oceny szefa Nvidii, zainwestowano w to jedynie pierwsze kilka set miliardów dolarów: „Musimy jeszcze zbudować infrastrukturę na tryliony dolarów. Potrzeba siły roboczej jest ogromna”.
Amazon zmaga się z awariami spowodowanymi przez AI po redukcji 30 000 pracowników
Amazon wprowadza nowe ograniczenia dotyczące użycia narzędzi AI w rozwoju po serii incydentów, kulminacją których była poważna awaria 5 marca 2026 roku. W tym dniu strona internetowa firmy i aplikacja mobilna nie działały przez około sześć godzin. Według danych Downdetector liczba skarg w szczytowym momencie przekroczyła 22 000: użytkownicy zgłaszali problemy z realizacją zamówień, błędy podczas płatności i nieprawidłowe wyświetlanie cen. Firma przeprosiła i wskazała przyczynę jako „błąd wdrożenia kodu programu”.
Tydzień kluczowych danych makroekonomicznych USA może wyznaczyć kierunek dla rynku kryptowalut
Nadchodzące dni mogą stać się jednymi z najważniejszych dla rynku kryptowalut w ostatnich miesiącach. Inwestorzy jednocześnie oczekują publikacji kluczowych wskaźników makroekonomicznych USA, sygnałów od Rezerwy Federalnej oraz nowych decyzji regulacyjnych w Waszyngtonie. Połączenie tych czynników może wzmocnić zmienność nie tylko na tradycyjnych rynkach, ale także w sektorze aktywów cyfrowych.
TRON przystąpił do Agentic AI Foundation i przygotowuje infrastrukturę płatniczą dla agentów AI
TRON DAO ogłosiło przystąpienie do Agentic AI Foundation (AAIF) w statusie Złotego Członka. Sieć blockchain również wejdzie do zarządu organizacji. Ten krok wprowadza infrastrukturę TRON do rozliczeń w stablecoinach do rozwijającego się ekosystemu autonomicznych systemów AI. Projekt zakłada, że agentom AI będą potrzebne szybkie, tanie i skalowalne platformy płatnicze. To właśnie w tej niszy TRON już zajmuje silną pozycję.
Tokeny AI wzrosły po wiadomościach o nowym projekcie Nvidia
Segment tokenów związanych ze sztuczną inteligencją znalazł się w czołówce rynku po doniesieniach, że Nvidia przygotowuje otwartą platformę dla autonomicznych agentów AI. W tym kontekście kapitalizacja całej kategorii wzrosła o około 4,8% i osiągnęła około 14,17 miliardów dolarów. Dla porównania, szerszy rynek rósł znacznie słabiej. To oznacza, że inwestorzy odrabiali nie tylko ogólny wzrost kryptowalut, ale właśnie temat infrastruktury AI.
Chainlink wspiera $10,9 miliardów tokenizowanych obligacji skarbowych USA
Chainlink stopniowo staje się jednym z kluczowych elementów infrastruktury tokenizowanych aktywów. Według szacunków analityków, przez systemy związane z siecią już przechodzi około $10,9 miliardów tokenizowanych obligacji skarbowych USA. Mowa nie dotyczy spekulacyjnych tokenów ani eksperymentów DeFi. Do sieci stopniowo integrowane są państwowe papiery dłużne — jeden z podstawowych instrumentów tradycyjnych finansów.
Trump omawia środki przeciwko wzrostowi cen ropy w obliczu wojny z Iranem
Prezydent USA Donald Trump może rozważyć nadzwyczajne środki z powodu ostrego wzrostu cen ropy. Konflikt wokół Iranu już zaczął wpływać na światowy rynek energii. Ropa wzrosła powyżej 100 dolarów za baryłkę. W Białym Domu obawiają się, że przedłużający się wzrost cen energii może uderzyć w biznes i zwykłych konsumentów. W takim przypadku presję poczuje cała gospodarka.
Analityk nazwał Cardano «najbardziej bezużyteczną siecią» na rynku
Cardano pozostaje jedną z największych kryptowalut pod względem kapitalizacji, jednak wokół aktywności sieci znów wybuchła dyskusja. Analityk Ali Martinez stwierdził, że ekosystem Cardano wykazuje zbyt słabą aktywność w porównaniu z jej rynkową wyceną. Jego zdaniem, różnica między kapitalizacją a rzeczywistym wykorzystaniem sieci pozostaje jednym z najbardziej zauważalnych na rynku.
Amerykańskie stablecoiny coraz bardziej przypominają CBDC, jeśli przyjrzeć się szczegółom.
USA odmówiły CBDC, ale stablecoiny wciąż mogą zamrażać cyfrowe dolary i współpracować z organami państwowymi. Ameryka odrzuca CBDC, ale buduje podobny system kontroli. Waszyngton prawnie zrezygnował z uruchomienia detalicznego cyfrowego dolara Systemu Rezerwy Federalnej. Jednak równolegle tworzy się nowy model regulacji stablecoinów. Stopniowo utrwala on funkcje zamrażania środków, blokowania transakcji, ich odrzucania lub tymczasowego wstrzymywania. Takie mechanizmy mogą być stosowane zarówno do prywatnych dolarowych tokenów, jak i coraz częściej do tokenizowanych aktywów finansowych.
Światowe rynki spadają drugi tydzień z rzędu na tle wojny USA i Izraela przeciwko Iranowi
Azjatyckie rynki znowu spadły. Największy spadek odnotowała Korea Południowa. Indeks Kospi stracił ponad 8%, po czym giełda na pewien czas wstrzymała handel. Na tym tle kontynuował się wzrost cen ropy. Brent i WTI wzrosły do około 116 dolarów za baryłkę. Taki skok był największy w ciągu jednego dnia od 1988 roku. Metale szlachetne zachowywały się inaczej. Złoto, srebro, platyna i pallad w tym momencie spadały.