Claude Mythos Preview podnosi autonomię modeli do ok. 17 godzin pracy
Wczeski podgląd modelu Anthropic pokazuje duży skok w tzw. time horizon, czyli jak długo AI potrafi samodzielnie wykonywać złożone zadania techniczne. Według opisu 50% skuteczności wypada przy ok. 17 godzinach pracy, wyraźnie powyżej wcześniejszych modeli. Chodzi głównie o zadania z programowania, ML i cyberbezpieczeństwa, a model działa na razie jako limitowany preview badawczy.
Azja jest dużo bardziej entuzjastyczna wobec AI niż USA
Z przytoczonych danych wynika wyraźny podział nastrojów: w Chinach 84% badanych deklaruje ekscytację produktami i usługami AI, podczas gdy w USA tylko 38%. Wysoki optymizm widać też w Azji Południowo-Wschodniej, m.in. w Indonezji, Malezji i Tajlandii. Jednocześnie globalnie rośnie zarówno wiara w korzyści z AI, jak i niepokój związany z jej wpływem na pracę, regulacje i codzienne życie.
restofworld.org
Floryda przerzuca pełne koszty energii i infrastruktury na duże centra danych
Nowe prawo na Florydzie wymaga, by wielkie centra danych, w tym obiekty AI, same pokrywały koszty prądu, modernizacji infrastruktury i zużycia wody. Celem jest zablokowanie sytuacji, w której rachunki za rozwój takich inwestycji byłyby przenoszone na mieszkańców i małe firmy. Lokalne władze zachowują też prawo do odrzucania projektów, a dostawcy wody mogą odmówić zgody przy niedoborach.
cbs12.com
Google szykuje plan AI Ultra Lite i czytelne limity użycia Gemini
Google przygotowuje nowy abonament Gemini o nazwie AI Ultra Lite, który ma wypełnić lukę między tańszym Pro a drogim Ultra. Z opisu wynika, że główną różnicą będą wyższe limity użycia. Firma pracuje też nad panelem pokazującym limity pięciogodzinne, tygodniowe i ewentualne kredyty ponad limit. To sugeruje, że korzystanie z Gemini ma stać się bardziej przewidywalne, ale też bardziej formalnie ograniczane.
9to5google.com
Hermes Agent wskoczył na 1. miejsce w metrykach tokenów OpenRouter
Według screena i opisu Hermes Agent był najczęściej używanym agentem w ostatnich 24 godzinach w statystykach tokenów OpenRouter. Miał wyprzedzać m.in. OpenClaw i Claude Code. Na grafice widać ok. 224 mld tokenów dla Hermesa, 186 mld dla OpenClaw i 51,5 mld dla Claude Code. To sugeruje szybki wzrost popularności narzędzi agentowych działających jak osobisty asystent lub agent CLI.
W Codexie pojawiają się wycieki toków rozumowania GPT-5.5
Post pokazuje, że po aktualizacji Codexa chwilami widoczne są surowe ślady rozumowania modelu, czyli tzw. chain-of-thought. Opis sugeruje, że GPT-5.5 ma być bardziej oszczędny w tokenach przy podobnym czasie odpowiedzi, szczególnie w zadaniach programistycznych. Widoczny fragment wygląda jak nieprzefiltrowany, roboczy tok myślenia modelu, co wywołało spekulacje, jak osiągnięto tę efektywność.
Airbnb: AI pisze już 60% nowego kodu, a menedżerowie też programują
Według opisu Airbnb dołącza do firm, które otwarcie mówią, jak duży udział ma AI w tworzeniu oprogramowania. Firma podaje, że 60% jej nowego kodu jest generowane przez AI, a CEO twierdzi też, że nawet menedżerowie pracują z narzędziami takimi jak Claude Code. Wpis zestawia to z wcześniejszymi deklaracjami Shopify i Google, sugerując szybkie przesuwanie programowania w stronę nadzoru nad AI.
businessinsider.com · techcrunch.com · msn.com
Neobot pokazuje domowe prace: drzwi, pranie, naczynia i precyzyjny chwyt
Krótki opis wskazuje na demonstrację humanoidalnego robota domowego, który wykonuje zwykłe czynności: otwieranie drzwi, składanie prania, mycie naczyń i manipulowanie przedmiotami. Całość wpisuje się w trend robotów ogólnego zastosowania do pracy w domu. Materiał wygląda jak pokaz możliwości systemu nastawionego na naukę ruchu i obsługę wielu różnych zadań w realnym otoczeniu.
v.redd.it
RecGen 1 i 2: AI zamienia obrazy w sceny 3D i może bić wcześniejsze metody
Wpis dotyczy RecGen, systemu do odbudowy scen 3D z ograniczonej liczby obrazów RGB-D. Z opisu wynika, że model dobrze radzi sobie z zasłonięciami, symetrią obiektów i złożoną geometrią, a w porównaniu z SAM3D ma wyraźnie lepszą jakość kształtu, tekstur i położenia obiektów. Autor posta sugeruje też, że projekt może być open source, ale w podanych danych nie ma na to potwierdzenia.
reddit.com
MIT pokazuje FINGERS-7B, model multi-omic do wczesnej oceny ryzyka Alzheimera
Post opisuje FINGERS-7B jako duży model bazowy do profilaktyki Alzheimera. Ma być trenowany na danych od 30 tys. osób i łączyć genetykę, biomarkery oraz styl życia, co ma pozwalać wcześniej wykrywać ryzyko choroby. Model jest udostępniony, ale uruchamianie ma odbywać się przez AD Workbench. To przykład przenoszenia architektury foundation model do medycyny i danych biologicznych.
v.redd.it · openreview.net · picower.mit.edu
ICLR 2026: najwięcej wkładu z Chin i USA, mocna pozycja Tsinghua, Stanforda i MIT
Grafika pokazuje rozkład wkładu do ICLR 2026 według krajów i instytucji. Największy udział mają Chiny kontynentalne z 43,7%, a za nimi USA z 31,9%. Wśród widocznych nazw dominują duże uczelnie i firmy, m.in. Tsinghua, Shanghai Jiao Tong, Stanford, MIT, Microsoft i Google. To szybki obraz tego, które ośrodki najmocniej napędzają dziś badania publikowane na jednej z głównych konferencji AI.