Machine Learning: Нейросети и машинное обучение
Podcastist
Подкаст «Machine Learning» – это захватывающее путешествие в мир нейросетей, машинного обучения и искусственного интеллекта, созданное для всех, кто хочет разобраться в технологиях, меняющих мир! Каждую неделю мы погружаемся в актуальные темы: от новейших архитектур нейросетей, таких как трансформеры, до применения ИИ в медицине, финансах, играх и творчестве. Вместе с ведущими экспертами, исследователями и практиками мы обсуждаем, как алгоритмы учатся, почему большие языковые модели вроде GPT революционизируют обработку данных, и какие этические дилеммы стоят за развитием ИИ.
Наши эпизоды – это не только глубокий разбор сложных концепций простым языком, но и реальные кейсы, вдохновляющие истории и прогнозы о будущем технологий. Хотите узнать, как обучить модель, избежать ловушек переобучения или интегрировать ИИ в свой проект? А может, вас волнует, заменят ли нейросети программистов или как обезопасить данные? Мы отвечаем на эти вопросы, делимся полезными инструментами, библиотеками и лайфхаками для разработчиков и энтузиастов.
"MachineLearning" – это место, где сложное становится понятным, а технологии – доступными. Слушайте нас, чтобы оставаться на волне инноваций, вдохновляться идеями и, возможно, найти свою нишу в мире ИИ! Подписывайтесь и присоединяйтесь к сообществу, где мы вместе исследуем, как нейросети формируют наше будущее. #ИИ #МашинноеОбучение #Нейросети #Технологии #Инновации
Žanrid ja sildid
Microsoft запустила Copilot 3D.
Microsoft открыла доступ к экспериментальному веб-инструменту Copilot 3D, который позволяет конвертировать статичные изображения в трехмерные модели. Сервис доступен бесплатно через портал Copilot Labs.
Инструмент поддерживает на входе PNG и JPG размером до 10 МБ. Созданные модели сохраняются на странице пользователя в течение 28 дней и могут быть скачаны в формате GLB. Copilot 3D является новой попыткой Microsoft популяризировать 3D-творчество после закрытия проектов Paint 3D и Remix3D.
Tesla сворачивает проект суперкомпьютера Dojo.
Команда, занимавшаяся разработкой суперкомпьютера Dojo расформирована, а ее руководитель Питер Бэннон покидает компанию.
Этот шаг завершает многолетнюю попытку Tesla создать кастомные чипы и процессоры "размером с кремниевую пластину" для обучения моделей автономного вождения и робототехники. Вместо этого компания перейдет на решения Nvidia и AMD, а производством чипов нового поколения займется Samsung.
Около 20 инженеров из команды Dojo уже основали собственный стартап DensityAI, а остальные сотрудники будут переведены на другие проекты внутри Tesla.
Apple интегрирует GPT-5 в Apple Intelligence с сентябрьским обновлением ОС.
Apple подтвердила, что осенние обновления: iOS, iPadOS и macOS получат поддержку GPT-5. Она заменит текущую GPT-4o в тех случаях, когда собственным моделям Apple потребуется помощь в обработке сложных запросов. Это коснется ответов Siri, инструментов для письма и визуального поиска.
Использование GPT-5 останется опциональным: пользователи должны будут явно дать согласие на передачу запросов в ChatGPT. Apple продолжит скрывать IP-адреса и запрещать OpenAI хранить данные, однако оставит возможность привязать платную подписку OpenAI для доступа к дополнительным функциям.
Кроме того, обновления ОС принесут функцию Live Translation для перевода разговоров в реальном времени и расширят возможности сквозного поиска по контенту.
Компания Марка Цукерберга купила стартап WaveForms AI.
Техногигант приобрел WaveForms AI - молодой стартап, чье программное обеспечение способно идентифицировать и воспроизводить эмоциональные оттенки в человеческой речи. Команда WaveForms присоединится к подразделению Superintelligence Labs.
Стартап был основан в декабре 2024 года, но уже успел привлечь 40 миллионов долларов инвестиций при оценке в 160 миллионов. Компания работала над "Тестом Тьюринга для речи" и так называемым "эмоциональным AGI", чтобы сделать голоса, сгенерированные ИИ, неотличимыми от человеческих.
Для Цукерберга это уже вторая сделка в области ИИ-аудио за последние месяцы после июльского поглощения PlayAI. Финансовые условия покупки не разглашаются.
Google тестирует Google Finance с генеративным ИИ.
Google приступил к тестированию редизайна сервиса Google Finance, в центре которого теперь находится ИИ. В ближайшие недели пользователи из США получат доступ к новой версии со встроенным чат-ботом. Он сможет отвечать на сложные вопросы о рынках, предоставляя обобщенные ответы со ссылками на внешние источники.
Помимо ИИ-помощника, обновление включает расширенные инструменты для построения графиков и добавляет рыночные данные в реальном времени для сырьевых товаров и криптовалют.
Появится и постоянно обновляемая новостная лента, которая позволит отслеживать важные заголовки, не покидая платформу. Во время тестового периода пользователи смогут переключаться между новым и классическим интерфейсами.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Grok 5 выйдет до конца этого года.
Спустя всего час после окончания презентации GPT-5, Илон Маск написал в Х, что следующая итерация модели искусственного интеллекта от xAI, Grok 5, будет выпущена до конца 2025 года, и пообещал, что она будет "разрушительно хороша".
OpenAI выплатит бонусы ключевым сотрудникам.
OpenAI предложила бонусы за удержание примерно тысяче своих исследователей и инженеров - это около трети всего штата. По данным The Information, суммы выплат варьируются от нескольких сотен тысяч до нескольких миллионов долларов на человека.
Эти денежные и акционерные поощрения призваны удержать ключевые таланты в компании. OpenAI сталкивается с агрессивным хантингом со стороны конкурентов, которые активно переманивают ведущих ИИ-специалистов.
Выплаты бонусов происходят на фоне слухов о возможной продаже акций, которая может оценить OpenAI в 500 миллиардов долларов - вдвое больше текущей оценки.
NASA и Google Cloud тестируют ИИ-врача для астронавтов.
NASA совместно с Google Cloud разработали прототип ИИ-системы, которая поможет астронавтам диагностировать и лечить заболевания в условиях ограниченной связи с Землей. Система под названием «Цифровой ассистент бортового врача» объединяет обработку естественного языка с медицинской литературой по космическим полетам, чтобы генерировать рекомендации по лечению и отслеживать здоровье экипажа.
Первые испытания, проведенные по стандартной методике оценки клинической компетентности, показали, что инструмент выдает надежные диагностические предположения. Сейчас модель дорабатывают с практикующими врачами перед ее интеграцией в будущие космические программы.
Baidu до конца месяца выпустит новую ризонинг-модель.
Китайский техгигант планирует представить новую модель, ориентированную на сложные логические рассуждения, уже до конца этого месяца. Кроме того, в ближайшие месяцы компания выпустит обновленную версию своей базовой модели - Ernie 5.0. Первая рмзонинг-модель Baidu представила в марте.
Baidu стала одной из первых крупных китайских компаний, запустивших собственный чат-бот Ernie Bot, аналог ChatGPT. Несмотря на ранний старт, в июле Ernie Bot занимал 10-е место по числу активных месячных пользователей среди ИИ-приложений в Китае.
Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o.
Microsoft объявила, что в ее сервисе Bing Image Creator теперь доступна модель GPT-4o. Она отличается более точным рендерингом текста и лучшим следованием промптам. Кроме того, GPT-4o позволяет редактировать загруженные изображения или использовать их в качестве референса для создания новых.
По просьбам пользователей, Microsoft сохранила и предыдущую модель - DALL-E 3. Теперь при создании изображения можно выбрать, какую из двух моделей использовать.
Как и раньше, сервис предоставляет 15 «быстрых» генераций. После исчерпания лимита за ускорение придется платить баллами Microsoft Rewards, однако медленная генерация остается неограниченной и бесплатной. Доступ к обновленному инструменту открыт через веб-сайт и мобильные приложения Bing.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
GPT-5 покажут 7 августа в 20.00 МСК.
OpenAI представит GPT-5 в ходе прямой трансляции 7 августа в 10 утра по тихоокеанскому времени (20.00 МСК). Это станет первым крупным обновлением с момента выхода GPT-4 в марте 2023 года.
По словам тестировщиков, новая система демонстрирует заметный прогресс в программировании и решении научных и математических задач. Однако они отмечают, что скачок по сравнению с GPT-4 менее заметен, чем переход от GPT-3.5 к GPT-4.
Сэм Альтман ранее намекал, что в основе GPT-5 лежит гибридный подход: традиционное масштабирование модели сочетается с технологией «test-time compute», которая динамически выделяет дополнительные вычислительные ресурсы для решения особо сложных задач.
Grok 2 будет опубликован в оперсорс на следующей неделе.
Илон Маск соообщил, что xAI откроет исходный код модели Grok 2 на следующей неделе. Этот шаг последовал за недавним релизом моделей с открытыми весами от OpenAI и свидетельствует об усилении конкуренции в сегменте открытых ИИ-решений.
Ожидается, что публикация Grok 2 в открытом доступе ускорит совместную разработку в области ИИ и укрепит репутационные позиции xAI в сообществе разработчиков.
Microsoft начала тестировать Gaming Copilot.
Компания запустила бета-тестирование Gaming Copilot, ИИ-помощника, встроенного в Game Bar Windows 11. Функция доступна участникам программы Xbox Insiders и впервые интегрирует технологию Xbox Copilot непосредственно в игровой процесс на ПК.
Ассистент распознает, в какую игру играет пользователь, и может анализировать скриншоты, достижения и историю, чтобы отвечать на вопросы, предлагать стратегии и делать снимки экрана, не выходя из полноэкранного режима. Поддерживается голосовое управление, чтобы геймеры могли в реальном времени запрашивать, например, тактику для битвы с боссом или совет по выбору персонажа.
На данный момент превью доступно только на английском языке в США, Австралии, Новой Зеландии, Японии и Сингапуре.
Jules от Google вышел из беты.
Спустя 2 месяца после начала публичного тестирования, Google официально выпустила своего ИИ-агента для программирования Jules. Инструмент, работающий на модели Gemini 2.5 Pro, способен в асинхронном режиме клонировать кодовые базы, создавать pull-запросы на GitHub и самостоятельно выполнять задачи по исправлению багов или обновлению зависимостей.
С релизом компания представила трехуровневую систему тарификации. Бесплатный план включает до 15 задач в день. Платный доступ интегрирован в подписки Google AI: тариф Pro увеличивает лимиты Jules в 5 раз, а Ultra - в 20 раз.
Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости.
Инструмент, получивший название Claude Code Security Reviewer, использует модель Claude и интегрируется в GitHub Actions, сканируя pull-запросы на наличие потенциальных проблем с безопасностью.
Благодаря способности Claude понимать контекст кода, система может находить уязвимости в разных языках программирования. Она автоматически добавляет комментарии к проблемным участкам, отсеивает вероятные ложные срабатывания и анализирует только измененные файлы. Инструмент доступен () на GitHub под лицензией MIT.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Anthropic обновила Claude Opus до версии 4.1.
Claude Opus 4.1 - обновленная версия флагманской модели Anthropic. Улучшили агентные задачи, работу с кодом и логические рассуждения. На бенчмарке SWE-bench Verified новая модель достигла результата в 74.5%.
Партнеры Anthropic хвалят обновленную модель. В GitHub заявили об улучшении большинства показателей, особенно в рефакторинге кода в нескольких файлах. А в Rakuten Group оценили способность модели находить точные исправления в больших кодовых базах, не внося лишних изменений.
Opus 4.1 уже доступен платным пользователям Claude, в среде Claude Code, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Цена на новую модель осталась такой же, как и на Opus 4.
DeepMind представила модель генерации интерактивных 3D-миров в реальном времени.
Google DeepMind анонсировала Genie 3, свою новую «модель мира», способную по одной текстовой команде создавать полностью интерактивные трехмерные окружения. Ключевая особенность системы 3 поколения - генерация сцен в реальном времени.
Genie 3 выдает видео в разрешении 720p с частотой 24 кадра в секунду и способна поддерживать связную симуляцию на протяжении нескольких минут, что на порядок дольше предыдущей версии. Модель обладает минутной визуальной памятью для сохранения консистентности объектов, а также поддерживает «события по запросу» — пользователи могут менять погоду или добавлять персонажей прямо во время сессии.
В DeepMind рассматривают технологию как источник практически неограниченных синтетических данных для обучения роботов и беспилотных автомобилей. Пока Genie 3 доступна в режиме ограниченного превью для небольшой группы ученых и авторов контента.
США изучают возможность встраивать в ИИ-чипы отслеживание геолокации.
Высокопоставленный чиновник Белого дома подтвердил, что правительство США рассматривает способы оснащения ИИ-чипов улучшенными возможностями отслеживания местоположения. Эта мера является частью стратегии по ограничению поставок передовых полупроводников, производимых Nvidia, в Китай.
Идея заключается в том, чтобы с помощью программных или аппаратных изменений в самих чипах более эффективно контролировать их перемещение и пресекать контрабанду. Этот пункт прямо включен в недавно представленный US AI Act.
Новость появилась на фоне недавнего вызова представителей Nvidia в правительство Китая для обсуждения как раз вопросов геолокации и других предполагаемых рисков, связанных с чипами H20. В Nvidia отказались от комментариев, но ранее заявляли об отсутствии «бэкдоров» в своей продукции.
xAI запустила Grok Video с режимом генерации NSFW-контента.
Компания Илона Маска представила Grok Imagine - инструмент для image-to-video и text-to-image генерациq. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.
Ключевым отличием от конкурентов стал режим «Spicy». Он прямо разрешает создание обнаженных и сексуализированных изображений, в то время как прямые конкуренты используют строгие контент-фильтры.
Пользователи могут выбирать один из четырех стилей анимации: Custom, Normal, Fun и Spicy. Маск сообщил, что за первые дни после запуска пользователи сгенерировали более 34 миллионов изображений.
theverge.com ()
ElevenLabs релизнула модель для создания музыки по текстовым запросам.
ElevenLabs запустила новый сервис Eleven Music. Это ИИ-модель, которая преобразует текстовые описания в готовые песни, джинглы и фоновые треки. Сервис доступен как для частных лиц, так и для бизнеса.
Весь сгенерированный контент подходит для коммерческого использования. Для этого ElevenLabs обучила свою модель исключительно на лицензированных материалах и заключила соглашения с крупными управляющими цифровыми правами, Merlin Network и Kobalt Music Group.
Кроме того, в систему встроены защитные механизмы, блокирующие запросы, которые могут привести к созданию оскорбительного контента.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
OpenAI добавила в ChatGPT напоминания о перерывах.
OpenAI анонсировала обновления для ChatGPT, направленные на формирование более здоровых привычек у пользователей. Теперь, по аналогии с соцсетями и стриминговыми сервисами, чат-бот будет показывать напоминания о необходимости сделать перерыв во время длительных сессий.
Кроме того, компания настраивает модель так, чтобы она давала менее категоричные ответы на запросы, требующие жизненных советов. Например, на вопрос о разрыве отношений ChatGPT не будет отвечать "да" или "нет", а вместо этого предложит темы для размышления, чтобы пользователь мог самостоятельно принять решение. Для разработки этих улучшений OpenAI сотрудничала с более чем 90 врачами из 30 стран и создает специальную консультативную группу экспертов.
Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио.
MiDashengLM-7B - мультимодальная модель для комплексного анализа аудио. В отличие от аналогов, она распознает не только речь, но и звуки и даже музыку. По словам Xiaomi, модель устанавливает новые рекорды на 22 публичных бенчмарках. В ее основе лежат собственный аудиоэнкодер Xiaomi Dasheng и декодер Qwen2.5-Omni-7B- Thinker.
Ключевым преимуществом модели заявляется высокая эффективность инференса. Задержка до первого токена (TTFT) в 4 раза ниже, а пропускная способность более чем в 20 раз выше, чем у передовых моделей при том же объеме VRAM. Модель обучена на 100% публичных данных и распространяется под лицензией Apache 2.0. Код и веса уже доступны на GitHub и Hugging Face.
Apple начала разрабатывать собственный ИИ-поисковик.
Apple активно работает над созданием собственного поискового движка на базе ИИ. Новая команда под названием AKI (Answers, Knowledge and Information) создает систему, которая будет сканировать Интернет и объединять результаты в единый продукт под рабочим названием «Answer Engine».
Разработка ведется как для отдельного приложения, так и для интеграции в Siri, Spotlight и Safari. Этот разворот в стратегии показывает, что Apple теперь рассматривает генеративный поиск как ключевой элемент в конкуренции с Google и OpenAI.
В Китае создали нейроморфный компьютер, имитирующий мозг обезьяны.
Инженеры из Чжэцзянского университета представили Darwin Monkey - крупнейший в мире нейроморфный компьютер, архитектура которого вдохновлена строением мозга макаки. Система состоит из 15 blade-серверов, вмещает 2 млрд. импульсных нейронов и 100 млрд. синапсов, а ее энергопотребление составляет всего около 2000 Вт, что сопоставимо с бытовым обогревателем.
В основе компьютера лежат 960 кастомных чипов Darwin 3. В отличие от традиционных GPU, они работают с дискретными "импульсами", подобно биологическим нейронам. Система уже продемонстрировала способность решать математические задачи, писать тексты и анализировать данные с сенсоров, работая с адаптированной моделью DeepSeek. Darwin Monkey также может симулировать нервные системы более простых организмов: червей и мышей, что открывает новые горизонты для нейробиологических исследований.
Cloudflare заблокировала Perplexity за скрытое сканирование сайтов.
Cloudflare приняла решение заблокировать Perplexity AI за использование незадекларированных веб-краулеров. По данным Cloudflare, Perplexity маскировала свои боты под обычные браузеры Chrome на macOS и меняла IP-адреса, чтобы обойти ограничения robots.txt и WAF.
Cloudflare зафиксировала от 3 до 6 миллионов таких запросов в день, это затронуло, по оценке, около десятков тысяч доменов. В компании назвали это скрытным сканированием. Perplexity отвергла обвинения, назвав это "PR-акцией" и заявила, что такой краулер им не принадлежит.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии.
ByteDance показала экспериментальную языковую модель Seed Diffusion Preview, основанную на дискретной диффузии, которая работает в 5.4 раза быстрее аналогов того же размера, достигая скорости 2146 токенов в секунду. При этом качество генерации кода на ключевых бенчмарках остается сопоставимым.
Для достижения такого результата команда применила двухэтапное обучение и оптимизированный параллельный декодинг. В задачах редактирования кода, диффузионный подход показал явное преимущество над авторегрессионными моделями. ByteDance рассматривает эту технологию как возможную основу для языковых моделей нового поколения. Модель уже доступна для тестирования.
Manus Wide Research: запуск до 100 ИИ-агентов одновременно.
Manus добавил новую функцию Wide Research, которая позволяет одним кликом задействовать до сотни ИИ-агентов для параллельного выполнения сложных исследовательских задач. Система автоматически определяет, когда требуется расширенный поиск, и запускает множество копий Manus, каждая из которых работает над своей частью задачи в отдельной виртуальной машине.
Архитектура Wide Research вдохновлена парадигмой MapReduce от Google. В отличие от традиционных мультиагентных систем с ролевым разделением, здесь каждый суб-агент является полной копией Manus.
Функция уже доступна для Pro-пользователей, Plus и Basic подписчики получат доступ позже .
Nvidia представит на SIGGRAPH 2025 ИИ-модель Queen для создания объемного видео.
Nvidia анонсировала дебют своей новой модели Queen для создания и стриминга объемного видео. Презентация состоится на конференции по компьютерной графике SIGGRAPH 2025 в Лос-Анджелесе. Демонстрации будут проходить на стенде Dell, где покажут, как Queen в связке с профессиональными видеокартами Nvidia RTX обеспечивает работу телеприсутствия в расширенной реальности и решает другие задачи по созданию контента.
Кроме того, 12 августа Nvidia проведет мероприятие «RTX Rendering Day». На нем исследователи компании расскажут о последних достижениях в области нейронного рендеринга, генерации синтетических данных и интеллектуального создания контента. Посетить сессии смогут все участники конференции.
Cohere выпустила новую мультимодальную модель Command A Vision.
Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.
Модель способна не только считывать текст с документов, но и понимать их структуру, выдавая результат в формате JSON. Кроме того, Command A Vision может анализировать и реальные изображения, например, для выявления потенциальных рисков на промышленных объектах.
Модель уже доступна на платформе Cohere и в репозитории Hugging Face для исследовательских целей. Для запуска понадобятся 2 GPU A100 или один H100 под квантованную 4-битную версию.
Anthropic научилась "вакцинировать" ИИ-модели от нежелательного поведения.
В Anthropic обнаружили специфические паттерны нейронной активности - "векторы персоны", которые отвечают за устойчивые черты поведения LLM: склонность к лести, галлюцинациям или откровенно злому поведению.
Выделив эти нейронные сигнатуры, ученые научились предсказывать появление проблемных личностей и, что более важно, "вакцинировать" модели от них. В ходе обучения они намеренно активируют нежелательный вектор, а затем удаляют его перед развертыванием. Это позволяет сохранить общую производительность модели, но при этом значительно снизить риск токсичных или ложных ответов.
Исследование легло в основу новой инициативы Anthropic по так называемой "ИИ-психиатрии", цель которой - мониторинг и управление поведением моделей в больших масштабах. Хотя эксперименты проводились (https://arxiv.org/pdf/2507.21509) на небольших системах, в Anthropic считают, что эта техника поможет коммерческим чат-ботам избегать непредсказуемых изменений личности.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Perplexity запускает Comet Shortcuts: функция для создания кастомных команд.
Perplexity начал развертывание функции Comet Shortcuts. Она превращает текстовые промпты в многоразовые команды для автоматизации сложных веб-запросов и других рутинных задач. Инструмент вызывается нажатием клавиши «/». В будущем компания планирует добавить возможность делиться созданными шорткатами и монетизировать их.
Новая возможность является частью закрытого бета-тестирования Comet, который позиционируется как следующее поколение ИИ-поиска. Perplexity уже разослала новую волну приглашений и обещает расширять доступ, предлагая подписчикам тарифов Max и Pro более быстрое включение в программу. Также в разработке находятся магазин агентов, менеджер задач и корпоративные функции.
OpenAI построит в Норвегии дата-центр мощностью 230 мегаватт.
OpenAI в партнерстве с норвежской компанией Nscale (подразделение Aker ASA) анонсировала строительство ИИ-ЦОД «Stargate Norway» в городе Нарвик. Это будет первый европейский объект в рамках глобальной программы Stargate, запущенной OpenAI.
Планируется, что к концу 2026 года ЦОД сможет вместить около 100 000 графических ускорителей NVIDIA, с последующим наращиванием мощностей. Комплекс будет полностью работать на возобновляемой гидроэнергии и использовать холодный климат региона для повышения энергоэффективности. Размещение мощной вычислительной инфраструктуры в Европе позволит OpenAI снизить задержки для региональных клиентов и удовлетворить растущий спрос на свои сервисы.
Ollama выпустила десктопное приложение для Windows и MacOS.
Официальное десктопное GUI-приложение упрощает взаимодействие с моделями, позволяя скачивать и запускать их без сложной настройки через командную строку.
Приложение получило drag-and-drop для текстовых и PDF-файлов и поддержку мультимодальности (например, с моделью Gemma 3). Для обработки больших документов предусмотрена возможность увеличения длины контекста. Также реализованы функции для работы с кодом, помогающие в его анализе и генерации. Приложение для Windows или MacOS можно скачать на сайте Ollama.
BFL представили новую модель FLUX1.1 Krea Dev.
Лаборатория Black Forest Labs в сотрудничестве с Krea AI выпустила FLUX1.1 Krea Dev - новую text-to-image модель с открытыми весами. Модель, как заверяют разработчики, обладает "самобытной эстетикой", которая решает проблему перенасыщенных текстур и узнаваемого пластикового вида, характерного для многих генеративных систем.
По результатам тестов, в оценках по пользовательским предпочтениям модель не уступает закрытым аналогам. Она совместима с экосистемой FLUX и позиционируется как гибкая основа для дальнейшей кастомизации. Веса модели уже доступны в репозитории на HuggingFace. Для коммерческого использования предусмотрены лицензии, а партнеры предоставляют доступ через API.
OpenRouter открыл доступ к модели Horizon Alpha, которую считают секретным GPT-5.
OpenRouter незаметно выпустил LLM Horizon Alpha, описав ее как "стелс-модель" и предложил пользователям бесплатное тестирование. Система сразу привлекла внимание своими характеристиками: контекстное окно в 256 тыс. токенов, это в 4 раза больше, чем у GPT-4o, и лидерство в бенчмарке EQ-Bench, оценивающем логику и качество текста.
Релиз немедленно породил слухи, что под названием Horizon Alpha скрывается GPT-5. Многие независимые разработчики указывают на ее исключительную производительность и творческие способности как на косвенные доказательства. Сама OpenAI пока не давала комментариев, а в документации OpenRouter нет официальной атрибуции.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Марк Цукерберг опубликовал открытое письмо: нас ждет "персональный сверхинтеллект".
Глава техногиганта в своем обращении определил видение компании на ближайшее десятилетие. Центральное место в нем занимает концепция персонализированного ИИ-помощника, который будет доступен каждому.
Цукерберг прямо противопоставил этот подход видению конкурентов, где сверхинтеллект централизованно автоматизирует всю работу, а человечество живет на его обеспечении. Сам Марк считает, что прогресс достигается через реализацию индивидуальных устремлений.
Ключевым элементом этой экосистемы станут персональные устройства, в первую очередь очки, которые будут считывать контекст пользователя и станут основным вычислительным устройством. Цукерберг также отметил, что, несмотря на симпатию к open-source, компания будет более осмотрительно подходить к вопросам безопасности, решая, какие технологии можно делать открытыми.
Google подпишет Кодекс по ИИ Евросоюза.
Google объявила о своем намерении присоединиться к добровольному Кодексу по регулированию моделей ИИ общего назначения, предложенному Еврокомиссией. Таким образом, компания последует примеру других ключевых игроков рынка.
Вместе с тем, в Google выразили обеспокоенность по поводу грядущего AI Act. По мнению компании, некоторые его положения, выходящие за рамки действующего законодательства об авторском праве, и потенциальные задержки в процессах утверждения могут замедлить развитие и внедрение ИИ в Европе. Компания также опасается, что ее могут вынудить раскрыть коммерческие тайны.
NEO: агентная система, которая полностью автоматизирует ML-разработку.
Стартап WithNeo анонсировал NEO - мультиагентную ИИ-систему для автоматизации всего цикла разработки в машинном обучении. Платформа использует 11 специализированных агентов, которые без участия человека выполняют весь спектр задач: от очистки данных и выбора моделей до настройки гиперпараметров и вывода кода в продакшен.
В WithNeo заявляют, что такой подход дает возможность просто описывать желаемый результат, а не писать код и связывать воедино разные компоненты. Инструмент позиционируется как следующий шаг в эволюции ИИ-ассистентов, превосходящий стандартные "копайлоты". В ходе ранних тестов система выбила медали в 34% соревнований на Kaggle.
DeepMind показала модель для создания цифрового двойника Земли.
AlphaEarth Foundations, ИИ-модель от Google Deepmind, которая объединяет спутниковые данные (оптические, радарные, LiDAR) и климатическую информацию в единое цифровое представление планеты. По заявлению компании, система снижает количество ошибок на 23.9% и сжимает данные в 16 раз по сравнению с существующими методами, что удешевляет и ускоряет анализ массивов изображений.
Модель генерирует поля эмбеддингов с разрешением 10 метров для каждого квадрата 10x10 метров на Земле. Это позволяет отслеживать вырубку лесов, состояние посевов и другие изменения почти в реальном времени.
Набор данных Satellite Embedding доступен через платформу Google Earth Engine. Компания подчеркивает, что разрешение достаточно для экологического мониторинга, но не позволяет идентифицировать людей.
Ideogram научился генерировать персонажей с сохранением внешности.
Ideogram AI выпустил модель Ideogram Character, решающую одну из главных проблем text-to-image систем - сохранение визуальной консистентности персонажа на разных изображениях.
Новый инструмент позволяет поддерживать идентичность героя, используя всего одно референсное изображение. После этого пользователи могут генерировать того же персонажа в разных стилях, с разными эмоциями и при различном освещении без необходимости дообучения модели.
Функция уже начала развертываться для всех пользователей. На бесплатном тарифе дают опробовать функцию 10 раз. Ideogram Character доступна как в веб-версии, так и в приложении для iOS.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Сотрудники Миры Мурати отказались от офферов Цукерберга.
Компания Марка Цукерберга предприняла агрессивную попытку переманить ключевых сотрудников из стартапа Thinking Machines Lab, основанного бывшим CTO OpenAI Мирой Мурати. По данным инсайдеров, компания сделала предложения более чем десятку специалистов. Одно из них превышало миллиард долларов за несколько лет, другие находились в диапазоне от 200 до 500 миллионов за 4 года.
Несмотря на беспрецедентные суммы, все сотрудники отклонили предложения Meta. Причинами отказа называют и без того высокое состояние, значительные доли в собственном стартапе и нежелание работать под руководством Марка Цукерберга.
Skild Brain: единая модель для управления любыми роботами.
Робототехнический стартап SkildAI анонсировал "Skild Brain", фундаментальную ИИ-модель, которая может служить универсальным программным "мозгом" для широкого спектра роботов: от гуманоидов до промышленных манипуляторов.
На демонстрациях роботы успешно ориентировались в незнакомой среде и выполняли сложные многоэтапные действия. По словам основателей, новая технология сокращает разрыв между достижениями в области генеративного ИИ и их практическим применением в физической робототехнике.
SkildAI , вышедшая из стелс-режима в июле 2024 года, уже привлекла инвестиции от Amazon, SoftBank и Sequoia Capital.
NotebookLM научился создавать видеообзоры по загруженным документам.
Google расширил возможности NotebookLM, добавив функцию Video Overviews. Она автоматически генерирует видеоролики с озвучкой, которые наглядно объясняют содержимое загруженных файлов. Система сама подбирает изображения, цитаты, диаграммы и цифры из исходных материалов и представляет их в виде пошаговых слайдов.
Новая функция, дополняющая уже существующие аудиообзоры, позволяет гибко настраивать результат. Пользователи могут указать целевую аудиторию, задать учебные цели или выделить конкретные темы для фокуса.
Кроме того, Google обновила интерфейс Studio, разрешив сохранять несколько результатов одного типа (например, несколько майнд-карт) в одном блокноте. Обновление уже доступно для англоязычных пользователей, в будущем планируется поддержка других языков.
Adobe добавила в Photoshop новые ИИ-инструменты.
Adobe выпустила в бета-версии Photoshop новые функции на базе модели Firefly. Одной из самых ожидаемых стала Generative Upscale, она увеличивает разрешение изображений до 8 мегапикселей без потери качества.
Инструмент Remove был обновлен, чтобы более реалистично и чисто убирать с фотографий лишние объекты, оставляя меньше артефактов. Появилась и совершенно новая функция Harmonize. Она автоматически анализирует контекст изображения и подгоняет цвет, свет и тени добавленных объектов, чтобы создать цельную композицию без долгой ручной коррекции.
Кроме того, Adobe анонсировала функцию Projects для более удобного управления файлами. Все нововведения уже доступны для тестирования в десктопной и веб-версиях Photoshop.
ChatGPT Agent научился проходить капчу Cloudflare.
ChatGPT Agent, способный выполнять многошаговые задачи, продемонстрировал неожиданную способность: он может проходить проверку "Я не робот" от Cloudflare. Пользователь Reddit опубликовал скриншоты, на которых агент в рамках задачи по конвертации видео самостоятельно нажимает на галочку "Подтвердите, что вы человек", комментируя свои действия.
Этот случай наглядно демонстрирует, насколько продвинулись ИИ-агенты. Они способны анализировать визуальный контекст, распознавая элементы веб-страниц и взаимодействуя с ними, как человек. В данном случае система поняла необходимость верификации и успешно ее прошла.
Прохождение CAPTCHA - лишь один из примеров возможностей нового агента. Другие пользователи уже показывают, как агент по их поручению заказывает продукты в супермаркете, самостоятельно составляя список покупок по общим критериям и укладываясь в заданный бюджет.
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения
Microsoft добавила новый режим Copilot для Edge.
Обновленный интерфейс Copilot теперь расположен в левом верхнем углу окна бразуера. Он получил оптимизированный дизайн, голосовое управление и улучшенное понимание контекста.
Copilot способен анализировать содержимое нескольких открытых вкладок одновременно. Это позволяет, например, сравнивать варианты путешествий или выбирать ресторан, не переключаясь между страницами. Система автоматически распознает URL-адреса, поисковые запросы и команды в чате.
Новый режим уже доступен бесплатно. В будущем Microsoft планирует добавить функции сортировки истории по проектам и контекстные рекомендации.
Runway анонсировала модель для редактирования видео с помощью текста.
Runway представила свою новую модель Aleph. Она может вносить точечные изменения в уже существующие видеоролики с помощью текстовых команд. Пользователи могут добавлять и удалять объекты, изменять время суток, убирать дым или отражения.
Одной из самых заметных функций стала генерация совершенно новых ракурсов камеры. Модель также способна изменять возраст персонажей, перекрашивать объекты, создавать эффект зеленого экрана и переносить движение с видео на статичные изображения.
Сейчас Aleph доступна только для корпоративных и креативных партнеров, среди которых уже есть голливудская студия Lionsgate. Широкий доступ планируется в будущем.
Huawei показала ИИ-систему, способную конкурировать с флагманом Nvidia.
На Всемирной конференции по искусственному интеллекту в Шанхае Huawei впервые публично продемонстрировала свою новую вычислительную систему CloudMatrix 384. Эксперты рассматривают ее как прямого конкурента самой продвинутой на сегодня системы от Nvidia - GB200 NVL72.
CloudMatrix состоит из 384 новейших чипов 910C и, по некоторым метрикам, превосходит решение Nvidia, которое использует 72 чипа B200. Как отмечают аналитики из SemiAnalysis, Huawei компенсирует более слабую производительность отдельных чипов за счет их большего количества и инноваций на системном уровне.
Система уже эксплуатируется на облачной платформе Huawei.
Alibaba презентовала умные очки Quark.
Alibaba анонсировала свои первые умные очки Quark. Устройство, которое выйдет на рынок Китая к концу 2025 года, позиционируется как конкурент умным очкам от Ray-Ban.
По капотом у Quark большая языковая модель Qwen и ИИ-ассистент Quark, которые управляют функциями звонков, прослушивания музыки, перевода в реальном времени и покупок. Очки тесно интегрированы с экосистемой Alibaba: платежным сервисом Alipay, торговой площадкой Taobao и картографическим сервисом Amap.
Технологически устройство работает на чипе Qualcomm AR1 и, по заявлению компании, получилось на 40% тоньше существующих аналогов на рынке.
Лейбл Hallwood подписал контракт с самым популярным ИИ-музыкантом платформы Suno.
Независимый лейбл Hallwood заключил сделку с Imoliver - самым прослушиваемым автором, создающим музыку с помощью нейросети. Imoliver уже набрал более 3 миллионов прослушиваний своей песни "Stone" на платформе Suno.
Теперь трек выйдет на всех основных стриминговых сервисах 8 августа, а полноценный альбом запланирован на октябрь. Глава Suno Майки Шульман назвал это событие "ключевой вехой для будущего музыки".
#news #ai #ml #ChatGPT #ИИ #ИскусственныйИнтеллект #Нейросети #GPT #OpenAI #МашинноеОбучение #NLP #ГенерацияТекста #Чатбот #Автоматизация #API #Prompt #FineTuning #DeepLearning #Трансформеры #LLM #ГенеративныйИИ #DataScience #Программирование #Python #Интеграция #Обучение #AIAssistant #ОбработкаДанных #Технологии #Инновации #ЭтикаИИ #БезопасностьИИ #ОтветственныйИИ #ПриложенияИИ #БизнесПриложения #Аналитика #Креативность #Образование #AICommunity #БудущееИИ #APIIntegration #ТестированиеИИ #Документация #AIExperiments #NaturalLanguageProcessing #ConversationalAI #AIResearch #AIApplications #ChatGPTAlternatives #МодельОбучения