Новости по тегу "learning"

Подборка публикаций, содержащих тег "learning". Актуальные темы и важные события.

Нет изображения

GSPO (Qwen RL Algorithm by Alibaba Cloud)

Qwen снова радуют релизом. Но на этот раз это не модель, а новый RL-алгоритм для обучения LLMМетод называется Group Sequence Policy Optimization...

10.08.2025 17:56
20
Нет изображения

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

Решение первого соревнования на kaggle титаник с помощью библиотеки от яндекса catboost. Два способа: обычная модель и второй: с перебором...

08.08.2025 19:36
25
Нет изображения

Как мы обучали модели для кода GigaCode

Привет, Хабр! Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ-помощника для...

08.08.2025 15:05
24
Нет изображения

Стратегия успеха: ключи к развитию карьеры в Data Science (ч.2)

Привет! Я Анна Ширшова, руководитель Кластера моделирования для CRM и оптимизации в ВТБ. Это вторая часть моего материала о карьерном росте в Data...

07.08.2025 07:27
23
Нет изображения

LLM-арсенал: от общих моделей до ESM-3 и DNABERT

В этой статье мы делимся практиками использования языковых моделей (LLM) в биологии и биомедицине — с акцентом на то, что действительно помогает...

07.08.2025 06:47
22
Нет изображения

Почему мы учим английский неправильно и как надо

Я написала и запустила продукт — тренажёр грамматики английского языка. Зачем я это сделала, если уже есть куча приложений, в т. ч. бесплатный в...

06.08.2025 15:44
20
Нет изображения

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты

Цель данной статьи - предоставить полное техническое руководство по созданию торгового агента, обученного с помощью Reinforcement Learning, на...

05.08.2025 14:15
27
Нет изображения

Semantic Error Correction Loop (SECL): самоисправляющиеся LLM-пайплайны с понятием доверия к контексту

В последние годы большие языковые модели кардинально изменили ландшафт искусственного интеллекта, открывая невероятные возможности для...

03.08.2025 20:00
23
Нет изображения

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум

Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз это была архитектура CTM,...

01.08.2025 12:48
24
Нет изображения

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения

Аналитический центр red_mad_robot разобрал объёмную научную статью «Advances and Challenges in Foundation Agents» от группы исследователей AI из...

24.07.2025 21:44
29
Нет изображения

ИИ на подъёме: восхождение к пику ожиданий и первые уроки в реальном бизнесе

Где мы все? Судя по классическому циклу зрелости, Large Language Models (LLM) уверенно маршируют к вершине «Пика завышенных ожиданий». Энтузиазм...

24.07.2025 13:24
26
Нет изображения

Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик

Практически каждый ML‑разработчик сталкивался с прогнозированием временных рядов, ведь окружающие нас сущности и метрики зачастую зависят от...

24.07.2025 07:00
25