Новости по тегу "learning"
Подборка публикаций, содержащих тег "learning". Актуальные темы и важные события.
GSPO (Qwen RL Algorithm by Alibaba Cloud)
Qwen снова радуют релизом. Но на этот раз это не модель, а новый RL-алгоритм для обучения LLMМетод называется Group Sequence Policy Optimization...
Titanic + CatBoost (Первое решение, первый Jupyter Notebook)
Решение первого соревнования на kaggle титаник с помощью библиотеки от яндекса catboost. Два способа: обычная модель и второй: с перебором...
Как мы обучали модели для кода GigaCode
Привет, Хабр! Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ-помощника для...
Стратегия успеха: ключи к развитию карьеры в Data Science (ч.2)
Привет! Я Анна Ширшова, руководитель Кластера моделирования для CRM и оптимизации в ВТБ. Это вторая часть моего материала о карьерном росте в Data...
LLM-арсенал: от общих моделей до ESM-3 и DNABERT
В этой статье мы делимся практиками использования языковых моделей (LLM) в биологии и биомедицине — с акцентом на то, что действительно помогает...
Почему мы учим английский неправильно и как надо
Я написала и запустила продукт — тренажёр грамматики английского языка. Зачем я это сделала, если уже есть куча приложений, в т. ч. бесплатный в...
RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты
Цель данной статьи - предоставить полное техническое руководство по созданию торгового агента, обученного с помощью Reinforcement Learning, на...
Semantic Error Correction Loop (SECL): самоисправляющиеся LLM-пайплайны с понятием доверия к контексту
В последние годы большие языковые модели кардинально изменили ландшафт искусственного интеллекта, открывая невероятные возможности для...
Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум
Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз это была архитектура CTM,...
От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения
Аналитический центр red_mad_robot разобрал объёмную научную статью «Advances and Challenges in Foundation Agents» от группы исследователей AI из...
ИИ на подъёме: восхождение к пику ожиданий и первые уроки в реальном бизнесе
Где мы все? Судя по классическому циклу зрелости, Large Language Models (LLM) уверенно маршируют к вершине «Пика завышенных ожиданий». Энтузиазм...
Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик
Практически каждый ML‑разработчик сталкивался с прогнозированием временных рядов, ведь окружающие нас сущности и метрики зачастую зависят от...