Перейти к содержимому
Лекция
#1.38

ИИ для написания кода: AI-помощники, рабочие практики и как выбрать инструмент /Артем Климов

Overview

  • Спикер с 20-летним опытом в аналитике данных обсудил эволюцию от data mining к AI, подчеркивая неизменные подходы в процессе.
  • В области написания кода достигнута существенная экономия, хотя общий финансовый эффект от AI остаётся невысоким.
  • Концепция Knowledge Discovery Database, представленная Григорием Петецкой-Шапирой, включает этапы от эксперта до интерпретации данных.
  • Пример системы в биоинформатике показал важность участия экспертов в анализе научных статей.
  • AI-технологии могут повысить эффективность работы экспертов в 5-10 раз, позволяя им решать задачи самостоятельно.
  • Первое поколение AI-помощников генерирует код на основе текстового описания, представлен инструмент Chatbot Arena для выбора моделей.
  • Для Queen3 с 32M параметрами требуется около 1 миллиона рублей оборудования, что важно для выбора модели.
  • Мультиагентные системы, состоящие из агентов для написания, тестирования и корректировки кода, рекомендуют создавать фреймворки самостоятельно.
  • Devin увеличил успешность автономного изменения кода с 1.96% до 13.86%, а с участием человека - до 23%.
  • Ключевые навыки эксперта включают декомпозицию задач и правильное

Введение и цель доклада (00:02 - 01:53)

  • Спикер представился как эксперт по аналитике данных с 20+ летним опытом.
  • Объяснил эволюцию от data mining к big data и AI.
  • Подчеркнул, что основные подходы остались неизменными.

AI-хайп и реальные результаты (01:53 - 03:22)

  • Несмотря на повсеместное обсуждение AI, мало кто получил финансовые эффекты.
  • В области написания кода уже достигается существенная экономия.

Основы Knowledge Discovery Database (03:22 - 04:41)

  • Представлена концепция 1992 года Григория Петецки-Шапиры.
  • Эксперт → гипотеза → предобработка → data mining → интерпретация.
  • Эксперт остается основой на всех этапах.

Кейс биоинформатики (04:41 - 05:57)

  • Приведен пример создания пилотной системы для поиска и анализа научных статей в биологии.
  • Подчеркнута важность экспертного участия.

10x эксперт-разработчик (05:57 - 08:43)

  • AI-технологии позволяют экспертам повысить эффективность в 5-10 раз.
  • Эксперты могут решать задачи самостоятельно без ожидания разработчиков.

Три поколения AI-помощников (08:43 - 09:59)

  • Первое поколение: базовая генерация кода по текстовому описанию задачи.
  • Представлен инструмент Chatbot Arena для выбора моделей написания кода.

Параметры выбора модели (09:59 - 13:09)

  • Контекстное окно (128k токенов стандарт) и размер модели (1 млрд параметров = 1 ГБ GPU памяти).
  • Для Queen3 32M параметров нужно ~1 млн рублей оборудования.

Мультиагентные системы (13:09 - 16:11)

  • Система из трех агентов: написание кода, тестирование, корректировка.
  • Рекомендация писать фреймворки самостоятельно из-за ограничений готовых решений.

HumanVAL бенчмарк (16:11 - 19:51)

  • Инструмент для выбора мультиагентных систем.
  • Лидер MgDebugger на базе DeepSeek R1.

Автономные мультиагентные системы (19:51 - 22:47)

  • До Devin модели решали только 1.96% задач автономного изменения кода.
  • С Devin показатель вырос до 13.86%, с участием человека до 23%.
  • Развитие идей Devin в open-source формате.

OpenAI Codex (22:47 - 24:07)

  • Популярная система работающая с терминалом.
  • Позволяет запускать до 100 параллельных задач, но не участвует в бенчмарках.

Ключевые навыки эксперта (24:07 - 26:55)

  • Постановка задач исходя из бизнес-потребностей и знания предметной области.
  • Декомпозиция задач для лучшего решения моделями.
  • Правильное тестирование и обратная связь для непрерывного улучшения системы.

Практические рекомендации (26:55 - 35:04)

  • Основные инструменты: OpenAI Codex, ChatGPT, DeepSeek, Queen A, Mistral.
  • Open-source модели как качественные альтернативы.
  • Не рекомендуется дообучать модели под свою кодовую базу.

Правильный пайплайн (35:04 - 37:44)

  • Качественная сегментация кода.
  • Выделение метаданных через LLM.
  • Модель-роутер для поиска релевантной информации.
Видеозапись

Доступно участникам клуба

Записи всех встреч — внутри клуба

Подать заявку