Сергей Арбузов
[ open for senior roles · remote / hybrid / RU ]

Строю инженерные процессы, в которых AI работает в production, а не в демо.

Сергей Арбузов. DevOps Team Lead · Platform Engineering · AI в инженерных процессах.

22 года в разработке и инфраструктуре. Девятый год в SpaceBridge (Канада, спутниковая связь), сейчас — Chief Automation. Внедрил AI code review, PRD review и автогенерацию тестов в рабочий цикл команды. До этого — миграции в Kubernetes, Jenkins pipelines, сборка embedded на Yocto.

Чем занимаюсь

01

AI в инженерных процессах

Code review и PRD review на Claude Code в production. MCP-интеграции, headless-агенты в CI. Путь от «купили подписки» до рабочей архитектуры.

02

Platform Engineering

Внутренние инструменты, универсальные pipelines, self-serve инфраструктура. Tooling для команды важнее личной продуктивности.

03

Kubernetes & release

Миграция legacy в k8s, распиливание монолита, дистрибутивы. Jenkins declarative, GitOps, Artifactory, observability.

04

Работа с командой

Собеседования, адаптация, обучение новым технологиям. Удержание людей и выстраивание процессов в нестабильных условиях.

Что я строил и как это работает сейчас

#01 PRODUCTION · 2025–2026

AI-агенты в цикле ревью: Code Review и PRD Review

Контекст. Распределённая инженерная команда, телеком-продукт, годами накопленное легаси. Ревью долгое, senior-времени мало, PRD часто дырявые. Нужно было встроить AI так, чтобы использование было нулевым усилием для разработчика — иначе инструмент умирает за неделю.

Что не сработало — и почему это важно

Прошли пять промежуточных этапов за год. Каждый закрыл гипотезу, а не отменил следующий:

01
Индивидуальные подписки ChatGPT / Copilot Нет общего контекста, несопоставимые результаты, нет интеграции с GitLab/Confluence.
02
Локальные Ollama + Open WebUI Своё «ChatGPT» с данными компании. Модели слишком медленные, MCP практически не работает, требования к железу высокие.
03
Централизованные платные подписки MCP-серверы нужно ставить локально — не все в команде готовы. Стандарта нет, каждый со своими промптами.
04
n8n + Claude API Удобная оркестрация мышкой, первый работающий AI code review — но проекты не шарятся между пользователями, упёрлись в rate limits.
05
Jenkins + Claude Code headless в Docker Навыки живут в GitLab — общие для всей команды. Никакой настройки на рабочем месте, один стандарт, всё через webhook.

Как работает сейчас

Разработчик пишет @ai mr review в комментарии к MR. Дальше — без его участия: Jenkins banner показывает прогресс прямо в MR, GitLab MCP подтягивает diff и контекст репозитория, Jira MCP сверяет релевантность тикету, результат возвращается inline-комментариями плюс аппрув.

Второй процесс — PRD Review в Confluence — на том же каркасе: триггер в комменте, Confluence + PDF MCP читают спецификацию, модель проверяет три критерия: противоречивость, полноту, верифицируемость. Дырявый PRD автоматически создаёт тикет в Jira.

Что бы сделал иначе

Сразу начал бы с headless-агента в CI. Локальные UI-first решения (Ollama, n8n) — тупик для production. Единственная архитектура, которая выживает: триггер в существующем инструменте разработчика → оркестрация на стороне CI → агент с доступом к корпоративному контексту через MCP.

stack: Jenkins · Claude Code (headless) · Docker · GitLab MCP · Jira MCP · Confluence MCP · Playwright MCP · PDF MCP · кастомные skills
#02 2017–2025 · LONG-TERM

Эволюция DevOps в SpaceBridge: от BASH до платформы

Контекст. Пришёл в компанию по спутниковой связи в 2017-м. На входе: ручная сборка, никакого контроля среды сборки, ручные релизы. GitoLite, GitLab, Jenkins — и «немного BASH». Задача растянулась на девять лет маленькими шагами.

2017
Первая задача: долгая сборка прошивки.Docker + Jenkins DSL + lint. Реакция команды: «А можно оставить всё старое рядом?». Можно.
2018–19
Перенос старых сред сборки в Docker, автоматизация и документирование.Миграция хранилища кода на GitLab. Внедрение merge-requests. Бинари — с windows share на Artifactory.
2020
All-as-Code: Jenkins declarative, универсальные pipelines.Atlassian-стек (Jira, Confluence). Мониторинг инфраструктуры разработки на Telegraf + Grafana. Инвентори — NetBox.
2021–23
Cloud NMS: сравнительный анализ AWS / GKE / on-prem k8s.Миграция legacy NMS в Kubernetes, помощь в распиливании монолита. Дистрибутив + документация для установки и поддержки.
2022+
Поддержка российского офиса в санкционных условиях.Удержание команды, механизмы финансовой устойчивости, легальные схемы расчётов, обучение людей новому стеку.
2024–25
Платформенный подход: универсальные pipelines под однотипные компоненты.SatCloud from firmware to SaaS. Продукт уезжает в облако, embedded остаётся — gap закрывается общим инструментарием.

Вынос — маленькие обратимые изменения работают. Переход от BASH к платформе в лоб не взлетает: люди отторгают. Работающая формула: добавить новое рядом со старым, дать команде время адаптироваться, убирать старое, когда она сама начинает спрашивать «а нельзя так же, как в соседнем проекте?».

stack: Docker · Jenkins (DSL & declarative) · GitLab · Artifactory · Atlassian · Kubernetes · Ansible · Grafana · NetBox · Yocto · cmake · Ant · Composer
#03 R&D · IN PROGRESS

За пределами ревью: BC-checks и тесты Web UI, которые пишет агент

После того, как два AI-процесса закрепились в production, естественный следующий шаг — расширить охват. Два живых эксперимента:

Backward compatibility checks

Релизится новая версия — агент должен увидеть, что в ней сломает обратную совместимость. Триггер — комментарий к release notes в Confluence. GitLab MCP изучает diff между релизами, модель детектирует изменения конфигов (новые обязательные поля, удалённые параметры, изменение типов и дефолтов) и протоколов (переименование методов, изменение структур сообщений, новые обязательные поля). Отчёт — комментарием в Confluence.

Автотесты Web UI NMS

Триггер на релиз NMS. Ansible обновляет тестовый сетап, Confluence MCP вынимает тесты на человеческом языке, модель превращает их в последовательность конкретных шагов, Playwright MCP выполняет. Работает — но честно: далеко не готовый процесс. Открытые проблемы:

  • Динамические UI-элементы — Playwright теряет селекторы после обновления
  • Шаги из Confluence неоднозначны → модель интерпретирует по-разному
  • Контекстное окно — большие наборы тестов не влезают, агент теряет часть сценариев
  • Главный вопрос: как понять, что тест прошёл корректно, а не просто без ошибок

План решения: разделение тестов по веткам Confluence с запуском в отдельных сессиях, subagents для изоляции контекста, скриншоты на каждом шаге для полной трассируемости. Честное «не факт, что взлетит именно так» — часть этого процесса.

stack: Claude Code · Playwright MCP · Confluence MCP · GitLab MCP · Ansible · Jenkins

С чем работаю

orchestration
Kubernetes · Docker · Docker Compose · Ansible · Helm
ci / cd
Jenkins (DSL & declarative) · GitLab CI · Artifactory · merge-request flows
observability
Grafana · Telegraf · NetBox · custom dashboards
ai tooling
Anthropic Claude · Claude Code headless · MCP (Model Context Protocol) · GitLab / Jira / Confluence / Playwright / PDF MCP servers · кастомные skills
languages
Python (основной) · TypeScript · Bash · PHP (legacy, осознанно)
legacy stack
Yocto · make / cmake · WildFly · ant · composer — с чем имею дело спокойно, потому что оно реально везде
management
Atlassian (Jira · Confluence) · Zephyr · подбор и адаптация инженеров · кросс-культурные распределённые команды

Как я работаю

1
Маленькие обратимые изменения важнее больших перестроек. Люди отторгают революции и принимают эволюцию.
2
Сначала метрика, потом оптимизация. Без dashboards не начинаю — иначе вместо решения получается вкусовщина.
3
Tooling для команды важнее личной продуктивности. Один час на общий pipeline экономит 40 часов в месяц в сумме.
4
AI-инструменты — на лапы, не на голову. Ревью не заменяет review. Агент ускоряет, не отвечает.
5
Нулевое усилие для пользователя инструмента. Если разработчику нужно что-то настраивать локально — инструмент умрёт за неделю.
6
Честный негативный опыт ценнее десяти success stories. Путь к рабочему AI в продакшене прошёл через пять провалов — и они в кейсах осознанно.

Публичный слой — что и зачем

Основные рабочие проекты закрыты NDA. GitHub — срез интересов и инженерной гигиены, а не полный проф-опыт.

Home Assistant & IoT — лаборатория

Здесь я держу руки в тонусе: reverse-engineering API устройств, дисциплина поддерживаемых интеграций, Python в условиях реальных пользователей. Не работа, а то, во что она переходит вечером.

Рассматриваю возврат на российский рынок на senior-роли

Сейчас работаю удалённо в канадской компании. Ищу серьёзное предложение по содержанию и уровню. Готов к командировкам, обсуждаю гибрид.

Пишите, если

  • Senior / Lead DevOps, Platform Engineer, SRE
  • Solution Architect в инфраструктуре
  • AI / LLM в инженерных процессах компании
  • Продуктовая команда с реальным масштабом
  • Automation-first культура, не «ещё бы дашбордов»

Не тратьте время, если

  • Единственный DevOps в стартапе на 5 человек
  • Чистый on-call без архитектурной работы
  • Аутсорс, бодишоп, почасовая галера
  • «Нужен скриптач, настроить CI»