Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
ИТ-менеджмент: Статьи Новости компаний Решения

Панорама

Игорь Буторин: «Собственная архитектура — это форма технологической независимости IT-сектора в России»

Разработчик архитектурного коммуникационного ядра, которое применялось при разработке продуктов для разных сегментов рынка …

ViRush: управление на основе данных в условиях турбулентности

Конференция ViRush 2030, ежегодно проводимая компанией Visiology — основное событие в сфере BI на российском …

Дарья Богун: «Обучение IT и криптовалютам скоро станет повсеместным»

Недавно завершился престижный международный конкурса Cases and Faсes, где отбирают самые инновационные и технологичные …

Продуктовой разработке пора уходить с Jira

Крупные компании продолжают использовать Jira по инерции — это решение создавалось для небольших команд, но его …

Молодой хостинг VS старый рынок: как UFO.Hosting использует свой возраст как преимущество

Хостинг — одна из тех ниш, где внешне мало что меняется. Даже несмотря на то, что это IT и технологии …

Как построить высоконагруженный сервис чатов и ВКС: практическое руководство

Игорь Малышев, директор по сервисам eXpress | 25.12.2025

Компании, работающие в гибридных и распределенных форматах, всё чаще переходят к собственным коммуникационным платформам: массовые ВКС, защищённые чаты, единое пространство взаимодействия. Но чтобы такая система выдерживала сотни и тысячи подключений, её нужно изначально проектировать как инфраструктурный сервис — с предсказуемой производительностью, контролируемым хранением данных и интеграцией в корпоративный контур.

Рассмотрим, какие сценарии требуют высоконагруженной коммуникационной платформы, как формировать технические требования, с чего начинать пилот и как закладывать масштабируемость архитектуры. Также разберем ключевые метрики под нагрузкой, особенности мониторинга и дадим рекомендации тем, кто начинает строить собственный сервис чатов и ВКС.

Когда мы говорим о том, как сегодня меняются требования к коммуникационной инфраструктуре, важно учитывать контекст последних лет. Массовое использование ВКС как рабочего инструмента началось во время пандемии, когда компании одномоментно перешли на удаленный формат и возникла необходимость быстро обеспечить сотрудников простыми и доступными средствами связи. Первую волну спроса закрыли, главным образом, зарубежные облачные сервисы вроде Zoom и Microsoft Teams. В 2022 году ситуация резко изменилась: часть провайдеров покинула российский рынок, у других появились ограничения, и использование внешних сервисов стало непредсказуемым. Это стало отправной точкой для пересмотра подхода к коммуникационной инфраструктуре. Компании начали всё чаще задумываться о снижении зависимости от иностранных платформ и о внедрении российских решений, работающих внутри корпоративного контура и обеспечивающих предсказуемость, безопасность и контроль. Именно эти факторы стали драйвером роста спроса на отечественные коммуникационные системы и подтолкнули рынок к развитию в сторону автономных платформ.

На этом фоне стал очевиден и другой тренд: потребность в сервисах, способных выдерживать сотни и тысячи одновременных подключений. В первую очередь это касается компаний с удалённой или гибридной моделью работы, где сотрудники не находятся в одном офисе и должны регулярно синхронизироваться в ходе рабочих процессов. Особенно остро эта потребность проявляется в географически распределённых организациях — с филиалами, командами и проектными группами в разных регионах и часовых поясах. Там высокая нагрузка на коммуникационные инструменты становится нормой. Изменение модели работы усилило этот эффект. Если еще 10-15 лет назад удалёнка была точечным экспериментом, то пандемия показала, что такой формат может быть массовым и эффективным. В результате цифровые коммуникации стали ключевым рабочим инструментом для компаний разных масштабов, и именно это сформировало устойчивый спрос на инфраструктуру, способную обеспечивать стабильное качество связи при больших масштабах подключений.

Когда стандартных ВКС уже недостаточно

Переход к собственному ВКС-решению обычно начинается не с технических ограничений, а с функциональных и организационных требований. Компании в первую очередь оценивают, насколько стандартный сервис закрывает их реальные задачи и соответствует внутренним правилам безопасности. И именно в этот момент становится ясно, подходит ли типовое решение или требуется собственная платформа, работающая внутри корпоративного контура.

Ключевым фактором здесь остаётся информационная безопасность. Записи встреч, транскрибированные материалы, рабочие документы и история коммуникаций должны храниться в контролируемой среде. То же касается и авторизации: компания должна быть уверена, что к совещаниям подключаются только сотрудники или уполномоченные участники, особенно если речь идет о крупных или стратегически важных мероприятиях. Когда данные выходят за пределы инфраструктуры, риски резко возрастают.

Следующим шагом становится запрос на создание единого коммуникационного пространства. Современному бизнесу нужен не отдельный инструмент в виде ВКС-сессии, а интегрированная среда, где чат, звонки и видеоконференции работают как единый механизм. Типичная ситуация: обсуждение идёт в рабочем чате, возникает необходимость быстро собрать всех в голосовую конференцию — без перехода между приложениями, с сохранением контекста переписки и гарантией, что данные остаются внутри защищенного корпоративного контура.

Ключевые параметры при формировании требований

Когда возникает необходимость в такой платформе, компании, как правило, опираются на четыре базовых параметра: производительность, безопасность, интеграции и отказоустойчивость. Эти характеристики не существуют по отдельности — они определяют, насколько система будет стабильной, безопасной и удобной в эксплуатации.

Производительность. От неё напрямую зависит способность платформы работать под реальными нагрузками. Если инфраструктура рассчитана на 500 пользователей, а фактически ею пользуются 5000, негативные последствия неизбежны: падение качества звука и видео, задержки доставки сообщений, нестабильная работа конференций. Поэтому корректный сайзинг и расчёт целевой нагрузки — фундамент проектирования.
Безопасность. Именно требования ИБ чаще всего становятся причиной перехода на собственную систему. Речь идет о контроле над хранением записей, управлении доступами, работе с персональными и корпоративными данными. Безопасность определяется не только политиками компании, но и тем, насколько платформа способна функционировать в защищённом периметре без передачи трафика во внешние сервисы.
Интеграции. По сути, это продолжение темы безопасности и управляемости. Платформа должна взаимодействовать с корпоративными каталогами, обеспечивая авторизацию по существующим правилам. Важны интеграции с DLP-системами, антивирусами, SIEM-решениями — они минимизируют риски утечек и угроз. Но есть и пользовательская сторона: связка с календарями упрощает планирование встреч, интеграции с почтой и рабочими сервисами позволяют быстро переключаться между каналами коммуникаций. Это делает систему частью повседневного процесса, а не ярлыком на рабочем столе.
Отказоустойчивость и SLA. SLA — это не просто формальная договоренность о доступности сервиса. Оно отражает требования к архитектуре. Ещё на старте необходимо определить, нужна ли компании геораспределённая отказоустойчивость, доступны ли резервные площадки и сколько ЦОДов можно задействовать. От этого напрямую зависит выбор технических решений.

Как правильно начинать пилот проекта

Отправная точка любого пилота — не инфраструктура или нагрузка, а чёткое понимание того, что именно необходимо проверить. Если цели не определены заранее, пилот теряет практическую ценность: невозможно оценить результат и понять, подходит ли решение для дальнейшего внедрения. Когда задачи зафиксированы, становится ясно, какой формат пилота оптимален. Если заказчику важно проверить функциональность и пользовательские сценарии, достаточно короткого облачного пилота: вендор предоставляет готовую среду, и заказчик оперативно оценивает ключевые возможности. Если же требуется увидеть, как система работает внутри корпоративного контура, провести интеграции с каталогами, DLP или другими внутренними сервисами, и при этом нет возможности увидеть работу таких интеграций в рамках готовых стендов или референсов других заказчиков, — выбирают формат on-premise. Он позволяет протестировать взаимодействие с реальной инфраструктурой, что невозможно в облаке.

При этом пилот не предназначен для проверки предельных нагрузок. Смоделировать целевой масштаб на небольшой группе невозможно, поэтому пилот — это оценка применимости решения, а не нагрузочных характеристик. Инфраструктурные вопросы в on-prem-сценариях обычно сводятся к настройкам: открытию портов, корректной маршрутизации, разрешению нужных типов трафика. Эти моменты решаются по мере прохождения пилота. В итоге успешный пилот всегда строится по одному принципу: сначала определяется набор сценариев для проверки, а уже под них выбирается формат и объём тестирования.

Как понять, достаточно ли ресурсов для корректного пилота

Оценка достаточности ресурсов во время пилота проводится по тем же принципам, что и в промышленной эксплуатации. На старте формируются требования к инфраструктуре, исходя из размера пилотной группы и предполагаемых сценариев. Далее в процессе тестирования отслеживаются ключевые метрики: загрузка процессора, потребление памяти, работа сети и поведение отдельных компонентов. Если показатели остаются в допустимых пределах, ресурсов достаточно. Если возникают превышения, корректируются мощности или настройки. Профиль использования системы и, соответственно, её нагрузки у каждой компании уникален, поэтому окончательные выводы делаются по фактическим данным, собранным в ходе пилота.

На этом этапе чаще всего возникают два типа ошибок:

Организационные. Когда нет чётко сформулированных целей, когда заранее не определено, что именно нужно проверить, пилот начинает «расползаться». Появляются дополнительные пожелания, меняются приоритеты, усложняется итоговая оценка.
Технические. Как правило, это не сбои платформы, а особенности инфраструктуры заказчика: необходимость открыть порты, настроить DNS, установить сертификаты, разрешить отдельные типы трафика. В on-prem-пилотах такие задачи встречаются почти всегда и решаются в рабочем порядке. Разница только в масштабе — при полном внедрении объём подготовительных работ выше.

Как заложить масштабируемость архитектуры с самого начала

Основой масштабируемой архитектуры является понимание того, как система будет развиваться. Часто компании начинают с небольшого числа пользователей, например 500, но заранее ожидают рост — до нескольких тысяч. Поэтому на старте важно зафиксировать разницу между текущими и целевыми требованиями. Эти данные определяют архитектурный подход. На первом этапе система действительно может быть развернута в минимальной конфигурации, но ее компоненты должны быть распределены так, чтобы масштабирование происходило без пересборки структуры. Проще говоря, роли и сервисы закладываются таким образом, чтобы добавление узлов, увеличение пропускной способности или перераспределение нагрузки стало штатным процессом.

Следующий важный аспект — требования к отказоустойчивости. Часто заказчики не нуждаются в резервировании на старте, но планируют его позже. Это влияет на архитектуру так же, как и прогнозируемый рост нагрузки: мы заранее определяем, какие элементы должны быть масштабируемыми сразу, какие можно добавить позже и как они будут интегрированы в существующую схему. В итоге формируется архитектура, продуманная наперёд. Она не «максимальная», а «эволюционная»: покрывает текущие потребности, но имеет заранее спроектированный путь расширения — и по нагрузке, и по устойчивости.

Где чаще всего возникают узкие места при росте нагрузки

Когда число подключений увеличивается, первым ограничением почти всегда становится производительность. Однако в реальности это не один «узкий участок», а несколько уровней, на которых система может начать приближаться к своим пределам. Чтобы заметить это своевременно, важно отслеживать метрики как на уровне инфраструктуры, так и на уровне платформы.

Первый уровень — базовые вычислительные ресурсы: загрузка процессора, потребление памяти и состояние сетевых интерфейсов. Эти показатели отражают способность подсистемы обрабатывать текущие конференции, звонки и активность пользователей. Если метрики подходят к верхней границе, это ранний сигнал, что конфигурация требует перераспределения ресурсов.
Второй уровень — поведенческие метрики самой платформы: количество активных конференций, длительность подключений, интенсивность медиа-трафика, реакция системы на пики нагрузки. Они показывают, насколько фактический профиль использования совпадает с расчетными сценариями, заложенными при первоначальном сайзинге.

Ключевой момент в том, что универсального профиля нагрузки не существует. Стандартный сайзинг задаёт лишь исходную точку, но каждая компания использует коммуникации по-своему: где-то преобладают длительные видеосессии, где-то — короткие групповые звонки, а где-то активность растет скачками по расписанию. Поэтому важнее не предсказать каждый сценарий, а выстроить процесс наблюдения. Здесь есть два подхода. Первый — закладывать ресурсы под «худший случай». Он надежен, но экономически избыточен. Второй — стартовать с конфигурации, оптимальной для среднего сценария, и по мере эксплуатации отслеживать, какой компонент приближается к своему пределу. В этот момент и выполняется масштабирование: добавляются узлы, меняется распределение ролей, увеличивается пропускная способность.

Как избежать проблем при переходе от пилота к промышленной эксплуатации

Основные сложности перехода почти никогда не связаны с самой платформой — они возникают из-за изменения нагрузки на инфраструктуру заказчика. На пилоте работает небольшая группа технически подкованных сотрудников, а после запуска в промышленную эксплуатацию в систему входит весь штат. Это увеличивает объём обращений и существенно меняет профиль использования.

Чтобы пройти этап без рисков, перед вводом в промышленную эксплуатацию необходимо подготовить базовый комплект материалов и обучить работе с обращениями техническую поддержку заказчика: инструкции по ключевым операциям, список типовых ошибок и порядок их обработки, правила маршрутизации обращений в поддержку. Параллельно проверяется готовность внутренних сервисов: корректность интеграции с каталогом, настройки авторизации, DNS, сертификатов. Если эти элементы выстроены заранее, нагрузка перераспределяется плавно.

Под высокой нагрузкой критичными становятся метрики, показывающие способность системы обрабатывать медиа-трафик. В первую очередь это загрузка CPU на узлах, отвечающих за обработку аудио и видео. Второй блок — сетевые показатели: пропускная способность, задержки, работа балансировщиков, фильтрующих прокси и инспектирующих систем, которые могут ограничивать поток. Конкретный набор параметров зависит от архитектуры: в горизонтально масштабируемых системах рост компенсируется добавлением узлов, в вертикальных — предел достигается быстрее, и ограничения возникают из-за физического ресурса. Определить, что инфраструктура подходит к своему пределу, можно только по данным мониторинга.

Как организовать мониторинг производительности

Для оперативного контроля производительности используются инструменты, которые позволяют собирать и анализировать технические метрики по отдельным компонентам системы. Конкретный стек системы мониторинга не принципиален — важно, чтобы он давал разрез метрик по сервисам и узлам и позволял видеть отклонения на ранних этапах. На практике чаще всего применяется связка Prometheus и Grafana: Prometheus агрегирует показатели по CPU, памяти, сетевым задержкам, количеству активных сессий и работе вспомогательных сервисов, а Grafana предоставляет удобную визуализацию и позволяет отслеживать динамику.

С точки зрения снижения нагрузки основной фактор — структура медиа-потоков. Именно обработка видео и аудио потребляет большую часть вычислительных ресурсов. Чем больше участников с активными камерами и микрофонами, тем выше нагрузка: одна конференция с двадцатью включенными видеопотоками принципиально отличается от встречи, где передаётся только голос одного спикера. Профиль трафика напрямую определяет, сколько CPU потребуется на конкретных ролях системы.

Мы используем cookie-файлы, возможности Яндекс.Метрики и SberAds для наилучшего представления нашего сайта в соответствии с Политикой обработки персональных данных. Если Вы согласны с этим, пожалуйста, нажмите кнопку «Принять». Продолжая пользоваться сайтом, Вы подтверждаете, что были проинформированы об использовании сайтом cookie-файлов, Яндекс.Метрики и SberAds, и согласны с Политикой обработки персональных данных.