VK внедрила визуально-языковые модели в поиск сервисов
Холдинг VK объявил о масштабном обновлении своих поисковых алгоритмов за счет внедрения продвинутых визуально-языковых моделей. Новая технология, получившая название Discovery, позволяет искусственному интеллекту одновременно анализировать текстовое описание, изображения, звук и видеоряд. Это решение уже успешно интегрировано в сервис VK Видео и постепенно охватит все остальные продукты экосистемы.
Основное отличие новой системы заключается в переходе от классического поиска по ключевым словам к пониманию глубокого смысла контента. VLM автоматически формирует датасеты, изучая саму суть роликов и их визуальные характеристики. Подобный подход сегодня развивают ведущие мировые ИТ-гиганты, такие как Google и TikTok, стремясь сделать взаимодействие пользователя с сервисами более органичным.
Внедрение Discovery уже принесло значимые результаты: число позитивных реакций на контент выросло на семь процентов. Точность рекомендаций похожих видео увеличилась сразу на шестьдесят процентов, что подтверждает эффективность семантического анализа. В будущем система научится распознавать даже специфические стили монтажа и сложные гибридные запросы, объединяющие текст и визуальные образы.
По мнению разработчиков, использование VLM в пять раз ускорит процесс создания и масштабирования новых технологий внутри компании. Это позволит оперативно улучшать выдачу во всех продуктах бренда, делая ее максимально персонализированной для каждого зрителя. Ранее Яндекс повысил эффективность обучения своих ИИ-моделей, также оптимизировав инфраструктуру для работы нейросетей.
Развитие мультимодальных моделей открывает новую эру в способах потребления цифрового контента. Теперь качественный интернет-маркетинг требует создания роликов, которые будут понятны алгоритмам не только по описанию, но и по визуальному ряду. Эффективное продвижение сайтов и видеоканалов сегодня напрямую зависит от глубины интеграции ИИ-технологий в механизмы ранжирования и поиска информации.