Компьютерное зрение — способность машины "видеть" и понимать изображения. За 15 лет от "узнать ли это кошка" до "нарисуй мне закат в стиле Ван Гога" — путь огромный.
Распознавание
Свёрточные нейронные сети (CNN) сделали прорыв в 2012 (AlexNet). Сеть анализирует изображение по частям, находит паттерны (края, формы, части объектов), собирает их в целое.
Применения распознавания
- Лицевая идентификация (FaceID)
- Медицинская диагностика (снимки рентгена, МРТ)
- Автономные автомобили (распознавание дорожных знаков, пешеходов)
- Система безопасности
- Агрономия (болезни растений по фото)
Генерация
Обратная задача: сгенерировать изображение из ничего или из текстового описания. Три главных подхода:
- GAN (Generative Adversarial Networks): две сети соревнуются — одна генерирует, другая отличает настоящее от поддельного. Каждая учит другую
- Диффузионные модели: добавляют шум к изображениям и учат модель удалять его. Stable Diffusion, DALL-E 3, Midjourney — на этой основе
- Автокодировщики: сжимают изображение и восстанавливают. Использовались раньше
Текст в изображение
Главный прорыв 2022 — модели, генерирующие изображения по текстовым описаниям. DALL-E 2, Stable Diffusion. Революция в дизайне, искусстве, стоке.
Как это работает
Две нейросети: одна превращает текст в "смысловое пространство" (эмбеддинг). Другая превращает эмбеддинг в изображение. Обучались на миллиардах пар текст-картинка из интернета.
Последние модели
FLUX, Stable Diffusion 3, DALL-E 4 (2025) — почти фотореалистичные результаты. Умеют точно следовать сложным инструкциям. Генерируют несколько секунд на обычном ПК.
Видео
Sora (OpenAI), Veo (Google), Kling (Китай) — генерация видео из текста. Начали работать в 2024. Качество быстро растёт.
Этика и проблемы
- Deepfakes — возможность создания ложных видео
- Авторское право — модели обучались на защищённых работах без разрешения
- Влияние на труд художников, иллюстраторов, стоковых фотографов
- Распространение fake news
Законодательство
ЕС принял AI Act (2024) с требованиями маркировки сгенерированного контента. Россия рассматривает аналогичный закон. Вопрос — как обеспечивать исполнение.
Есть вопрос?
Вопросы и ответы · 0
Не поняли что-то?
Зарегистрируйтесь — и сможете задать вопрос автору объяснения.
Загрузка комментариев…