Урок 2. Направления AI: что умеют нейросети в 2026#
Зачем это нужно#
AI — это не только чат-боты. Нейросети умеют работать с разными типами контента: текст, изображения, видео, аудио, код. Понимание этих направлений поможет вам:
- найти AI-инструмент под конкретную задачу
- автоматизировать рутину (транскрипция, дизайн, монтаж)
- предлагать клиентам больше услуг
- понимать, что возможно прямо сейчас
Карта модальностей: что во что превращается#
Текст → Текст (основа всего)
Что это: Классическая работа AI — получает текст, выдаёт текст. Генерация, анализ, перевод, суммаризация, ответы на вопросы. Это фундамент, на котором работают все AI-чаты.
Ключевые инструменты:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| ChatGPT | Универсальные задачи, копирайтинг, идеи | Бесплатно / $20/мес |
| Claude | Длинные документы, анализ, код | Бесплатно / $20/мес |
| Gemini | Работа с Google Workspace, мультимодальность | Бесплатно / $20/мес |
| Perplexity | Поиск фактов с источниками | Бесплатно / $20/мес |
| DeepSeek | Бюджетные задачи, reasoning, код | Бесплатно / дёшевый API |
На практике: написание текстов, переводы, редактура, анализ отчётов, ответы на вопросы клиентов, создание промптов, обработка обращений.
Текст → Изображение
Что это: AI создаёт изображения по текстовому описанию (промпту). Революция в дизайне, маркетинге и контент-производстве.
Ключевые инструменты:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| Midjourney | Художественные, детализированные изображения | от $10/мес |
| DALL-E 3 | Быстрые иллюстрации (встроен в ChatGPT) | Включён в ChatGPT |
| Stable Diffusion | Бесплатная генерация (нужен мощный комп или сервер) | Бесплатно (open-source) |
| Flux | Фотореализм, современные стили | Бесплатно / от $10/мес |
| Ideogram | Текст на изображениях (логотипы, постеры) | Бесплатно / от $8/мес |
| Adobe Firefly | Интеграция с Photoshop/Illustrator | от $5/мес |
| Canva AI | Быстрый дизайн без навыков дизайнера | Бесплатно / Pro от $10/мес |
На практике: иллюстрации для постов, баннеры для рекламы, логотипы, презентации, мокапы продуктов, аватарки, визуалы для соцсетей.
Текст → Видео
Что это: AI создаёт видеоролики по текстовому описанию или из статичных изображений. Одно из самых быстроразвивающихся направлений.
Ключевые инструменты:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| Sora (OpenAI) | Кинематографичные видео, реализм | Включён в ChatGPT Plus |
| Runway Gen-3 | Профессиональный видеомонтаж с AI | от $12/мес |
| Pika | Быстрые короткие видео, анимации | Бесплатно / от $8/мес |
| Kling (Kuaishou) | Качественные длинные видео | Бесплатно / от $5/мес |
| Veo (Google) | Высокое качество, интеграция с Google | Через Gemini Advanced |
| HeyGen | AI-аватары, «говорящие головы» | от $24/мес |
| Synthesia | Корпоративные видео с AI-спикерами | от $22/мес |
На практике: рекламные ролики, обучающие видео, контент для соцсетей (Reels, TikTok, Shorts), видеопрезентации, видеовизитки, объясняющие анимации.
Текст → Аудио и музыка
Что это: AI озвучивает текст реалистичными голосами или создаёт музыку по описанию. Два направления: озвучка (голос) и музыкальная генерация.
Озвучка и голос:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| ElevenLabs | Реалистичная озвучка, клонирование голоса | Бесплатно / от $5/мес |
| Murf.ai | Корпоративные голоса, презентации | от $19/мес |
| OpenAI TTS | Озвучка через API (для интеграции) | Pay-per-use |
| YandexSpeechKit | Русские голоса, синтез речи | Бесплатный тариф |
Музыка:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| Suno | Генерация песен с текстом и вокалом | Бесплатно / от $8/мес |
| Udio | Высококачественная музыка разных жанров | Бесплатно / от $10/мес |
На практике: озвучка видео и презентаций, подкасты, рекламные аудиоролики, фоновая музыка для контента, аудиокниги, голосовые ассистенты, джинглы.
Аудио → Текст (транскрипция)
Что это: AI превращает аудио и видео в текст. Незаменимо для встреч, интервью, подкастов, лекций.
Ключевые инструменты:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| Whisper (OpenAI) | Универсальная транскрипция, 99+ языков | Бесплатно (open-source) |
| Otter.ai | Записи встреч Zoom/Meet с AI-саммари | Бесплатно / от $10/мес |
| Fireflies.ai | Командные встречи, CRM-интеграция | Бесплатно / от $10/мес |
| tl;dv | Запись + тайм-коды + AI-резюме встреч | Бесплатно / от $20/мес |
| Deepgram | Быстрая транскрипция через API | Pay-per-use |
На практике: расшифровка встреч, субтитры для видео, транскрипция интервью и подкастов, протоколирование совещаний.
Изображение и видео → Текст
Что это: AI «видит» изображения и видео — описывает, анализирует, извлекает информацию.
Ключевые инструменты:
| Инструмент | Лучше всего для | Цена |
|---|---|---|
| GPT-4o (Vision) | Анализ фото, скриншотов, документов | Встроен в ChatGPT |
| Gemini | Понимание изображений и видео | Встроен в Gemini |
| Claude (Vision) | Анализ документов и сложных схем | Встроен в Claude |
| Google Lens | Распознавание объектов, текста с фото | Бесплатно |
На практике: распознавание текста с фото (чеки, визитки, вывески), анализ графиков из отчётов, описание товаров по фото, модерация контента, перевод текста с изображений.
AI-инструменты для создания приложений (для не-технарей)#
Одно из самых удивительных направлений 2025–2026: AI научился писать код за вас. Теперь человек без технических навыков может создать работающее приложение, сайт или инструмент — просто описав, что ему нужно.
Что такое AI IDE и AI CLI простыми словами
IDE (среда разработки) — программа, в которой пишут код. AI IDE = программа, где AI пишет код за вас, а вы описываете, что хотите.
CLI (командная строка) — текстовый интерфейс для ввода команд. AI CLI = вы даёте задачу текстом, AI выполняет её в терминале.
Главное: Вам не нужно учить программирование — достаточно описать, что вы хотите получить.
Генераторы приложений (самое простое для старта)
Эти инструменты создают рабочие сайты и приложения по текстовому описанию:
| Инструмент | Что делает | Для кого | Цена |
|---|---|---|---|
| v0.dev (Vercel) | Генерирует веб-интерфейсы и UI по описанию | Предприниматели, дизайнеры | Бесплатно / от $20/мес |
| Lovable | Создаёт полноценные веб-приложения из описания | Не-технари, стартаперы | Бесплатно / от $20/мес |
| Bolt.new | Генерирует и запускает приложения прямо в браузере | Быстрые прототипы | Бесплатно / от $20/мес |
| Replit Agent | Пишет и запускает код в браузере | Новички | Бесплатно / от $25/мес |
Пример: Вы пишете «Создай лендинг для курсов английского с формой записи и калькулятором цен» → инструмент генерирует рабочий сайт за 2–5 минут.
AI-редакторы кода (для тех, кто хочет больше контроля)
| Инструмент | Что делает | Цена |
|---|---|---|
| Cursor | IDE с AI-ассистентом: пишет, редактирует, объясняет код | Бесплатно / от $20/мес |
| Windsurf | AI-среда разработки от Codeium | Бесплатно / от $10/мес |
| GitHub Copilot | AI-помощник прямо в редакторе кода | Бесплатно / от $10/мес |
AI-агенты для кода (самые мощные)
Эти инструменты работают автономно — вы даёте задачу, AI делает:
| Инструмент | Что делает | От кого | Цена |
|---|---|---|---|
| Claude Code | Агент в терминале: пишет, тестирует, исправляет код | Anthropic | Через подписку Claude |
| Codex CLI | Терминальный агент для работы с кодом | OpenAI | Через API OpenAI |
| Jules | AI-агент для программирования | Бета, бесплатно | |
| Gemini CLI | Агент Google для работы с кодом и задачами | Бесплатно (бета) |
Не только код: AI-редакторы для работы с документами
Многие думают, что Cursor, Claude Code и подобные инструменты — только для программистов. На самом деле они отлично подходят для работы с любыми текстовыми документами: заметками, статьями, ТЗ, контрактами, базами знаний.
Как это работает:
IDE (Integrated Development Environment — интегрированная среда разработки) — по сути, мощный текстовый редактор с встроенным AI-помощником. Вы открываете папку с файлами, и AI видит все ваши документы, понимает их структуру и может:
- редактировать сразу несколько файлов по вашей просьбе
- искать и заменять информацию по всей папке
- генерировать новые документы на основе существующих
- анализировать содержимое и предлагать улучшения
CLI (Command Line Interface — интерфейс командной строки) — текстовый интерфейс, где вы даёте AI задачу обычным языком. Например, Claude Code или Gemini CLI работают так: вы описываете задачу → AI сам просматривает, создаёт и редактирует файлы.
Cursor (есть бесплатный тариф) — лучшая точка входа для не-технарей. Вы открываете в нём папку с документами и общаетесь с AI-ассистентом, который «видит» все файлы. Можно попросить: «перепиши раздел 3 в этом документе», «найди все упоминания клиента X во всех файлах» или «создай резюме по всем документам в папке». Всё это — без единой строчки кода.
Ключевое преимущество: интеграция с Git
Все AI-редакторы кода имеют встроенную поддержку Git — системы контроля версий. Простыми словами, Git — это «машина времени» для ваших файлов:
- Сохраняет каждую версию документа — вы видите всю историю изменений
- Показывает, что изменилось — какие строки добавлены, удалены, изменены
- Позволяет откатиться к любой предыдущей версии одним кликом
- Работает без интернета — все версии хранятся на вашем компьютере
Это особенно важно, когда документы правит AI: иногда модель может удалить нужный абзац, переписать текст неудачно или изменить смысл. С Git вы одним кликом вернёте всё как было. Никакой Google Docs или Notion не даёт такого уровня контроля над версиями.
Подробнее: Как использовать Git для версионирования документов (без консоли, без сложных команд, с удобным визуальным интерфейсом) — см. Модуль 8, Урок 6.
Примеры: реальные проекты на AI-редакторах
Чтобы понять масштаб возможностей, посмотрите на два проекта, созданных с помощью Cursor и Claude Code — людьми без традиционного образования в программировании:
Cybos — AI-операционная система для жизни и бизнеса
- Что это: персональная система, которая исследует компании, обрабатывает сообщения из Telegram и email, генерирует контент, составляет инвестиционные меморандумы и ведёт GTD-задачи
- Как создана: с помощью Claude Code. Автор описывает задачу → AI-агент создаёт и дорабатывает систему
- Принцип: «файлы прежде всего» — вся информация хранится в markdown-документах на вашем компьютере, версии отслеживаются через Git
- Ссылки: cybos.ai · GitHub
OpenClaw — персональный AI-ассистент для всех устройств
- Что это: AI-ассистент, который работает через привычные мессенджеры (WhatsApp, Telegram, Slack, Discord, iMessage) и управляет задачами за вас
- Масштаб: 190 000+ звёзд на GitHub — один из самых популярных open-source AI-проектов в мире
- Как создан: разрабатывается с помощью Cursor и Claude Code. Использует файлы AGENTS.md и CLAUDE.md для управления поведением AI-ассистента
- Ссылки: openclaw.ai · GitHub
Главный вывод: Вам не нужно быть программистом, чтобы использовать AI-редакторы. Папка с документами + Cursor + Git = мощная система управления знаниями с AI-помощником и полной историей изменений.
Почему это важно даже для не-технарей
Вам не нужно становиться программистом. Но понимание того, что AI может создать приложение по вашему описанию, открывает возможности:
- Быстрые прототипы: Описали идею → получили рабочий прототип за час, а не за неделю
- Автоматизация: AI может написать скрипт для обработки данных или парсинга
- Собственные инструменты: Простой бот, калькулятор, форма — без найма разработчика
- Понимание возможностей: Когда нанимаете программиста, вы понимаете, что реально, а что нет
- Экономия: Прототип за $0 вместо $5 000 у фрилансера
Совет: Начните с Lovable или v0.dev — они самые простые. Опишите на русском языке, что хотите получить, и посмотрите на результат. Это бесплатно!
Навигационная таблица: какой AI для какой задачи#
| Задача | Направление | Лучший инструмент | Бюджетная альтернатива |
|---|---|---|---|
| Написать текст, письмо, статью | Текст → Текст | ChatGPT | Claude, DeepSeek |
| Нарисовать картинку | Текст → Изображение | Midjourney | DALL-E (в ChatGPT), Flux |
| Создать видеоролик | Текст → Видео | Sora (ChatGPT Plus) | Kling, Pika |
| Озвучить текст | Текст → Аудио | ElevenLabs | Murf.ai |
| Сделать музыку / джингл | Текст → Музыка | Suno | Udio |
| Расшифровать встречу | Аудио → Текст | Otter.ai | Fireflies, tl;dv |
| Распознать текст с фото | Изображение → Текст | GPT-4o Vision | Google Lens |
| Исследовать тему | Поиск + Анализ | Perplexity | NotebookLM |
| Создать сайт без кода | Текст → Приложение | Lovable | v0.dev, Bolt |
| Написать / отладить скрипт | Текст → Код | Claude Code | Cursor, Copilot |