Модуль 03Урок 2

Урок 2. Направления AI: что умеют нейросети в 2026

Теория

Урок 2. Направления AI: что умеют нейросети в 2026#

Зачем это нужно#

AI — это не только чат-боты. Нейросети умеют работать с разными типами контента: текст, изображения, видео, аудио, код. Понимание этих направлений поможет вам:

  • найти AI-инструмент под конкретную задачу
  • автоматизировать рутину (транскрипция, дизайн, монтаж)
  • предлагать клиентам больше услуг
  • понимать, что возможно прямо сейчас

Карта модальностей: что во что превращается#


Текст → Текст (основа всего)

Что это: Классическая работа AI — получает текст, выдаёт текст. Генерация, анализ, перевод, суммаризация, ответы на вопросы. Это фундамент, на котором работают все AI-чаты.

Ключевые инструменты:

ИнструментЛучше всего дляЦена
ChatGPTУниверсальные задачи, копирайтинг, идеиБесплатно / $20/мес
ClaudeДлинные документы, анализ, кодБесплатно / $20/мес
GeminiРабота с Google Workspace, мультимодальностьБесплатно / $20/мес
PerplexityПоиск фактов с источникамиБесплатно / $20/мес
DeepSeekБюджетные задачи, reasoning, кодБесплатно / дёшевый API

На практике: написание текстов, переводы, редактура, анализ отчётов, ответы на вопросы клиентов, создание промптов, обработка обращений.


Текст → Изображение

Что это: AI создаёт изображения по текстовому описанию (промпту). Революция в дизайне, маркетинге и контент-производстве.

Ключевые инструменты:

ИнструментЛучше всего дляЦена
MidjourneyХудожественные, детализированные изображенияот $10/мес
DALL-E 3Быстрые иллюстрации (встроен в ChatGPT)Включён в ChatGPT
Stable DiffusionБесплатная генерация (нужен мощный комп или сервер)Бесплатно (open-source)
FluxФотореализм, современные стилиБесплатно / от $10/мес
IdeogramТекст на изображениях (логотипы, постеры)Бесплатно / от $8/мес
Adobe FireflyИнтеграция с Photoshop/Illustratorот $5/мес
Canva AIБыстрый дизайн без навыков дизайнераБесплатно / Pro от $10/мес

На практике: иллюстрации для постов, баннеры для рекламы, логотипы, презентации, мокапы продуктов, аватарки, визуалы для соцсетей.


Текст → Видео

Что это: AI создаёт видеоролики по текстовому описанию или из статичных изображений. Одно из самых быстроразвивающихся направлений.

Ключевые инструменты:

ИнструментЛучше всего дляЦена
Sora (OpenAI)Кинематографичные видео, реализмВключён в ChatGPT Plus
Runway Gen-3Профессиональный видеомонтаж с AIот $12/мес
PikaБыстрые короткие видео, анимацииБесплатно / от $8/мес
Kling (Kuaishou)Качественные длинные видеоБесплатно / от $5/мес
Veo (Google)Высокое качество, интеграция с GoogleЧерез Gemini Advanced
HeyGenAI-аватары, «говорящие головы»от $24/мес
SynthesiaКорпоративные видео с AI-спикерамиот $22/мес

На практике: рекламные ролики, обучающие видео, контент для соцсетей (Reels, TikTok, Shorts), видеопрезентации, видеовизитки, объясняющие анимации.


Текст → Аудио и музыка

Что это: AI озвучивает текст реалистичными голосами или создаёт музыку по описанию. Два направления: озвучка (голос) и музыкальная генерация.

Озвучка и голос:

ИнструментЛучше всего дляЦена
ElevenLabsРеалистичная озвучка, клонирование голосаБесплатно / от $5/мес
Murf.aiКорпоративные голоса, презентацииот $19/мес
OpenAI TTSОзвучка через API (для интеграции)Pay-per-use
YandexSpeechKitРусские голоса, синтез речиБесплатный тариф

Музыка:

ИнструментЛучше всего дляЦена
SunoГенерация песен с текстом и вокаломБесплатно / от $8/мес
UdioВысококачественная музыка разных жанровБесплатно / от $10/мес

На практике: озвучка видео и презентаций, подкасты, рекламные аудиоролики, фоновая музыка для контента, аудиокниги, голосовые ассистенты, джинглы.


Аудио → Текст (транскрипция)

Что это: AI превращает аудио и видео в текст. Незаменимо для встреч, интервью, подкастов, лекций.

Ключевые инструменты:

ИнструментЛучше всего дляЦена
Whisper (OpenAI)Универсальная транскрипция, 99+ языковБесплатно (open-source)
Otter.aiЗаписи встреч Zoom/Meet с AI-саммариБесплатно / от $10/мес
Fireflies.aiКомандные встречи, CRM-интеграцияБесплатно / от $10/мес
tl;dvЗапись + тайм-коды + AI-резюме встречБесплатно / от $20/мес
DeepgramБыстрая транскрипция через APIPay-per-use

На практике: расшифровка встреч, субтитры для видео, транскрипция интервью и подкастов, протоколирование совещаний.


Изображение и видео → Текст

Что это: AI «видит» изображения и видео — описывает, анализирует, извлекает информацию.

Ключевые инструменты:

ИнструментЛучше всего дляЦена
GPT-4o (Vision)Анализ фото, скриншотов, документовВстроен в ChatGPT
GeminiПонимание изображений и видеоВстроен в Gemini
Claude (Vision)Анализ документов и сложных схемВстроен в Claude
Google LensРаспознавание объектов, текста с фотоБесплатно

На практике: распознавание текста с фото (чеки, визитки, вывески), анализ графиков из отчётов, описание товаров по фото, модерация контента, перевод текста с изображений.


AI-инструменты для создания приложений (для не-технарей)#

Одно из самых удивительных направлений 2025–2026: AI научился писать код за вас. Теперь человек без технических навыков может создать работающее приложение, сайт или инструмент — просто описав, что ему нужно.

Что такое AI IDE и AI CLI простыми словами

IDE (среда разработки) — программа, в которой пишут код. AI IDE = программа, где AI пишет код за вас, а вы описываете, что хотите.

CLI (командная строка) — текстовый интерфейс для ввода команд. AI CLI = вы даёте задачу текстом, AI выполняет её в терминале.

Главное: Вам не нужно учить программирование — достаточно описать, что вы хотите получить.

Генераторы приложений (самое простое для старта)

Эти инструменты создают рабочие сайты и приложения по текстовому описанию:

ИнструментЧто делаетДля когоЦена
v0.dev (Vercel)Генерирует веб-интерфейсы и UI по описаниюПредприниматели, дизайнерыБесплатно / от $20/мес
LovableСоздаёт полноценные веб-приложения из описанияНе-технари, стартаперыБесплатно / от $20/мес
Bolt.newГенерирует и запускает приложения прямо в браузереБыстрые прототипыБесплатно / от $20/мес
Replit AgentПишет и запускает код в браузереНовичкиБесплатно / от $25/мес

Пример: Вы пишете «Создай лендинг для курсов английского с формой записи и калькулятором цен» → инструмент генерирует рабочий сайт за 2–5 минут.

AI-редакторы кода (для тех, кто хочет больше контроля)

ИнструментЧто делаетЦена
CursorIDE с AI-ассистентом: пишет, редактирует, объясняет кодБесплатно / от $20/мес
WindsurfAI-среда разработки от CodeiumБесплатно / от $10/мес
GitHub CopilotAI-помощник прямо в редакторе кодаБесплатно / от $10/мес

AI-агенты для кода (самые мощные)

Эти инструменты работают автономно — вы даёте задачу, AI делает:

ИнструментЧто делаетОт когоЦена
Claude CodeАгент в терминале: пишет, тестирует, исправляет кодAnthropicЧерез подписку Claude
Codex CLIТерминальный агент для работы с кодомOpenAIЧерез API OpenAI
JulesAI-агент для программированияGoogleБета, бесплатно
Gemini CLIАгент Google для работы с кодом и задачамиGoogleБесплатно (бета)

Не только код: AI-редакторы для работы с документами

Многие думают, что Cursor, Claude Code и подобные инструменты — только для программистов. На самом деле они отлично подходят для работы с любыми текстовыми документами: заметками, статьями, ТЗ, контрактами, базами знаний.

Как это работает:

IDE (Integrated Development Environment — интегрированная среда разработки) — по сути, мощный текстовый редактор с встроенным AI-помощником. Вы открываете папку с файлами, и AI видит все ваши документы, понимает их структуру и может:

  • редактировать сразу несколько файлов по вашей просьбе
  • искать и заменять информацию по всей папке
  • генерировать новые документы на основе существующих
  • анализировать содержимое и предлагать улучшения

CLI (Command Line Interface — интерфейс командной строки) — текстовый интерфейс, где вы даёте AI задачу обычным языком. Например, Claude Code или Gemini CLI работают так: вы описываете задачу → AI сам просматривает, создаёт и редактирует файлы.

Cursor (есть бесплатный тариф) — лучшая точка входа для не-технарей. Вы открываете в нём папку с документами и общаетесь с AI-ассистентом, который «видит» все файлы. Можно попросить: «перепиши раздел 3 в этом документе», «найди все упоминания клиента X во всех файлах» или «создай резюме по всем документам в папке». Всё это — без единой строчки кода.

Ключевое преимущество: интеграция с Git

Все AI-редакторы кода имеют встроенную поддержку Git — системы контроля версий. Простыми словами, Git — это «машина времени» для ваших файлов:

  • Сохраняет каждую версию документа — вы видите всю историю изменений
  • Показывает, что изменилось — какие строки добавлены, удалены, изменены
  • Позволяет откатиться к любой предыдущей версии одним кликом
  • Работает без интернета — все версии хранятся на вашем компьютере

Это особенно важно, когда документы правит AI: иногда модель может удалить нужный абзац, переписать текст неудачно или изменить смысл. С Git вы одним кликом вернёте всё как было. Никакой Google Docs или Notion не даёт такого уровня контроля над версиями.

Подробнее: Как использовать Git для версионирования документов (без консоли, без сложных команд, с удобным визуальным интерфейсом) — см. Модуль 8, Урок 6.

Примеры: реальные проекты на AI-редакторах

Чтобы понять масштаб возможностей, посмотрите на два проекта, созданных с помощью Cursor и Claude Code — людьми без традиционного образования в программировании:

Cybos — AI-операционная система для жизни и бизнеса

  • Что это: персональная система, которая исследует компании, обрабатывает сообщения из Telegram и email, генерирует контент, составляет инвестиционные меморандумы и ведёт GTD-задачи
  • Как создана: с помощью Claude Code. Автор описывает задачу → AI-агент создаёт и дорабатывает систему
  • Принцип: «файлы прежде всего» — вся информация хранится в markdown-документах на вашем компьютере, версии отслеживаются через Git
  • Ссылки: cybos.ai · GitHub

OpenClaw — персональный AI-ассистент для всех устройств

  • Что это: AI-ассистент, который работает через привычные мессенджеры (WhatsApp, Telegram, Slack, Discord, iMessage) и управляет задачами за вас
  • Масштаб: 190 000+ звёзд на GitHub — один из самых популярных open-source AI-проектов в мире
  • Как создан: разрабатывается с помощью Cursor и Claude Code. Использует файлы AGENTS.md и CLAUDE.md для управления поведением AI-ассистента
  • Ссылки: openclaw.ai · GitHub

Главный вывод: Вам не нужно быть программистом, чтобы использовать AI-редакторы. Папка с документами + Cursor + Git = мощная система управления знаниями с AI-помощником и полной историей изменений.

Почему это важно даже для не-технарей

Вам не нужно становиться программистом. Но понимание того, что AI может создать приложение по вашему описанию, открывает возможности:

  • Быстрые прототипы: Описали идею → получили рабочий прототип за час, а не за неделю
  • Автоматизация: AI может написать скрипт для обработки данных или парсинга
  • Собственные инструменты: Простой бот, калькулятор, форма — без найма разработчика
  • Понимание возможностей: Когда нанимаете программиста, вы понимаете, что реально, а что нет
  • Экономия: Прототип за $0 вместо $5 000 у фрилансера

Совет: Начните с Lovable или v0.dev — они самые простые. Опишите на русском языке, что хотите получить, и посмотрите на результат. Это бесплатно!


ЗадачаНаправлениеЛучший инструментБюджетная альтернатива
Написать текст, письмо, статьюТекст → ТекстChatGPTClaude, DeepSeek
Нарисовать картинкуТекст → ИзображениеMidjourneyDALL-E (в ChatGPT), Flux
Создать видеороликТекст → ВидеоSora (ChatGPT Plus)Kling, Pika
Озвучить текстТекст → АудиоElevenLabsMurf.ai
Сделать музыку / джинглТекст → МузыкаSunoUdio
Расшифровать встречуАудио → ТекстOtter.aiFireflies, tl;dv
Распознать текст с фотоИзображение → ТекстGPT-4o VisionGoogle Lens
Исследовать темуПоиск + АнализPerplexityNotebookLM
Создать сайт без кодаТекст → ПриложениеLovablev0.dev, Bolt
Написать / отладить скриптТекст → КодClaude CodeCursor, Copilot