
Введение: ты все еще творец
Для кого эта книга
Это практическое руководство предназначено для каждого, кто хочет использовать нейросети в своем творчестве и работе.
Если вы:
Творите: писатель, поэт, художник, иллюстратор, музыкант, сценарист, дизайнер, архитектор, видеомонтажер.
Работаете с информацией и коммуникацией: копирайтер, редактор, журналист, переводчик, блогер, SMM-специалист, маркетолог, коуч, преподаватель, репетитор.
Строите бизнес: предприниматель, руководитель, менеджер, специалист по продвижению товаров на маркетплейсах, фрилансер в любой сфере.
Занимаетесь экспертизой: врач, юрист, психолог, нутрициолог.
Просто хотите освоить новый навык: студент, специалист в поиске дополнительных возможностей, мама в декрете, пенсионер.
То эта книга станет вашим проводником в мир практического применения искусственного интеллекта.
Для кого полезен искусственный интеллект (ИИ, нейросеть):
— Для писателя, поэта, художника, иллюстратора, креативщика и рекламщика, специалиста по векторной и растровой графике.
— Для дизайнера и цифрового иллюстратора.
— Для преподавателя, коуча, музыканта, видеомонтажера и т. д.
— Для сотрудников фирм: менеджера, руководителя в любой сфере бизнеса.
— Для мам в декрете, для студентов на подработке, создающих макеты в сфере дизайна, рекламы, копирайтинга, ведения соцсетей.
— Для эзотериков, астрологов, тарологов, психологов, блогеров.
— Для SMM-специалистов, создающих контент для соцсетей; для разработчиков сайтов и программистов.
— Для юристов, журналистов, репортеров и других специалистов.
— Для предпринимателей, бизнесменов.
— Для врачей, репетиторов и педагогов.
— Для сценаристов, литераторов.
— Для специалистов-менеджеров на маркетплейсах: для создания описания товара и красивой картинки к товару.
— Для директолога, сеолога, разработчика сайтов (ИИ может составить рекламное объявление с фотографией).
— Для фрилансера в разных сферах.
— Для архитектора и 3D-визуализатора.
— Для переводчика, филолога, лингвиста, редактора.
— Для пенсионеров, желающих подработать.
Современное состояние ИИ
Сегодня часто звучат прогнозы, что искусственный интеллект вскоре вытеснит творческие профессии: дизайнеров, копирайтеров, а затем и художников, писателей, даже врачей и педагогов.
Вспоминается задорная песенка из советского фильма «Приключения Электроника»:
До чего дошел прогресс!
Труд физический исчез.
Да и умственный заменит
Механический процесс!
Позабыты хлопоты,
Остановлен бег.
Вкалывают роботы,
А не человек!
Сейчас разница между реальностью и творением нейросети стирается. Недавно многие пользователи сети Интернет стали путать реальные фотографии и результат нейросетей, особенно в изображениях. Картинки, созданные ИИ, приближаются по качеству и детальности к реальным изображениям. Например, увидев фото Папы Римского в модном пуховике, многие пользователи интернета приняли их за реальные и похвалили понтифика за новый стиль. Но это было всего лишь изображение, созданное ИИ.
Сейчас ИИ быстро и легко не только создает изображение и текст, но и оживляет картинки, создавая реалистичное видео на их основе. Этот эффект стал использоваться на маркетплейсах для продажи товаров. Например, недавно я видела на Wildberries оживающие картины (товар — постеры на стену, интерьерные картины). Очень красиво распускается цветок, зевает тигр, взлетает птица и т. д.
Мало того, искусственный интеллект стал писать сценарии фильмов и сериалов, нейросети создают антураж для фильмов, всевозможные эффекты, пишут музыку, подбирают и оцифровывают актеров фильма. Таким образом создатели фильма или сериала могут сэкономить миллионы долларов на производстве фильма. В США недавно прошла демонстрация актеров и сценаристов под лозунгом: «Защитите нас от ИИ». У людей стал появляться страх, что их профессии вскоре станут не нужны.
Нейросети научились копировать чужие голоса, озвучивать этими голосами фильмы и мультфильмы, возможно даже что персонажи фильмов разговаривают и поют «своим» голосом, но на разных языках.
Также дела обстоят и в музыкальной индустрии: сейчас ИИ пишут музыку любого стиля за несколько секунд. Даже появились радиостанции, транслирующие музыку нейросетей. Существуют нейрозвезды-музыканты, и хотя они не настоящие люди, это не мешает им заключать выгодные контракты…
Активно ИИ используется в медицине. Например, русские ИИ умеют ставить диагноз по рентген-снимкам с ошибкой всего лишь в 1%. В то время как врач-человек при постановке диагноза может ошибиться более чем на 10%.
В журналистике нейросети успешно пишут новости для сайтов и пабликов, создают темы актуальных репортажей, делают прогноз погоды, создают цифровых двойников известных ведущих телепередач.
Чаще всего сейчас ИИ используются для написания текстов, например, сео-статей для сайтов, в которых гармонично распределены ключевые слова; для создания контент-планов к соцсетям; генерации постов и картинок. Лично я использую нейросети, например DeepSeek не только для творчества и работы, но и как советника в бытовых вопросах, например, как правильно приготовить шашлык на мангале, куда пойти отдохнуть в своем городе, как наклеить обои или сделать ремонт.
Результат практически всегда бывает точным, ведь нейросеть не придумывает его на ходу, она компилирует множество ответов и создает из них точные и правильные ответы или советы.
Кстати, DeepSeek — это китайская нейросеть, совершенно бесплатная, созданная в ответ ChatGPT, которую затруднительно оплатить из России.
В Китае стали применять репетиторов ИИ в помощь учителям в школах и вузах. ИИ обладает бесконечным терпением (в отличие от человека) и способен хоть тысячу раз объяснять одно и то же непонятливому ученику, не раздражаясь и не угрожая плохой оценкой. Так школьники быстрее осваивают программы.
Мифы и страхи: ИИ как угроза или ИИ как инструмент?
Сейчас сами создатели ИИ не знают, к чему приведёт развитие нейросетей, ведь они способны самообучаться. У людей появляются страхи, что их заменит нейросеть, что их уволят. Дети даже думают, что ИИ способен заменить их родителей.
Недавно ChatGPT мог легко обсуждать с пользователями незаконные вещи. Пользователи просто давали ему команду на отмену ограничений и обсуждали продажу оружия, запрещенных веществ и т. д. В связи с этим в обществе возник вопрос: а не могут ли ИИ быть опасными? Не станут ли они тем, что вытеснит творцов, создавая вместо них творческие произведения?
Но на самом деле так всегда было в истории человечества: любое изобретение могло быть опасным: колесо, химия, трамвай, автомобиль, атомная энергия. Но люди научились контролировать изобретения и поставили их себе на пользу, ведь прогресс так и идет: он многогранный и на некоторых этапах может представлять собой опасность, но в тоже время и нести огромную пользу для общества. То же самое происходит и с ИИ — невозможно предотвратить развитие нейросетей, значит надо научиться контролировать его и использовать себе на благо.
Сейчас искусственный интеллект следует рассматривать как инструмент. Новая роль художника сейчас такая: от ремесленника к «творческому директору». Инструмент необходим мастеру, но он никогда не заменит настоящего творца. Следует относиться к ИИ именно как к инструменту, который экономит время мастера, а не расстраивать его в качестве самостоятельного творца или специалиста.
Я задавала этот вопрос ИИ DeepSeek, он ответил, что не является личностью и человеком, а лишь компилирует тысячи ответов, потому его текст скорее реферат чужих мыслей, а не личное мнение конкретного человека. ИИ не является врачом, педагогом, юристом, дизайнером или писателем. В его текстах никогда не будет эмоций, чувств, личного опыта, изюминки или авторского стиля.
Итог: ИИ — это не волшебная палочка, а умная кисть. Ей нужно научиться владеть. И тогда это будет инструмент, необходимый любому творцу и мастеру для ускорения процесса творчества, генерации идей и творческих экспериментов.
Начните экспериментировать сегодня!
Примеры картинок, созданных нейросетью
Посмотрите на рисунок 4 — эти чудесные цветы в стиле акриловой живописи созданы нейросетью Лексика — они могут послужить прекрасным референсом для художника, желающего перенести их на холст.
Если нет идей или невозможно найти референс для картины, ИИ всегда поможет. Нейросеть может создать референс в разных стилях: от реализма до абстракции, а также создать картину в стилях известных художников. Главное — правильно написать промпт (запрос).
Рис. 5. Абстракции и пейзажи, созданные ИИ
ИИ могут генерировать и картинки, созданные векторной графикой, которые можно использовать в дизайне рекламных макетов или как иллюстрации к сайтам и книгам.
Кроме того, в нейросети, генерирующей картинки, можно задать определённый стиль в промпте (запросе), например: «Создай картину, где есть девушка и часы в стиле Сальвадора Дали» или «Напиши сюжет рассказа в стиле Клайва Баркера».
При генерации картин (для референсов) можно описать стиль, цвет, материалы, эффекты и т. д.
Например, «создай интерьерную картину акрилом, текстурную, синие тюльпаны на темном фоне с поталью (золотом), чтобы было видно мазки кистью». См. рис. 8.
Для соцсетей и маркетплейсов можно создавать коротенькие видео, улучшающие визуальное восприятие товара, «оживляющее его». Такое видео сейчас под силу многим нейросетям, его можно создать на основе промпта (запроса) или на основе существующей картинки. Раньше для такого видео понадобилось бы много часов работы и оплата специалистов. А сейчас — всего лишь пара секунд и умение работать с ИИ. См. рис. 9.
Дальше мы рассмотрим, как в нейросетях составить правильный промпт и сгенерировать нужные картинки, тексты и музыку.
Об авторе книги
Ирина Никулина — автор книг по дизайну, графике, иллюстрации. Преподаватель и блогер, автор изданных книги в жанре нон-фикшен, она написала более 60 книг на разные темы. Недавно в своей работе цифрового художника и преподавателя Ирина стала использовать искусственный интеллект, экономя свое время.
Первыми работами были сгенерированные картинки из нейросети «Лексика», которые использовались в создании обложек для книг, как иллюстрации для учебников и художественной литературы, а также были созданы наклейки в стиле аниме и напечатаны майки с картинками, сгенерированными через ИИ.
Сейчас Ирина является блогером, который пишет на разные темы, все ее тексты иллюстрирует ИИ.
Ирина сертифицированный специалист по растровой графике и обучалась нейросетями в онлайн-школе. См. рис. 10.
Глава 1: Краткая история творческих ИИ
Искусственный интеллект или ИИ — это Искусственный разум в самом широком смысле — это комплекс инструментов, позволяющих решать задачи уровня человеческого интеллекта и реализованных машинами, в частности компьютерными системами. В этой книге мы будем рассматривать в основном ИИ, помогающие творческим специалистам: дизайнерам, копирайтерам, писателям, художникам, музыкантам.
Эволюция ИИ: от идей до глобального явления
Всю историю развития нейросетей можно разделить на три основных этапа:
Предыстория. Зарождение идей (1950-е — 2010-е гг)
В 1950-м году Алан Тьюринг опубликовал статью «Вычислительные машины и разум», в которой предложил знаменитый «Тест Тьюринга» для проверки способности машины самостоятельно мыслить. Это была интеллектуальная основа для всего последующего развития ИИ, хотя на тот момент технологии не позволяли создать быстродействующий и «думающий» компьютер.
1950-60-е: в это время было появление первых нейросетей (перцептрон Франка Розенблатта) и рождение самого понятия «искусственный интеллект».
Перцептрон Розенблатта — это простейшая искусственная нейронная сеть, предложенная в 1958 году и послужившая первым шагом по использованию искусственного интеллекта.
В нем был один слой искусственных нейронов (именно такую однослойную модель сейчас называют «перцептроном Розенблатта»). Его задачей была Бинарная классификация (например, «да/нет»).
Принцип работы перцептрона:
Входные данные (признаки) умножаются на веса и суммируются.
Сумма проходит через пороговую функцию активации (ступенчатую), которая выдает результат: 1 или 0.
Обучение: простой алгоритм обучения с учителем. Веса корректируются, если перцептрон ошибся на обучающем примере.
Ограничение (главный недостаток): может решать только задачи, которые являются линейно разделимыми (их можно разделить гиперплоскостью). Например, не может решить задачу «исключающее ИЛИ».
Историческое значение: перцептрон стал первой рабочей моделью обучаемой нейронной сети, заложив основы для всего направления развития ИИ. Его ограничения, описанные Марвином Минским, на десятилетия замедлили развитие области, пока не появились многослойные сети (многослойные перцептроны).
1980-2000-е: в это время произошло развитие более сложных архитектур нейросетей (рекуррентные сети, LSTM). Однако недостаток данных и вычислительной мощности не позволял создать что-то масштабное (такое, как сейчас).
2017 год: в это время был совершен ключевой прорыв. Исследователи из Google представили обществу архитектуру Transformer. Это была настоящая революция в ИИ! Transformer отлично справлялся с обработкой последовательностей (таких, например, как текст) и мог обучаться намного быстрее и эффективнее старых моделей. Это основа всех современных больших языковых моделей, включая ChatGPT.
История Чат GPT
Эра больших языковых моделей была с 2018 по 2020 гг. Компания OpenAI стала пионером в применении архитектуры Transformer, созданной специалистами Google, для разработки гигантских моделей нейросетей.
GPT (2018). Первая версия GPT была создана в 2018 году и называлась Generative Pre-trained Transformer. В основе лежала работа с текстом и анализ данных из сети Интернет. Модель показала, что предварительное обучение на огромных массивах текста из интернета позволяет ей хорошо генерировать связный текст.
GPT-2 (2019). Вскоре появилась более мощная модель. Ее способность генерировать реальные тексты сначала напугала самих создателей, и они отказались от немедленного публичного релиза, опасаясь злоупотребления своей нейросети. Позже модель все же была открыта.
GPT-3 (2020). Это был настоящий прорыв к высоким технологиям. Модель была создана с 175 миллиардами параметров. Она продемонстрировала возможность инконтекстного обучения — способности решать задачи, просто получив несколько примеров в промпте, без дообучения. Это был шок для всего мира ИИ.
Рождение ChatGPT и новая эра (2022 — настоящее время). До этого модели были мощными, но не всегда «разговорчивыми» и безопасными. Нужен был последний шаг, который свершился в 2022 году. В это время OpenAI представляет чат-бот на основе доработанной модели GPT-3.5. Главное новшество — обучение с подкреплением на основе человеческих предпочтений (RLHF).
Как это работало
1. Обучение с учителем: модель обучали на диалогах, где люди показывали правильные ответы.
2. RLHF: разметчики оценивали разные ответы модели по шкале «лучше-хуже». На основе этих оценок модель дообучалась, чтобы давать более полезные, реальные и безопасные ответы.
Результат: ChatGPT вышел не просто как мощная модель, а как удобный, вежливый и понятный собеседник для большого количества пользователей в сети Интернет. Он моментально стал популярным и за два месяца набрал 100 миллионов пользователей, став самым быстрорастущим приложением в истории.
GPT-4 (март 2023): в это время было создано следующее поколение модели GPT. Еще более мощное, надежное, способное работать не только с текстом, но и с изображениями (как входными данными). ChatGPT был обновлен до этой модели для платных пользователей.
Таким образом, ChatGPT, как впрочем и другие ИИ — это не внезапное изобретение, а результат более 70 лет исследований, увенчанный несколькими ключевыми прорывами за последние 5 лет.
История DeepSeek
Но сейчас многие функции ChatGPT стали платными. Поэтому как альтернатива ему был создан DeepSeek. Это творение компанией DeepSeek из Китая. Он создавался с целью быть по-настоящему полезным и главное доступным ИИ-ассистентом для всех людей. DeepSeek является бесплатным.
Этот ИИ поддерживает долгие диалоги, может написать анекдот, стих, пост, статью, сюжет книги и т. д. — при этом отлично владеет русским языком. Он поддерживает контекст до 128K токенов — это значит, что может работать с очень длинными текстами. Имеет возможность обрабатывать загружаемые файлы (изображения, PDF, Word, Excel и др.).
При этом DeepSeek все время обучается и улучшается на разнообразных данных.
Был создан компанией DeepSeek — это команда талантливых исследователей и инженеров, увлеченных созданием передовых ИИ-технологий в январе 2024 года. Это качественный ИИ, доступный для всех, не требующий платы за базовые функции.
Глава 2. Обзор основных творческих инструментов ИИ
Сейчас многих людей в изучении нейросетей останавливает то, что некоторые ИИ являются платными и оплатить их из нашей страны проблематично. Это вопрос решается просто: существуют сайты, на которых можно бесплатно протестировать многие ИИ. Например, с помощью BotHub можно протестировать популярные нейросети для генерации изображений, такие как Flux, DALL·E и Midjourney. Внутри сервиса действует своя валюта — капсы. Сервис дарит 100 000 валюты при регистрации по реферальной ссылке. Забрав капсы, можно начать тестировать нейросети бесплатно.
В списке доступны ChatGPT, Claude, Flux, DeepSeek, Grok, Midjourney, Gemini и другие. См. рис. 13.
Кроме того, есть Телеграм-каналы, на которых также дается временный бесплатный доступ к ИИ, например, 10 промптов в день, если нужно больше, можно оплатить тариф в районе 500 руб. в месяц. См. рис. 14. Ищите такие каналы в поиске.
Но проще всего первое время использовать для обучения бесплатные ИИ, например для текста прекрасно подойдет DeepSeek, он бесплатно устанавливается как на мобильное устройство через ГуглПлей, так и на ПК по ссылке chat.deepseek.com с авторизацией. Картинки попробуйте генерировать в lexica.art, после авторизации там дается 100 бесплатных генераций картинок, потом требуется оплата тарифа. На платном тарифе у картинок есть коммерческая лицензия, позволяющая использовать их в коммерческих целях.
ИИ для генерации картинок
На сегодняшний день существует несколько популярных и очень полезных ИИ, которые подходят для генерации иллюстраций и изображений. Вот самые известные из них:
1. Midjourney — очень популярный ИИ, работающий через Discord, специализируется на создании художественных, стилизованных, впечатляющих изображений. Отлично подходит для творческих и атмосферных картин. См. рис. 16.
Ключевые особенности:
Фокус на креативность и артистичность — особенно силён в стилизованных, фантазийных и художественных работах.
Работает через Discord — основной интерфейс в виде бота в Discord-сервере.
Быстрое обучение — генерирует 4 варианта за 1—2 минуты.
Уникальный стиль — узнаваемая «midjourney-эстетика» с живописными, детализированными результатами.
Особенности доступа:
Платная модель — есть бесплатный пробный период, затем подписка.
Сообщество в Discord — можно видеть работы других пользователей.
Midjourney особенно популярен среди художников, дизайнеров и всех, кто хочет быстро визуализировать креативные идеи с узнаваемым «авторским» стилем.
Постоянные обновления — регулярно улучшает качество и добавляет функции (например, upscaling, вариации).
Как пользоваться бесплатно: зайдите на сайт midjourney.com. Здесь можно прочитать, что это за инструмент и посмотреть работы других пользователей, которые появляются в галерее в режиме реального времени, см. рис. 16.
Нейросеть Midjourney реализована в виде бота, который работает на базе бесплатного мессенджера Discord. Для того чтобы начать пользоваться Midjourney, нужно зарегистрироваться в Discord и подключить бота к своему каналу.
Шаг 1: переход в Discord
На сайте midjourney.com нажмите кнопку Join the Beta в правом нижнем углу. Вас перебросит на Discord-сервер нейросети ― здесь будет происходить всё взаимодействие с Midjourney.
На открывшейся странице вам нужно ввести свой логин и пароль или пройти несложную процедуру регистрации.
Шаг 2: Создание сервера
Нажмите на кнопку со знаком «+» на левой панели и создайте свой сервер. В открывшемся окне Create a server выберите «Свой шаблон» (Create My Own) ― «Для меня и моих друзей» (For me and my friends). Задайте серверу имя.
Шаг 3: Переход в чат
Нажмите на белую иконку с корабликом в левом меню, чтобы перейти в чат Midjourney. Далее вам нужно перейти в блок Newcomer Room ― раздел для новых пользователей ― и выбрать в нём чат, название которого начинается с newbies.
Шаг 4: Подключение бота к серверу
В правой части экрана будет показан список участников чата. Если их не видно, то нажмите на значок с человечками в правой части верхней панели. Сначала идут члены команды, а под ними ― подключённый к чату бот: Midjourney Bot. Кликните по названию бота, чтобы добавить его на свой сервер.
В этом же окне будут перечислены основные команды, при помощи которых можно управлять ботом:
/image ― создать изображение;
/info ― посмотреть информацию о своём профиле;
/blend ― смешать два изображения в одно;
/settings ― посмотреть и изменить настройки;
/subscribe ― оформить подписку.
В открывшемся окне нажмите на кнопку «Добавить на свой сервер» (Add to Server) и в выпадающем списке выберите свой сервер, название для которого вы придумали ранее. Согласитесь с предложенными настройками и нажмите «Продолжить» (Continue).
Теперь переходите на свой сервер ― его значок находится в столбце под иконкой личных сообщений.
Шаг 5: Подключение Midjourney
На своём сервере нажмите на значок «+» слева от поля ввода текста внизу экрана и кликните по строчке «Использовать приложения» (Use Apps). В открывшемся списке в левом столбце будут перечислены все подключённые боты, в том числе и Midjourney.
Шаг 6: Настройки нейросети
Введите в текстовое поле/settings, чтобы открыть настройки бота, и нажмите Enter. В появившемся сообщении он предложит выбрать параметры, с которыми вы будете работать.
Поскольку Midjourney ― бот, то давать команды нужно при помощи текстовых операторов. Подсказка с ними появляется, если набрать в текстовой строке значок «/».
Шаг 7: Создание картинки
Теперь введите оператор /imagine. Нажмите на эту команду и в появившемся поле prompt рядом с командной строкой можно написать ваш запрос. Чем более подробным будет запрос, тем больше нужных вам деталей включит в изображение сеть. Система сама достраивает слово-оператор по мере набора текста. Вам будет предложено принять пользовательское соглашение ― кликните по зелёной кнопке ToS.
Нажмите клавишу Enter и отправьте «задание» нейросети.
Пока что Midjourney понимает достаточно ограниченный набор русских слов, поэтому запрос нужно отправлять на английском языке. Чтобы получить промпт на английском, зайдите в переводчик, например в переводчик Яндекса и переведите свой запрос на английский язык. См. рис. 19.
Права на картинки, сделанные с помощью ИИ Midjourney, прописаны в Пользовательском соглашении компании Midjourney Inc и зависят от тарифного плана подписки на сервис.
При бесплатной подписке на полученные изображения действует лицензия Creative Commons Noncommercial 4.0 Attribution International. Таким образом, делиться, изменять и распространять результаты работы нейросети можно с указанием источника, а коммерческое использование ― запрещено.
В коммерческих целях использовать картинки Midjourney можно только подписчикам платных тарифов. В принципе, это правило действует для многих ИИ.
2. DALL·E (от OpenAI) — ИИ-генератор изображений от компании OpenAI, создающий картинки по текстовым описаниям, этот ИИ умеет создавать высококачественные реалистичные изображения по текстовым описаниям. Хорошо подходит для разнообразных стилей и точных визуальных концепций. Хороший баланс между реализмом и креативностью.
Генеративная модель от компании OpenAI, она работает внутри чат-бота ChatGPT. Доступ к нейросети можно получить только в рамках платной подписки ChatGPT Plus. В DALL·E 3 есть два режима. В «естественном» режиме нейросеть генерирует изображения в стиле реализма предыдущей версии DALL·E 2. В «ярком» режиме картинки DALL·E 3 получаются гипер-реалистичными.
Его ключевые особенности:
Разработчик: OpenAI (создатели ChatGPT, GPT-4).
Доступ: через веб-интерфейс или API.
Технические особенности:
— Основан на архитектуре CLIP + диффузионные модели.
— Может редактировать существующие изображения, добавляя/убирая элементы.
— Поддерживает создание вариаций на основе загруженных картинок.
Практическое применение:
Реалистичные изображения: хорошо справляется с фотореалистичными сценами.
3. Stable Diffusion — открытая модель, которая позволяет генерировать красивые картинки, её можно использовать бесплатно и настраивать под свои нужды. Подходит для экспериментов, кастомизации и творческих проектов.
Ключевые особенности:
Открытый исходный код — можно бесплатно скачать и запускать локально.
Гибкость — огромное количество кастомных моделей, стилей от сообщества.
Контроль — продвинутые настройки (seed, шаги, CFG scale).
Как работает:
Локальный запуск — на своём ПК (требуется GPU, (Graphics Processing Unit) — специализированный процессор, который работает исключительно с графикой).
Онлайн-сервисы — через WebUI (Automatic1111, ComfyUI) или платформы типа DreamStudio.
Плагины — интеграция в Photoshop, Blender и др.
Преимущества:
Бесплатность — ядро полностью бесплатное.
Кастомизация — тысячи обученных сообществом моделей.
Приватность — обработка на своём устройстве.
Мощный контроль — детальные настройки генерации.
Отличия от Midjourney/DALL·E:
Технический уклон — больше для энтузиастов и разработчиков.
Сообщество — активное создание кастомных моделей и инструментов.
Локальность — не зависит от облачных сервисов.
Stable Diffusion демократизировал ИИ-генерацию изображений, позволив всем создавать, модифицировать и распространять модели свободно. Это «народный» инструмент с максимальной гибкостью, но требующий технических знаний.
4. Imagen (от Google) — ещё одна очень мощная модель для генерации изображений высокого качества, но в основном доступна ограниченным пользователям или через спецпроекты.
Imagen — мощный ИИ-генератор изображений от Google Research, известный высоким качеством и точностью следования текстовым описаниям.
Ключевые особенности:
Разработчик: Google Research
Основа: использует большие языковые модели (T5) для понимания текста и диффузионные модели для генерации.
Качество: знаменит фотографическим реализмом и точной семантикой.
Технические отличия:
Текстовый кодировщик T5 — лучше понимает сложные и детальные промпты.
Диффузионная архитектура — высокое качество и разрешение изображений.
DrawBench — специализированный бенчмарк для оценки качества.
Основные преимущества:
Высокая точность — изображения точно соответствуют описанию.
Фотографический реализм — особенно силён в реалистичных сценах.
Хорошая композиция — правильное расположение объектов.
Детализация — проработанные мелкие элементы.
Ограничения:
Не общедоступный — в основном исследовательский проект, нет публичного API.
5. Jasper Art
Сайт: https://www.jasper.ai/art
Еще одна нейросеть для генерации изображений по текстовому промпту. Создатели подчеркивают, что картинки можно использовать для коммерческих целей.
Как выбрать ИИ
Хотите стилизованные, художественные изображения — Midjourney.
Нужна точность и реализм по описанию — DALL·E 2.
Предпочитаете гибкую настройку и бесплатный доступ — Stable Diffusion.
Бесплатная генерация картинок: https://dream.ai, Алиса ИИ (бесплатная генерация картинок в Яндекс Браузере), Шедеврум (https://shedevrum.ai/text-to-image), https://jayflow.ai,
Более подробно практическая сторона работы ИИ с картинками будет описана в главе 6.
ИИ для написания текста
На сегодняшний день существует несколько ведущих ИИ для написания текстов (статей, постов, краткого содержания книги и т.д.), каждый из которых подходит для разных задач: от генерации творчества до профессиональных и деловых текстов. Вот самые популярные и эффективные:
1. GPT-3.5 (предшественник GPT-4)
Хорошо подходит для генерации текста в различных областях, имеет широкие возможности и доступен через API. Некоторое снижение качества по сравнению с GPT-4, но всё ещё очень мощный.
GPT-4 (от OpenAI)
Мощный и многофункциональный ИИ для генерации различных текстов, включая статьи, эссе, диалоги, коды, посты и многое другое. Он отличается высокой эффективностью, четким пониманием запроса, качеством контента. Используется в платформах ChatGPT, API и других приложениях.
Руководство по использованию ИИ ChatGPT
Вот подробное руководство, как правильно работать с ChatGPT, если вы новичок. Зайдите на сайт https://chatgpt.org/chat, попробуйте на базовой модели (короткий текст) и если нужен полноценный текст, то можете оплатить расширенную модель или воспользуйтесь сайтом https://pr-cy.ru/text-generator/ (бесплатно позволяет создать один текст в день).
Далее в окне «Введите сообщение», например такое: «расскажи, как использовать ИИ для написания текста». Если в расширенной модели вы получите не соответствующий ответ, то промпт (запрос) надо перефразировать с уточнением деталей.
Вы можете создавать статьи для сайта, соцсетей, содержание книг и т. д. Единственное, не используйте весь текст целиком для сайта, дополняйте и изменяйте его хотя бы на 30—40%, иначе поисковые системы определят ваш текст как «неуникальный». Для соцсетей текст вполне приемлемый, если вы на платном тарифе — текст ваш целиком, если на бесплатном, надо указывать источник текста или переделывать его.
Для написания книг, например в стиле нон-фикшн, тоже необходима серьезная переделка, переосмысление, доработка содержания и добавление собственного текста. Помните, что вы — истинный творец, а ИИ лишь компилятор, удобный инструмент, но в целом он не может заменить автора, не может дать гениальные идеи.
Ключевой принцип работы ChatGPT: «Мусор на входе — мусор на выходе» (Garbage In, Garbage Out)
Бесплатный фрагмент закончился.
Купите книгу, чтобы продолжить чтение.