OpenAI шокирует мир ИИ с DALL-E 3: ChatGPT теперь не остановить!
Так, OpenAI только что выпустила DALL-E3, последнюю версию своего инструмента для преобразования текста в изображения, способного создавать удивительные изображения на основе описаний на естественном языке. Это большое событие, потому что DALL-E3 гораздо лучше, чем DALL-E2, в создании изображений, которые тесно соответствуют сложным заданиям. Например, DALL-E3 может точно представить сцену с определенными объектами и связями между ними. Он также может генерировать текст внутри изображения и более реалистично отображать детали, такие как руки. И лучшая часть в том, что для использования DALL-E3 вам не нужно никакого специального подготовительного этапа. Вы просто можете ввести простое предложение и получить потрясающие результаты. Никаких хаков или трюков не требуется.
Итак, что такое DALL-E3 и как он работает? DALL-E3 - это версия GPT-3 с 12 миллиардами параметров, обученная генерировать изображения на основе текстовых описаний с использованием набора данных из пар текст-изображение. Он получает как текст, так и изображение в виде одного потока данных, содержащего до 1 280 токенов, и обучается с использованием метода максимального правдоподобия для генерации всех токенов один за другим. Токеном является любой символ из дискретного словаря. Например, каждая буква английского алфавита является токеном из 26 нашего алфавита. Но для DALL-E3 его токены могут представлять как слова, так и части изображений. DALL-E3 построен на основе ChatGPT, что означает, что вы можете использовать ChatGPT в качестве партнера для генерации и уточнения ваших заданий. Просто спросите его, что вы хотите увидеть, от простого предложения до подробного абзаца. ChatGPT автоматически сгенерирует настроенные и подробные задания для DALL-E3, которые оживят вашу идею. Если вам нравится определенное изображение, но оно не совсем подходит, вы можете попросить внести изменения всего несколькими словами. DALL-E3 затем обновит изображение соответствующим образом.
DALL-E3 сейчас находится в режиме исследования и будет доступен для клиентов ChatGPT и Enterprise в октябре через API и в лабораториях позже этой осенью. Как и с DALL-E2, изображения, созданные с помощью DALL-E3, принадлежат вам, и вам не нужно разрешение OpenAI для их печати, продажи или коммерциализации.
Теперь, когда мы рассматриваем DALL-E3 и другие модели преобразования текста в изображения, честно говоря, он превосходит их. Он создает изображения, которые более детализированы и реалистичны, чем у Mid-Journey. Изображения от DALL-E3 имеют более яркие цвета, четкие формы и лучший общий вид. В отличие от этого, изображения от Mid-Journey выглядят размытыми и не такими четкими.
Еще одна популярная модель - Stable Diffusion Excel, предназначенная для создания изображений на основе текстовых заданий. Она утверждает, что создает изображения с меньшим количеством слов и даже может вставлять текст в изображения. Но если сравнить ее с тем, что может сделать DALL-E3, Stable Diffusion Excel не совсем соответствует. Изображения от DALL-E3 имеют более высокое качество, с более четким текстом и более привлекательным дизайном. Изображения от Stable Diffusion Excel кажутся зернистыми и содержат слишком много ненужных мелких деталей.
Также есть Deep-Floid IF, новая модель, которая утверждает, что умно вставляет текст в изображения. Но когда мы видим, что она может сделать рядом с DALL-E3, становится ясно, что Deep-Floid IF не может сравниться с возможностями DALL-E3. Способ, которым новая модель OpenAI сочетает текст и изображения, более плавный и выглядит более реалистично. А изображения от Deep-Floid IF не выглядят так хорошо и кажутся поддельными.
В заключение, DALL-E3 является лидером в преобразовании текста в изображения. Он является значительным шагом вперед по сравнению с DALL-E2 и лучше других доступных моделей. Он создает отличные изображения без необходимости дополнительных настроек. Кроме того, он работает с ChatGPT, что делает его еще более гибким и мощным, при этом оставаясь простым в использовании. И, если быть честным, удобство использования инструмента искусственного интеллекта является важным фактором, поэтому ChatGPT остается лучшим чат-ботом в мире. Хотя некоторые чат-боты могут быть лучше для конкретных задач, ChatGPT предпочтителен из-за своей удобности.
Теперь, хотя DALL-E3 выделяется как последнее чудо от OpenAI, важно понять его путь. Оригинальный DALL-E был революционным достижением, когда он появился в январе 2021 года. К апрелю 2022 года мир увидел замечательное продвинутое продолжение, которое переформатировало область создания изображений с помощью искусственного интеллекта. Технология, лежащая в основе этих моделей, известна как... Латентное распространение постепенно преобразует шум в изображения, которые система распознает из своих тренировочных данных. Эта техника также открыла путь для других моделей, таких как Open Weight Stable diffusion. Однако, приверженность OpenAI совершенствованию инструментов искусственного интеллекта для синтеза текста в изображения не существует в вакууме. Несколько серьезных игроков стремятся усовершенствовать свои модели генерации изображений. Эти конкуренты предлагают уникальные возможности, и некоторые из них даже имеют определенные преимущества в конкретных областях. И, конечно, DALL-E3 не является идеальным. У него все еще есть некоторые ограничения и проблемы, которые нужно решить.
Как мы все знаем, появление изображений, созданных искусственным интеллектом, не прошло без контроверзий. С использованием огромных наборов данных человеческого искусства, искусствоведы по всему миру беспокоятся о потенциальном подрыве или недобросовестном воспроизведении их стилей. Этот страх настолько глубок, что возникли протесты, судебные иски о нарушении авторских прав, и даже решения от организаций, таких как Управление по авторским правам США. Недавно судья окружного суда США вынес решение относительно авторского права на произведения искусства, созданные искусственным интеллектом.
Более того, OpenAI в настоящее время сталкивается с судебными исками со стороны группы американских авторов, включая таких известных имен, как Джон Гришэм и Джордж Р. Р. Мартин, обвиняющих компанию в использовании их произведений без разрешения для обучения ChatGPT. Именно поэтому OpenAI предприняла шаги для ограничения возможности DALL-E3 генерировать насильственный, взрослый или ненавистный контент. Она также внедрила меры для отклонения запросов, которые требуют изображения публичной фигуры по имени, чтобы предотвратить создание изображений, которые могут использоваться для пропаганды или дезинформации. И она разработала DALL-E3 таким образом, чтобы отклонять запросы на изображение в стиле живого художника, чтобы уважать права и творчество других художников. Однако эти шаги недостаточны для обеспечения этичного и ответственного использования DALL-E3. Все еще существует множество нерешенных вопросов и контроверзий, связанных с генерацией изображений искусственным интеллектом, таких как вопрос о владении правами на изображения, созданные искусственным интеллектом, о защите оригинальности и подлинности произведений искусства, созданных людьми, и о предотвращении злоупотребления или злоупотребления изображениями, созданными искусственным интеллектом, в злонамеренных целях.
Таким образом, OpenAI пытается найти решения. Они разрабатывают инструмент, называемый классификатором происхождения, чтобы определить, создал ли DALL-E3 определенное изображение. Они надеются использовать этот инструмент, чтобы лучше понять, как могут быть использованы сгенерированные изображения и чтобы информировать свои будущие политики и практики.
НазадЕще по этой теме
Cheelee | Смотри и Зарабатывай | Как получить NFT очки Бесплатно | GameFi | Заработок Без Вложений
В этом видео мы поговорим о новом проекте NFT под названием Чили. Основная концепция заключается в том, чтобы смотреть и играть.
Генерация музыки и звуковых эффектов с помощью искусственного интеллекта! | Stability AI's NEW Stable Audio Review
Теперь, стабильный звук может создавать до 90 секунд музыки и звуковых эффектов. Давайте сразу перейдем к обзору веб-сайта
Microsoft AI Copilot теперь включен в основное обновление Windows 11 и другие функции искусственного интеллекта
Итак, Microsoft только что представила крупное обновление для Windows 11, включающее нового помощника по искусственному интеллекту под названием Copilot.