Вы должны знать это, чтобы использовать GPT-4

Наконец-то выпущен GPT-4. Эта модель — одна из важнейших вех OpenAI в области глубокого обучения. Самым большим отличием GPT-4 от других современных моделей является то, что он является многомодальным. Это означает, что в то время как ChatGPT принимает только текстовые данные, GPT-4 теперь принимает текст и изображения.

Чтобы лучше понять это, давайте посмотрим на пример Open AI, показанный в демонстрационном видео GPT-4.

На изображении выше показано, как создать веб-сайт с помощью визуального элемента. Сначала на шаге 1 был нарисован макет. Затем на шаге 2 была сделана фотография этого макета. Затем это изображение было отправлено в GPT-4 на шаге 3. Модель дала необходимые коды. Наконец, на шаге 4 с помощью этих кодов был создан красочный веб-сайт. Как видите, даже если вы не знаете, как программировать, вы можете использовать GPT-4 для преобразования бумажного макета в веб-сайт.

Как и ChatGPT, вы также можете вводить текст в GPT-4. Допустим, вы хотите сделать игру. Но вы не хотите иметь дело с написанием кода. Просто скажите GPT-4, какую игру вы хотите.

Бамммм! Модель дает вам коды игры, вы можете сделать свою игру используя эти коды. Позвольте мне показать вам другой пример. Скажите GPT-4, чтобы он сделал игру про змей, используя Javascript и необходимые коды HTML и CSS.

GPT-4 дает вам необходимые коды. Если вы запустите эти коды в своем браузере, вы сможете таким образом создать игру со змейкой. Конечно, вы можете сделать гораздо больше с GPT-4. Давайте посмотрим, что мы расскажем в этом блоге.

  • Что такое GPT-4?
  • GPT-4 против GPT-3.5
  • Как получить доступ к GPT-4?
  • Цены на API GPT-4

Давайте погрузимся!

Что такое GPT-4?

Вы видели, как чудесно GPT-4 справляется с задачами человеческого уровня. Но что такое GPT-4 под капотом? GPT-4 основан на архитектуре Transformers, разработанной мозговой командой Google в 2017 году.

Преобразователи состоят из энкодера и декодера. Эта архитектура была революционной и прекрасно работала, особенно в задачах перевода с одного языка на другой. Вот почему Google переводчик делает переводы на уровне человека.

Есть две важные модели, основанные на этой архитектуре. Один из них — BERT, а другой — GPT. BERT в основном используется для таких задач, как классификация текста, тогда как GPT в основном используется для генерации текста. Итак, GPT-4 основан на архитектуре Transformers.

Эта модель обучалась на данных из Интернета. Вы знаете, что работать с большими данными непросто. Для обучения модели в течение двух лет был разработан суперкомпьютер с Azure. Модель GPT-3.5 была обучена в прошлом году для тестирования этой системы. Подумайте об этом ChatGPT, который очаровал весь мир, был построен на GPT-3.5. Вы можете лучше понять мощь GPT-4.

Хорошо, мы видели архитектуру GPT-4. Чтобы понять, что вы можете делать с GPT-4, давайте рассмотрим несколько примеров, которые Open AI показывает на своей веб-странице.

Например, когда вы даете модели изображение, подобное приведенному выше, и говорите, что панель изображения определяется панелью за панелью, модель понимает, что находится на изображении, и объясняет это вам.

GPT-4 говорит, что это трехпанельный адаптер Lightning Cable. И модель описывает объекты в панелях один за другим. Давайте посмотрим на эту картинку.

Как видите, мужчина гладит в кузове такси. Мы понимаем, что ситуация на этой картине абсурдна. Когда мы спрашиваем у GPT-4, что необычного на этой картинке, модель описывает, что происходит на картинке.

Модель впервые распознала объекты на изображении как человека. Модели ИИ уже могли распознавать объекты. Но модель обнаружила на снимке что-то необычное. Другими словами, он замечал картинку почти как человек и делал выводы.

Это потрясающе. Если бы кто-то сказал 5 лет назад, что ИИ будет распознавать объекты на картинках и делать выводы, никто бы ему не поверил. Но теперь посмотрите, до какого уровня дошел ИИ за такое короткое время.

Семейство GPT состоит из нескольких основных языковых моделей, способных генерировать реалистичный текст. Предыдущая версия GPT-4 была GPT-3.5. ChatGPT на основе GPT-3.5. Давайте сравним модели GPT, чтобы лучше понять семейство GPT.

GPT-4 против GPT-3.5

Семейство GPT совершило невозможное. Двумя последними членами семейства GPT являются GPT-3.5 и GPT-4. Давайте сравним их, чтобы лучше понять.

Первое отличие заключается в том, что хотя GPT-3.5 работает только с текстовыми данными, GPT-4 также может работать с визуальными и видеоданными, помимо текстовых данных. Это самая большая разница между двумя моделями.

Что касается количества параметров, то у GPT-3 было 175 миллиардов параметров. GPT-4 имеет 100 триллионов параметров. Так вот, эта модель примерно в 500 раз крупнее ГПТ-3. Какая большая модель, правда?

Теперь давайте сравним две модели в соответствии с разговором. В простом разговоре разницы между этими двумя моделями нет, а вот для сложных разговоров GPT-4 отлично подходит. GPT-4 более надежен, креативен и способен обрабатывать гораздо более тонкие инструкции, чем GPT-3.5.

Таким образом, эта модель отлично работает и с текстовыми данными. Давайте перейдем к сравнению экзаменов, которое Open AI особенно выделяет.

GPT-4 выполняет академические и профессиональные экзамены на уровне человека, хотя он менее способен, чем человек, решать реальные проблемы. Если у вас есть GPT-4 на академическом или профессиональном экзамене, вы можете легко набрать высокий балл. Исследователи OpenAI проверили GPT-3.5 и GPT-4 на тестах на людях. Эти экзамены состоят как из вопросов с несколькими вариантами ответов, так и из открытых вопросов.

Здесь вы можете увидеть экзамены и успехи моделей на этих экзаменах. Диаграмма ранжирована от низкого к высокому по производительности GPT-3.5. Синие цвета указывают на успех GPT-3.5, а зеленые — на успех GPT-4.

Если вы заметили, что GPT-4 работает лучше почти на всех экзаменах. Успех GPT-4 на большинстве экзаменов превышает 80 процентов, а на некоторых приближается к 100. Эти экзамены не простые, это академические и профессиональные экзамены. Обратите внимание, что эти экзамены являются тестами, которые большинство людей не сдают.

На сегодняшний день разработано множество моделей, обучаемых на больших данных. Для сравнения этих моделей используются различные эталонные тесты. Эти тесты, например, измеряют, как модель предсказывает слово за словом. Как правило, эти тесты на английском языке.

На этой диаграмме вы видите оценки моделей на разных языках. В первой строке показан процент нахождения правильного ответа при выборе случайного ответа. Вероятность найти правильный ответ в викторине с 4 вариантами ответов составляет 25 процентов, верно?

Например, тест модели PaLM, разработанной Google, составляет 69 % для английского языка, 70 % для модели GPT-3.5 и 85 % для GPT-4.

GPT-4 превзошел другие модели в тестах производительности. Когда эти тесты были переведены на другие языки, а затем протестированы, GPT-4 снова стал отличным. Хорошо, GPT-4 — отличная модель, но есть ли у нее недостатки, спросите вы? Давайте рассмотрим ограничения GPT-4.

Ограничения

Несмотря на высокие возможности этой модели, она, как и другие представители семейства GPT, имеет некоторые ограничения. Исследователи OpenAI сравнили показатели точности семейства GPT.

По горизонтальной оси отложены площади, а по вертикальной оси - показатели точности моделей. Чем ближе это отношение к 1, тем более идеальные гуманоидные ответы получаются. Посмотрите на эту диаграмму, зеленый цвет указывает на GPT-4.

В тестах GPT-4 выдает более точные результаты, чем другие модели, но, к сожалению, мы видим, что он не может дать стопроцентно правильный ответ. Таким образом, для получения точных результатов GPT-4 нужно немного улучшить.

В этом разделе мы сравнили модели GPT и увидели, насколько мощной является GPT-4. Мы также говорили о некоторых ограничениях модели. Давайте посмотрим, где вы можете использовать GPT-4 сейчас.

Как получить доступ к GPT-4?

Как вы знаете, OpenAI недавно представила платную подписку на ChatGPT. Вы можете подписаться на ChatGPT за 20 долларов в месяц. Вы можете использовать GPT-4 напрямую, если у вас есть подписка.

Если у вас нет подписки, другой способ использовать эту модель — зарегистрироваться в списке ожидания и дождаться своей очереди. Я не знаю, когда будет твоя очередь. Даже если это так, они, вероятно, будут предлагать ограниченное использование. Другими словами, они направляют вас на платную подписку. Когда подойдет ваша очередь, модель GPT-4 откроется вам на странице игровой площадки OpenAI.

Другой способ получить доступ к GPT-4 — использовать Bing. Как вы знаете, Bing — это поисковая система, разработанная Microsoft. Ранее в этом движке использовался ChatGPT. Юсуф Мехди, корпоративный вице-президент Microsoft, объявил, что они изменили движок, лежащий в основе предварительного просмотра Bing, на GPT-4. Итак, вы можете получить доступ к GPT-4 с помощью чата Bing. Но для этого вам все равно придется записаться в лист ожидания.

В этом разделе мы рассмотрели, как получить доступ к GPT-4. Давайте посмотрим на стоимость API GPT-4.

Цены на API GPT-4

Разработчики могут использовать модели GPT в своих приложениях. Таким образом, вы можете подключать модели GPT к своим приложениям в виде API. У меня есть хорошие новости для вас. Вы можете сразу же использовать API GPT-4 в своих приложениях. API ChatGPT был выпущен с небольшим опозданием. OpenAI сразу же сделал API GPT-4 доступным.

Теперь давайте посмотрим на цены API GPT-4. Обратите внимание, что API GPT-4 получил название gpt-4–0314. Цена основана на токенах. Токен означает строку символов. Таким образом, вы можете думать о токене как о наименьшем фрагменте текста. Это может быть токен, символ или слово. Вы можете подумать, что 1000 токенов примерно равны примерно 750 словам.

Здесь вы можете увидеть цены на модели в зависимости от использования токена. Например, 2133 токена равны примерно 1600 словам. Вы можете написать сообщение в блоге среднего размера с таким количеством слов. Это стоит 0,128 доллара за завершение и 0,064 доллара за подсказку. Цена GPT-3.5 составляет 0,004 доллара США. Цены на другие модели можно посмотреть здесь. Обратите внимание, что эти модели не такие мощные, как GPT-4.

Давайте посмотрим на наибольшее количество токенов. Это эквивалентно примерно 1 миллиону слов. Вы можете писать книги о Гарри Поттере с таким количеством слов. Итак, написание книг о Гарри Поттере с помощью GPT-4 стоит 43 доллара с использованием подсказки.

GPT-4 для подсказки в 14 раз дороже, чем ChatGPT, и в 29 раз дороже для завершения. Так стоит ли разница? Это зависит от тебя. Вы видели силу GPT-4 в чартах. Эта модель дает более точные и детализированные результаты. Решение за вами. Вот как взимается плата за API GPT-4.

Заворачивать

GPT-4 — это новейшая современная модель, разработанная OpenAI. Эта модель принимает как текстовые, так и визуальные данные. В этом блоге мы увидели возможности GPT-4 и изучили его ограничения. Затем мы узнали, как получить доступ к модели, и, наконец, обсудили цены на GPT API.

Вот и все. Спасибо за прочтение. Подключим YouTube | Средний | Твиттер | Инстаграм.