Каковы ограничения Vicuna AI?

Vicuna AI, как и другие крупные языковые модели, имеет определенные ограничения. К ним относятся: <ul><li> Трудности с рассуждениями и математическими вычислениями.</li><li> Потенциальная неточная фактическая точность.</li><li> Ограниченные гарантии безопасности и возможная токсичность или предвзятость.</li></ul> <br > Разработчики работают над устранением этих ограничений посредством продолжающихся будущих исследований.

Vicuna AI

Vicuna: Чат-бот с открытым исходным кодом, впечатляющий GPT-4 с качеством ChatGPT 90%*

Доступ

Информация о Vicuna AI

Информация о продукте

Социальные сети

Описание продукта

<p>Мы представляем Vicuna-13B, чат-бота с открытым исходным кодом, обученного путем тонкой настройки LLaMA на общих разговорах пользователей, собранных из ShareGPT. Предварительная оценка...

Vicuna AI Введение

Vicuna: чат-бот с открытым исходным кодом, впечатляющий GPT-4 с качеством ChatGPT 90%*

Обзор

Быстрое развитие больших языковых моделей (LLM) произвело революцию в системах чат-ботов, что привело к беспрецедентным уровни интеллекта, как показано в ChatGPT OpenAI. Однако, несмотря на впечатляющую производительность, детали обучения и архитектуры ChatGPT остаются неясными, что препятствует исследованиям и инновациям с открытым исходным кодом в этой области. Вдохновленные проектом Meta LLaMA и Stanford Alpaca, мы представляем Vicuna-13B, чат-бота с открытым исходным кодом, поддерживаемого расширенным набором данных и простой в использовании масштабируемой инфраструктурой. Благодаря точной настройке базовой модели LLaMA на основе общих разговоров пользователей, собранных с ShareGPT.com, Vicuna-13B продемонстрировала конкурентоспособную производительность по сравнению с другими моделями с открытым исходным кодом, такими как Stanford Alpaca. В этом сообщении блога представлена предварительная оценка характеристик Vicuna-13B, а также описана инфраструктура его обучения и обслуживания. Мы также приглашаем сообщество поработать с нашей онлайн-демоверсией, чтобы проверить возможности этого чат-бота.

Насколько хорош Vicuna?

После тонкой настройки Vicuna с помощью 70 тысяч общих разговоров ChatGPT, которыми пользуются пользователи, мы обнаруживаем, что Vicuna становится способной генерирования более подробных и хорошо структурированных ответов по сравнению с Alpaca (см. примеры ниже), с качеством на уровне ChatGPT.

Онлайн-демо

Попробуйте демо-версию Vicuna-13B здесь!

Обучение

Vicuna создается путем тонкой настройки базовой модели LLaMA с использованием примерно 70 тысяч общих разговоров пользователей, собранных на ShareGPT.com с общедоступными API. Чтобы обеспечить качество данных, мы конвертируем HTML обратно в уценку и отфильтровываем некоторые неподходящие или некачественные образцы. Кроме того, мы делим длинные разговоры на более мелкие сегменты, которые соответствуют максимальной длине контекста модели.

Многоходовые разговоры. Мы корректируем потери на обучение, чтобы учесть многоходовые разговоры, и вычисляем потери при точной настройке исключительно на основе вывод чат-бота.
Оптимизация памяти. Чтобы Викуна могла понимать длинный контекст, мы увеличиваем максимальную длину контекста с 512 в альпаке до 2048, что существенно увеличивает требования к памяти графического процессора. Мы справляемся с нехваткой памяти, используя контрольные точки градиента и мгновенное внимание.
Снижение затрат за счет спотового инстанса. Увеличение в 40 раз набора данных и четырехкратная длина последовательности для обучения создают значительную проблему с точки зрения затрат на обучение. Мы используем управляемые спотовые инстансы SkyPilot, чтобы снизить затраты за счет использования более дешевых спотовых инстансов с автоматическим восстановлением для приоритетных операций и автоматическим переключением зон. Это решение сокращает затраты на обучение модели 7B примерно со 140, а модели 13B примерно с 300.

Обслуживание

Мы создаем систему обслуживания, которая способна обслуживать несколько моделей с распределенными рабочие. Он поддерживает гибкое подключение работников графических процессоров как из локальных кластеров, так и из облака. Благодаря использованию отказоустойчивого контроллера и функции управляемого спота в SkyPilot эта обслуживающая система может хорошо работать с более дешевыми спотовыми инстансами из нескольких облаков, что позволяет снизить затраты на обслуживание. В настоящее время это упрощенная реализация, и мы работаем над интеграцией в нее большего количества наших последних исследований.

Как оценить чат-бота?

Оценка чат-ботов с искусственным интеллектом — сложная задача, поскольку она требует изучения понимания языка, рассуждения, и осведомленность о контексте. Поскольку чат-боты с искусственным интеллектом становятся все более продвинутыми, текущих открытых тестов может быть уже недостаточно. Например, чат-боты SOTA могут эффективно отвечать на набор оценочных данных, используемый в Стэнфордской программе самообучения «Альпака», что затрудняет людям различение различий в производительности. Дополнительные ограничения включают загрязнение данных обучения/тестирования и потенциально высокую стоимость создания новых тестов. Чтобы решить эти проблемы, мы предлагаем систему оценки на основе GPT-4 для автоматизации оценки производительности чат-ботов.

Ограничения

Мы заметили, что, как и другие модели большого языка, Vicuna имеет определенные ограничения. Например, он плохо справляется с задачами, связанными с рассуждением или математикой, и у него могут быть ограничения в точной идентификации или обеспечении фактической точности его результатов. Кроме того, он не был достаточно оптимизирован, чтобы гарантировать безопасность или снизить потенциальную токсичность или предвзятость. Чтобы решить проблемы безопасности, мы используем API модерации OpenAI для фильтрации неуместных пользовательских данных в нашей онлайн-демо. Тем не менее, мы ожидаем, что Vicuna может послужить открытой отправной точкой для будущих исследований по устранению этих ограничений.

Релиз

В нашем первом выпуске мы поделимся кодом обучения, обслуживания и оценки в репозитории GitHub: https://github.com/lm-sys/FastChat. Также мы выпустили модельные гири «Викуна-13Б». Публикация набора данных не планируется. Присоединяйтесь к нашему серверу Discord и следите за нашим Twitter, чтобы получать последние обновления.

Насколько хороша Викунья?

После тонкой настройки Викуньи с помощью 70 000 общих бесед ChatGPT, которыми пользуются пользователи, мы обнаружили, что Викунья становится способной генерировать более подробные и хорошо структурированные ответы по сравнению с Альпакой (см. примеры ниже). ), с качеством на уровне ChatGPT.

Онлайн-демо

Попробуйте демо-версию Vicuna-13B здесь< /a>!

Обзор

Быстрое развитие больших языковых моделей (LLM) произвело революцию в системах чат-ботов, что привело к беспрецедентному уровню интеллекта, как это видно в ChatGPT от OpenAI. Однако, несмотря на впечатляющую производительность, детали обучения и архитектуры ChatGPT остаются неясными, что препятствует исследованиям и инновациям с открытым исходным кодом в этой области. Вдохновленные проектом Meta LLaMA и Stanford Alpaca, мы представляем Vicuna-13B, чат-бота с открытым исходным кодом, поддерживаемого расширенным набором данных и простой в использовании масштабируемой инфраструктурой. Благодаря точной настройке базовой модели LLaMA на основе общих разговоров пользователей, собранных с ShareGPT.com, Vicuna-13B продемонстрировала конкурентоспособную производительность по сравнению с другими моделями с открытым исходным кодом, такими как Stanford Alpaca. В этом сообщении блога представлена предварительная оценка характеристик Vicuna-13B, а также описана инфраструктура его обучения и обслуживания. Мы также приглашаем сообщество поработать с нашей онлайн-демоверсией, чтобы проверить возможности этого чат-бота.

Обучение

Vicuna создается путем тонкой настройки базовой модели LLaMA с использованием примерно 70 тысяч пользователей. общие беседы, собранные на ShareGPT.com, с общедоступными API. Чтобы обеспечить качество данных, мы конвертируем HTML обратно в уценку и отфильтровываем некоторые неподходящие или некачественные образцы. Кроме того, мы делим длинные разговоры на более мелкие сегменты, соответствующие максимальной длине контекста модели.

Обслуживание

Мы создаем систему обслуживания, способную обслуживать несколько моделей с распределенными рабочими процессами. Он поддерживает гибкое подключение работников графических процессоров как из локальных кластеров, так и из облака. Благодаря использованию отказоустойчивого контроллера и функции управляемого спота в SkyPilot эта обслуживающая система может хорошо работать с более дешевыми спотовыми инстансами из нескольких облаков, что позволяет снизить затраты на обслуживание. В настоящее время это упрощенная реализация, и мы работаем над интеграцией в нее наших последних исследований.

Как Оценить чат-бота?

Оценка чат-ботов с искусственным интеллектом — непростая задача, поскольку она требует изучения понимания языка, рассуждения и понимания контекста. Поскольку чат-боты с искусственным интеллектом становятся все более продвинутыми, текущих открытых тестов может быть уже недостаточно. Например, на набор оценочных данных, используемый в Стэнфордской Альпаке, self-instruct, можно эффективно ответить, Чат-боты SOTA, затрудняющие людям различение различий в производительности. Дополнительные ограничения включают загрязнение данных обучения/тестирования и потенциально высокую стоимость создания новых тестов. Чтобы решить эти проблемы, мы предлагаем систему оценки на основе GPT-4 для автоматизации оценки производительности чат-бота.

Ограничения

Мы заметили, что, как и в других крупных языковых моделях, Vicuna имеет определенные ограничения. Например, он плохо справляется с задачами, связанными с рассуждением или математикой, и у него могут быть ограничения в точной идентификации или обеспечении фактической точности его результатов. Кроме того, он не был достаточно оптимизирован, чтобы гарантировать безопасность или снизить потенциальную токсичность или предвзятость. Чтобы решить проблемы безопасности, мы используем API модерации OpenAI, чтобы отфильтровывать недопустимые вводимые пользователем данные в нашей онлайн-демо. . Тем не менее, мы ожидаем, что Викунья может послужить открытой отправной точкой для будущих исследований по устранению этих ограничений.

Vicuna AI Часто задаваемые вопросы

Предварительные оценки с использованием GPT-4 в качестве критерия показывают, что Vicuna AI обеспечивает более 90 % качества ChatGPT и Google Bard. Это означает, что ИИ Викуны в большинстве случаев может предоставлять ответы, которые столь же полезны, релевантны, точны и подробны, как ChatGPT и Bard.

ИИ Викуны обучался путем тонкой настройки базовой модели LLaMA на наборе данных из 70 000 общих разговоров пользователей, собранных из ShareGPT. Эти разговоры были преобразованы в уценку и отфильтрованы по качеству перед обучением.

Vicuna AI, как и другие крупные языковые модели, имеет определенные ограничения. К ним относятся:

Трудности с рассуждениями и математическими вычислениями.
Потенциальная неточная фактическая точность.
Ограниченные гарантии безопасности и возможная токсичность или предвзятость.

Разработчики работают над устранением этих ограничений посредством продолжающихся будущих исследований.

Vicuna AI Трафик веб-сайта

Посещения

Дата	Посещения
2024-06-01	2207473
2024-07-01	2143625
2024-08-01	2099531

Метрика

Метрика	Значение
Показатель отказов	59.33%
Страниц за посещение	1.99
Средняя продолжительность посещения	177.02 s

География

Страна	Доля
🇨🇳 КНР (Китайская Народная Республика)	14.42%
🇺🇸 США	14.22%
🇷🇺 Российская Федерация	12.08%
🇻🇳 Вьетнам	5.55%
🇩🇪 Германия	5.30%

Источник

Источник	Значение
Прямой доступ	55.07%
Поиск	33.37%
Рефералы	8.26%
Социальные сети	3.06%
Платные рефералы	0.16%
Электронная почта	0.07%

Vicuna AI Альтернативные продукты

TianGong AI(opens in a new tab)

Общающийся чат-бот

Tiangong — первая поисковая система с искусственным интеллектом в Китае. Она может понимать намерения пользователей, искать массивную информацию по всей сети и использовать технологию искусственного интеллекта для обобщения, суммирования и интеграции этой информации для получения высококачественных результатов поиска без рекламы. Он также может автоматически организовывать результаты поиска в интеллектуальные карты и схемы для поддержки профессиональных академических и научных исследований. Кроме того, Tiangong также имеет возможность общаться, писать, задавать вопросы и отвечать, а также рисовать. Tiangong взаимодействует с пользователями посредством естественного языка вопросов и ответов, который может удовлетворить разнообразные потребности, такие как вопросы и ответы в области знаний, создание статей, логические выводы, математические вычисления, программирование кода, рисование искусственного интеллекта, виртуальный человеческий чат и эмоциональное общение. В Tiangong также имеется большое количество интеллектуальных агентов, которые могут помочь вам в различных сценариях, таких как учеба, работа и жизнь.

812Посещения

46%Поиск

HumanizerPro(opens in a new tab)

Подсказка

Бесплатное преобразование искусственного интеллекта в человеческий контент с помощью HumanizerPro.ai. Лучший бесплатный инструмент гуманизации искусственного интеллекта для улучшения читаемости и обхода детекторов! Попробуйте сейчас!

1.3KПосещения

4%Поиск

MagicShot.ai(opens in a new tab)

Генерация изображения

Превратите свои идеи в потрясающие произведения искусства с помощью ИИ с помощью MagicShot.ai. Мгновенно создавайте изображения с помощью нашего фотогенератора с искусственным интеллектом. Раскройте свой творческий потенциал!

33.9KПосещения

38%Поиск

AI Updates Now(opens in a new tab)

Рассказы

Мы предоставляем экспертные советы и честные обзоры инструментов на базе искусственного интеллекта для написания любовных романов, помогая вам творчески создавать захватывающие любовные истории. Исследуйте сейчас!

1.5KПосещения

40%Поиск

LogoAI AI(opens in a new tab)

Графический дизайн

Создавайте уникальные и профессиональные логотипы без особых усилий с помощью конструктора логотипов с искусственным интеллектом от LogoAI.ai. Наслаждайтесь бесплатным онлайн-доступом, расширенными возможностями настройки, логотипами без водяных знаков и безопасным дизайном.

299Посещения

55%Поиск

AI Logo Creator(opens in a new tab)

Графический дизайн

AI инструмент для создания логотипов для создания красивых эмблем. Лучший генератор логотипов AI с простым интерфейсом для вашего бизнеса.

Vicuna AI

Информация о Vicuna AI

Информация о продукте

Веб-сайт

Категория

Электронная почта

Социальные сети

Описание продукта

Vicuna AI Введение

Vicuna: чат-бот с открытым исходным кодом, впечатляющий GPT-4 с качеством ChatGPT 90%*

Обзор

Насколько хорош Vicuna?

Онлайн-демо

Обучение

Обслуживание

Как оценить чат-бота?

Ограничения

Релиз

Насколько хороша Викунья?

Онлайн-демо

Обзор

Обучение

Обслуживание

Как Оценить чат-бота?

Ограничения

Vicuna AI Часто задаваемые вопросы

Чем Vicuna AI отличается от ChatGPT и Bard?

Как обучался ИИ Викуны?

Каковы ограничения Vicuna AI?

Vicuna AI Трафик веб-сайта

Посещения

Метрика

География

Источник

Vicuna AI Альтернативные продукты

TianGong AI(opens in a new tab)

HumanizerPro(opens in a new tab)

MagicShot.ai(opens in a new tab)

AI Updates Now(opens in a new tab)

LogoAI AI(opens in a new tab)

AI Logo Creator(opens in a new tab)