Vicuna AI の制限は何ですか?

Vicuna AI には、他の大規模な言語モデルと同様に、特定の制限があります。 <ul><li> 推論と数学の難しさ</li><li> 事実の正確性が不正確である可能性がある</li><li> 安全性の保証が限られており、毒性または偏見の可能性がある</li></ul> <br > 開発者は、今後の継続的な研究を通じてこれらの制限に対処するよう取り組んでいます。

Vicuna AI

Q: Vicuna AI はどのようにトレーニングされましたか?

Vicuna AI は、LLaMA ベース モデルを微調整することによってトレーニングされました。 ShareGPT から収集された 70,000 のユーザー共有会話のデータセットを対象としています。これらの会話はマークダウンに変換され、トレーニング前に品質のためにフィルタリングされました。

Vicuna: 90%* ChatGPT 品質で GPT-4 に優れたオープンソースチャットボット

アクセス

Vicuna AIの詳細

製品情報

ソーシャルメディア

製品説明

<p>Vicuna-13B は、ShareGPT から収集されたユーザー共有会話で LLaMA を微調整することによってトレーニングされたオープンソースチャットボットです。事前評価…

Vicuna AI 紹介

Vicuna: 90%* ChatGPT 品質で GPT-4 を印象づけるオープンソースチャットボット

概要

大規模言語モデル (LLM) の急速な進歩により、チャットボットシステムに革命が起こり、前例のないレベルのチャットボットが実現しました。 OpenAI の ChatGPT に見られるインテリジェンスのレベル。しかし、その優れたパフォーマンスにもかかわらず、ChatGPT のトレーニングとアーキテクチャの詳細は依然として不明瞭であり、この分野における研究やオープンソースのイノベーションを妨げています。 Meta LLaMA と Stanford Alpaca プロジェクトからインスピレーションを得て、強化されたデータセットと使いやすくスケーラブルなインフラストラクチャを基盤とするオープンソースチャットボットである Vicuna-13B を紹介します。 ShareGPT.com から収集したユーザー共有会話に基づいて LLaMA ベースモデルを微調整することにより、Vicuna-13B は、Stanford Alpaca などの他のオープンソースモデルと比較して競争力のあるパフォーマンスを実証しました。このブログ投稿では、Vicuna-13B のパフォーマンスの予備評価を提供し、その訓練とサービスのインフラストラクチャについて説明します。また、このチャットボットの機能をテストするためにオンラインデモに参加するようコミュニティを招待します。

Vicuna はどのくらい優れていますか?

ユーザーが共有する 70,000 の ChatGPT 会話で Vicuna を微調整した結果、Vicuna が有効になることがわかりました。 Alpaca (下記の例を参照) と比較して、ChatGPT と同等の品質で、より詳細で適切に構造化された回答を生成できます。

オンラインデモ

ここで Vicuna-13B デモをお試しください。

トレーニング

Vicuna は、パブリック API を使用して ShareGPT.com から収集された約 70,000 のユーザー共有会話を使用して、LLaMA ベースモデルを微調整することによって作成されます。データの品質を確保するために、HTML をマークダウンに変換し、不適切なサンプルや低品質のサンプルを除外します。さらに、長い会話を、モデルのコンテキストの最大長に適合する小さなセグメントに分割します。

マルチターン会話: マルチターン会話を考慮してトレーニング損失を調整し、のみに基づいて微調整損失を計算します。
メモリの最適化: Vicuna が長いコンテキストを理解できるようにするために、コンテキストの最大長をアルパカの 512 から 2048 に拡張しました。これにより、GPU メモリ要件が大幅に増加します。私たちは、勾配チェックポイントとフラッシュアテンションを利用してメモリプレッシャーに取り組みます。
スポットインスタンスによるコスト削減: トレーニング用の 40 倍のデータセットと 4 倍のシーケンス長により、トレーニング費用の面でかなりの課題が生じます。 SkyPilot マネージドスポットを採用し、プリエンプションの自動回復と自動ゾーンスイッチを備えた安価なスポットインスタンスを活用することでコストを削減します。このソリューションにより、7B モデルのトレーニングコストが約 140 から、13B モデルのトレーニングコストが約 300 から削減されます。

サービス提供

分散型モデルを使用して複数のモデルを提供できるサービスシステムを構築します。労働者。オンプレミスクラスターとクラウドの両方からの GPU ワーカーの柔軟なプラグインをサポートします。 SkyPilot のフォールトトレラントコントローラーとマネージドスポット機能を利用することで、このサービスシステムは複数のクラウドの安価なスポットインスタンスとうまく連携して、サービスコストを削減できます。これは現在軽量の実装であり、最新の研究をさらに統合することに取り組んでいます。

チャットボットを評価するにはどうすればよいですか?

AI チャットボットの評価は、言語の理解、推論、分析を調べる必要があるため、困難な作業です。そしてコンテキスト認識。 AI チャットボットがより高度になるにつれて、現在のオープンベンチマークではもはや十分ではなくなる可能性があります。たとえば、スタンフォード大学の Alpaca で使用されている自己指導型の評価データセットは、SOTA チャットボットによって効果的に回答できるため、人間がパフォーマンスの違いを識別することが困難になります。さらに制限には、トレーニング/テストデータの汚染や、新しいベンチマークの作成にかかる潜在的な高コストなどが含まれます。これらの問題に取り組むために、チャットボットのパフォーマンス評価を自動化するための GPT-4 に基づく評価フレームワークを提案します。

制限

他の大規模な言語モデルと同様に、Vicuna にも特定の制限があることに気付きました。たとえば、推論や数学を含むタスクは苦手であり、自分自身を正確に識別したり、出力の事実の正確さを保証したりすることに限界がある可能性があります。さらに、安全性を保証したり、潜在的な毒性やバイアスを軽減したりするために十分に最適化されていません。安全性の懸念に対処するために、OpenAI モデレーション API を使用して、オンラインデモで不適切なユーザー入力を除外します。それにもかかわらず、私たちは Vicuna がこれらの制限に対処するための将来の研究のためのオープンな出発点として機能することを期待しています。

リリース

最初のリリースでは、トレーニング、サービス、評価のコードを GitHub リポジトリで共有します。 https://github.com/lm-sys/FastChat。 Vicuna-13Bモデルのウェイトもリリースしました。データセットを公開する予定はありません。 Discord サーバーに参加し、Twitter をフォローして最新情報を入手してください。

Vicuna はどの程度優れていますか?

70,000 人のユーザーが共有する ChatGPT 会話で Vicuna を微調整した結果、Vicuna は Alpaca と比較してより詳細でよく構造化された回答を生成できることがわかりました (以下の例を参照) ）、ChatGPT と同等の品質です。

オンラインデモ

Vicuna-13B デモは、こちらからお試しください< /a>!

概要

大規模言語モデル (LLM) の急速な進歩によりチャットボットシステムに革命が起こり、OpenAI の ChatGPT に見られるような前例のないレベルのインテリジェンスが実現しました。しかし、その優れたパフォーマンスにもかかわらず、ChatGPT のトレーニングとアーキテクチャの詳細は依然として不明瞭であり、この分野における研究やオープンソースのイノベーションを妨げています。 Meta LLaMA と Stanford Alpaca プロジェクトからインスピレーションを得て、強化されたデータセットと使いやすくスケーラブルなインフラストラクチャを基盤とするオープンソースチャットボットである Vicuna-13B を紹介します。 ShareGPT.com から収集したユーザー共有会話に基づいて LLaMA ベースモデルを微調整することにより、Vicuna-13B は、Stanford Alpaca などの他のオープンソースモデルと比較して競争力のあるパフォーマンスを実証しました。このブログ投稿では、Vicuna-13B のパフォーマンスの予備評価を提供し、その訓練とサービスのインフラストラクチャについて説明します。また、このチャットボットの機能をテストするためにオンラインデモと対話するようコミュニティを招待します。

トレーニング

Vicuna は、約 70,000 人のユーザーを使用して LLaMA ベースモデルを微調整することによって作成されます。 ShareGPT.com からパブリック API を使用して収集された共有会話。データの品質を確保するために、HTML をマークダウンに変換し、不適切なサンプルや低品質のサンプルを除外します。さらに、長い会話をモデルのコンテキストの最大長に合わせて小さなセグメントに分割します。

サービス提供

分散ワーカーで複数のモデルにサービスを提供できるサービスシステムを構築します。オンプレミスクラスターとクラウドの両方からの GPU ワーカーの柔軟なプラグインをサポートします。 SkyPilot のフォールトトレラントコントローラーとマネージドスポット機能を利用することで、このサービスシステムは複数のクラウドの安価なスポットインスタンスとうまく連携して、サービスコストを削減できます。これは現在軽量の実装であり、最新の研究をさらに統合することに取り組んでいます。

方法チャットボットを評価するには?

AI チャットボットの評価は、言語理解、推論、コンテキスト認識を調べる必要があるため、困難な作業です。 AI チャットボットがより高度になるにつれて、現在のオープンベンチマークではもはや十分ではなくなる可能性があります。たとえば、スタンフォード大学の Alpaca で使用されている評価データセットである self-instruct は、次のように効果的に答えることができます。 SOTA チャットボットにより、人間がパフォーマンスの違いを認識することが困難になります。さらに制限には、トレーニング/テストデータの汚染や、新しいベンチマークの作成にかかる潜在的な高コストなどが含まれます。これらの問題に取り組むために、チャットボットのパフォーマンス評価を自動化するための GPT-4 に基づく評価フレームワークを提案します。

制限

他の大規模な言語モデルと同様に、Vicuna には次のような特徴があることに気付きました。特定の制限。たとえば、推論や数学を含むタスクは苦手であり、自分自身を正確に識別したり、出力の事実の正確さを保証したりすることに限界がある可能性があります。さらに、安全性を保証したり、潜在的な毒性やバイアスを軽減したりするために十分に最適化されていません。安全上の懸念に対処するため、OpenAI モデレーション API を使用して、オンラインデモで不適切なユーザー入力を除外します。。それにもかかわらず、私たちはビクーニャがこれらの制限に対処するための将来の研究のためのオープンな出発点として機能することを期待しています。

Vicuna AI FAQ

GPT-4 を審査員として使用した予備評価では、Vicuna AI が ChatGPT および Google Bard の品質の 90% 以上を達成していることが示されています。これは、Vicuna AI が、ほとんどの場合、ChatGPT や Bard と同じくらい役立つ、関連性があり、正確で詳細な応答を提供できることを意味します。

Vicuna AI は、LLaMA ベースモデルを微調整することによってトレーニングされました。 ShareGPT から収集された 70,000 のユーザー共有会話のデータセットを対象としています。これらの会話はマークダウンに変換され、トレーニング前に品質のためにフィルタリングされました。

Vicuna AI には、他の大規模な言語モデルと同様に、特定の制限があります。

推論と数学の難しさ
事実の正確性が不正確である可能性がある
安全性の保証が限られており、毒性または偏見の可能性がある

開発者は、今後の継続的な研究を通じてこれらの制限に対処するよう取り組んでいます。

Vicuna AI ウェブサイトのトラフィック

訪問数

日付	訪問数
2024-06-01	2207473
2024-07-01	2143625
2024-08-01	2099531

指標

指標	値
直帰率	59.33%
訪問あたりのページ数	1.99
平均訪問時間	177.02 s

地理

国	共有
🇨🇳 中華人民共和国	14.42%
🇺🇸 アメリカ合衆国	14.22%
🇷🇺 ロシア連邦	12.08%
🇻🇳 ベトナム	5.55%
🇩🇪 ドイツ	5.30%

ソース

ソース	値
直接アクセス	55.07%
検索	33.37%
リファラル	8.26%
ソーシャルメディア	3.06%
有料リファラル	0.16%
メール	0.07%

Vicuna AI 代替製品

网易天音(opens in a new tab)

音楽生成

NetEase Tianyin AI 作成プラットフォーム、歌詞、音楽、編曲、歌唱に堪能で、多数のスタイルがすべて揃っています無料で使用できます。ぜひ試してみてください。あなたの音楽の才能を披露してください!

FakeYou AI(opens in a new tab)

音声合成

FakeYou 有名人 AI 音声および AI ビデオジェネレーター

948.6K訪問数

53%検索

1.5K訪問数

40%検索

Biblical AI(opens in a new tab)

会話型チャットボット

聖書に関する包括的な情報を提供する無料の AI アシスタント。聖書本文の探索に興味がある場合は、この AI がお手伝いします。

169訪問数

50%検索

Vicuna AI

Vicuna AIの詳細

製品情報

ウェブサイト

カテゴリ