Vicuna AI favicon
Vicuna AI

Vicuna AI

Vicuna: Chatbot Sumber Terbuka yang Mengesankan GPT-4 dengan 90%* Kualitas ChatGPT

Akses

Detail Vicuna AI

Informasi Produk

Media Sosial

Deskripsi Produk

<p>Kami memperkenalkan Vicuna-13B, chatbot sumber terbuka yang dilatih dengan menyempurnakan LLaMA pada percakapan bersama pengguna yang dikumpulkan dari ShareGPT. Evaluasi awal...

Vicuna AI Pengenalan

Vicuna: Chatbot Sumber Terbuka yang Mengesankan GPT-4 dengan 90%* Kualitas ChatGPT

Ikhtisar

Kemajuan pesat model bahasa besar (LLM) telah merevolusi sistem chatbot, menghasilkan kemajuan yang belum pernah terjadi sebelumnya tingkat kecerdasan seperti yang terlihat di ChatGPT OpenAI. Namun, meskipun kinerjanya mengesankan, detail pelatihan dan arsitektur ChatGPT masih belum jelas, sehingga menghambat penelitian dan inovasi sumber terbuka di bidang ini. Terinspirasi oleh proyek Meta LLaMA dan Stanford Alpaca, kami memperkenalkan Vicuna-13B, chatbot sumber terbuka yang didukung oleh kumpulan data yang disempurnakan dan infrastruktur yang mudah digunakan dan terukur. Dengan menyempurnakan model dasar LLaMA pada percakapan bersama pengguna yang dikumpulkan dari ShareGPT.com, Vicuna-13B telah menunjukkan kinerja kompetitif dibandingkan model sumber terbuka lainnya seperti Stanford Alpaca. Posting blog ini memberikan evaluasi awal kinerja Vicuna-13B dan menjelaskan infrastruktur pelatihan dan pelayanannya. Kami juga mengundang komunitas untuk berinteraksi dengan demo online kami untuk menguji kemampuan chatbot ini.

Seberapa Baguskah Vicuna?

Setelah menyempurnakan Vicuna dengan 70 ribu percakapan ChatGPT yang dibagikan pengguna, kami menemukan bahwa Vicuna menjadi mampu menghasilkan jawaban yang lebih detail dan terstruktur dibandingkan Alpaca (lihat contoh di bawah), dengan kualitas yang setara dengan ChatGPT.

Demo Online

Coba demo Vicuna-13B di sini!

Pelatihan

Vicuna dibuat dengan menyempurnakan model dasar LLaMA menggunakan sekitar 70 ribu percakapan bersama pengguna yang dikumpulkan dari ShareGPT.com dengan API publik. Untuk memastikan kualitas data, kami mengonversi HTML kembali ke penurunan harga dan memfilter beberapa sampel yang tidak pantas atau berkualitas rendah. Selain itu, kami membagi percakapan panjang menjadi segmen-segmen lebih kecil yang sesuai dengan panjang konteks maksimum model.
  • Percakapan multi-putaran: Kami menyesuaikan kerugian pelatihan untuk memperhitungkan percakapan multi-putaran dan menghitung kerugian penyesuaian hanya pada percakapan keluaran chatbot.
  • Optimasi Memori: Untuk memungkinkan Vicuna memahami konteks panjang, kami memperluas panjang konteks maksimal dari 512 di alpaka menjadi 2048, yang secara signifikan meningkatkan kebutuhan memori GPU. Kami mengatasi tekanan memori dengan memanfaatkan titik pemeriksaan gradien dan perhatian kilat.
  • Pengurangan Biaya melalui Instans Spot: Kumpulan data yang 40x lebih besar dan panjang urutan 4x untuk pelatihan menimbulkan tantangan besar dalam biaya pelatihan. Kami menggunakan spot terkelola SkyPilot untuk mengurangi biaya dengan memanfaatkan instans spot yang lebih murah dengan pemulihan otomatis untuk preemption dan peralihan zona otomatis. Solusi ini memangkas biaya pelatihan model 7B dari sekitar 140 dan model 13B dari sekitar 300.

Melayani

Kami membangun sistem penyajian yang mampu melayani banyak model dengan terdistribusi pekerja. Ini mendukung plug-in pekerja GPU yang fleksibel dari cluster lokal dan cloud. Dengan memanfaatkan pengontrol toleransi kesalahan dan fitur spot terkelola di SkyPilot, sistem penyajian ini dapat bekerja dengan baik dengan instans spot yang lebih murah dari beberapa cloud untuk mengurangi biaya penyajian. Saat ini penerapannya masih ringan dan kami berupaya untuk mengintegrasikan lebih banyak penelitian terbaru kami ke dalamnya.

Bagaimana Cara Mengevaluasi Chatbot?

Mengevaluasi chatbot AI adalah tugas yang menantang, karena memerlukan pengujian pemahaman bahasa, penalaran, dan kesadaran konteks. Dengan semakin canggihnya chatbot AI, tolok ukur terbuka saat ini mungkin tidak lagi memadai. Misalnya, kumpulan data evaluasi yang digunakan di Alpaca Stanford, yang diinstruksikan sendiri, dapat dijawab secara efektif oleh chatbot SOTA, sehingga menyulitkan manusia untuk membedakan perbedaan kinerja. Keterbatasan lainnya mencakup kontaminasi data pelatihan/pengujian dan potensi biaya tinggi untuk membuat tolok ukur baru. Untuk mengatasi masalah ini, kami mengusulkan kerangka evaluasi berdasarkan GPT-4 untuk mengotomatiskan penilaian kinerja chatbot.

Keterbatasan

Kami memperhatikan bahwa, mirip dengan model bahasa besar lainnya, Vicuna memiliki keterbatasan tertentu. Misalnya, lembaga ini tidak pandai mengerjakan tugas-tugas yang melibatkan penalaran atau matematika, dan mungkin mempunyai keterbatasan dalam mengidentifikasi dirinya secara akurat atau memastikan keakuratan faktual dari keluarannya. Selain itu, hal ini belum dioptimalkan secara memadai untuk menjamin keamanan atau memitigasi potensi toksisitas atau bias. Untuk mengatasi masalah keamanan, kami menggunakan API moderasi OpenAI untuk menyaring masukan pengguna yang tidak pantas dalam demo online kami. Meskipun demikian, kami mengantisipasi bahwa Vicuna dapat menjadi titik awal yang terbuka untuk penelitian di masa depan guna mengatasi keterbatasan ini.

Rilis

Dalam rilis pertama kami, kami akan membagikan kode pelatihan, penyajian, dan evaluasi di repo GitHub: https://github.com/lm-sys/FastChat. Kami juga merilis anak timbangan model Vicuna-13B. Tidak ada rencana untuk merilis kumpulan data tersebut. Bergabunglah dengan server Discord kami dan ikuti Twitter kami untuk mendapatkan pembaruan terkini.

Seberapa Baguskah Vicuna?

Setelah menyempurnakan Vicuna dengan 70 ribu percakapan ChatGPT yang dibagikan pengguna, kami menemukan bahwa Vicuna mampu menghasilkan jawaban yang lebih detail dan terstruktur dengan baik dibandingkan dengan Alpaca (lihat contoh di bawah ), dengan kualitas yang setara dengan ChatGPT.

Demo Online

Coba demo Vicuna-13B di sini< /a>!

Ikhtisar

Kemajuan pesat model bahasa besar (LLM) telah merevolusi sistem chatbot, menghasilkan tingkat kecerdasan yang belum pernah terjadi sebelumnya seperti yang terlihat pada ChatGPT OpenAI. Namun, meskipun kinerjanya mengesankan, detail pelatihan dan arsitektur ChatGPT masih belum jelas, sehingga menghambat penelitian dan inovasi sumber terbuka di bidang ini. Terinspirasi oleh proyek Meta LLaMA dan Stanford Alpaca, kami memperkenalkan Vicuna-13B, chatbot sumber terbuka yang didukung oleh kumpulan data yang disempurnakan dan infrastruktur yang mudah digunakan dan terukur. Dengan menyempurnakan model dasar LLaMA pada percakapan bersama pengguna yang dikumpulkan dari ShareGPT.com, Vicuna-13B telah menunjukkan kinerja kompetitif dibandingkan model sumber terbuka lainnya seperti Stanford Alpaca. Posting blog ini memberikan evaluasi awal kinerja Vicuna-13B dan menjelaskan infrastruktur pelatihan dan pelayanannya. Kami juga mengundang komunitas untuk berinteraksi dengan demo online kami untuk menguji kemampuan chatbot ini.

Pelatihan

Vicuna dibuat dengan menyempurnakan model dasar LLaMA menggunakan sekitar 70 ribu pengguna- percakapan bersama yang dikumpulkan dari ShareGPT.com dengan API publik. Untuk memastikan kualitas data, kami mengonversi HTML kembali ke penurunan harga dan memfilter beberapa sampel yang tidak pantas atau berkualitas rendah. Selain itu, kami membagi percakapan panjang menjadi segmen-segmen lebih kecil yang sesuai dengan panjang konteks maksimum model.

Pelayanan

Kami membangun sistem penyajian yang mampu melayani banyak model dengan pekerja terdistribusi. Ini mendukung plug-in pekerja GPU yang fleksibel dari cluster lokal dan cloud. Dengan memanfaatkan pengontrol toleransi kesalahan dan fitur spot terkelola di SkyPilot, sistem penyajian ini dapat bekerja dengan baik dengan instans spot yang lebih murah dari beberapa cloud untuk mengurangi biaya penyajian. Saat ini penerapannya ringan dan kami berupaya mengintegrasikan lebih banyak penelitian terbaru kami ke dalamnya.

Bagaimana caranya Untuk Mengevaluasi Chatbot?

Mengevaluasi chatbot AI adalah tugas yang menantang, karena memerlukan pemeriksaan pemahaman bahasa, penalaran, dan kesadaran konteks. Dengan semakin canggihnya chatbot AI, tolok ukur terbuka saat ini mungkin tidak lagi memadai. Misalnya, kumpulan data evaluasi yang digunakan di Alpaca Stanford, self-instruct, dapat dijawab secara efektif dengan Chatbots SOTA, sehingga menyulitkan manusia untuk membedakan perbedaan kinerja. Keterbatasan lainnya mencakup kontaminasi data pelatihan/pengujian dan potensi biaya tinggi untuk membuat tolok ukur baru. Untuk mengatasi masalah ini, kami mengusulkan kerangka evaluasi berdasarkan GPT-4 untuk mengotomatiskan penilaian kinerja chatbot.

Keterbatasan

Kami memperhatikan bahwa, mirip dengan model bahasa besar lainnya, Vicuna telah batasan tertentu. Misalnya, lembaga ini tidak pandai mengerjakan tugas-tugas yang melibatkan penalaran atau matematika, dan lembaga tersebut mungkin memiliki keterbatasan dalam mengidentifikasi dirinya secara akurat atau memastikan keakuratan faktual dari keluarannya. Selain itu, hal ini belum dioptimalkan secara memadai untuk menjamin keamanan atau memitigasi potensi toksisitas atau bias. Untuk mengatasi masalah keamanan, kami menggunakan moderasi OpenAI untuk menyaring masukan pengguna yang tidak pantas dalam demo online kami . Meskipun demikian, kami berharap Vicuna dapat menjadi titik awal yang terbuka untuk penelitian di masa depan guna mengatasi keterbatasan ini.

Tampilkan Lebih Banyak

Vicuna AI FAQ

Evaluasi awal yang menggunakan GPT-4 sebagai juri menunjukkan bahwa Vicuna AI mencapai lebih dari 90% kualitas ChatGPT dan Google Bard. Artinya, dalam banyak kasus, Vicuna AI dapat memberikan respons yang bermanfaat, relevan, akurat, dan mendetail seperti ChatGPT dan Bard.

Vicuna AI dilatih dengan menyempurnakan model dasar LLaMA pada kumpulan data 70.000 percakapan bersama pengguna yang dikumpulkan dari ShareGPT. Percakapan ini diubah menjadi penurunan harga dan disaring kualitasnya sebelum pelatihan.

Vicuna AI, seperti model bahasa besar lainnya, memiliki batasan tertentu. Hal ini mencakup:
  • Kesulitan dalam penalaran dan matematika
  • Potensi keakuratan faktual yang tidak akurat
  • Terbatasnya jaminan keamanan dan kemungkinan toksisitas atau bias

Para pengembang berupaya mengatasi keterbatasan ini melalui penelitian berkelanjutan di masa depan.

Vicuna AI Lalu Lintas Situs Web

Kunjungan

TanggalKunjungan
2024-06-012207473
2024-07-012143625
2024-08-012099531

Metrik

MetrikNilai
Tingkat Pentalan59.33%
Halaman Per Kunjungan1.99
Durasi Kunjungan Rata-Rata177.02 s

Geografi

NegaraBagikan
🇨🇳

China

14.42%

🇺🇸

Amerika Serikat

14.22%

🇷🇺

Rusia

12.08%

🇻🇳

Viet Nam

5.55%

🇩🇪

Jerman

5.30%

Sumber

SumberNilai
Akses Langsung55.07%
Cari33.37%
Rujukan8.26%
Media Sosial3.06%
Rujukan Berbayar0.16%
Email0.07%

Vicuna AI Produk Alternatif

View details for AI Art
https://aiart.chuangkit.com

AI Art(opens in a new tab)

Penghasilan Gambar

Platform kolaborasi online desain cerdas Maker Post adalah alat desain grafis dan perangkat lunak desain grafis online yang menyediakan sejumlah besar templat poster, grafik media baru, e- templat perdagangan, templat gambar utama, undangan, pengumuman, kabar baik, logo, serta materi dan templat desain gratis lainnya, Kotak Alat AI Pembuat Poster menyediakan pembuatan poster online yang cerdas, potongan sekali klik, penghapusan sekali klik, penghapusan tanda air sekali klik , restorasi gambar definisi tinggi, pembesaran lossless, teka-teki cerdas, dan banyak alat AI pintar lainnya.

90.9KKunjungan
7%Cari
View details for AIDesign
https://aidesign.click

AIDesign(opens in a new tab)

Konversi Teks ke Gambar

Hasilkan gambar AI dari deskripsi teks, dan lebih banyak teks ke gambar

View details for MolyPix AI
https://molypix.ai

MolyPix AI(opens in a new tab)

Pembuatan Ilustrasi

Buat kartu ulang tahun yang dipersonalisasi dengan mudah menggunakan Molypix.AI! Biarkan AI Generatif kami membuat kartu ulang tahun unik untuk orang yang Anda cintai.

17.2KKunjungan
9%Cari
View details for insMind
https://www.insmind.com/ai-design-generator

insMind(opens in a new tab)

Penghasilan Gambar

Generator desain AI kami dirancang untuk membuat grafik, gambar, logo, pamflet, sampul, spanduk AI, dan banyak lagi. Mulai buat desain sekarang, gratis!

View details for Stockimg AI
https://stockimg.ai/

Stockimg AI(opens in a new tab)

Penghasilan Gambar

Stockimg adalah alat desain dan pembuatan konten lengkap yang didukung oleh AI. Anda dapat dengan mudah membuat logo, ilustrasi, wallpaper, poster, dan lainnya.

265.5KKunjungan
48%Cari
View details for LogoAI AI
https://logoai.ai

LogoAI AI(opens in a new tab)

Desain Grafis

Buat logo unik dan profesional dengan mudah menggunakan pembuat logo AI LogoAI.ai. Nikmati akses online gratis, penyesuaian tingkat lanjut, logo bebas tanda air, dan desain aman.

299Kunjungan
55%Cari