Vicuna AI favicon
Vicuna AI

Vicuna AI

Vicuna: avoimen lähdekoodin chatbot, joka tekee vaikutuksen GPT-4:stä 90 prosentin* ChatGPT-laadulla

Pääsy

Vicuna AI Tiedot

Tuotetiedot

Sosiaalinen media

Tuotekuvaus

<p>Esittelemme Vicuna-13B:n, avoimen lähdekoodin chatbotin, joka on koulutettu hienosäätämällä LLaMA ShareGPT:stä kerättyihin käyttäjien jakamiin keskusteluihin. Alustava arvio...

Vicuna AI Esittely

Vicuna: avoimen lähdekoodin chatbot, joka tekee vaikutuksen GPT-4:lle 90 %* ChatGPT-laadulla

Yleiskatsaus

Suurten kielimallien (LLM) nopea kehitys on mullistanut chatbot-järjestelmät, mikä on johtanut ennennäkemättömiin älykkyystasot, kuten OpenAI:n ChatGPT:ssä näkyy. Huolimatta sen vaikuttavasta suorituskyvystä, ChatGPT:n koulutus- ja arkkitehtuuritiedot ovat kuitenkin edelleen epäselviä, mikä haittaa tutkimusta ja avoimen lähdekoodin innovaatioita tällä alalla. Meta LLaMA- ja Stanford Alpaca -projektin inspiroimana esittelemme Vicuna-13B:n, avoimen lähdekoodin chatbotin, jonka taustalla on parannettu tietojoukko ja helppokäyttöinen, skaalautuva infrastruktuuri. Hienosäätämällä LLaMA-perusmallia ShareGPT.com-sivustolta kerätyissä käyttäjien jakamissa keskusteluissa Vicuna-13B on osoittanut kilpailukykyistä suorituskykyä muihin avoimen lähdekoodin malleihin, kuten Stanford Alpacaan, verrattuna. Tämä blogikirjoitus antaa alustavan arvion Vicuna-13B:n suorituskyvystä ja kuvaa sen koulutus- ja palveluinfrastruktuuria. Kehotamme myös yhteisöä olemaan vuorovaikutuksessa online-demomme kanssa tämän chatbotin ominaisuuksien testaamiseksi.

Kuinka hyvä Vicuna on?

Kun Vicuna on hienosäädetty 70 000 käyttäjän jakamalla ChatGPT-keskustelulla, huomaamme, että Vicunasta tulee kyvykäs luoda yksityiskohtaisempia ja hyvin jäsenneltyjä vastauksia Alpacaan verrattuna (katso esimerkit alla) ChatGPT:n laadulla.

Online-demo

Kokeile Vicuna-13B-demoa täällä!

Koulutus

Vicuna luodaan hienosäätämällä LLaMA-perusmallia käyttämällä noin 70 000 käyttäjien jakamaa keskustelua, jotka on kerätty ShareGPT.comista julkisten API-liittymien avulla. Tietojen laadun varmistamiseksi muunnamme HTML-koodin takaisin merkintään ja suodatamme pois sopimattomat tai huonolaatuiset näytteet. Lisäksi jaamme pitkät keskustelut pienempiin segmentteihin, jotka sopivat mallin enimmäiskontekstin pituuteen.
  • Monikierroskeskustelut: Säädämme harjoitushäviön ottamaan huomioon monikäännökset keskustelut ja laskemme hienosäätöhäviön yksinomaan chatbotin tuotos.
  • Muistin optimoinnit: Jotta Vicuna ymmärtäisi pitkän kontekstin, laajennamme kontekstin enimmäispituutta 512:sta alpakassa 2048:aan, mikä lisää huomattavasti GPU-muistin vaatimuksia. Selvitämme muistin paineen käyttämällä gradienttitarkistuspisteitä ja flash-tarkistusta.
  • Kustannusten aleneminen Spot Instancen avulla: 40 kertaa suurempi tietojoukko ja 4x sekvenssin pituus harjoitteluun muodostavat huomattavan haasteen koulutuskuluissa. Käytämme SkyPilot-hallittua spottia kustannusten alentamiseksi hyödyntämällä halvempia spot-tapauksia automaattisella palautuksella ennaltaehkäisyä ja automaattista vyöhykevaihtoa varten. Tämä ratkaisu leikkaa 7B-mallin koulutuskustannuksia noin 140:sta ja 13B-mallin koulutuskustannuksista noin 300:sta.

Palvelu

Rakennamme palvelujärjestelmän, joka pystyy palvelemaan useita malleja hajautetusti. työntekijöitä. Se tukee GPU-työntekijöiden joustavia laajennuksia sekä paikallisista klustereista että pilvestä. Käyttämällä SkyPilotin vikasietoista ohjainta ja hallittua spottiominaisuutta tämä palvelujärjestelmä voi toimia hyvin halvempien spot-esiintymien kanssa useista pilvistä, mikä vähentää käyttökustannuksia. Se on tällä hetkellä kevyt toteutus, ja pyrimme integroimaan siihen lisää viimeisimpiä tutkimuksiamme.

Kuinka arvioida chatbotia?

Tekoälychatbottien arviointi on haastava tehtävä, koska se vaatii kielen ymmärtämisen, päättelyn, ja kontekstitietoisuus. Tekoälykeskustelubottien kehittyessä entistä kehittyneempiä, nykyiset avoimet vertailuarvot eivät ehkä enää riitä. Esimerkiksi SOTA-chatbotit voivat vastata tehokkaasti Stanfordin Alpacassa käytettyyn arviointitietoaineistoon, itseohjautuvaan, mikä tekee ihmisten vaikeaksi havaita suorituserot. Lisää rajoituksia ovat koulutus-/testitietojen saastuminen ja uusien vertailuarvojen luomisen mahdollisesti korkeat kustannukset. Näiden ongelmien ratkaisemiseksi ehdotamme GPT-4:ään perustuvaa arviointikehystä chatbotin suorituskyvyn arvioinnin automatisoimiseksi.

Rajoitukset

Olemme huomanneet, että kuten muissakin suurissa kielimalleissa, Vicunalla on tiettyjä rajoituksia. Se ei esimerkiksi ole hyvä päättelyä tai matematiikkaa sisältävissä tehtävissä, ja sillä voi olla rajoituksia itsensä tunnistamisessa tai tulostensa asiallisen tarkkuuden varmistamisessa. Lisäksi sitä ei ole optimoitu riittävästi turvallisuuden takaamiseksi tai mahdollisen myrkyllisyyden tai vinouden vähentämiseksi. Turvallisuusongelmien ratkaisemiseksi käytämme OpenAI-valvontasovellusliittymää suodattamaan sopimattomat käyttäjien syötteet online-demossamme. Odotamme kuitenkin, että Vicuna voi toimia avoimena lähtökohtana tuleville tutkimuksille näiden rajoitusten ratkaisemiseksi.

Julkaisu

Ensimmäisessä julkaisussamme jaamme koulutus-, käyttö- ja arviointikoodin GitHub-repossa: https://github.com/lm-sys/FastChat. Julkaisimme myös Vicuna-13B-mallin painot. Aineistoa ei ole tarkoitus julkaista. Liity Discord-palvelimellemme ja seuraa Twitterämme saadaksesi viimeisimmät päivitykset.

Kuinka hyvä Vicuna on?

Kun Vicuna on hienosäädetty 70 000 käyttäjien jakamilla ChatGPT-keskusteluilla, huomaamme, että Vicuna pystyy luomaan yksityiskohtaisempia ja paremmin jäsenneltyjä vastauksia kuin Alpaca (katso esimerkit alla ), jonka laatu on sama kuin ChatGPT.

Online-demo

Kokeile Vicuna-13B-demoa täällä< /a>!

Yleiskatsaus

Suurten kielimallien (LLM) nopea kehitys on mullistanut chatbot-järjestelmät, mikä on johtanut ennennäkemättömään älykkyyteen, kuten OpenAI:n ChatGPT:ssä näkyy. Huolimatta sen vaikuttavasta suorituskyvystä, ChatGPT:n koulutus- ja arkkitehtuuritiedot ovat kuitenkin edelleen epäselviä, mikä haittaa tutkimusta ja avoimen lähdekoodin innovaatioita tällä alalla. Meta LLaMA- ja Stanford Alpaca -projektin inspiroimana esittelemme Vicuna-13B:n, avoimen lähdekoodin chatbotin, jonka taustalla on parannettu tietojoukko ja helppokäyttöinen, skaalautuva infrastruktuuri. Hienosäätämällä LLaMA-perusmallia ShareGPT.com-sivustolta kerätyissä käyttäjien jakamissa keskusteluissa Vicuna-13B on osoittanut kilpailukykyistä suorituskykyä muihin avoimen lähdekoodin malleihin, kuten Stanford Alpacaan, verrattuna. Tämä blogikirjoitus antaa alustavan arvion Vicuna-13B:n suorituskyvystä ja kuvaa sen koulutus- ja palveluinfrastruktuuria. Kehotamme myös yhteisöä olemaan vuorovaikutuksessa online-demomme kanssa tämän chatbotin ominaisuuksien testaamiseksi.

Koulutus

Vicuna luodaan hienosäätämällä LLaMA-perusmallia käyttäen noin 70 000 käyttäjää ShareGPT.comista kerätyt jaetut keskustelut julkisten sovellusliittymien kanssa. Tietojen laadun varmistamiseksi muunnamme HTML-koodin takaisin merkintään ja suodatamme pois sopimattomat tai huonolaatuiset näytteet. Lisäksi jaamme pitkät keskustelut pienempiin segmentteihin, jotka sopivat mallin enimmäiskontekstin pituuteen.

Palvelu

Rakennamme palvelujärjestelmän, joka pystyy palvelemaan useita malleja hajautettujen työntekijöiden kanssa. Se tukee GPU-työntekijöiden joustavia laajennuksia sekä paikallisista klustereista että pilvestä. Käyttämällä SkyPilotin vikasietoista ohjainta ja hallittua spottiominaisuutta tämä palvelujärjestelmä voi toimia hyvin halvempien spot-esiintymien kanssa useista pilvistä, mikä vähentää käyttökustannuksia. Se on tällä hetkellä kevyt toteutus, ja pyrimme integroimaan siihen lisää uusinta tutkimustamme.

Miten Chatbotin arvioiminen?

Tekoälychatbottien arviointi on haastava tehtävä, koska se vaatii kielen ymmärtämisen, päättelyn ja kontekstitietoisuuden tutkimista. Tekoälykeskustelubottien kehittyessä entistä kehittyneempiä, nykyiset avoimet vertailuarvot eivät ehkä enää riitä. Esimerkiksi Stanfordin Alpakassa käytettyyn arviointitietoaineistoon self-instruct voidaan vastata tehokkaasti SOTA chatbotit, mikä vaikeuttaa ihmisten havaitsemaan suorituskyvyn eroja. Lisää rajoituksia ovat koulutus-/testitietojen saastuminen ja uusien vertailuarvojen luomisen mahdollisesti korkeat kustannukset. Näiden ongelmien ratkaisemiseksi ehdotamme GPT-4:ään perustuvaa arviointikehystä chatbotin suorituskyvyn arvioinnin automatisoimiseksi.

Rajoitukset

Olemme huomanneet, että Vicuna on muiden suurten kielimallien tapaan tiettyjä rajoituksia. Se ei esimerkiksi ole hyvä päättelyä tai matematiikkaa sisältävissä tehtävissä, ja sillä voi olla rajoituksia itsensä tunnistamisessa tai tulostensa asiallisen tarkkuuden varmistamisessa. Lisäksi sitä ei ole optimoitu riittävästi turvallisuuden takaamiseksi tai mahdollisen myrkyllisyyden tai vinouden vähentämiseksi. Turvallisuusongelmien ratkaisemiseksi käytämme OpenAI:n valvontasovellusliittymää suodattamaan sopimattomat käyttäjien syötteet online-demossamme. . Odotamme kuitenkin, että Vicuna voi toimia avoimena lähtökohtana tuleville tutkimuksille näiden rajoitusten ratkaisemiseksi.

Näytä lisää

Vicuna AI UKK

Alustavat arvioinnit GPT-4:llä tuomarina osoittavat, että Vicuna AI saavuttaa yli 90 % ChatGPT:n ja Google Bardin laadusta. Tämä tarkoittaa, että Vicuna AI voi tarjota vastauksia, jotka ovat yhtä hyödyllisiä, osuvia, tarkkoja ja yksityiskohtaisia ​​kuin ChatGPT ja Bard useimmissa tapauksissa.

Vicuna AI koulutettiin hienosäätämällä LLaMA-perusmallia ShareGPT:stä kerätyn 70 000 käyttäjien jakaman keskustelun tietojoukossa. Nämä keskustelut muunnettiin alennuksiksi ja suodatettiin laadun suhteen ennen harjoittelua.

Vicuna AI:llä, kuten muillakin suurilla kielimalleilla, on tiettyjä rajoituksia. Näitä ovat:
  • Vaikeudet päättelyn ja matematiikan kanssa
  • Mahdollisesti epätarkka faktatarkkuus
  • Rajoitetut turvallisuustakuut ja mahdollinen myrkyllisyys tai harha

Kehittäjät pyrkivät korjaamaan nämä rajoitukset jatkuvalla tulevalla tutkimuksella.

Vicuna AI Verkkosivuliikenne

Vierailut

PäivämääräVierailut
2024-06-012207473
2024-07-012143625
2024-08-012099531

Mitta

MittaArvo
Poistumisprosentti59.33%
Sivuja vierailua kohden1.99
Vierailun keskimääräinen kesto177.02 s

Maantiede

MaaJaa
🇨🇳

Kiina

14.42%

🇺🇸

Yhdysvallat

14.22%

🇷🇺

Venäjä

12.08%

🇻🇳

Vietnam

5.55%

🇩🇪

Saksa

5.30%

Lähde

LähdeArvo
Suora pääsy55.07%
Haku33.37%
Suosittelut8.26%
Sosiaalinen media3.06%
Maksetut suosittelut0.16%
Sähköposti0.07%

Vicuna AI Vaihtoehtoiset tuotteet

View details for ClosersCopy
https://closerscopy.com

ClosersCopy(opens in a new tab)

Mainoskirjoittaminen

ClosersCopy on tekoälyyn perustuva tekstinkirjoitusalusta, jonka avulla voit luoda erittäin tuottavia myyntisivuja, mainoksia, sähköpostikampanjoita ja paljon muuta. Sen omalla tekoälyllä voit myös luoda mukautettuja kehyksiä ja työnkulkuja erityistarpeisiisi.

10.1KVierailut
52%Haku
View details for AI Art
https://aiart.chuangkit.com

AI Art(opens in a new tab)

Kuvan luominen

Maker Post älykkään suunnittelun online-yhteistyöalusta on graafisen suunnittelun työkalu ja online-graafisen suunnittelun ohjelmisto, joka tarjoaa suuren määrän julistemalleja, uuden median grafiikkaa, e- kauppamallit, pääkuvamallit, kutsut, ilmoitukset, hyvät uutiset, logot ja muut ilmaiset suunnittelumateriaalit ja -mallit, Maker Poster AI Toolbox tarjoaa älykkään julisteiden luomisen verkossa, yhden napsautuksen katkaisun, yhden napsautuksen poistamisen, vesileiman poiston yhdellä napsautuksella , teräväpiirtokuvan palauttaminen, häviötön suurennus, älykäs palapeli ja monia muita älykkäitä tekoälytyökaluja.

90.9KVierailut
7%Haku
View details for Hocoos AI
https://hocoos.com

Hocoos AI(opens in a new tab)

Verkkosivuston rakentaminen

Luo ammattimaisia ​​verkkosivustoja sekunneissa Hocoos AI -verkkosivustojen rakennustyökalulla. Hanki kaikki myynti- ja markkinointityökalut aloittaaksesi ja kasvattaaksesi verkkoliiketoimintaasi nyt.

134.2KVierailut
52%Haku
View details for TianGong AI
https://tiangong.kunlun.com

TianGong AI(opens in a new tab)

Keskusteleva chatbotti

Tiangong on ensimmäinen tekoälyhakukone Kiinassa. Se voi ymmärtää käyttäjien aikomuksia, etsiä valtavasti tietoa koko verkosta ja käyttää tekoälyteknologiaa yhteenvedon tekemiseen, yhteenvetoon ja integrointiin laadukkaiden hakutulosten tuottamiseksi. Se voi myös Hakutulokset järjestetään automaattisesti mielenkartoiksi ja ääriviivoiksi tukemaan ammattimaisia ​​akateemisia ja tieteellisiä tutkimushakuja. Lisäksi Tiangongilla on myös mahdollisuus keskustella, kirjoittaa, kysyä ja vastata sekä piirtää. Tiangong on vuorovaikutuksessa käyttäjien kanssa luonnollisen kysymyksen ja vastauksen kielen avulla, joka voi vastata erilaisiin tarpeisiin, kuten tiedon kysymiseen ja vastaukseen, artikkelien luomiseen, loogiseen päättelyyn, matemaattiseen laskemiseen, koodiohjelmointiin, tekoälyn piirtämiseen, virtuaaliseen ihmiskeskusteluun ja tunnekumppanuuteen. Tiangongilla on myös suuri määrä älykkäitä agentteja, jotka voivat auttaa sinua erilaisissa skenaarioissa, kuten opiskelussa, työpaikalla ja elämässä.

812Vierailut
46%Haku
View details for Content GPT
https://chromewebstore.google.com/detail/content-gpt/cdoloamelpionidgoonlbhbcankmaffh

Content GPT(opens in a new tab)

Blogi- ja artikkelikirjoitus

content gpt on työkalu, joka luo sisältöä yli 100 000 sanalla kerrallaan.

View details for MolyPix AI
https://molypix.ai

MolyPix AI(opens in a new tab)

Kuvituksen luominen

Luo yksilöllisiä syntymäpäiväkortteja vaivattomasti Molypix.AI:lla! Anna Generatiivisen tekoälymme suunnitella ainutlaatuinen syntymäpäiväkortti läheisillesi.

17.2KVierailut
9%Haku