Beranda News Wijen, startup di balik asisten virtual virus Maya, melepaskan model AI dasarnya

Wijen, startup di balik asisten virtual virus Maya, melepaskan model AI dasarnya

2
0

Anda memiliki perusahaan Wijen telah merilis model dasar yang Powers Maya, Asisten Suara Realistis yang mengesankan.

Model, yang berukuran 1 miliar parameter dalam ukuran (“parameter” yang mengacu pada komponen individu model), berada di bawah lisensi Apache 2.0, yang berarti dapat digunakan secara komersial dengan beberapa batasan. Disebut CSM-1B, model ini menghasilkan “kode audio RVQ” dari input teks dan audio, menurut Deskripsi wijen tentang platform AI dev memeluk wajah.

RVQ mengacu pada “kuantisasi vektor residual,” teknik untuk mengkode audio ke dalam token diskrit yang disebut kode. RVQ digunakan dalam sejumlah teknologi audio AI baru -baru initermasuk Google’s Soundstream dan Meta’s EncodeC.

CSM-1B menggunakan model dari keluarga Llama Meta sebagai tulang punggungnya dipasangkan dengan komponen “decoder” audio. Varian CSM Powers Maya yang disesuaikan, kata Sesame.

“Model open-source di sini adalah model pembangkit dasar,” tulis Sesame di CSM-1B Wajah memeluk Dan Girub repositori. “Ini mampu menghasilkan berbagai suara, tetapi belum disesuaikan dengan suara spesifik (…) model ini memiliki kapasitas untuk bahasa non-Inggris karena kontaminasi data dalam data pelatihan, tetapi kemungkinan besar tidak akan melakukannya dengan baik.”

Tidak jelas data apa yang digunakan wijen untuk melatih CSM-1B. Perusahaan tidak mengatakannya.

Perlu dicatat bahwa model tidak memiliki perlindungan nyata untuk dibicarakan. Sesame memiliki sistem kehormatan dan hanya mendesak pengembang dan pengguna untuk tidak menggunakan model untuk meniru suara seseorang tanpa persetujuan mereka, membuat konten yang menyesatkan seperti berita palsu, atau terlibat dalam kegiatan “berbahaya” atau “jahat”.

Saya mencoba demo Di wajah memeluk, dan mengkloning suaraku membutuhkan waktu kurang dari satu menit. Dari sana, mudah untuk menghasilkan pidato dengan keinginan hati saya, termasuk pada topik kontroversial seperti pemilihan dan propaganda Rusia.

Laporan Konsumen Baru-baru ini memperingatkan bahwa banyak alat kloning suara bertenaga AI yang populer di pasar tidak memiliki perlindungan “bermakna” untuk mencegah penipuan atau penyalahgunaan.

Sesame, yang didirikan oleh co-pencipta Oculus Brendan Iribe, menjadi viral pada akhir Februari untuk asisten teknologi, yang mendekati membersihkan wilayah Lembah yang luar biasa. Asisten Maya dan Sesame lainnya, bermil -mil, mengambil napas dan berbicara dengan disfluensi, dan dapat terganggu saat berbicara, seperti mode suara Openai.

Wijen telah mengumpulkan jumlah modal yang dirahasiakan dari Andreessen Horowitz, Spark Capital, dan Matrix Partners. Selain membangun Tech Asisten Suara, perusahaan mengatakan itu membuat prototipe kacamata AI “dirancang untuk dipakai sepanjang hari” yang akan dilengkapi dengan model kustomnya.

Sumber