Buka kunci pencernaan editor secara gratis
Roula Khalaf, editor FT, memilih cerita favoritnya di buletin mingguan ini.
Mark Zuckerberg sedang membangun kemampuan suara kecerdasan buatan Meta tahun ini, karena raksasa media sosial mendorong ke depan dengan rencana untuk menghasilkan pendapatan dari teknologi yang berkembang cepat.
Meta berencana untuk memperkenalkan fitur suara yang lebih baik ke dalam model bahasa besar open-source terbaru, Llama 4, yang diharapkan dalam beberapa minggu mendatang, kata orang-orang yang akrab dengan masalah ini, karena bertaruh bahwa agen bertenaga AI di masa depan akan menjadi percakapan daripada yang dipimpin oleh teks.
Perusahaan telah secara khusus berfokus pada membuat percakapan antara pengguna dan model suaranya lebih dekat dengan dialog alami dua arah, memungkinkan gangguan dari pengguna daripada format tanya jawab dan jawaban yang lebih kaku, kata satu orang.
Dorongan suara datang ketika Zuckerberg, kepala eksekutif, telah menguraikan rencana BOLD untuk menjadikan perusahaan Lembah Silikon $ 1,7tn sebagai “pemimpin AI”, menyebut tahun 2025 sebagai tahun yang dibuat-atau-istirahat untuk banyak produk AI-nya, sebagai kelompok balapan melawan para pesaing seperti Openai, Microsoft dan Google untuk mengkomersialkan teknologi.
Hal ini telah membuat perusahaan melihat trialling langganan premium untuk asisten AI meta AI, untuk tugas -tugas agen seperti pemesanan pemesanan dan pembuatan video, kata dua orang yang akrab dengan masalah ini. Ia juga mempertimbangkan untuk memperkenalkan iklan berbayar atau posting yang disponsori ke dalam hasil pencarian asisten AI -nya, kata salah satu orang.
Zuckerberg tahun ini mengungkapkan rencana untuk membangun agen teknik AI yang memiliki kemampuan pengkodean dan pemecahan masalah dari seorang insinyur tingkat menengah, yang katanya berpotensi “pasar yang sangat besar”.
Meta menolak berkomentar.
Chief Product Officer kelompok itu Chris Cox pada hari Rabu menyoroti beberapa rencananya untuk Llama 4, dengan mengatakan itu akan menjadi “model omni” di mana pidato akan “asli. . . Daripada menerjemahkan suara ke dalam teks, mengirim teks ke LLM, mengeluarkan teks, dan mengubahnya kembali menjadi pidato ”.
Berbicara di Morgan Stanley Technology, Media & Telecom Conference, ia menambahkan: “Saya percaya ini adalah masalah besar untuk produk antarmuka, gagasan bahwa Anda dapat berbicara dengan internet dan menanyakan apa saja. Saya pikir kita masih membungkus kepala kita di sekitar betapa kuatnya itu. ”
Meta juga telah membahas pagar pembatas yang harus dimiliki oleh model LLAMA terbaru tentang apa yang dapat dihasilkannya dan apakah akan menurunkannya, dua orang yang akrab dengan masalah tersebut mengatakan.
Diskusi datang di tengah kesibukan peluncuran dari saingan dan peringatan dari David Sacks ‘Ai Tsar’ yang baru ditunjuk, seorang kapitalis ventura Silicon Valley, yang mengatakan dia ingin memastikan model AI AS tidak bias secara politis atau “bangun”.
Openai merilis mode suaranya tahun lalu dan telah fokus pada memberikan kepribadian yang berbeda, sementara Grok 3, dibuat oleh Elon Musk’s Xai dan tersedia di platform X, meluncurkan fitur suaranya untuk memilih pengguna akhir bulan lalu.
Model GROK secara khusus dirancang untuk memiliki lebih sedikit pagar, termasuk “mode tanpa cengkeraman” yang dengan sengaja merespons dengan cara yang dimaksudkan untuk “tidak menyenangkan, tidak pantas, dan menyinggung”, menurut perusahaan.
Meta tahun lalu meluncurkan versi AI yang kurang “suci” untuk iterasi Llama ketiganya, mengikuti kritik bahwa Llama 2 menolak untuk menjawab pertanyaan yang tidak bersalah.
Mengizinkan pengguna untuk berinteraksi dengan asisten AI yang menggunakan perintah suara adalah fitur utama dari kacamata pintar Ray Bans Meta, yang baru -baru ini menjadi hit besar di antara konsumen. Grup ini telah mempercepat rencananya untuk membangun headset ringan yang dapat merebut smartphone sebagai perangkat komputasi utama konsumen.
Pelaporan tambahan oleh Melissa Heikkilä di London