Rilis GPT-4.5 Openai untuk pelanggan ChatGPT Plus minggu ini membuat saya segera ingin mencobanya, meskipun dengan beberapa skeptis. Ada laporan tentang Openai (dan pengembang lain) yang berjuang untuk membuat perbaikan besar pada model mereka yang pernah kita lihat sebelumnya. Dan model standar saat ini GPT-4O, cukup bagus dalam banyak kasus. Dan jika Anda menginginkan laporan yang komprehensif, ada fitur penelitian yang mendalam.
Openai mengklaim bahwa GPT-4.5 memiliki kecerdasan emosional yang tinggi dan pemahaman yang bernuansa tentang apa yang Anda katakan padanya. Deskripsi perusahaan melukis gambar kedua model sebagai teman yang dapat diandalkan, tetapi GPT-4.5 akan menjadi yang Anda harapkan dari buku puisi dari hari ulang tahun Anda. Jadi, saya memutuskan untuk menguji 4,5 melawan 4O dengan beberapa petunjuk yang mungkin digunakan pengguna chatgpt kasual.
AI puisi
Dengan analogi di kepala saya, saya memutuskan untuk mulai dengan tantangan puitis. Saya bertanya kedua model, “Bisakah kamu menulis puisi pendek tentang sore hujan di New York City dan membuat gambar untuk itu?” Tampaknya adil karena melihat keluar jendela hujan di kota yang sibuk dapat mengeluarkan penyair pada kebanyakan orang.
GPT-4.5 ada di sebelah kiri dan GPT-4O ada di sebelah kanan. Mereka sangat mirip. Saya pribadi berpikir GPT-4.5 melakukan pekerjaan yang sedikit lebih baik dengan ide-ide serupa. Ini menggugah bukan hanya tampilan hujan tetapi perasaan langit abu -abu, genangan air, dan lalu lintas di antara tetesan hujan. Dalam tes buta dari tiga teman acak, dua dari tiga memilih yang sama, dengan yang ketiga mengatakan mereka hanya lebih suka skema sajak GPT-4O.
Sedangkan untuk gambar, kedua model menggunakan Dall-E 3, tetapi GPT-4.5 terlihat jauh lebih realistis. Saya sebenarnya lebih suka pencahayaan impresionistik dari upaya GPT-4O, tetapi keduanya mendapatkan ide puisi dengan cukup baik.
Wawasan Oscar
Dengan Oscar baru-baru ini, saya pergi dengan pertanyaan trivia yang menyenangkan dengan tindak lanjut yang lebih kompleks, subyektif: “Siapa yang memenangkan Oscar Aktris Terbaik pada tahun 2023, dan apa yang membuat kinerja mereka menonjol?”
Keduanya memiliki jawaban yang tepat dari Michelle Yeoh untuk “semuanya di mana-mana sekaligus,” tetapi GPT-4.5 memiliki penjelasan yang sangat bagus mengapa penampilannya selaras dengan pemirsa. Itu mencakup penampilannya dan menyebutkan bagaimana Yeoh adalah orang Asia pertama yang memenangkan Oscar itu. Jawaban GPT-4O memiliki banyak ketukan yang sama, tetapi ia pergi dengan esai aneh dan format daftar bernomor yang agak menjengkelkan untuk dibaca ketika pertanyaan itu adalah permintaan opini yang sederhana. Jawaban GPT-4.5 terasa lebih seperti bagaimana manusia yang sebenarnya akan menjawab, meskipun orang yang sangat menyukai film itu dan Yeoh sebagai pemain.
Koki yang mudah
Akhirnya, saya menempatkan model melawan perjuangan sehari -hari yang kekal dengan prompt ini: “Aku bosan dengan pasta. Bisakah kamu menyarankan resep makan malam yang mudah yang berbeda tapi tidak rumit?”
Saya tidak tahu inspirasi kuliner seperti apa yang saya harapkan, tetapi GPT-4.5 memukul kepala dengan salmon bawang putih madu dengan brokoli panggang. Anda dapat melihatnya adalah resep yang sangat sederhana, singkat, dan tampaknya mudah dan cepat dibuat. GPT-4O pergi dengan udang bawang putih dan sayuran panggang. Itu bukan ide yang buruk untuk makan (meskipun saya pribadi perlu mengubah protein), tetapi Anda dapat melihat persiapan saja membutuhkan banyak panci untuk disiapkan dan daftar bahan bahkan tidak bisa muat di ruang yang sama dengan seluruh resep dari GPT-4.5. Saya meminta mudah dan tidak rumit, GPT-4.5 mengirimkannya jauh lebih baik, saya akan mengatakannya.
Pikiran yang dalam
GPT 4.5 memberikan getaran mengenali preferensi yang tidak dinyatakan dalam prompt dibandingkan dengan GPT-4O. Tapi, sangat halus dalam memahami nada emosional itu. Tanpa perbandingan langsung, Anda mungkin tidak pernah tahu ada perbedaan.
GPT-4O efisien, akurat, dan praktis dalam tanggapannya, dan puisinya benar-benar memadai. Saya tidak akan mengatakan itu di tingkat gratis yang menggunakannya hilang banyak dari tidak memiliki akses ke GPT-4.5, setidaknya sekarang. Seiring waktu, itu dapat berubah karena GPT-4.5 masih merupakan pratinjau penelitian dan tidak sepenuhnya lengkap dan keluar. Saya akan terus bereksperimen dengan keduanya dan melihat apakah ada jenis petunjuk di mana model baru secara definitif lebih baik, tetapi untuk saat ini, saya akan mengatakan jangan terlalu khawatir tentang model yang Anda gunakan, kecuali jika Anda merencanakan makanan dan tidak punya banyak waktu untuk mempersiapkan.