Ototekno

ChatGPT Pecahkan Batas Realitas: Kini Bisa Melihat, Mendengar, dan Berbicara!

Perusahaan teknologi yang terkenal dengan inovasi di bidang kecerdasan buatan (AI), OpenAI, kembali membuat gebrakan. Melalui pengumuman resmi di laman resmi mereka, Selasa (26/9/2023), OpenAI mengungkapkan bahwa ChatGPT, salah satu produk AI mereka, kini telah ditingkatkan dengan kemampuan suara dan gambar. “ChatGPT kini bisa melihat, mendengar, dan bicara,” demikian pernyataan dari OpenAI.

Kemampuan baru ini menawarkan antarmuka yang lebih intuitif bagi pengguna. Selain berkomunikasi melalui teks, pengguna kini bisa melakukan percakapan suara atau bahkan memberitahu ChatGPT tentang apa yang mereka bicarakan melalui gambar.

Bayangkan, Anda bisa memotret isi kulkas dan dapur Anda, lalu menanyakan kepada ChatGPT tentang menu makan malam yang cocok. Atau setelah makan malam, Anda bisa membantu anak Anda mengerjakan soal matematika dengan mengambil foto soal tersebut dan meminta petunjuk dari ChatGPT.

Untuk memulai percakapan suara, pengguna cukup membuka pengaturan di aplikasi seluler, memilih fitur baru, dan ikut serta dalam percakapan suara. OpenAI juga menyediakan lima pilihan suara yang bisa dipilih oleh pengguna.

Kemampuan suara baru ini didukung oleh model text-to-speech terbaru yang mampu menghasilkan audio mirip manusia hanya dari teks. OpenAI berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. “Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks,” ungkap OpenAI.

ChatGPT kini juga didukung oleh teknologi multimodal GPT-3.5 dan GPT-4, yang memungkinkan model ini untuk menerapkan keterampilan penalaran bahasanya pada berbagai jenis gambar, mulai dari foto hingga tangkapan layar.

Meski demikian, OpenAI menegaskan bahwa mereka telah mengambil langkah-langkah teknis untuk membatasi kemampuan ChatGPT dalam menganalisis dan membuat pernyataan langsung tentang individu, sebagai bentuk penghormatan terhadap privasi.

OpenAI akan meluncurkan fitur ini kepada pengguna Plus dan Perusahaan dalam dua minggu ke depan. Fitur suara akan tersedia di platform iOS dan Android, sementara fitur gambar akan tersedia di semua platform.

Dengan peluncuran ini, OpenAI tidak hanya memperkaya dunia kecerdasan buatan tetapi juga membuka peluang baru dalam interaksi manusia dengan mesin.

Back to top button