Informasi

Dalam uji coba pemikiran kreatif, kecerdasan buatan mampu melampaui kinerja manusia biasa.

Sebuah studi terbaru telah mengungkap bahwa kecerdasan buatan, terutama ChatGPT4, bisa melampaui kemampuan rata-rata manusia dalam menghasilkan ide dalam uji coba kreativitas klasik. Namun, meskipun chatbot AI secara konsisten menunjukkan kinerja tinggi, mereka tidak melampaui partisipan manusia yang paling kreatif. Sebaliknya, manusia menunjukkan spektrum potensi kreatif yang lebih luas, mungkin karena perbedaan dalam fungsi eksekutif dan proses kognitif.

Secara tradisional, kreativitas dianggap sebagai atribut eksklusif manusia, yang didorong oleh proses kognitif rumit seperti imajinasi, intuisi, dan kemampuan untuk menghubungkan konsep-konsep yang tampaknya tidak terkait. Namun, seiring perkembangan teknologi kecerdasan buatan, semakin jelas bahwa mesin memiliki kemampuan untuk menghasilkan hasil kreatif yang dapat bersaing dengan, bahkan terkadang melampaui, pencapaian manusia.

Penulis studi, Simone Grassini, seorang profesor di Universitas Bergen, menyatakan, “Saya percaya bahwa saat ini kita berada dalam persimpangan sejarah yang unik di mana persepsi kita tentang mesin dan kecerdasan mesin mungkin mengalami transformasi mendalam. Sebagai seorang ilmuwan, saya yakin ada ruang yang cukup untuk penelitian tentang bagaimana manusia memandang mesin dan kemampuan manusia apa saja yang saat ini bisa ditiru oleh mesin.”

“Beberapa dekade yang lalu, akan sulit membayangkan mesin memiliki kemampuan seperti perilaku kreatif, dan bidang ini berkembang begitu cepat sehingga sulit untuk meramalkan apa yang akan terjadi dalam satu atau dua tahun mendatang.”

Para peneliti melakukan penyelidikan mereka menggunakan penilaian kreativitas konvensional yang disebut Alternate Uses Task (AUT). Dalam penilaian ini, baik peserta manusia maupun chatbot AI diberi tugas untuk menghasilkan aplikasi yang kreatif dan unik untuk benda-benda sehari-hari, seperti tali, kotak, pensil, dan lilin.

Bagi peserta manusia, batas waktu 30 detik diberikan untuk menghasilkan sebanyak mungkin ide kreatif. Sebaliknya, chatbot diberi instruksi untuk menghasilkan sejumlah ide tertentu (misalnya, 3 ide) dan dibatasi untuk menggunakan hanya 1-3 kata dalam setiap tanggapan. Setiap chatbot menjalani penilaian sebanyak 11 kali.

Studi ini melibatkan tiga chatbot AI: ChatGPT3, ChatGPT4, dan Copy.Ai, serta sekelompok 256 peserta manusia. Semua peserta manusia ini merupakan penutur asli bahasa Inggris, direkrut dari platform online Prolific, dengan usia rata-rata 30,4 tahun, berkisar antara 19 hingga 40 tahun.

Berikut tanggapan dari peserta manusia dan chatbot AI melalui dua metode utama dalam analisis:

  1. Skor Jarak Semantik: Metode otomatis ini mengukur tingkat keoriginalan dari tanggapan dengan mengukur sejauh mana tanggapan-tanggapan tersebut berbeda dari penggunaan umum atau yang diharapkan dari objek yang diberikan.
  2. Penilaian Subjektif Kreativitas: Enam penilai manusia, yang tidak mengetahui apakah tanggapan tersebut dihasilkan oleh AI atau manusia, diberi tugas untuk menilai tingkat kreativitas dari ide-ide tersebut menggunakan skala 5 poin.

Hasil penelitian menunjukkan bahwa chatbot AI, terutama ChatGPT3 dan ChatGPT4, secara konsisten mendapatkan skor jarak semantik yang lebih tinggi dibandingkan dengan peserta manusia. Ini mengindikasikan bahwa chatbot AI mampu menghasilkan tanggapan yang lebih tidak konvensional dan jarang ditemui jika dibandingkan dengan peserta manusia. Para penilai manusia juga menilai chatbot AI, terutama ChatGPT4, sebagai lebih kreatif secara rata-rata daripada peserta manusia.

Peneliti Simone Grassini menyatakan, “Berdasarkan hasil kami, chatbot AI seperti ChatGPT menunjukkan kemampuan luar biasa dalam menghasilkan tanggapan kreatif saat terlibat dalam tugas pemikiran kreatif konvensional, yang biasanya digunakan dalam penelitian psikologis.”

Meskipun chatbot AI memperoleh hasil yang mengesankan, penting untuk diakui bahwa mereka tidak selalu dapat mengalahkan peserta manusia yang sangat kreatif. Dalam beberapa kasus, individu yang sangat kreatif di antara peserta manusia dapat bersaing dengan chatbot AI dalam menghasilkan tanggapan yang segar dan imajinatif.

Grassini menambahkan, “Mesin mungkin bisa mengungguli manusia rata-rata dalam Tugas Penggunaan Alternatif. Namun, peserta manusia yang paling kreatif tetap unggul atas semua model yang kami uji.”

Keberhasilan sistem AI ini merupakan pencapaian yang menarik. Namun, penting untuk tidak mengambil kesimpulan berlebihan terkait dengan implikasinya dalam dunia nyata. Fakta bahwa mesin dapat unggul dalam tugas kreatif yang sangat spesifik tidak selalu berarti bahwa mereka akan sukses dalam pekerjaan yang kompleks yang memerlukan kreativitas. Sejauh mana “kemampuan” mesin ini bisa diaplikasikan dalam situasi dunia nyata tetap menjadi subjek penelitian yang lebih lanjut.

Grassini juga menyatakan, “Saya percaya bahwa di masa depan, AI seperti chatbot akan melengkapi kreativitas manusia daripada menggantikannya dalam peran kreatif. Kita harus mempertimbangkan masa depan di mana manusia dan mesin AI dapat hidup berdampingan tanpa harus otomatis mengasumsikan bahwa mesin akan menggantikan kita atau mengambil pekerjaan kita secara keseluruhan.”

Namun, perlu ditekankan bahwa dampak kecerdasan buatan (AI) pada pasar tenaga kerja memiliki dampak yang signifikan dan diperkirakan akan terus berkembang dalam beberapa tahun mendatang. Bagaimana masyarakat kita beradaptasi dengan integrasi AI ke dalam lingkungan kerja manusia adalah perhatian krusial saat ini. Saya berharap pemerintah dan pemangku kepentingan akan merumuskan pedoman dan regulasi terkait penggunaan mesin untuk menggantikan atau mendukung pekerjaan manusia.

Dalam penilaian chatbot yang dilakukan, ChatGPT4 muncul sebagai yang paling kreatif ketika melibatkan penilaian subjektif.

“Salah satu temuan menarik adalah bahwa ChatGPT4, model terbaru yang kami uji, tidak secara signifikan berbeda dari model AI lainnya ketika dinilai menggunakan algoritma untuk mengukur jarak semantik,” dijelaskan oleh Grassini. “Namun, secara keseluruhan, ChatGPT4 unggul dibandingkan dengan model lainnya dalam penilaian manusia mengenai tingkat kreativitas yang terdapat dalam tanggapannya.”

Hal ini menunjukkan bahwa output dari ChatGPT4 pada dasarnya tidak berbeda secara signifikan dari model-model lain ketika dianalisis dengan kriteria ‘objektif’ seperti jarak semantik antara item yang diusulkan dan cara mereka digunakan secara kreatif. Namun, tanggapan yang dihasilkan oleh ChatGPT4 dianggap lebih ‘menarik’ atau ‘subjektif lebih kreatif’ oleh penilai manusia.

Penting untuk diakui bahwa, seperti dalam setiap penelitian ilmiah, penelitian ini memiliki batasan tertentu. “Kami hanya mengamati satu aspek perilaku kreatif,” kata Grassini kepada PsyPost. “Temuan kami mungkin tidak dapat digeneralisasi secara universal pada kreativitas sebagai fenomena multi-aspek.”

Para peneliti juga menyadari bahwa membandingkan kreativitas pada tingkat proses antara manusia dan chatbot memiliki tantangan, karena chatbot pada dasarnya berfungsi sebagai “kotak hitam” dengan proses internal yang tersembunyi.

“Mesin mungkin tidak ‘menunjukkan’ kreativitas dalam arti konvensional, karena mungkin telah mempelajari respons terbaik untuk tugas tertentu dari data pelatihan,” dijelaskan oleh Grassini. Tugas tersebut mungkin lebih mencerminkan kapasitas ingatan chatbot daripada “kemampuannya untuk menghasilkan penggunaan kreatif untuk objek. Karena arsitektur model-model ini, hal ini tetap belum pasti.”

Sumber : https://www.psypost.org/2023/10/artificial-intelligence-outperforms-the-average-human-in-a-creative-thinking-test-213944