Mau tahu masa depan AI? Lihatlah kegagalan Google Translate

The Conversation
24 Apr 2025

Mau tahu masa depan AI? Lihatlah kegagalan Google Translate

Pakar komputer Rich Sutton dan Andrew Barto mendapatkan Turing Award tahun 2024, penghargaan paling bergengsi bagi sosok yang punya rekam jejak panjang di ranah teknologi. Esai karya Sutton yang dirilis pada 2019, The Bitter Lesson, secara spesifik mengupas demam penggunaan kecerdasan buatan (AI) masa kini.

Sutton berpendapat bahwa mengembangkan AI dengan proses komputasi intensif merupakan metode yang "jelas paling efektif dan jauh lebih efektif" dibanding pemanfaatan pengetahuan manusia.

Gagasan ini sebenarnya telah berulang kali terbukti dalam sejarah AI. Namun, terdapat pelajaran penting lain terkait AI-berasal dari sekitar 20 tahun lalu-yang harus kita perhatikan.

Chatbot AI saat ini (ChatGPT, DeepSeek, dan lain-lain) dibangun dengan menggunakan model bahasa besar (large language models/LLMs). LLM adalah model yang dilatih dengan sangat banyak data sehingga model tersebut bisa "menalar" dengan cara memprediksi kata berikutnya dalam kalimat. Model ini berfungsi dengan mempertimbangkan kemungkinan-kemungkinan (probabilitas).

Model bahasa probabilistik yang fungsional tahap awal dikembangkan oleh Claude Shannon, ahli berbagai bidang asal Amerika Serikat pada 1948. Ia mempelajari temuan masa lampau dari tahun 1910-an dan 1920-an.

Bentuk model bahasa ini sempat populer pada 1970-an dan 1980-an karena digunakan dalam komputer untuk penerjemahan dan pengenalan ucapan (speech recognition) yaitu fitur mengubah kata-kata yang diucapkan menjadi teks.

LLM berkemampuan tinggi, seperti yang kita kenal di era sekarang, pertama kali dirilis pada 2007. Model ini menjadi bagian dari Google Translate yang diluncurkan setahun sebelumnya.

Model tersebut dilatih oleh triliunan kata-kata dengan ribuan komputer, menjadikannya leluhur dari LLM masa kini, meski tetap ada perbedaannya.

LLM tahap awal bergantung pada perhitungan kemungkinan berdasarkan jumlah kata. Berbeda dengan LLM masa kini yang dasarnya adalah sistem produksi makna atau disebut dengan transformers.

Transformers dikembangkan pada 2017, sebuah sistem yang awalnya memang dibuat untuk proses penerjemahan. Sistem ini merupakan [jaringan saraf buatan](https://en.wikipedia.org/wiki/Neural_network_(machine_learning) yang memungkinkan teknologi memahami konteks setiap kata dengan lebih baik.

Terjemahan mesin (machine translation/MT) berkembang pesat selama dua dekade belakangan. Tak hanya didorong oleh perkembangan teknologi, model ini juga berkembang karena kumpulan data yang semakin banyak dan beragam. Perkembangan tersebut memperkaya proses pelatihan model.

Dulu, pada 2006, Google Translate hanya menawarkan penerjemahan dalam tiga bahasa yaitu Inggris, Mandarin, dan Arab. Sekarang, ada 249 bahasa yang ditawarkan. Terdengar keren, tetapi sebenarnya angka tersebut hanya 4% dari keseluruhan bahasa di dunia yang diperkirakan berjumlah 7 ribu.

Dengan Google Translate, penerjemahan beberapa bahasa seperti Inggris dan Spanyol biasanya mulus. Namun, tetap saja proses penerjemahan terkadang gagal mengenali ungkapan, nama tempat, istilah hukum dan teknis, dan perbedaan-perbedaan halus lain dalam bahasa.

Untuk penerjemahan bahasa lainnya, Google Translate dapat membantu kita memahami inti sebuah teks, tetapi terkadang masih tak akurat.

Evaluasi tahunan terbesar sistem machine translation-yang kini juga memperhitungkan penerjemahan versi LLM sebagai saingan machine translation-secara terang-terangan menyimpulkan bahwa "machine translation masih perlu dibenahi".

Machine translation secara umum masih sering digunakan sekalipun memiliki beberapa isu. Pada 2021, aplikasi Google Translate telah mencapai 1 miliar unduhan.

Meski begitu, pengguna tampaknya sadar untuk menggunakan layanan penerjemahan tersebut dengan hati-hati. Sebuah survei pada 2022 yang diikuti 1.200 orang menunjukkan bahwa mereka umumnya menggunakan machine translation hanya untuk situasi santai, seperti menerjemahkan konten dari internet, bukan konteks pekerjaan atau edukasi. Hanya 2% dari responden yang memakai layanan tersebut untuk situasi serius seperti berbicara pada tenaga kesehatan atau polisi.

Tak dapat dimungkiri bahwa terdapat risiko serius dalam penggunaan machine translation dalam situasi yang krusial. Beberapa penelitian menunjukkan bahwa kesalahan terjemahan machine translation dalam pelayanan kesehatan berisiko menimbulkan bahaya serius.

Terdapat temuan bahwa penggunaan machine translation mencederai proses kasus suaka yang kredibel, membuat pencari suaka tertolak karena si mesin salah mengartikan data. Keadaan ini diperparah dengan kecenderungan pengguna yang mempercayai hasil penerjemahan yang mudah dipahami dari machine translation, meski hasilnya menyesatkan.

Dengan risiko yang mengintai ini, industri penerjemahan bergantung pada penerjemah untuk ranah yang serius seperti hukum internasional dan perdagangan. Biarpun begitu, daya jual jasa penerjemahan dari para individu tersebut telah berkurang lantaran teknologi bisa melakukan sebagian besar pekerjaan mereka.

Manusia berperan dalam menjaga kualitas penerjemahan. Mereka biasanya adalah pekerja lepas (freelancer) di sebuah platform jual beli yang disalurkan oleh platform machine-translation.

Ironis ketika kita kehilangan pekerjaan, tetapi justru harus mengoreksi hasil buruk dari pekerjaan tersebut. Belum lagi tekanan dari keadaan tak menentu dan perasaan kesepian yang muncul akibat kerja berbasis platform.

Seluruh tekanan tersebut masih dilengkapi dengan ancaman-entah nyata atau dianggap nyata-dari teknologi yang sewaktu-waktu akan menggantikan mereka. Tekanan ini disebut para peneliti sebagai kecemasan otomatisasi (automation anxiety).

Baru-baru ini industri teknologi dikejutkan dengan Deepseek, model kecerdasan buatan Cina yang memiliki kemampuan serupa dengan pendominasi pasar yaitu model GPT terbaru dari OpenAI. Daya tarik Deepseek berada pada harganya yang jauh lebih memikat dibanding produk OpenAI.

Pertarungan ini mengindikasikan bahwa bahkan LLM pun cepat atau lambat akan menjadi sebuah komoditas, layanan yang dengan mudah diperjualbelikan. LLM akan dipakai oleh organisasi skala apa pun dengan biaya rendah sama seperti machine translation saat ini.

Tentu saja LLM saat ini sudah jauh lebih canggih dibanding machine translation karena menawarkan berbagai jenis tugas. Namun, kekurangan utama LLM adalah data. Sebab, teknologi ini benar-benar memeras data yang ada di internet.

Di titik ini, data pelatihan model tersebut kurang kaya untuk beragam jenis tugas yang ada. Sama halnya dengan kurangnya data untuk bahasa yang dapat dimanfaatkan machine translation.

Masalah data yang telah terkuras menjadi lebih serius di AI generatif: berbeda dengan bahasa, akan lebih sulit mengukur kualitas dari hasil pekerjaan LLM.

Tentu akan ada upaya memperkaya data pelatihan untuk membuat LLM lebih akurat dalam mengerjakan tugas yang kurang mampu dikerjakan. Namun, persoalan penyelesaian berbagai jenis tugas ini menjadi tantangan yang bahkan lebih serius daripada machine translation.

Para ahli mengupayakan model-model ini tetap berkembang dengan terus menambah ukuran data pelatihan model dengan membuat versi sintensisnya atau memanfaatkan masukan dari manusia melalui interaksi chatbot. Cara ini sudah dicoba untuk machine translation, tetapi tidak efektif.

Maka dari itu, masa depan LLM adalah kemampuan menakjubkan mereka di beberapa jenis tugas, kemampuan rata-rata di tugas lain, dan kemampuan di bawah rata-rata di tugas jenis lainnya lagi.

Kita hanya akan menggunakan LLM ketika risikonya rendah karena model ini dapat merugikan jika dipakai di konteks serius. Misalnya kasus pengacara yang memanfaatkan ChatGPT untuk menyusun pembelaan, tetapi ChatGPT mensitasi kasus hukum yang tak nyata.

LLM akan membantu pekerja dalam industri yang memiliki budaya pengecekan kualitas seperti pemrograman komputer. Meski membantu, LLM juga berpotensi menyulitkan pekerja. Ditambah dengan ancaman pada karya seni yang diciptakan manusia dan lingkungan kita.

Pertanyaan pentingnya: apakah ini memang masa depan yang ingin kita perjuangkan?

Kezia Kevina Harmoko berkontribusi dalam penerjemahan artikel ini.

This article was originally published in English